CN114528764A - 基于整体优化的即时学习的软测量建模方法及装置 - Google Patents
基于整体优化的即时学习的软测量建模方法及装置 Download PDFInfo
- Publication number
- CN114528764A CN114528764A CN202210151538.7A CN202210151538A CN114528764A CN 114528764 A CN114528764 A CN 114528764A CN 202210151538 A CN202210151538 A CN 202210151538A CN 114528764 A CN114528764 A CN 114528764A
- Authority
- CN
- China
- Prior art keywords
- ridge regression
- data set
- weighted
- target
- coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005457 optimization Methods 0.000 title claims abstract description 92
- 238000000034 method Methods 0.000 title claims abstract description 74
- 238000005259 measurement Methods 0.000 title claims description 37
- 239000011159 matrix material Substances 0.000 claims abstract description 96
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 47
- 230000006870 function Effects 0.000 claims abstract description 24
- 238000004519 manufacturing process Methods 0.000 claims abstract description 16
- 238000010276 construction Methods 0.000 claims abstract description 5
- 238000012549 training Methods 0.000 claims description 75
- 239000000126 substance Substances 0.000 claims description 28
- 230000008569 process Effects 0.000 claims description 22
- 230000004186 co-expression Effects 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 8
- 238000003860 storage Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 7
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 4
- 230000014509 gene expression Effects 0.000 abstract description 4
- 238000004891 communication Methods 0.000 description 9
- 239000001273 butane Substances 0.000 description 8
- IJDNQMDRQITEOD-UHFFFAOYSA-N n-butane Chemical compound CCCC IJDNQMDRQITEOD-UHFFFAOYSA-N 0.000 description 8
- OFBQJSOFQDEBGM-UHFFFAOYSA-N n-pentane Natural products CCCCC OFBQJSOFQDEBGM-UHFFFAOYSA-N 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000012824 chemical production Methods 0.000 description 2
- 238000009533 lab test Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000010238 partial least squares regression Methods 0.000 description 2
- 238000012628 principal component regression Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 238000012369 In process control Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000006477 desulfuration reaction Methods 0.000 description 1
- 230000023556 desulfurization Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010965 in-process control Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000004540 process dynamic Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种基于整体优化的即时学习的软测量建模方法、装置、电子设备及存储介质,该方法通过协同表示算法获得历史样本的权重矩阵,并通过加权岭回归算法建立加权岭回归模型,将两种算法进行融合,形成统一的即时学习优化目标,最终通过交替迭代的方式进行求解。从而很好地处理工业过程的非线性、时变性及多重共线性问题,还将相似样本选择和局部模型的构建融合到一个优化函数中,实现利用局部模型的信息指导相似样本的选择,提高相似样本的可靠性及局部模型的预测精度。由此,解决了现有技术预测精度差等问题。
Description
技术领域
本申请涉及工业过程检测技术领域,特别涉及一种基于整体优化的即时学习的软测量建模方法、装置、电子设备及存储介质。
背景技术
在现代工业生产过程中,许多重要质量变量(例如:油品黏度、组分等)难以实时测量,给化工过程控制与优化带来很大影响。因为化工生产过程存在样品现场取样困难、分析仪器成本高以及分析时间滞后等问题,在实际生产过程中,往往难以使用在线分析仪表和离线化验等方式对质量变量进行实时测量,无法对质量变量形成闭环控制。因此,质量变量如何实时获取成为过程控制首先要解决的问题。由此,软测量进入了过程工业控制领域的研究视线。
常用的数据驱动软测量建模方法包括主元回归(Principal ComponentRegression,PCR)、偏最小二乘回归(Partial Least Square Regression,PLSR)以及人工神经网络(ANN)。上述软测量算法建立的模型属于离线模型,模型建立后不会随着生成过程的改变而自适应调整,无法跟踪生产状态的变化,从而导致预测精度逐渐下降。因此,软测量模型的自动维护成为了算法研究与改进的重点。因此,为了适应现代化工生产过程表现出的多模态特性和时变特性,各种在线建模算法已经被广泛应用于生产过程的监控与质量变量预测。
目前,主流的在线软测量建模算法包括:滑动窗算法、递归算法、时间差分算法以及即时学习算法。其中,前三种都是根据时间相关性更新模型,属于时间自适应算法;即时学习算法是基于空间相关性对模型进行更新和维护,属于空间自适应算法。相比其他算法,即时学习算法的优势在于可以更好的适应生产过程中的突变现象,并且由于该算法对每个样本都建立局部模型,因此,也可以很好的描述过程变量之间的非线性关系。
相似样本的选择或者样本权重的计算是即时学习算法的核心步骤,会在很大程度上影响算法的预测精度。对于传统即时学习算法,一方面,算法中一些可调参数的选择往往是一件非常困难的事,例如LWPLS算法中的核宽度参数以及LWLS算法中的相似样本的数目,这些参数的选择并没有明确的理论经验指导,并且会对模型的性能产生较大影响;另一方面,算法的两个核心步骤:选择相似样本和建立局部模型是相互独立的,这可能导致选择出的相似样本对于局部模型来说是次优的。即选择的相似样本用于建立局部模型,但建立局部模型获得的信息并没有用于指导相似样本的选择。由上可知,采用传统即时学习算法建立的模型存在预测精度差的问题,亟待解决。
发明内容
本申请提供一种基于整体优化的即时学习的软测量建模方法、装置、电子设备及存储介质,以解决现有技术预测精度差等问题。
本申请第一方面实施例提供一种基于整体优化的即时学习的软测量建模方法,包括以下步骤:根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离;将所述加权欧式距离融合到协同表示正则项中,得到目标协同表示模型,并利用所述目标协同表示模型计算所述预设辅助变量数据集中各个历史样本的权重矩阵;根据目标训练数据集和所述各个历史样本的权重矩阵建立加权岭回归模型,将所述目标协同表示模型和所述加权岭回归模型的优化目标进行融合,计算所述预设辅助变量数据集与所述查询数据的加权岭回归模型系数;利用所述加权岭回归模型系数计算所述查询数据的预测值。
可选地,在本申请的一个实施例中,所述根据目标训练数据集和所述各个历史样本的权重矩阵建立加权岭回归模型之前,还包括:构建存储工业过程中的所述预设辅助变量数据集;对所述预设辅助变量数据集进行分析,得到所述辅助变量数据集中各个样本对应的真实质量变量值;根据所述辅助变量数据和所述真实质量变量值构建初始训练数据集,并对所述训练数据集进行标准化处理,得到所述目标训练数据集。
可选地,在本申请的一个实施例中,所述标准化处理为:
可选地,在本申请的一个实施例中,所述根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离之前,还包括:
根据所述目标训练数据集建立离线岭回归模型,优化目标为:
求解所述离线岭回归模型的优化目标,得到所述离线岭回归模型的岭回归系数W0:
W0=(XLXL T+λ0×I)-1XLYL
其中,XL T为数据XL的转置,I为单位矩阵;
根据所述岭回归系数计算各个输入变量的权重矩阵得到所述预设输入变量权重矩阵:
其中,W0(1)为岭回归系数W0的第一个元素,W0(m)为岭回归系数W0的第m个元素。
可选地,在本申请的一个实施例中,所述根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离,将所述加权欧式距离融合到协同表示正则项中,得到目标协同表示模型,利用所述目标协同表示模型计算所述预设辅助变量数据集中各个历史样本的权重矩阵,包括:
根据所述预设输入变量权重矩阵计算所述查询数据与标准化的预设辅助变量数据集中所有样本的加权欧式距离:
Dxq=Wvar(xq×1-XL)
建立所述查询数据与所述目标训练数据集的协同表示模型,并融合所述预设输入变量权重矩阵和所述加权欧式距离,优化目标为:
计算所述标准化的预设辅助变量数据集与所述查询数据的协同表示系数b:
b=(XL TWvarXL+λ1D)-1XL TWvarxq
利用所述协同表示系数得出所述目标训练数据集中各历史样本的权重矩阵:
其中,b1为向量b的第一个元素,bn为向量b的第n个元素。
可选地,在本申请的一个实施例中,所述根据目标训练数据集和所述各个历史样本的权重矩阵建立加权岭回归模型,将所述目标协同表示模型和所述加权岭回归模型的优化目标进行融合,计算所述预设辅助变量数据集与所述查询数据的加权岭回归模型系数,利用所述加权岭回归模型系数计算所述查询数据的预测值,包括:
根据所述目标训练数据集与所述历史样本的权重矩阵建立所述加权岭回归模型,优化目标为:
将所述目标协同表示模型和所述加权岭回归模型的优化目标进行融合,得出统一的优化目标为:
计算所述加权岭回归模型系数w:
可选地,在本申请的一个实施例中,计算所述查询数据的实际值,将所述实际值与所述查询数据增加至所述目标训练数据集。
本申请第二方面实施例提供一种基于整体优化的即时学习的软测量建模装置,包括:计算模块,用于根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离,将所述加权欧式距离融合到协同表示正则项中,得到目标协同表示模型,并利用所述目标协同表示模型计算所述预设辅助变量数据集中各个历史样本的权重矩阵;预测模块,用于根据目标训练数据集和所述各个历史样本的权重矩阵建立加权岭回归模型,将所述目标协同表示模型和所述加权岭回归模型的优化目标进行融合,计算所述预设辅助变量数据集与所述查询数据的加权岭回归模型系数;利用所述加权岭回归模型系数计算所述查询数据的预测值。
可选地,在本申请的一个实施例中,还包括:构建模块,用于构建存储工业过程中的所述预设辅助变量数据集;分析模块,用于对所述预设辅助变量数据集进行分析,得到所述辅助变量数据集中各个样本对应的真实质量变量值;预处理模块,用于根据所述辅助变量数据和所述真实质量变量值构建初始训练数据集,并对所述训练数据集进行标准化处理,得到所述目标训练数据集。
可选地,在本申请的一个实施例中,所述标准化处理为:
可选地,在本申请的一个实施例中,还包括:
建模模块,用于在根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离之前,根据所述目标训练数据集建立离线岭回归模型,优化目标为:
求解模块,用于求解所述离线岭回归模型的优化目标,得到所述离线岭回归模型的岭回归系数W0:
W0=(XLXL T+λ0×I)-1XLYL
其中,XL T为数据XL的转置,I为单位矩阵;
权重计算模块,用于根据所述岭回归系数计算各个输入变量的权重矩阵得到所述预设输入变量权重矩阵:
其中,W0(1)为岭回归系数W0的第一个元素,W0(m)为岭回归系数W0的第m个元素。
可选地,在本申请的一个实施例中,所述计算模块,具体用于:
根据所述预设输入变量权重矩阵计算所述查询数据与标准化的预设辅助变量数据集中所有样本的加权欧式距离:
Dxq=Wvar(xq×1-XL)
建立所述查询数据与所述目标训练数据集的协同表示模型,并融合所述预设输入变量权重矩阵和所述加权欧式距离,优化目标为:
计算所述标准化的预设辅助变量数据集与所述查询数据的协同表示系数b:
b=(XL TWvarXL+λ1D)-1XL TWvarxq
利用所述协同表示系数得出所述目标训练数据集中各历史样本的权重矩阵:
其中,b1为向量b的第一个元素,bn为向量b的第n个元素。
可选地,在本申请的一个实施例中,所述预测模块,具体用于:
根据所述目标训练数据集与所述历史样本的权重矩阵建立所述加权岭回归模型,优化目标为:
将所述目标协同表示模型和所述加权岭回归模型的优化目标进行融合,得出统一的优化目标为:
计算所述加权岭回归模型系数w:
利用所述加权岭回归模型系数计算所述查询数据的预测值:
可选地,在本申请的一个实施例中,还包括:扩充模块,用于计算所述查询数据的实际值,将所述实际值与所述查询数据增加至所述目标训练数据集。
本申请第三方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以执行如上述实施例所述的基于整体优化的即时学习的软测量建模方法。
本申请第四方面实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以执行如上述实施例所述的基于整体优化的即时学习的软测量建模方法。
由此,本申请至少具有如下有益效果:
本申请通过将数据自表示算法引入即时学习中,并且针对即时学习的应用背景,对自表示算法进行改进,具体地,一方面,通过自表示算法计算样本权重的同时考虑到了输入变量的权重;另一方面,通过计算查询样本与历史样本之间的加权欧式距离,并且将其作为算法的正则项,从而融合了数据的局部空间距离信息。相比现有其他算法,本申请将相似样本的选择或者样本权重的计算转化为优化问题,提高了样本权重的合理性与可靠性。另外,相比传统算法中选择相似样本与建立局部模型相互独立,本申请通过一个统一的优化目标同时实现了选择相似样本与建立局部模型,提高了模型优化效率与预测精度。由此,解决了现有技术预测精度差等问题。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本申请实施例提供的一种基于整体优化的即时学习的软测量建模方法的流程图;
图2为根据本申请一个实施例提供的脱丁烷塔(DCP)的过程原理图;
图3为根据本申请一个实施例提供的脱丁烷塔过程数据的真实输出曲线图;
图4为根据本申请一个实施例提供的基于整体优化的即时学习的软测量建模方法对脱丁烷塔数据的预测偏差示意图;
图5为根据本申请一个实施例提供的现有局部加权偏最小二乘算法对脱丁烷塔数据的预测偏差示意图;
图6为根据本申请实施例的一种基于整体优化的即时学习的软测量建模装置的示例图;
图7为申请实施例提供的电子设备的结构示意图。
附图标记说明:计算模块-100、预测模块-200、存储器-701、处理器-702、通信接口-703。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的一种基于整体优化的即时学习的软测量建模方法、装置、电子设备及存储介质。针对上述背景技术中提到的由于工业过程中的时变、多模态特性,以及工业数据中普遍存在多重共线性等问题,本申请提供了一种基于整体优化的即时学习的软测量建模方法,在该方法中,通过即时学习算法建立软测量模型,克服了时变以及多模态问题;通过岭回归算法建立局部模型(即离线岭回归模型和加权岭回归模型),解决过程数据的多重共线性问题,并且具有较高的计算效率。另外,本申请中将相似样本的选择转化为优化问题,并且与局部模型优化目标进行融合,优化了建模过程,提高了样本权重的可靠性以及软测量模型的预测精度。由此,解决了现有技术预测精度差等问题。
具体而言,图1为根据本申请实施例提供的一种基于整体优化的即时学习的软测量建模方法的流程图。
如图1所示,该基于整体优化的即时学习的软测量建模方法包括以下步骤:
在步骤S101中,根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离。
需要注意的是,上述预设辅助变量数据集通过目标训练数据集经过标准化处理后得到,具体过程如下所述。
可选地,在本申请的一个实施例中,构建目标训练数据集包括:构建存储工业过程中的预设辅助变量数据集;对预设辅助变量数据集进行分析,得到辅助变量数据集中各个样本对应的真实质量变量值;根据辅助变量数据和真实质量变量值构建初始训练数据集,并对训练数据集进行标准化处理,标准化处理为:
其中,函数mean(·)表示计算矩阵各行的均值,函数std(·)表示计算矩阵各行的标准差。从而得到目标训练数据集。
具体地,在本申请的实施例中,通过现场传感器以及存储设备实时采集与存储工业过程中与质量相关的辅助变量的数据X=[x1,x2,…xn]T,X=[x1,x2,…xn]T,n为样本数量,m为样本的维度;通过实验室化验分析采集的数据,得到各个样本对应的真实质量变量值将已采集到的数据作为初始训练数据集对初始训练数据集按照式(1)进行标准化处理,使其均值为0、方差为1,得到训练数据集XL为数据X标准化处理后得到的数据,为变量值标准化处理后得到的变量值。
可选地,在本申请的一个实施例中,根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离之前,还包括:
W0=(XLXL T+λ0×I)-1XLYL (3)
其中,XL T为数据XL的转置,I为单位矩阵;
根据离线岭回归模型的岭回归系数W0通过式(4)计算出各输入变量的权重矩阵,式(4)表示为:
其中,W0(1)为岭回归系数W0的第一个元素,W0(m)为岭回归系数W0的第m个元素。
可选地,在本申请的一个实施例中,对于新采集的查询数据按照式(1)进行标准化处理,根据权重矩阵Wvar通过式(5)和式(6)计算查询数据xq与数据XL中所有样本的加权欧式距离d;式(5)和式(6)的表达式为:
Dxq=Wvar(xq×1-XL) (5)
在步骤S102中,将加权欧式距离融合到协同表示正则项中,得到目标协同表示模型,并利用目标协同表示模型计算预设辅助变量数据集中各个历史样本的权重矩阵。
通过式(8)计算数据XL与查询数据xq的协同表示系数,式(8)表示为:
b=(XL TWvarXL+λ1D)-1XL TWvarxq (8)
其中,b1为向量b的第一个元素,bn为向量b的第n个元素。
在步骤S103中,根据目标训练数据集和各个历史样本的权重矩阵建立加权岭回归模型,将协同表示算法的优化目标与加权岭回归算法的优化目标融合,计算数据XL与查询数据xq的协同表示系数以及局部模型系数。
具体地,在本申请的实施例中,通过统一的优化目标求解协同表示系数与局部模型系数的具体步骤如下:
将改进协同表示优化目标与加权岭回归优化目标加权组合,即式(7)和式(10),可以得到统一的即时学习优化目标,如式(11)所示:
其中,a为改进协同表示算法与加权岭回归算法的权重系数。
首先,通过固定局部模型系数w求解协同表示系数b,式(11)可以重新描述为式(12):
然后,固定协同表示系数b求解局部模型系数w,式(11)可以重新描述为式(14):
通过式(15)计算出局部模型的系数w,式(15)表示为:
可选地,在本申请的一个实施例中,计算查询数据的实际值,将实际值与查询数据增加至目标训练数据集。
下面将结合附图,以脱丁烷塔的过程数据为例对基于整体优化的即时学习的软测量建模方法进行阐述。
脱丁烷塔(DCP)是脱硫和石脑油***工厂的一部分,其任务是尽可能地减少塔底丁烷的浓度。某DCP的原理如图2所示。通常塔底丁烷浓度是由安装在塔顶的一块气相色谱分析仪在线测量的,由于塔底丁烷蒸汽到达塔顶需要一定的时间,气相色谱仪的分析过程亦需要一定的时间,因此,对塔底丁烷浓度的在线测量存在较大的滞后,从而需要建立软测量模型,以在线实时估计塔底丁烷浓度。在建立塔底丁烷浓度的软测量模型时,选择安装在脱丁烷塔中的七个变量(参见图2)作为辅助变量,表1给出了这七个辅助变量的解释。数据集来自实际工业生产过程,样本数量为2382,按采样时间排列,实际的输出曲线如图3所示。
表1辅助变量说明
接下来结合脱丁烷塔生产过程对本申请的具体步骤进行阐述:
1、将已采集到的数据作为训练数据集,并且进行预处理。
进而得到:
2、利用训练数据集建立离线岭回归模型,并且计算出各输入变量的权重矩阵。
3、采集新数据进行标准化处理。
首先,计算采集到的查询数据xq与训练样本之间的加权欧式距离然后,将d融合到协同表示的正则项中,并且将协同表示与加权岭回归算法融合,得到统一的即时学习优化目标;最后,通过交替迭代优化的方式计算出样本协同表示系数以及局部模型系数
5、根据加权岭回归模型系数预测查询数据的输出值。
本申请所述方法(UniJITL)与传统局部加权偏最小二乘(LWPLS)算法对脱丁烷塔数据输出变量的预测偏差值如图4、图5所示。由图4、图5可以看出,本申请所述方法与传统方法相比,具有更高的预测精度。
根据本申请实例提出的一种基于整体优化的即时学习的软测量建模方法,通过协同表示算法获得历史样本的权重矩阵,并通过加权岭回归算法建立加权岭回归模型,将两种算法进行融合,形成统一的优化目标。对于采集的查询数据,首先计算查询数据与训练样本的加权欧式距离,并将加权欧式距离融合到协同表示的正则项中,通过一个统一的优化目标,同时实现相似样本的选择和局部模型的建立。本申请实施例所述方法,不仅能够很好地处理工业过程的非线性、时变性及多重共线性问题,还将相似样本选择和局部模型的构建融合到一个优化函数中,实现利用局部模型的信息指导相似样本的选择,提高相似样本的可靠性及局部模型的预测精度。
其次参照附图描述根据本申请实施例提出的一种基于整体优化的即时学习的软测量建模装置。
图6是本申请实施例的一种基于整体优化的即时学习的软测量建模装置的方框示意图。
如图6所示,该基于整体优化的即时学习的软测量建模装置10包括:计算模块100以及预测模块200。
其中,计算模块100,用于根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离,将加权欧式距离融合到协同表示正则项中,得到目标协同表示模型,并利用目标协同表示模型计算预设辅助变量数据集中各个历史样本的权重矩阵;预测模块200,用于根据目标训练数据集和各个历史样本的权重矩阵建立加权岭回归模型,将目标协同表示模型和加权岭回归模型的优化目标进行融合,计算预设辅助变量数据集与查询数据的加权岭回归模型系数;利用加权岭回归模型系数计算查询数据的预测值。
可选地,在本申请的一个实施例中,还包括:构建模块,用于构建存储工业过程中的预设辅助变量数据集;分析模块,用于对预设辅助变量数据集进行分析,得到辅助变量数据集中各个样本对应的真实质量变量值;预处理模块,用于根据辅助变量数据和真实质量变量值构建初始训练数据集,并对训练数据集进行标准化处理,得到目标训练数据集。
可选地,在本申请的一个实施例中,标准化处理为:
可选地,在本申请的一个实施例中,还包括:
建模模块,用于在根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离之前,根据目标训练数据集建立离线岭回归模型,优化目标为:
求解模块,用于求解离线岭回归模型的优化目标,得到离线岭回归模型的岭回归系数W0:
W0=(XLXL T+λ0×I)-1XLYL
其中,XL T为数据XL的转置,I为单位矩阵;
权重计算模块,用于根据岭回归系数计算各个输入变量的权重矩阵得到预设输入变量权重矩阵:
其中,W0(1)为岭回归系数W0的第一个元素,W0(m)为岭回归系数W0的第m个元素。
可选地,在本申请的一个实施例中,计算模块100,具体用于,
根据预设输入变量权重矩阵计算查询数据与标准化的预设辅助变量数据集中所有样本的加权欧式距离:
Dxq=Wvar(xq×1-XL)
建立查询数据与目标训练数据集的协同表示模型,并融合预设输入变量权重矩阵和加权欧式距离,优化目标为:
计算标准化的预设辅助变量数据集与查询数据的协同表示系数b:
b=(XL TWvarXL+λ1D)-1XL TWvarxq
利用协同表示系数得出目标训练数据集中各历史样本的权重矩阵:
其中,b1为向量b的第一个元素,bn为向量b的第n个元素。
可选地,在本申请的一个实施例中,预测模块200,具体用于,
根据目标训练数据集与历史样本的权重矩阵建立加权岭回归模型,优化目标为:
将目标协同表示模型和加权岭回归模型的优化目标进行融合,得出统一的优化目标为:
计算加权岭回归模型系数w:
利用加权岭回归模型系数计算查询数据的预测值:
可选地,在本申请的一个实施例中,还包括:扩充模块,用于计算查询数据的实际值,将实际值与查询数据增加至目标训练数据集。
需要说明的是,前述对一种基于整体优化的即时学习的软测量建模方法实施例的解释说明也适用于该实施例的一种基于整体优化的即时学习的软测量建模装置,此处不再赘述。
根据本申请实例提出的一种基于整体优化的即时学习的软测量建模装置,通过将相似样本的选择转化为优化问题,并且与局部模型优化目标进行融合,实现了相似样本选择和局部模型建立的整体优化,从而提高样本权重的合理性与可靠性,改善模型优化效率与预测精度。
图7为本申请实施例提供的电子设备的结构示意图。该电子设备可以包括:
存储器701、处理器702及存储在存储器701上并可在处理器702上运行的计算机程序。
处理器702执行程序时实现上述实施例中提供的基于整体优化的即时学习的软测量建模方法。
进一步地,电子设备还包括:
通信接口703,用于存储器701和处理器702之间的通信。
存储器701,用于存放可在处理器702上运行的计算机程序。
存储器701可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器701、处理器702和通信接口703独立实现,则通信接口703、存储器701和处理器702可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(Industry Standard Architecture,简称为ISA)总线、外部设备互连(PeripheralComponent,简称为PCI)总线或扩展工业标准体系结构(Extended Industry StandardArchitecture,简称为EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器701、处理器702及通信接口703,集成在一块芯片上实现,则存储器701、处理器702及通信接口703可以通过内部接口完成相互间的通信。
处理器702可能是一个中央处理器(Central Processing Unit,简称为CPU),或者是特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。
本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如上的基于整体优化的即时学习的软测量建模方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或N个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“N个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更N个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,N个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
Claims (16)
1.一种基于整体优化的即时学习的软测量建模方法,其特征在于,包括以下步骤:
根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离;
将所述加权欧式距离融合到协同表示正则项中,得到目标协同表示模型,并利用所述目标协同表示模型计算所述预设辅助变量数据集中各个历史样本的权重矩阵;
根据目标训练数据集和所述各个历史样本的权重矩阵建立加权岭回归模型,将所述目标协同表示模型和所述加权岭回归模型的优化目标进行融合,计算所述预设辅助变量数据集与所述查询数据的加权岭回归模型系数;
利用所述加权岭回归模型系数计算所述查询数据的预测值。
2.根据权利要求1所述的方法,其特征在于,所述根据目标训练数据集和所述各个历史样本的权重矩阵建立加权岭回归模型之前,还包括:
构建存储工业过程中的所述预设辅助变量数据集;
对所述预设辅助变量数据集进行分析,得到所述辅助变量数据集中各个样本对应的真实质量变量值;
根据所述辅助变量数据和所述真实质量变量值构建初始训练数据集,并对所述训练数据集进行标准化处理,得到所述目标训练数据集。
4.根据权利要求1所述的方法,其特征在于,所述根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离之前,还包括:
根据所述目标训练数据集建立离线岭回归模型,优化目标为:
求解所述离线岭回归模型的优化目标,得到所述离线岭回归模型的岭回归系数W0:
W0=(XLXL T+λ0×I)-1XLYL
其中,XL T为数据XL的转置,I为单位矩阵;
根据所述岭回归系数计算各个输入变量的权重矩阵得到所述预设输入变量权重矩阵:
其中,W0(1)为岭回归系数W0的第一个元素,W0(m)为岭回归系数W0的第m个元素。
5.根据权利要求4所述的方法,其特征在于,所述根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离,将所述加权欧式距离融合到协同表示正则项中,得到目标协同表示模型,利用所述目标协同表示模型计算所述预设辅助变量数据集中各个历史样本的权重矩阵,包括:
根据所述预设输入变量权重矩阵计算所述查询数据与标准化的预设辅助变量数据集中所有样本的加权欧式距离:
Dxq=Wvar(xq×1-XL)
建立所述查询数据与所述目标训练数据集的协同表示模型,并融合所述预设输入变量权重矩阵和所述加权欧式距离,优化目标为:
计算所述标准化的预设辅助变量数据集与所述查询数据的协同表示系数b:
b=(XL TWvarXL+λ1D)-1XL TWvarxq
利用所述协同表示系数得出所述目标训练数据集中各历史样本的权重矩阵:
其中,b1为向量b的第一个元素,bn为向量b的第n个元素。
6.根据权利要求5所述的方法,其特征在于,所述根据目标训练数据集和所述各个历史样本的权重矩阵建立加权岭回归模型,将所述目标协同表示模型和所述加权岭回归模型的优化目标进行融合,计算所述预设辅助变量数据集与所述查询数据的加权岭回归模型系数,利用所述加权岭回归模型系数计算所述查询数据的预测值,包括:
根据所述目标训练数据集与所述历史样本的权重矩阵建立所述加权岭回归模型,优化目标为:
将所述目标协同表示模型和所述加权岭回归模型的优化目标进行融合,得出统一的优化目标为:
计算所述加权岭回归模型系数w:
7.根据权利要求1-6任一项所述的方法,其特征在于,
计算所述查询数据的实际值,将所述实际值与所述查询数据增加至所述目标训练数据集。
8.一种基于整体优化的即时学习的软测量建模装置,其特征在于,包括:
计算模块,用于根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离,将所述加权欧式距离融合到协同表示正则项中,得到目标协同表示模型,并利用所述目标协同表示模型计算所述预设辅助变量数据集中各个历史样本的权重矩阵;
预测模块,用于根据目标训练数据集和所述各个历史样本的权重矩阵建立加权岭回归模型,将所述目标协同表示模型和所述加权岭回归模型的优化目标进行融合,计算所述预设辅助变量数据集与所述查询数据的加权岭回归模型系数;利用所述加权岭回归模型系数计算所述查询数据的预测值。
9.根据权利要求8所述的装置,其特征在于,还包括:
构建模块,用于构建存储工业过程中的所述预设辅助变量数据集;
分析模块,用于对所述预设辅助变量数据集进行分析,得到所述辅助变量数据集中各个样本对应的真实质量变量值;
预处理模块,用于根据所述辅助变量数据和所述真实质量变量值构建初始训练数据集,并对所述训练数据集进行标准化处理,得到所述目标训练数据集。
11.根据权利要求8所述的装置,其特征在于,还包括:
建模模块,用于在根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离之前,根据所述目标训练数据集建立离线岭回归模型,优化目标为:
求解模块,用于求解所述离线岭回归模型的优化目标,得到所述离线岭回归模型的岭回归系数W0:
W0=(XLXL T+λ0×I)-1XLYL
其中,XL T为数据XL的转置,I为单位矩阵;
权重计算模块,用于根据所述岭回归系数计算各个输入变量的权重矩阵得到所述预设输入变量权重矩阵:
其中,W0(1)为岭回归系数W0的第一个元素,W0(m)为岭回归系数W0的第m个元素。
12.根据权利要求11所述的装置,其特征在于,所述计算模块,具体用于:
根据所述预设输入变量权重矩阵计算所述查询数据与标准化的预设辅助变量数据集中所有样本的加权欧式距离:
Dxq=Wvar(xq×1-XL)
建立所述查询数据与所述目标训练数据集的协同表示模型,并融合所述预设输入变量权重矩阵和所述加权欧式距离,优化目标为:
计算所述标准化的预设辅助变量数据集与所述查询数据的协同表示系数b:
b=(XL TWvarXL+λ1D)-1XL TWvarxq
利用所述协同表示系数得出所述目标训练数据集中各历史样本的权重矩阵:
其中,b1为向量b的第一个元素,bn为向量b的第n个元素。
14.根据权利要求8-13任一项所述的装置,其特征在于,还包括:
扩充模块,用于计算所述查询数据的实际值,将所述实际值与所述查询数据增加至所述目标训练数据集。
15.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-7任一项所述的基于整体优化的即时学习的软测量建模方法。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以用于实现如权利要求1-7任一项所述的基于整体优化的即时学习的软测量建模方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210151538.7A CN114528764A (zh) | 2022-02-18 | 2022-02-18 | 基于整体优化的即时学习的软测量建模方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210151538.7A CN114528764A (zh) | 2022-02-18 | 2022-02-18 | 基于整体优化的即时学习的软测量建模方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114528764A true CN114528764A (zh) | 2022-05-24 |
Family
ID=81623426
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210151538.7A Pending CN114528764A (zh) | 2022-02-18 | 2022-02-18 | 基于整体优化的即时学习的软测量建模方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114528764A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116738866A (zh) * | 2023-08-11 | 2023-09-12 | 中国石油大学(华东) | 一种基于时间序列特征提取的即时学习的软测量建模方法 |
CN117272244A (zh) * | 2023-11-21 | 2023-12-22 | 中国石油大学(华东) | 一种融合特征提取和自适应构图的软测量建模方法 |
-
2022
- 2022-02-18 CN CN202210151538.7A patent/CN114528764A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116738866A (zh) * | 2023-08-11 | 2023-09-12 | 中国石油大学(华东) | 一种基于时间序列特征提取的即时学习的软测量建模方法 |
CN116738866B (zh) * | 2023-08-11 | 2023-10-27 | 中国石油大学(华东) | 一种基于时间序列特征提取的即时学习的软测量建模方法 |
CN117272244A (zh) * | 2023-11-21 | 2023-12-22 | 中国石油大学(华东) | 一种融合特征提取和自适应构图的软测量建模方法 |
CN117272244B (zh) * | 2023-11-21 | 2024-03-15 | 中国石油大学(华东) | 一种融合特征提取和自适应构图的软测量建模方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107765347B (zh) | 一种高斯过程回归和粒子滤波的短期风速预测方法 | |
CN103389472B (zh) | 一种基于nd-ar模型的锂离子电池循环寿命的预测方法 | |
CN114528764A (zh) | 基于整体优化的即时学习的软测量建模方法及装置 | |
Kaya et al. | Process capability analyses with fuzzy parameters | |
CN109389314B (zh) | 一种基于最优近邻成分分析的质量软测量与监测方法 | |
CN114117919B (zh) | 基于样本协同表示的即时学习的软测量建模方法 | |
CN104952753A (zh) | 测量抽样方法 | |
CN109523077B (zh) | 一种风电功率预测方法 | |
CN117312816B (zh) | 一种特种钢材的冶炼效果评估方法及*** | |
CN114841073A (zh) | 基于局部标签传播的即时学习半监督软测量建模方法 | |
CN117594164A (zh) | 基于数字孪生的金属结构剩余疲劳寿命计算评估方法、*** | |
CN114970341B (zh) | 基于机器学习的低轨卫星轨道预报精度提升模型建立方法 | |
CN101446828A (zh) | 一种非线性过程质量预报方法 | |
CN116821695B (zh) | 一种半监督神经网络软测量建模方法 | |
Wang et al. | Research on construction cost estimation based on artificial intelligence technology | |
CN116644655A (zh) | 一种基于加权目标特征回归神经网络工业过程软测量方法 | |
CN115631804A (zh) | 基于数据协调的蒸发过程铝酸钠溶液出口浓度预测方法 | |
CN115577856A (zh) | 一种变电工程造价预测与结余控制方法及*** | |
JP7020500B2 (ja) | 予測モデルの生成方法、金属材料の腐食量予測方法、予測モデルの生成プログラムおよび予測モデルの生成装置 | |
CN114240006A (zh) | 一种水资源承载力评估方法 | |
CN106773703B (zh) | 基于模糊推理和泰勒展开的锻造压机负载在线预测方法 | |
CN110866638A (zh) | 交通量预测模型构建方法、装置、计算机设备和存储介质 | |
CN110705187A (zh) | 通过最小二乘算法即时在线仪表校验和诊断方法 | |
CN110188433B (zh) | 基于分布并行局部建模机制的岭回归软测量建模方法 | |
CN113971372B (zh) | 基于神经网络的风速预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |