CN114528764A - 基于整体优化的即时学习的软测量建模方法及装置 - Google Patents

基于整体优化的即时学习的软测量建模方法及装置 Download PDF

Info

Publication number
CN114528764A
CN114528764A CN202210151538.7A CN202210151538A CN114528764A CN 114528764 A CN114528764 A CN 114528764A CN 202210151538 A CN202210151538 A CN 202210151538A CN 114528764 A CN114528764 A CN 114528764A
Authority
CN
China
Prior art keywords
ridge regression
data set
weighted
target
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210151538.7A
Other languages
English (en)
Inventor
王智权
袁志宏
白玮
李秀洁
吴昂山
徐飞
许恒微
宋垚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Sailboat Petrochemical Co ltd
Tsinghua University
Original Assignee
Jiangsu Sailboat Petrochemical Co ltd
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Sailboat Petrochemical Co ltd, Tsinghua University filed Critical Jiangsu Sailboat Petrochemical Co ltd
Priority to CN202210151538.7A priority Critical patent/CN114528764A/zh
Publication of CN114528764A publication Critical patent/CN114528764A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种基于整体优化的即时学习的软测量建模方法、装置、电子设备及存储介质,该方法通过协同表示算法获得历史样本的权重矩阵,并通过加权岭回归算法建立加权岭回归模型,将两种算法进行融合,形成统一的即时学习优化目标,最终通过交替迭代的方式进行求解。从而很好地处理工业过程的非线性、时变性及多重共线性问题,还将相似样本选择和局部模型的构建融合到一个优化函数中,实现利用局部模型的信息指导相似样本的选择,提高相似样本的可靠性及局部模型的预测精度。由此,解决了现有技术预测精度差等问题。

Description

基于整体优化的即时学习的软测量建模方法及装置
技术领域
本申请涉及工业过程检测技术领域,特别涉及一种基于整体优化的即时学习的软测量建模方法、装置、电子设备及存储介质。
背景技术
在现代工业生产过程中,许多重要质量变量(例如:油品黏度、组分等)难以实时测量,给化工过程控制与优化带来很大影响。因为化工生产过程存在样品现场取样困难、分析仪器成本高以及分析时间滞后等问题,在实际生产过程中,往往难以使用在线分析仪表和离线化验等方式对质量变量进行实时测量,无法对质量变量形成闭环控制。因此,质量变量如何实时获取成为过程控制首先要解决的问题。由此,软测量进入了过程工业控制领域的研究视线。
常用的数据驱动软测量建模方法包括主元回归(Principal ComponentRegression,PCR)、偏最小二乘回归(Partial Least Square Regression,PLSR)以及人工神经网络(ANN)。上述软测量算法建立的模型属于离线模型,模型建立后不会随着生成过程的改变而自适应调整,无法跟踪生产状态的变化,从而导致预测精度逐渐下降。因此,软测量模型的自动维护成为了算法研究与改进的重点。因此,为了适应现代化工生产过程表现出的多模态特性和时变特性,各种在线建模算法已经被广泛应用于生产过程的监控与质量变量预测。
目前,主流的在线软测量建模算法包括:滑动窗算法、递归算法、时间差分算法以及即时学习算法。其中,前三种都是根据时间相关性更新模型,属于时间自适应算法;即时学习算法是基于空间相关性对模型进行更新和维护,属于空间自适应算法。相比其他算法,即时学习算法的优势在于可以更好的适应生产过程中的突变现象,并且由于该算法对每个样本都建立局部模型,因此,也可以很好的描述过程变量之间的非线性关系。
相似样本的选择或者样本权重的计算是即时学习算法的核心步骤,会在很大程度上影响算法的预测精度。对于传统即时学习算法,一方面,算法中一些可调参数的选择往往是一件非常困难的事,例如LWPLS算法中的核宽度参数以及LWLS算法中的相似样本的数目,这些参数的选择并没有明确的理论经验指导,并且会对模型的性能产生较大影响;另一方面,算法的两个核心步骤:选择相似样本和建立局部模型是相互独立的,这可能导致选择出的相似样本对于局部模型来说是次优的。即选择的相似样本用于建立局部模型,但建立局部模型获得的信息并没有用于指导相似样本的选择。由上可知,采用传统即时学习算法建立的模型存在预测精度差的问题,亟待解决。
发明内容
本申请提供一种基于整体优化的即时学习的软测量建模方法、装置、电子设备及存储介质,以解决现有技术预测精度差等问题。
本申请第一方面实施例提供一种基于整体优化的即时学习的软测量建模方法,包括以下步骤:根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离;将所述加权欧式距离融合到协同表示正则项中,得到目标协同表示模型,并利用所述目标协同表示模型计算所述预设辅助变量数据集中各个历史样本的权重矩阵;根据目标训练数据集和所述各个历史样本的权重矩阵建立加权岭回归模型,将所述目标协同表示模型和所述加权岭回归模型的优化目标进行融合,计算所述预设辅助变量数据集与所述查询数据的加权岭回归模型系数;利用所述加权岭回归模型系数计算所述查询数据的预测值。
可选地,在本申请的一个实施例中,所述根据目标训练数据集和所述各个历史样本的权重矩阵建立加权岭回归模型之前,还包括:构建存储工业过程中的所述预设辅助变量数据集;对所述预设辅助变量数据集进行分析,得到所述辅助变量数据集中各个样本对应的真实质量变量值;根据所述辅助变量数据和所述真实质量变量值构建初始训练数据集,并对所述训练数据集进行标准化处理,得到所述目标训练数据集。
可选地,在本申请的一个实施例中,所述标准化处理为:
Figure BDA0003510558310000021
其中,
Figure BDA0003510558310000022
为需要标准化的数据集,函数mean(·)表示计算矩阵各行的均值,函数std(·)表示计算矩阵各行的标准差。
可选地,在本申请的一个实施例中,所述根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离之前,还包括:
根据所述目标训练数据集建立离线岭回归模型,优化目标为:
Figure BDA0003510558310000023
其中,
Figure BDA0003510558310000024
为离线岭回归模型的岭回归系数,λ0为离线岭回归模型的正则项系数,XL为标准化后的辅助变量数据,
Figure BDA0003510558310000025
为标准化后的真实质量变量值;
求解所述离线岭回归模型的优化目标,得到所述离线岭回归模型的岭回归系数W0
W0=(XLXL T0×I)-1XLYL
其中,XL T为数据XL的转置,I为单位矩阵;
根据所述岭回归系数计算各个输入变量的权重矩阵得到所述预设输入变量权重矩阵:
Figure BDA0003510558310000031
其中,W0(1)为岭回归系数W0的第一个元素,W0(m)为岭回归系数W0的第m个元素。
可选地,在本申请的一个实施例中,所述根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离,将所述加权欧式距离融合到协同表示正则项中,得到目标协同表示模型,利用所述目标协同表示模型计算所述预设辅助变量数据集中各个历史样本的权重矩阵,包括:
根据所述预设输入变量权重矩阵计算所述查询数据与标准化的预设辅助变量数据集中所有样本的加权欧式距离:
Dxq=Wvar(xq×1-XL)
Figure BDA0003510558310000032
其中,xq为查询数据,
Figure BDA0003510558310000033
为对角矩阵
Figure BDA0003510558310000034
且元素全为1,符号
Figure BDA0003510558310000035
表示两个矩阵的对应元素相乘,函数sum(·)表示将矩阵各行相加;
建立所述查询数据与所述目标训练数据集的协同表示模型,并融合所述预设输入变量权重矩阵和所述加权欧式距离,优化目标为:
Figure BDA0003510558310000036
其中,b为协同表示系数,λ1为正则项系数,
Figure BDA0003510558310000037
为二范数运算;
计算所述标准化的预设辅助变量数据集与所述查询数据的协同表示系数b:
b=(XL TWvarXL1D)-1XL TWvarxq
利用所述协同表示系数得出所述目标训练数据集中各历史样本的权重矩阵:
Figure BDA0003510558310000038
其中,b1为向量b的第一个元素,bn为向量b的第n个元素。
可选地,在本申请的一个实施例中,所述根据目标训练数据集和所述各个历史样本的权重矩阵建立加权岭回归模型,将所述目标协同表示模型和所述加权岭回归模型的优化目标进行融合,计算所述预设辅助变量数据集与所述查询数据的加权岭回归模型系数,利用所述加权岭回归模型系数计算所述查询数据的预测值,包括:
根据所述目标训练数据集与所述历史样本的权重矩阵建立所述加权岭回归模型,优化目标为:
Figure BDA0003510558310000041
其中,
Figure BDA0003510558310000042
为加权岭回归模型系数,λ2为岭回归正则项系数;
将所述目标协同表示模型和所述加权岭回归模型的优化目标进行融合,得出统一的优化目标为:
Figure BDA0003510558310000043
其中,a为两个算法优化目标的权重系数,b为协同表示系数,λ1为协同表示正则项系数,
Figure BDA0003510558310000044
为加权岭回归模型系数,λ2为岭回归正则项系数;
计算所述加权岭回归模型系数w:
Figure BDA0003510558310000045
其中,
Figure BDA0003510558310000046
利用所述加权岭回归模型系数计算所述查询数据的预测值
Figure BDA0003510558310000047
Figure BDA0003510558310000048
其中,
Figure BDA0003510558310000049
为查询数据xq的转置。
可选地,在本申请的一个实施例中,计算所述查询数据的实际值,将所述实际值与所述查询数据增加至所述目标训练数据集。
本申请第二方面实施例提供一种基于整体优化的即时学习的软测量建模装置,包括:计算模块,用于根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离,将所述加权欧式距离融合到协同表示正则项中,得到目标协同表示模型,并利用所述目标协同表示模型计算所述预设辅助变量数据集中各个历史样本的权重矩阵;预测模块,用于根据目标训练数据集和所述各个历史样本的权重矩阵建立加权岭回归模型,将所述目标协同表示模型和所述加权岭回归模型的优化目标进行融合,计算所述预设辅助变量数据集与所述查询数据的加权岭回归模型系数;利用所述加权岭回归模型系数计算所述查询数据的预测值。
可选地,在本申请的一个实施例中,还包括:构建模块,用于构建存储工业过程中的所述预设辅助变量数据集;分析模块,用于对所述预设辅助变量数据集进行分析,得到所述辅助变量数据集中各个样本对应的真实质量变量值;预处理模块,用于根据所述辅助变量数据和所述真实质量变量值构建初始训练数据集,并对所述训练数据集进行标准化处理,得到所述目标训练数据集。
可选地,在本申请的一个实施例中,所述标准化处理为:
Figure BDA0003510558310000051
其中,
Figure BDA0003510558310000052
为需要标准化的数据集,函数mean(·)表示计算矩阵各行的均值,函数std(·)表示计算矩阵各行的标准差。
可选地,在本申请的一个实施例中,还包括:
建模模块,用于在根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离之前,根据所述目标训练数据集建立离线岭回归模型,优化目标为:
Figure BDA0003510558310000053
其中,
Figure BDA0003510558310000054
为离线岭回归模型的岭回归系数,λ0为离线岭回归模型的正则项系数,XL为标准化后的辅助变量数据,
Figure BDA0003510558310000055
为标准化后的真实质量变量值;
求解模块,用于求解所述离线岭回归模型的优化目标,得到所述离线岭回归模型的岭回归系数W0
W0=(XLXL T0×I)-1XLYL
其中,XL T为数据XL的转置,I为单位矩阵;
权重计算模块,用于根据所述岭回归系数计算各个输入变量的权重矩阵得到所述预设输入变量权重矩阵:
Figure BDA0003510558310000056
其中,W0(1)为岭回归系数W0的第一个元素,W0(m)为岭回归系数W0的第m个元素。
可选地,在本申请的一个实施例中,所述计算模块,具体用于:
根据所述预设输入变量权重矩阵计算所述查询数据与标准化的预设辅助变量数据集中所有样本的加权欧式距离:
Dxq=Wvar(xq×1-XL)
Figure BDA0003510558310000061
其中,xq为查询数据,
Figure BDA0003510558310000062
为对角矩阵
Figure BDA0003510558310000063
且元素全为1,符号
Figure BDA0003510558310000064
表示两个矩阵的对应元素相乘,函数sum(·)表示将矩阵各行相加;
建立所述查询数据与所述目标训练数据集的协同表示模型,并融合所述预设输入变量权重矩阵和所述加权欧式距离,优化目标为:
Figure BDA0003510558310000065
其中,b为协同表示系数,λ1为正则项系数,
Figure BDA0003510558310000066
为二范数运算;
计算所述标准化的预设辅助变量数据集与所述查询数据的协同表示系数b:
b=(XL TWvarXL1D)-1XL TWvarxq
利用所述协同表示系数得出所述目标训练数据集中各历史样本的权重矩阵:
Figure BDA0003510558310000067
其中,b1为向量b的第一个元素,bn为向量b的第n个元素。
可选地,在本申请的一个实施例中,所述预测模块,具体用于:
根据所述目标训练数据集与所述历史样本的权重矩阵建立所述加权岭回归模型,优化目标为:
Figure BDA0003510558310000068
其中,
Figure BDA0003510558310000069
为加权岭回归模型系数,λ2为岭回归正则项系数;
将所述目标协同表示模型和所述加权岭回归模型的优化目标进行融合,得出统一的优化目标为:
Figure BDA00035105583100000610
其中,a为两个算法优化目标的权重系数,b为协同表示系数,λ1为协同表示正则项系数,
Figure BDA0003510558310000071
为加权岭回归模型系数,λ2为岭回归正则项系数;
计算所述加权岭回归模型系数w:
Figure BDA0003510558310000072
其中,
Figure BDA0003510558310000073
利用所述加权岭回归模型系数计算所述查询数据的预测值:
Figure BDA0003510558310000074
其中,
Figure BDA0003510558310000075
为查询数据xq的转置。
可选地,在本申请的一个实施例中,还包括:扩充模块,用于计算所述查询数据的实际值,将所述实际值与所述查询数据增加至所述目标训练数据集。
本申请第三方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以执行如上述实施例所述的基于整体优化的即时学习的软测量建模方法。
本申请第四方面实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以执行如上述实施例所述的基于整体优化的即时学习的软测量建模方法。
由此,本申请至少具有如下有益效果:
本申请通过将数据自表示算法引入即时学习中,并且针对即时学习的应用背景,对自表示算法进行改进,具体地,一方面,通过自表示算法计算样本权重的同时考虑到了输入变量的权重;另一方面,通过计算查询样本与历史样本之间的加权欧式距离,并且将其作为算法的正则项,从而融合了数据的局部空间距离信息。相比现有其他算法,本申请将相似样本的选择或者样本权重的计算转化为优化问题,提高了样本权重的合理性与可靠性。另外,相比传统算法中选择相似样本与建立局部模型相互独立,本申请通过一个统一的优化目标同时实现了选择相似样本与建立局部模型,提高了模型优化效率与预测精度。由此,解决了现有技术预测精度差等问题。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本申请实施例提供的一种基于整体优化的即时学习的软测量建模方法的流程图;
图2为根据本申请一个实施例提供的脱丁烷塔(DCP)的过程原理图;
图3为根据本申请一个实施例提供的脱丁烷塔过程数据的真实输出曲线图;
图4为根据本申请一个实施例提供的基于整体优化的即时学习的软测量建模方法对脱丁烷塔数据的预测偏差示意图;
图5为根据本申请一个实施例提供的现有局部加权偏最小二乘算法对脱丁烷塔数据的预测偏差示意图;
图6为根据本申请实施例的一种基于整体优化的即时学习的软测量建模装置的示例图;
图7为申请实施例提供的电子设备的结构示意图。
附图标记说明:计算模块-100、预测模块-200、存储器-701、处理器-702、通信接口-703。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的一种基于整体优化的即时学习的软测量建模方法、装置、电子设备及存储介质。针对上述背景技术中提到的由于工业过程中的时变、多模态特性,以及工业数据中普遍存在多重共线性等问题,本申请提供了一种基于整体优化的即时学习的软测量建模方法,在该方法中,通过即时学习算法建立软测量模型,克服了时变以及多模态问题;通过岭回归算法建立局部模型(即离线岭回归模型和加权岭回归模型),解决过程数据的多重共线性问题,并且具有较高的计算效率。另外,本申请中将相似样本的选择转化为优化问题,并且与局部模型优化目标进行融合,优化了建模过程,提高了样本权重的可靠性以及软测量模型的预测精度。由此,解决了现有技术预测精度差等问题。
具体而言,图1为根据本申请实施例提供的一种基于整体优化的即时学习的软测量建模方法的流程图。
如图1所示,该基于整体优化的即时学习的软测量建模方法包括以下步骤:
在步骤S101中,根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离。
需要注意的是,上述预设辅助变量数据集通过目标训练数据集经过标准化处理后得到,具体过程如下所述。
可选地,在本申请的一个实施例中,构建目标训练数据集包括:构建存储工业过程中的预设辅助变量数据集;对预设辅助变量数据集进行分析,得到辅助变量数据集中各个样本对应的真实质量变量值;根据辅助变量数据和真实质量变量值构建初始训练数据集,并对训练数据集进行标准化处理,标准化处理为:
Figure BDA0003510558310000091
其中,函数mean(·)表示计算矩阵各行的均值,函数std(·)表示计算矩阵各行的标准差。从而得到目标训练数据集。
具体地,在本申请的实施例中,通过现场传感器以及存储设备实时采集与存储工业过程中与质量相关的辅助变量的数据X=[x1,x2,…xn]T,X=[x1,x2,…xn]T,n为样本数量,m为样本的维度;通过实验室化验分析采集的数据,得到各个样本对应的真实质量变量值
Figure BDA0003510558310000092
将已采集到的数据作为初始训练数据集
Figure BDA0003510558310000093
对初始训练数据集
Figure BDA0003510558310000094
按照式(1)进行标准化处理,使其均值为0、方差为1,得到训练数据集
Figure BDA0003510558310000095
XL为数据X标准化处理后得到的数据,
Figure BDA0003510558310000096
为变量值标准化处理后得到的变量值。
可选地,在本申请的一个实施例中,根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离之前,还包括:
利用训练数据集
Figure BDA0003510558310000097
建立离线岭回归模型,并且通过模型的回归系数计算得到各输入变量的权重矩阵
Figure BDA0003510558310000098
其具体步骤为:
利用训练数据集
Figure BDA0003510558310000099
建立离线岭回归模型,优化目标为:
Figure BDA00035105583100000910
其中,
Figure BDA00035105583100000911
为离线岭回归模型的岭回归系数,λ0为离线岭回归模型的正则项系数;求解优化目标,得出离线岭回归模型的岭回归系数W0的解析表达式为:
W0=(XLXL T0×I)-1XLYL (3)
其中,XL T为数据XL的转置,I为单位矩阵;
根据离线岭回归模型的岭回归系数W0通过式(4)计算出各输入变量的权重矩阵,式(4)表示为:
Figure BDA00035105583100000912
其中,W0(1)为岭回归系数W0的第一个元素,W0(m)为岭回归系数W0的第m个元素。
可选地,在本申请的一个实施例中,对于新采集的查询数据
Figure BDA00035105583100000913
按照式(1)进行标准化处理,根据权重矩阵Wvar通过式(5)和式(6)计算查询数据xq与数据XL中所有样本的加权欧式距离d;式(5)和式(6)的表达式为:
Dxq=Wvar(xq×1-XL) (5)
Figure BDA0003510558310000101
式中,
Figure BDA0003510558310000102
为对角矩阵
Figure BDA0003510558310000103
且元素全为1,符号
Figure BDA0003510558310000104
表示两个矩阵的对应元素相乘,函数sum(·)表示将矩阵各行相加。
在步骤S102中,将加权欧式距离融合到协同表示正则项中,得到目标协同表示模型,并利用目标协同表示模型计算预设辅助变量数据集中各个历史样本的权重矩阵。
可选地,在本申请的一个实施例中,建立查询数据xq与训练数据集
Figure BDA0003510558310000105
的协同表示模型,并融合权重矩阵和加权欧式距离,优化目标为:
Figure BDA0003510558310000106
其中,
Figure BDA0003510558310000107
为协同表示系数,λ1为正则项系数。
通过式(8)计算数据XL与查询数据xq的协同表示系数,式(8)表示为:
b=(XL TWvarXL1D)-1XL TWvarxq (8)
利用协同表示系数通过式(9)得出训练数据集
Figure BDA0003510558310000108
中各历史样本的权重矩阵
Figure BDA0003510558310000109
式(9)表示为:
Figure BDA00035105583100001010
其中,b1为向量b的第一个元素,bn为向量b的第n个元素。
在步骤S103中,根据目标训练数据集和各个历史样本的权重矩阵建立加权岭回归模型,将协同表示算法的优化目标与加权岭回归算法的优化目标融合,计算数据XL与查询数据xq的协同表示系数以及局部模型系数。
具体地,在本申请的实施例中,通过统一的优化目标求解协同表示系数与局部模型系数的具体步骤如下:
根据训练集
Figure BDA00035105583100001011
与权重矩阵Wsample建立加权岭回归模型,优化目标为:
Figure BDA00035105583100001012
其中,
Figure BDA00035105583100001013
为加权岭回归模型系数,λ2为岭回归正则项系数。
将改进协同表示优化目标与加权岭回归优化目标加权组合,即式(7)和式(10),可以得到统一的即时学习优化目标,如式(11)所示:
Figure BDA00035105583100001014
其中,a为改进协同表示算法与加权岭回归算法的权重系数。
首先,通过固定局部模型系数w求解协同表示系数b,式(11)可以重新描述为式(12):
Figure BDA0003510558310000111
其中,
Figure BDA0003510558310000112
cst(b)代表与b无关的项。通过式(13)计算出改进协同表示系数b,式(13)表示为:
Figure BDA00035105583100001112
然后,固定协同表示系数b求解局部模型系数w,式(11)可以重新描述为式(14):
Figure BDA0003510558310000113
其中,
Figure BDA0003510558310000114
cst(w)代表与w无关的项。
通过式(15)计算出局部模型的系数w,式(15)表示为:
Figure BDA0003510558310000115
可选地,在本申请的一个实施例中,计算查询数据的实际值,将实际值与查询数据增加至目标训练数据集。
具体地,在本申请的实施例中,利用加权岭回归模型系数w通过式(16)计算查询数据xq的输出值
Figure BDA0003510558310000116
式(16)表示为:
Figure BDA0003510558310000117
当通过实验室化验分析得到真实输出值yq时,将样本[xq,yq]加入到训练数据集
Figure BDA0003510558310000118
中,以扩充训练数据集
Figure BDA0003510558310000119
中所包含的工作区间;否则,维持训练数据集
Figure BDA00035105583100001110
中所包含空间不变。
下面将结合附图,以脱丁烷塔的过程数据为例对基于整体优化的即时学习的软测量建模方法进行阐述。
脱丁烷塔(DCP)是脱硫和石脑油***工厂的一部分,其任务是尽可能地减少塔底丁烷的浓度。某DCP的原理如图2所示。通常塔底丁烷浓度是由安装在塔顶的一块气相色谱分析仪在线测量的,由于塔底丁烷蒸汽到达塔顶需要一定的时间,气相色谱仪的分析过程亦需要一定的时间,因此,对塔底丁烷浓度的在线测量存在较大的滞后,从而需要建立软测量模型,以在线实时估计塔底丁烷浓度。在建立塔底丁烷浓度的软测量模型时,选择安装在脱丁烷塔中的七个变量(参见图2)作为辅助变量,表1给出了这七个辅助变量的解释。数据集来自实际工业生产过程,样本数量为2382,按采样时间排列,实际的输出曲线如图3所示。
表1辅助变量说明
Figure BDA00035105583100001111
Figure BDA0003510558310000121
接下来结合脱丁烷塔生产过程对本申请的具体步骤进行阐述:
1、将已采集到的数据作为训练数据集,并且进行预处理。
首先,对所有样本进行预处理,删除其中的异常样本;然后,考虑到过程的动态特性,对所有样本按照下式进行维度扩展,扩展后的样本维度为30;最后,进行标准化处理得到最终训练数据集
Figure BDA0003510558310000122
则:
Figure BDA0003510558310000123
其中,
Figure BDA0003510558310000124
表示软测量模型对塔底丁烷浓度的预测值,fDCP(·)代表丁烷浓度与X1~X7的潜在关系。
进而得到:
Figure BDA0003510558310000125
2、利用训练数据集建立离线岭回归模型,并且计算出各输入变量的权重矩阵。
根据训练数据集
Figure BDA0003510558310000126
建立离线岭回归模型,并且根据模型的岭回归系数
Figure BDA0003510558310000127
计算出各输入变量的权重矩阵
Figure BDA0003510558310000128
3、采集新数据进行标准化处理。
对于新采集到的查询数据
Figure BDA0003510558310000129
按照训练数据集的标准化方式对该数据进行标准化。
4、根据统一的优化目标同时计算出样本协同表示系数
Figure BDA00035105583100001210
以及加权岭回归模型系数
Figure BDA00035105583100001211
首先,计算采集到的查询数据xq与训练样本之间的加权欧式距离
Figure BDA00035105583100001212
然后,将d融合到协同表示的正则项中,并且将协同表示与加权岭回归算法融合,得到统一的即时学习优化目标;最后,通过交替迭代优化的方式计算出样本协同表示系数
Figure BDA00035105583100001213
以及局部模型系数
Figure BDA00035105583100001214
5、根据加权岭回归模型系数预测查询数据的输出值。
根据加权岭回归系数w计算查询数据xq的预测输出值
Figure BDA00035105583100001215
当获得输出变量的真实值yq时,将样本[xq;yq]添加到训练数据集
Figure BDA00035105583100001216
本申请所述方法(UniJITL)与传统局部加权偏最小二乘(LWPLS)算法对脱丁烷塔数据输出变量的预测偏差值如图4、图5所示。由图4、图5可以看出,本申请所述方法与传统方法相比,具有更高的预测精度。
根据本申请实例提出的一种基于整体优化的即时学习的软测量建模方法,通过协同表示算法获得历史样本的权重矩阵,并通过加权岭回归算法建立加权岭回归模型,将两种算法进行融合,形成统一的优化目标。对于采集的查询数据,首先计算查询数据与训练样本的加权欧式距离,并将加权欧式距离融合到协同表示的正则项中,通过一个统一的优化目标,同时实现相似样本的选择和局部模型的建立。本申请实施例所述方法,不仅能够很好地处理工业过程的非线性、时变性及多重共线性问题,还将相似样本选择和局部模型的构建融合到一个优化函数中,实现利用局部模型的信息指导相似样本的选择,提高相似样本的可靠性及局部模型的预测精度。
其次参照附图描述根据本申请实施例提出的一种基于整体优化的即时学习的软测量建模装置。
图6是本申请实施例的一种基于整体优化的即时学习的软测量建模装置的方框示意图。
如图6所示,该基于整体优化的即时学习的软测量建模装置10包括:计算模块100以及预测模块200。
其中,计算模块100,用于根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离,将加权欧式距离融合到协同表示正则项中,得到目标协同表示模型,并利用目标协同表示模型计算预设辅助变量数据集中各个历史样本的权重矩阵;预测模块200,用于根据目标训练数据集和各个历史样本的权重矩阵建立加权岭回归模型,将目标协同表示模型和加权岭回归模型的优化目标进行融合,计算预设辅助变量数据集与查询数据的加权岭回归模型系数;利用加权岭回归模型系数计算查询数据的预测值。
可选地,在本申请的一个实施例中,还包括:构建模块,用于构建存储工业过程中的预设辅助变量数据集;分析模块,用于对预设辅助变量数据集进行分析,得到辅助变量数据集中各个样本对应的真实质量变量值;预处理模块,用于根据辅助变量数据和真实质量变量值构建初始训练数据集,并对训练数据集进行标准化处理,得到目标训练数据集。
可选地,在本申请的一个实施例中,标准化处理为:
Figure BDA0003510558310000131
其中,
Figure BDA0003510558310000132
为需要标准化的数据集,函数mean(·)表示计算矩阵各行的均值,函数std(·)表示计算矩阵各行的标准差。
可选地,在本申请的一个实施例中,还包括:
建模模块,用于在根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离之前,根据目标训练数据集建立离线岭回归模型,优化目标为:
Figure BDA0003510558310000141
其中,
Figure BDA0003510558310000142
为离线岭回归模型的岭回归系数,λ0为离线岭回归模型的正则项系数,XL为标准化后的辅助变量数据,
Figure BDA0003510558310000143
为标准化后的真实质量变量值;
求解模块,用于求解离线岭回归模型的优化目标,得到离线岭回归模型的岭回归系数W0
W0=(XLXL T0×I)-1XLYL
其中,XL T为数据XL的转置,I为单位矩阵;
权重计算模块,用于根据岭回归系数计算各个输入变量的权重矩阵得到预设输入变量权重矩阵:
Figure BDA0003510558310000144
其中,W0(1)为岭回归系数W0的第一个元素,W0(m)为岭回归系数W0的第m个元素。
可选地,在本申请的一个实施例中,计算模块100,具体用于,
根据预设输入变量权重矩阵计算查询数据与标准化的预设辅助变量数据集中所有样本的加权欧式距离:
Dxq=Wvar(xq×1-XL)
Figure BDA0003510558310000145
其中,xq为查询数据,
Figure BDA0003510558310000146
为对角矩阵
Figure BDA0003510558310000147
且元素全为1,符号
Figure BDA0003510558310000148
表示两个矩阵的对应元素相乘,函数sum(·)表示将矩阵各行相加;
建立查询数据与目标训练数据集的协同表示模型,并融合预设输入变量权重矩阵和加权欧式距离,优化目标为:
Figure BDA0003510558310000149
其中,b为协同表示系数,λ1为正则项系数,
Figure BDA00035105583100001410
为二范数运算;
计算标准化的预设辅助变量数据集与查询数据的协同表示系数b:
b=(XL TWvarXL1D)-1XL TWvarxq
利用协同表示系数得出目标训练数据集中各历史样本的权重矩阵:
Figure BDA0003510558310000151
其中,b1为向量b的第一个元素,bn为向量b的第n个元素。
可选地,在本申请的一个实施例中,预测模块200,具体用于,
根据目标训练数据集与历史样本的权重矩阵建立加权岭回归模型,优化目标为:
Figure BDA0003510558310000152
其中,
Figure BDA0003510558310000153
为加权岭回归模型系数,λ2为岭回归正则项系数;
将目标协同表示模型和加权岭回归模型的优化目标进行融合,得出统一的优化目标为:
Figure BDA0003510558310000154
其中,a为两个算法优化目标的权重系数,b为协同表示系数,λ1为协同表示正则项系数,
Figure BDA0003510558310000155
为加权岭回归模型系数,λ2为岭回归正则项系数;
计算加权岭回归模型系数w:
Figure BDA0003510558310000156
其中,
Figure BDA0003510558310000157
利用加权岭回归模型系数计算查询数据的预测值:
Figure BDA0003510558310000158
其中,
Figure BDA0003510558310000159
为查询数据xq的转置。
可选地,在本申请的一个实施例中,还包括:扩充模块,用于计算查询数据的实际值,将实际值与查询数据增加至目标训练数据集。
需要说明的是,前述对一种基于整体优化的即时学习的软测量建模方法实施例的解释说明也适用于该实施例的一种基于整体优化的即时学习的软测量建模装置,此处不再赘述。
根据本申请实例提出的一种基于整体优化的即时学习的软测量建模装置,通过将相似样本的选择转化为优化问题,并且与局部模型优化目标进行融合,实现了相似样本选择和局部模型建立的整体优化,从而提高样本权重的合理性与可靠性,改善模型优化效率与预测精度。
图7为本申请实施例提供的电子设备的结构示意图。该电子设备可以包括:
存储器701、处理器702及存储在存储器701上并可在处理器702上运行的计算机程序。
处理器702执行程序时实现上述实施例中提供的基于整体优化的即时学习的软测量建模方法。
进一步地,电子设备还包括:
通信接口703,用于存储器701和处理器702之间的通信。
存储器701,用于存放可在处理器702上运行的计算机程序。
存储器701可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器701、处理器702和通信接口703独立实现,则通信接口703、存储器701和处理器702可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(Industry Standard Architecture,简称为ISA)总线、外部设备互连(PeripheralComponent,简称为PCI)总线或扩展工业标准体系结构(Extended Industry StandardArchitecture,简称为EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器701、处理器702及通信接口703,集成在一块芯片上实现,则存储器701、处理器702及通信接口703可以通过内部接口完成相互间的通信。
处理器702可能是一个中央处理器(Central Processing Unit,简称为CPU),或者是特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。
本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如上的基于整体优化的即时学习的软测量建模方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或N个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“N个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更N个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,N个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

Claims (16)

1.一种基于整体优化的即时学习的软测量建模方法,其特征在于,包括以下步骤:
根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离;
将所述加权欧式距离融合到协同表示正则项中,得到目标协同表示模型,并利用所述目标协同表示模型计算所述预设辅助变量数据集中各个历史样本的权重矩阵;
根据目标训练数据集和所述各个历史样本的权重矩阵建立加权岭回归模型,将所述目标协同表示模型和所述加权岭回归模型的优化目标进行融合,计算所述预设辅助变量数据集与所述查询数据的加权岭回归模型系数;
利用所述加权岭回归模型系数计算所述查询数据的预测值。
2.根据权利要求1所述的方法,其特征在于,所述根据目标训练数据集和所述各个历史样本的权重矩阵建立加权岭回归模型之前,还包括:
构建存储工业过程中的所述预设辅助变量数据集;
对所述预设辅助变量数据集进行分析,得到所述辅助变量数据集中各个样本对应的真实质量变量值;
根据所述辅助变量数据和所述真实质量变量值构建初始训练数据集,并对所述训练数据集进行标准化处理,得到所述目标训练数据集。
3.根据权利要求2所述的方法,其特征在于,所述标准化处理为:
Figure FDA0003510558300000011
其中,
Figure FDA0003510558300000012
为需要标准化的数据集,函数mean(·)表示计算矩阵各行的均值,函数std(·)表示计算矩阵各行的标准差。
4.根据权利要求1所述的方法,其特征在于,所述根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离之前,还包括:
根据所述目标训练数据集建立离线岭回归模型,优化目标为:
Figure FDA0003510558300000013
其中,
Figure FDA0003510558300000014
为离线岭回归模型的岭回归系数,λ0为离线岭回归模型的正则项系数,XL为标准化后的辅助变量数据,
Figure FDA0003510558300000015
为标准化后的真实质量变量值;
求解所述离线岭回归模型的优化目标,得到所述离线岭回归模型的岭回归系数W0
W0=(XLXL T0×I)-1XLYL
其中,XL T为数据XL的转置,I为单位矩阵;
根据所述岭回归系数计算各个输入变量的权重矩阵得到所述预设输入变量权重矩阵:
Figure FDA0003510558300000021
其中,W0(1)为岭回归系数W0的第一个元素,W0(m)为岭回归系数W0的第m个元素。
5.根据权利要求4所述的方法,其特征在于,所述根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离,将所述加权欧式距离融合到协同表示正则项中,得到目标协同表示模型,利用所述目标协同表示模型计算所述预设辅助变量数据集中各个历史样本的权重矩阵,包括:
根据所述预设输入变量权重矩阵计算所述查询数据与标准化的预设辅助变量数据集中所有样本的加权欧式距离:
Dxq=Wvar(xq×1-XL)
Figure FDA0003510558300000022
其中,xq为查询数据,
Figure FDA0003510558300000023
为对角矩阵Di,i=di,i=1,2,…,n,
Figure FDA0003510558300000024
且元素全为1,符号
Figure FDA0003510558300000025
表示两个矩阵的对应元素相乘,函数sum(·)表示将矩阵各行相加;
建立所述查询数据与所述目标训练数据集的协同表示模型,并融合所述预设输入变量权重矩阵和所述加权欧式距离,优化目标为:
Figure FDA0003510558300000026
其中,b为协同表示系数,λ1为正则项系数,
Figure FDA0003510558300000027
为二范数运算;
计算所述标准化的预设辅助变量数据集与所述查询数据的协同表示系数b:
b=(XL TWvarXL1D)-1XL TWvarxq
利用所述协同表示系数得出所述目标训练数据集中各历史样本的权重矩阵:
Figure FDA0003510558300000028
其中,b1为向量b的第一个元素,bn为向量b的第n个元素。
6.根据权利要求5所述的方法,其特征在于,所述根据目标训练数据集和所述各个历史样本的权重矩阵建立加权岭回归模型,将所述目标协同表示模型和所述加权岭回归模型的优化目标进行融合,计算所述预设辅助变量数据集与所述查询数据的加权岭回归模型系数,利用所述加权岭回归模型系数计算所述查询数据的预测值,包括:
根据所述目标训练数据集与所述历史样本的权重矩阵建立所述加权岭回归模型,优化目标为:
Figure FDA0003510558300000031
其中,
Figure FDA0003510558300000032
为加权岭回归模型系数,λ2为岭回归正则项系数;
将所述目标协同表示模型和所述加权岭回归模型的优化目标进行融合,得出统一的优化目标为:
Figure FDA0003510558300000033
其中,a为两个算法优化目标的权重系数,b为协同表示系数,λ1为协同表示正则项系数,
Figure FDA0003510558300000034
为加权岭回归模型系数,λ2为岭回归正则项系数;
计算所述加权岭回归模型系数w:
Figure FDA0003510558300000035
其中,
Figure FDA0003510558300000036
利用所述加权岭回归模型系数计算所述查询数据的预测值
Figure FDA0003510558300000037
Figure FDA0003510558300000038
其中,
Figure FDA0003510558300000039
为查询数据xq的转置。
7.根据权利要求1-6任一项所述的方法,其特征在于,
计算所述查询数据的实际值,将所述实际值与所述查询数据增加至所述目标训练数据集。
8.一种基于整体优化的即时学习的软测量建模装置,其特征在于,包括:
计算模块,用于根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离,将所述加权欧式距离融合到协同表示正则项中,得到目标协同表示模型,并利用所述目标协同表示模型计算所述预设辅助变量数据集中各个历史样本的权重矩阵;
预测模块,用于根据目标训练数据集和所述各个历史样本的权重矩阵建立加权岭回归模型,将所述目标协同表示模型和所述加权岭回归模型的优化目标进行融合,计算所述预设辅助变量数据集与所述查询数据的加权岭回归模型系数;利用所述加权岭回归模型系数计算所述查询数据的预测值。
9.根据权利要求8所述的装置,其特征在于,还包括:
构建模块,用于构建存储工业过程中的所述预设辅助变量数据集;
分析模块,用于对所述预设辅助变量数据集进行分析,得到所述辅助变量数据集中各个样本对应的真实质量变量值;
预处理模块,用于根据所述辅助变量数据和所述真实质量变量值构建初始训练数据集,并对所述训练数据集进行标准化处理,得到所述目标训练数据集。
10.根据权利要求9所述的装置,其特征在于,所述标准化处理为:
Figure FDA0003510558300000041
其中,
Figure FDA0003510558300000042
为需要标准化的数据集,函数mean(·)表示计算矩阵各行的均值,函数std(·)表示计算矩阵各行的标准差。
11.根据权利要求8所述的装置,其特征在于,还包括:
建模模块,用于在根据预设输入变量权重矩阵计算采集的查询数据与预设辅助变量数据集中所有样本的加权欧氏距离之前,根据所述目标训练数据集建立离线岭回归模型,优化目标为:
Figure FDA0003510558300000043
其中,
Figure FDA0003510558300000044
为离线岭回归模型的岭回归系数,λ0为离线岭回归模型的正则项系数,XL为标准化后的辅助变量数据,
Figure FDA0003510558300000045
为标准化后的真实质量变量值;
求解模块,用于求解所述离线岭回归模型的优化目标,得到所述离线岭回归模型的岭回归系数W0
W0=(XLXL T0×I)-1XLYL
其中,XL T为数据XL的转置,I为单位矩阵;
权重计算模块,用于根据所述岭回归系数计算各个输入变量的权重矩阵得到所述预设输入变量权重矩阵:
Figure FDA0003510558300000046
其中,W0(1)为岭回归系数W0的第一个元素,W0(m)为岭回归系数W0的第m个元素。
12.根据权利要求11所述的装置,其特征在于,所述计算模块,具体用于:
根据所述预设输入变量权重矩阵计算所述查询数据与标准化的预设辅助变量数据集中所有样本的加权欧式距离:
Dxq=Wvar(xq×1-XL)
Figure FDA0003510558300000051
其中,xq为查询数据,
Figure FDA0003510558300000052
为对角矩阵Di,i=di,i=1,2,…,n,
Figure FDA0003510558300000053
且元素全为1,符号
Figure FDA0003510558300000054
表示两个矩阵的对应元素相乘,函数sum(·)表示将矩阵各行相加;
建立所述查询数据与所述目标训练数据集的协同表示模型,并融合所述预设输入变量权重矩阵和所述加权欧式距离,优化目标为:
Figure FDA0003510558300000055
其中,b为协同表示系数,λ1为正则项系数,
Figure FDA0003510558300000056
为二范数运算;
计算所述标准化的预设辅助变量数据集与所述查询数据的协同表示系数b:
b=(XL TWvarXL1D)-1XL TWvarxq
利用所述协同表示系数得出所述目标训练数据集中各历史样本的权重矩阵:
Figure FDA0003510558300000057
其中,b1为向量b的第一个元素,bn为向量b的第n个元素。
13.根据权利要求12所述的装置,其特征在于,所述预测模块,具体用于:
根据所述目标训练数据集与所述历史样本的权重矩阵建立所述加权岭回归模型,优化目标为:
Figure FDA0003510558300000058
其中,
Figure FDA0003510558300000059
为加权岭回归模型系数,λ2为岭回归正则项系数;
将所述目标协同表示模型和所述加权岭回归模型的优化目标进行融合,得出统一的优化目标为:
Figure FDA00035105583000000510
其中,a为两个算法优化目标的权重系数,b为协同表示系数,λ1为协同表示正则项系数,
Figure FDA0003510558300000061
为加权岭回归模型系数,λ2为岭回归正则项系数;
计算所述加权岭回归模型系数w:
Figure FDA0003510558300000062
其中,
Figure FDA0003510558300000063
利用所述加权岭回归模型系数计算所述查询数据的预测值:
Figure FDA0003510558300000064
其中,
Figure FDA0003510558300000065
为查询数据xq的转置。
14.根据权利要求8-13任一项所述的装置,其特征在于,还包括:
扩充模块,用于计算所述查询数据的实际值,将所述实际值与所述查询数据增加至所述目标训练数据集。
15.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-7任一项所述的基于整体优化的即时学习的软测量建模方法。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以用于实现如权利要求1-7任一项所述的基于整体优化的即时学习的软测量建模方法。
CN202210151538.7A 2022-02-18 2022-02-18 基于整体优化的即时学习的软测量建模方法及装置 Pending CN114528764A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210151538.7A CN114528764A (zh) 2022-02-18 2022-02-18 基于整体优化的即时学习的软测量建模方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210151538.7A CN114528764A (zh) 2022-02-18 2022-02-18 基于整体优化的即时学习的软测量建模方法及装置

Publications (1)

Publication Number Publication Date
CN114528764A true CN114528764A (zh) 2022-05-24

Family

ID=81623426

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210151538.7A Pending CN114528764A (zh) 2022-02-18 2022-02-18 基于整体优化的即时学习的软测量建模方法及装置

Country Status (1)

Country Link
CN (1) CN114528764A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116738866A (zh) * 2023-08-11 2023-09-12 中国石油大学(华东) 一种基于时间序列特征提取的即时学习的软测量建模方法
CN117272244A (zh) * 2023-11-21 2023-12-22 中国石油大学(华东) 一种融合特征提取和自适应构图的软测量建模方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116738866A (zh) * 2023-08-11 2023-09-12 中国石油大学(华东) 一种基于时间序列特征提取的即时学习的软测量建模方法
CN116738866B (zh) * 2023-08-11 2023-10-27 中国石油大学(华东) 一种基于时间序列特征提取的即时学习的软测量建模方法
CN117272244A (zh) * 2023-11-21 2023-12-22 中国石油大学(华东) 一种融合特征提取和自适应构图的软测量建模方法
CN117272244B (zh) * 2023-11-21 2024-03-15 中国石油大学(华东) 一种融合特征提取和自适应构图的软测量建模方法

Similar Documents

Publication Publication Date Title
CN107765347B (zh) 一种高斯过程回归和粒子滤波的短期风速预测方法
CN103389472B (zh) 一种基于nd-ar模型的锂离子电池循环寿命的预测方法
CN114528764A (zh) 基于整体优化的即时学习的软测量建模方法及装置
Kaya et al. Process capability analyses with fuzzy parameters
CN109389314B (zh) 一种基于最优近邻成分分析的质量软测量与监测方法
CN114117919B (zh) 基于样本协同表示的即时学习的软测量建模方法
CN104952753A (zh) 测量抽样方法
CN109523077B (zh) 一种风电功率预测方法
CN117312816B (zh) 一种特种钢材的冶炼效果评估方法及***
CN114841073A (zh) 基于局部标签传播的即时学习半监督软测量建模方法
CN117594164A (zh) 基于数字孪生的金属结构剩余疲劳寿命计算评估方法、***
CN114970341B (zh) 基于机器学习的低轨卫星轨道预报精度提升模型建立方法
CN101446828A (zh) 一种非线性过程质量预报方法
CN116821695B (zh) 一种半监督神经网络软测量建模方法
Wang et al. Research on construction cost estimation based on artificial intelligence technology
CN116644655A (zh) 一种基于加权目标特征回归神经网络工业过程软测量方法
CN115631804A (zh) 基于数据协调的蒸发过程铝酸钠溶液出口浓度预测方法
CN115577856A (zh) 一种变电工程造价预测与结余控制方法及***
JP7020500B2 (ja) 予測モデルの生成方法、金属材料の腐食量予測方法、予測モデルの生成プログラムおよび予測モデルの生成装置
CN114240006A (zh) 一种水资源承载力评估方法
CN106773703B (zh) 基于模糊推理和泰勒展开的锻造压机负载在线预测方法
CN110866638A (zh) 交通量预测模型构建方法、装置、计算机设备和存储介质
CN110705187A (zh) 通过最小二乘算法即时在线仪表校验和诊断方法
CN110188433B (zh) 基于分布并行局部建模机制的岭回归软测量建模方法
CN113971372B (zh) 基于神经网络的风速预测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination