CN110490496B - 一种基于分步约简筛选复杂工业过程中影响产品质量的敏感变量的方法 - Google Patents

一种基于分步约简筛选复杂工业过程中影响产品质量的敏感变量的方法 Download PDF

Info

Publication number
CN110490496B
CN110490496B CN201910880769.XA CN201910880769A CN110490496B CN 110490496 B CN110490496 B CN 110490496B CN 201910880769 A CN201910880769 A CN 201910880769A CN 110490496 B CN110490496 B CN 110490496B
Authority
CN
China
Prior art keywords
variable
sensitive
auxiliary
cosine
variables
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910880769.XA
Other languages
English (en)
Other versions
CN110490496A (zh
Inventor
王雅琳
李灵
袁小锋
孙备
阳春华
陈志文
吴东哲
王思哲
郭静宇
李繁飙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Publication of CN110490496A publication Critical patent/CN110490496A/zh
Application granted granted Critical
Publication of CN110490496B publication Critical patent/CN110490496B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Manufacturing & Machinery (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于分步约简筛选复杂工业过程中影响产品质量的敏感变量的方法,属于软测量技术领域,包括以下步骤:通过专家知识,选取影响产品质量的辅助变量并收集数据样本;综合考虑变量相关性与变量对工况变化的敏感性计算辅助变量敏感性指标,初步筛选影响主导变量的敏感变量;构建加权余弦马田***,精确筛选影响产品质量的关键敏感变量。本发明可以准确地反应变量的相关性和工况信息,同时较好地降低变量的冗余性,不仅可以提高产品质量预测精度,而且可以有效地降低预测模型复杂性,对软传感器模型的维护同样具有重要意义。

Description

一种基于分步约简筛选复杂工业过程中影响产品质量的敏感 变量的方法
技术领域
本发明涉及软测量技术领域,具体涉及一种基于分步约简筛选影响产品质量的敏感变量的方法。
背景技术
随着先进制造技术的发展,制造行业对生产发展由数量和规模扩张向质量、效益和环保的提升提出了更高的要求。为了能够及时有效地监测和评估过程运行状况、实现***故障的准确诊断、产品质量的快速跟踪,需要对过程关键产品质量进行实时检测。然而受限于检测环境的恶劣性、分析仪器的高昂成本以及化验分析的滞后性,目前这些关键产品质量较难实现在线检测。因此基于过程特征及过程数据的数据驱动软测量建模技术被广泛应用于工业生产中。
数据驱动软测量技术将生产过程知识有机地结合了起来,应用计算机技术对难以测量或者暂时不能测量的产品质量,选择另外一些容易测量的变量,通过构成某种数学关系来推断或者估计。由于过程可测变量数目大,若将这些变量全部看作软测量建模的辅助变量,不仅会增大模型的复杂度、降低计算速度,造成维数灾难,降低模型的稳定性和预测精度,而且会大大增加数据采集和存储的经济成本。因此,如何快速有效地选取一组最能够精确描述或解释过程主导变量的辅助变量子集显得极为重要。
目前变量优选方法根据变量搜索与评价方法的不同,可将分为过滤式、包裹式和嵌入式三种类型。其中过滤式方法因其计算速度快且不易造成过拟合得到了广泛应用。该方法以变量排序技术作选择变量的主要标准,一般采用数据本身特性或者统计规律作为分析依据。常用的分析依据有相关系数、互信息、欧氏距离、贝叶斯推理等。过滤式变量选择方法不依赖于学习算法,是通过改变数据来适应学习算法,但是该方法容易忽略变量相关性,造成所选子集可能不是最优子集。
为解决过滤式变量选择方法变量冗余问题,国内外理论界和工业实践中进行了不少尝试和研究,这些研究能有效地解决过滤式变量选择方法容易忽略变量间相关性及冗余性问题,却不具备过程工况信息描述的能力。然而在实际工业生产过程中,受到入口原料品质波动、加工方案调整、产品规格要求变化等影响,生产工况处于波动状态,工况不同产品质量也会存在一定的差异。若筛选出的辅助变量不能较好地描述工况的变化,将在一定程度上降低预测模型的精度。因此研究处一种既能反应工况信息又能反应主导变量与辅助变量相关性的敏感变量选择方法具有现实的意义。
发明内容
本发明所要解决的技术问题在于提供一种基于分步约简筛选复杂工业过程中影响产品质量的敏感变量的方法实现既能反应工况信息又能反应主导变量与辅助变量相关性。
一种基于分步约简筛选复杂工业过程中影响产品质量的敏感变量的方法,包括以下步骤:
S1.基于生产过程,通过机理分析和专家知识,初步选取若干影响产品质量的辅助变量,并收集若干组辅助变量值和对应时刻产品质量值作为样本;
S2.综合考量辅助变量与产品质量的相关性与辅助变量对工况变化的敏感性计算辅助变量敏感性指标,根据敏感性指标初步筛选影响产品质量的敏感变量:
S21.对收集的辅助变量值样本进行离群点剔除、小波去噪和标准化处理;
S22.利用皮尔逊相关分析法计算辅助变量与产品质量的相关系数矩阵,并根据所述的相关系数矩阵计算辅助变量与产品质量的偏相关系数;
S23.计算辅助变量的均值、标准差和方差,进而计算辅助变量的变异系数;
S24.以辅助变量与产品质量的偏相关系数和辅助变量的变异系数的乘积作为辅助变量的敏感性指标,根据步骤S22和S23所述的辅助变量偏相关系数和变异系数计算得到辅助变量敏感性指数;
S25.根据生产过程对象及产品质量,基于专家知识对敏感性指标设定不同的阈值,选取阈值范围内的辅助变量作为敏感变量;
S3.构建加权余弦马田***,从距离和方向两个角度对初选的敏感变量进行属性约简,精确筛选出影响产品质量的敏感变量作为关键敏感变量:
S31、对收集的敏感变量样本,通过机理分析和专家知识,将其分为正常样本和异常样本两类,并对两类样本进行标准化处理,其中对所述的异常样本数据标准化处理时的均值和标准差均等同于正常样本数据;
S32、分别计算所有正常样本的马氏距离;
S33、分别计算所有正常样本的夹角余弦值,进而分别计算所有正常样本的余弦相似度;
S34、分别计算正常样本的马氏距离和余弦相似度的变异系数,根据马氏距离和余弦相似度变异系数分别占总变异系数的比值确定余弦马氏距离权重;
S35、基于正常样本的余弦马氏距离构建加权余弦马氏基准空间;
S36、设计正交表,正交表中每行对应一个加权余弦马氏基准空间,计算在每个基准空间中异常样本的余弦马氏距离;
S37、选用望大特性信噪比计算每个基准空间中异常样本的信噪比;
S38、分别计算使用和未使用该敏感变量时信噪比的均值,然后计算其信噪比增量,根据专家知识对信噪比增量设定一定阈值,选取阈值范围内的所有敏感变量为关键敏感变量。
进一步地,步骤S35之后、S36之前还包括如下步骤:
根据构建的加权余弦马氏基准空间,计算异常样本的余弦马氏距离,验证构建的余弦马氏基准空间的有效性,若该加权余弦马氏基准空间可以较好的区分正常样本和异常样本的余弦马氏距离,则构建的加权余弦马氏基准空间有效;否则,进入步骤S3,重新构建加权余弦马田***。进一步地,步骤S3之后还包括步骤S4:采用局部加权偏最小二乘方法建立产品质量预测模型,验证选取的关键敏感变量的有效性和准确性。
进一步地,步骤S21、S31中所述的标准化处理采用如下方式:
zij=(xiji)/Si
其中,zij表示标准化处理后的第i个辅助变量或敏感变量的第j个样本值,xij表示第i个辅助变量或敏感变量的第j个样本值,μi表示第i个辅助变量或敏感变量的均值,si表示第i个辅助变量或敏感变量的标准差。
进一步地,步骤S22所述的相关系数矩阵计算如下:
Figure GDA0003482988900000051
其中,
Figure GDA0003482988900000052
所述的偏相关系数计算如下:
Figure GDA0003482988900000053
其中,cik为所述Mcc的逆矩阵
Figure GDA0003482988900000054
中元素:
Figure GDA0003482988900000055
步骤S23所述的辅助变量的变异系数计算如下:
Figure GDA0003482988900000056
其中,μi表示第i个辅助变量或敏感变量的均值,si表示第i个辅助变量或敏感变量的标准差,σi表示第i个辅助变量或敏感变量的方差;
步骤S24所述的辅助变量敏感性指数计算如下:
Figure GDA0003482988900000061
其中ηik表示第i个辅助变量对第k个主导变量的敏感性指数,rik表示第i个辅助变量与第k个主导变量的偏相关系数,μi表示第i个辅助变量或敏感变量的均值,si表示第i个辅助变量或敏感变量的标准差,σi表示第i个辅助变量或敏感变量的方差。进一步地,步骤S32所述的正常样本的马氏距离计算如下:
S321.选取n个正常样本,假设样本中具有q个初始敏感变量,则样本空间可以表示为:
Figure GDA0003482988900000062
其中oli表示第l个正常样本第i个辅助变量或敏感变量的数据,其中,l=1,2,...,n;i=1,2,...,q;
S322.对正常样本数据进行标准化处理:
Figure GDA0003482988900000071
其中
Figure GDA0003482988900000072
表示第l个正常样本第i个辅助变量或敏感变量的标准化数据,其中,l=1,2,...,n;i=1,2,...,q;
S323.马氏距离为:
Figure GDA0003482988900000073
其中,MDl为第l个正常样本的马氏距离,S为正常样本的相关系数矩阵,
Figure GDA0003482988900000074
其中,
Figure GDA0003482988900000075
表示标准化处理后的正常样本数据矩阵的转置,S-1表示正常样本相关系数矩阵的逆矩阵,q表示初始的敏感变量的个数。
进一步地,步骤S33中所述的余弦相似度为:
Figure GDA0003482988900000076
其中
Figure GDA0003482988900000077
为第l个正常样本第i个辅助变量或敏感变量的标准化数据,
Figure GDA0003482988900000078
为第i个辅助变量或敏感变量数据的均值。
进一步地,步骤S34所述的余弦马氏距离的权重计算方法为:
Figure GDA0003482988900000079
Figure GDA0003482988900000081
Figure GDA0003482988900000082
其中ξ1为正常样本马氏距离的变异系数,sMDl为正常样本马氏距离的标准差,μMDl为正常样本马氏距离的均值;ξ2为正常样本余弦相似度的变异系数,sCSl为正常样本余弦相似度的标准差,μCSl为正常样本余弦相似度的均值;
步骤S35所述的余弦马氏距离计算如下:
CMDl=αMDl+βCSl
其中MDl表示第l个正常样本的马氏距离,用以描述样本距离的相似度;CSl表示第l个正常样本的余弦相似度,用于描述样本方向的相似度。
进一步地,步骤S37所述的信噪比计算方法如下:
Figure GDA0003482988900000083
其中CMDu表示异常样本的马氏距离,v表示异常样本的个数,对辅助变量而言;
步骤S38所述的信噪比增量用ΔSNj表示:
Figure GDA0003482988900000084
其中,
Figure GDA0003482988900000085
表示使用该敏感变量时信噪比的均值;
Figure GDA0003482988900000086
表示未使用该敏感变量时信噪比的均值。
进一步地,所述的复杂工业过程为加裂生产过程;所述的产品为航煤10%馏出温度。
与现有技术相比,本发明的有益效果在于:在明确敏感变量和关键敏感变量的基础上,根据变量对工况变化的敏感性和辅助变量与产品质量的净相关性计算了敏感性指标,实现敏感变量的初选;再通过构建的加权余弦马田***解决变量冗余性大的问题,实现敏感变量的精选。较好地解决了传统过滤式变量选择方法容易忽略变量的相关性且不能准确反应工况信息的问题,具有计算简单、不易造成过拟合、冗余性小等优点。
附图说明
图1为本发明一个具体实施例的流程图。
图2为本发明一个具体实施例中加裂流程敏感变量信噪比增量直方图。
图3为本发明一个具体实施例中采用局部加权偏最小二乘方法及利用关键敏感变量集合进行预测的结果。
图4为本发明一个具体实施例中采用局部加权偏最小二乘方法及利用敏感变量集合进行预测的结果。
图5为本发明一个具体实施例中采用局部加权偏最小二乘方法及利用机理筛选辅助变量集合进行预测的结果。
图6为本发明一个具体实施例中采用局部加权偏最小二乘方法及利用关键敏感变量集合进行预测的相对误差结果。
图7为本发明一个具体实施例中采用局部加权偏最小二乘方法及利用敏感变量集合进行预测的相对误差结果。
图8为本发明一个具体实施例中采用局部加权偏最小二乘方法及利用机理筛选辅助变量集合进行预测的相对误差结果。
具体实施方式
为了进一步公开本发明,下文将结合说明书附图对本发明所公开的技术方案进行全面、细致地描述:
如图1所示,本发明提供的一种基于分步约简筛选复杂工业过程中影响产品质量的敏感变量的方法,包括以下步骤:
S1.基于生产过程,通过机理分析和专家知识,初步选取若干可能影响产品质量的辅助变量,并收集若干组辅助变量值和对应时刻产品质量值作为样本;
S2.综合考量辅助变量与产品质量的相关性与辅助变量对工况变化的敏感性计算辅助变量敏感性指标,根据敏感性指标初步筛选影响产品质量的敏感变量。
S3.构建加权余弦马田***,从距离和方向两个角度对初选的敏感变量进行属性约简,精确筛选出影响产品质量的敏感变量作为关键敏感变量。
作为一种改进,前述技术方案还可以包括步骤S4:采用局部加权偏最小二乘方法建立产品质量预测模型,验证选取的关键敏感变量的有效性和准确性。
步骤S2具体实现过程如下:
S21.对收集的辅助变量值样本进行离群点剔除、小波去噪和标准化处理;
S22.利用皮尔逊相关分析法计算辅助变量与产品质量的相关系数矩阵,并根据所述的相关系数矩阵计算辅助变量与产品质量的偏相关系数;
S23.计算辅助变量的均值、标准差和方差,进而计算辅助变量的变异系数;
S24.以辅助变量与产品质量的偏相关系数和辅助变量的变异系数的乘积作为辅助变量的敏感性指标,根据步骤S22和S23所述的辅助变量偏相关系数和变异系数计算得到辅助变量敏感性指数;
S25.根据生产过程对象及产品质量,基于专家知识对敏感性指标设定不同的阈值,选取阈值范围内的辅助变量作为敏感变量。
前述技术方案步骤S21、S31中所述的标准化处理采用如下方式:
zij=(xiji)/Si
其中,zij表示标准化处理后的第i个辅助变量或敏感变量的第j个样本值,xij表示第i个辅助变量或敏感变量的第j个样本值,μi表示第i个辅助变量或敏感变量的均值,si表示第i个辅助变量或敏感变量的标准差。
步骤S22所述的相关系数矩阵计算如下:
Figure GDA0003482988900000111
其中,
Figure GDA0003482988900000112
所述的偏相关系数计算如下:
Figure GDA0003482988900000113
其中,cik为所述Mcc的逆矩阵
Figure GDA0003482988900000114
中元素:
Figure GDA0003482988900000121
步骤S23所述的辅助变量的变异系数计算如下:
Figure GDA0003482988900000122
其中,μi表示第i个辅助变量或敏感变量的均值,si表示第i个辅助变量或敏感变量的标准差,σi表示第i个辅助变量或敏感变量的方差;
步骤S24所述的辅助变量敏感性指数计算如下:
Figure GDA0003482988900000123
其中ηik表示第i个辅助变量对第k个主导变量的敏感性指数,rik表示第i个辅助变量与第k个主导变量的偏相关系数,μi表示第i个辅助变量或敏感变量的均值,si表示第i个辅助变量或敏感变量的标准差,σi表示第i个辅助变量或敏感变量的方差。步骤S3具体实现过程如下:
S31、对收集的敏感变量样本,通过机理分析和专家知识,将其分为正常样本和异常样本两类,并对两类样本进行标准化处理,其中对所述的异常样本数据标准化处理时的均值和标准差均等同于正常样本数据;
S32、分别计算所有正常样本的马氏距离;
S33、分别计算所有正常样本的夹角余弦值,进而分别计算所有正常样本的余弦相似度;
S34、分别计算正常样本的马氏距离和余弦相似度的变异系数,根据马氏距离和余弦相似度变异系数分别占总变异系数的比值确定余弦马氏距离权重;
S35、基于正常样本的余弦马氏距离构建加权余弦马氏基准空间;
S36、设计正交表,正交表中每行对应一个加权余弦马氏基准空间,计算在每个基准空间中异常样本的余弦马氏距离;
S37、选用望大特性信噪比计算每个基准空间中异常样本的信噪比;
S38、分别计算使用和未使用该敏感变量时信噪比的均值,然后计算其信噪比增量,根据专家知识对信噪比增量设定一定阈值,选取阈值范围内的所有敏感变量为关键敏感变量。
作为前述技术方案的一种改进,步骤S35之后、S36之前还包括如下步骤:
根据构建的加权余弦马氏基准空间,计算异常样本的余弦马氏距离,验证构建的余弦马氏基准空间的有效性,若该加权余弦马氏基准空间可以较好的区分正常样本和异常样本的余弦马氏距离,则构建的加权余弦马氏基准空间有效;否则,进入步骤S3,重新构建加权余弦马田***。步骤S32所述的正常样本的马氏距离计算如下:
S321.选取n个正常样本,假设样本中具有q个初始敏感变量,则样本空间可以表示为:
Figure GDA0003482988900000141
其中oli表示第l个正常样本第i个辅助变量或敏感变量的数据,其中,l=1,2,...,n;i=1,2,...,q;
S322.对正常样本数据进行标准化处理:
Figure GDA0003482988900000142
其中
Figure GDA0003482988900000143
表示第l个正常样本第i个辅助变量或敏感变量的标准化数据,其中,l=1,2,...,n;i=1,2,...,q;
S323.马氏距离为:
Figure GDA0003482988900000144
其中,MDl为第l个正常样本的马氏距离,S为正常样本的相关系数矩阵,
Figure GDA0003482988900000145
其中,
Figure GDA0003482988900000146
表示标准化处理后的正常样本数据矩阵的转置,S-1表示正常样本相关系数矩阵的逆矩阵,q表示初始的敏感变量的个数。
步骤S33中所述的余弦相似度为:
Figure GDA0003482988900000151
其中
Figure GDA0003482988900000152
为第l个正常样本第i个辅助变量或敏感变量的标准化数据,
Figure GDA0003482988900000153
为第i个辅助变量或敏感变量数据的均值。
步骤S34所述的余弦马氏距离的权重计算方法为:
Figure GDA0003482988900000154
Figure GDA0003482988900000155
Figure GDA0003482988900000156
其中ξ1为正常样本马氏距离的变异系数,sMDl为正常样本马氏距离的标准差,μMDl为正常样本马氏距离的均值;ξ2为正常样本余弦相似度的变异系数,sCSl为正常样本余弦相似度的标准差,μCSl为正常样本余弦相似度的均值;
步骤S35所述的余弦马氏距离计算如下:
CMDl=αMDl+βCSl
其中MDl表示第l个正常样本的马氏距离,用以描述样本距离的相似度;CSl表示第l个正常样本的余弦相似度,用于描述样本方向的相似度。
步骤S37所述的信噪比计算方法如下:
Figure GDA0003482988900000157
其中CMDu表示异常样本的马氏距离,v表示异常样本的个数,对辅助变量而言;
步骤S38所述的信噪比增量用ΔSNj表示:
Figure GDA0003482988900000161
其中,
Figure GDA0003482988900000162
表示使用该敏感变量时信噪比的均值;
Figure GDA0003482988900000163
表示未使用该敏感变量时信噪比的均值。
具体实施例:
本发明公开的技术方案对加氢裂化过程产品质量预测的应用,包括以下步骤:
a、基于加裂生产过程,根据机理分析和专家经验,初步选取对航煤10%馏出温度质量指标有影响的相关变量共39个,作为加氢裂化过程质量预测的输入变量,分别记为x1、x2、...、x39,提取了966天连续生产的、39个相关变量的采样数据,提取了966天每天8时和20时离线化验测得的航煤10%馏出温度的数据,共1932组。将所得数据分两部分用于基于LWPLS的航煤10%馏出温度质量指标预测建模,其中1288组作训练集,644组作测试集。使用训练集中180组数据作为敏感变量选择的输入数据,则输入矩阵为:
xi=[xi,1,xi,2,...,xi,39]T,i=1,2,...,180
X=[x1,x2,...,x180]
b、综合考虑变量相关性与变量对工况变化的敏感性,计算辅助变量敏感性指标,根据敏感性指标初步筛选影响航煤10%馏出温度的敏感变量。
对选取的辅助变量采样样本进行标准化:
zij=(xiji)/si
其中zij表示标准化后的数据值,xij表示第i个变量的第j个样本值,μi表示第i个变量的均值,si表示第i个变量的标准差。
计算辅助变量的偏相关系数,利用皮尔逊相关分析法计算相关系数矩阵:
Figure GDA0003482988900000171
其中,
Figure GDA0003482988900000172
标准化后的辅助变量zi和航煤10%馏出温度A10%的偏相关系数riA10%为:
Figure GDA0003482988900000173
其中ciA10%为Mcc的逆矩阵
Figure GDA0003482988900000174
中元素
Figure GDA0003482988900000175
计算选取的辅助变量的变异系数:
Figure GDA0003482988900000176
其中,μi表示第i个变量的均值,si表示第i个变量的标准差,σi表示第i个变量的方差。
计算辅助变量的敏感性指数,即辅助变量与航煤10%馏出温度的偏相关系数和辅助变量的变异系数的乘积:
Figure GDA0003482988900000177
其中ηiA10%表示第i个辅助变量对航煤10%馏出温度A10%的敏感性指数,riA10%表示第i个辅助变量与航煤10%馏出温度A10%的偏相关系数,μi表示第i个变量的均值,si表示第i个变量的标准差,σi表示第i个变量的方差。
敏感性指数越大表明该辅助变量对航煤10%馏出温度A10%的影响作用越大,对工况的变化越敏感。计算39个辅助变量的离散程度、与航煤10%馏出温度A10%的偏相关系数及敏感性指数,结果如表1所示。
表1加氢裂化流程机理筛选辅助变量敏感性指数
Figure GDA0003482988900000181
基于航煤10%馏出温度,根据专家知识将辅助变量敏感性指标的阈值设定为0.01,分析各变量的敏感性指数可知,精制反应器塔底温度指示(12)、精制反应器压差(13)、注水罐注水量(21)、脱硫化氢汽提塔塔顶回流量(24)、主分馏塔中段返回温度(32)、柴油汽提塔塔顶温度(38)、柴油汽提塔底部温度(39)敏感性指数较低。因此除去这7个敏感性指数较低的变量以外其他剩余32个辅助变量为敏感变量。
c、构建加权余弦马田***,从距离和方向两个角度对初选的敏感变量进行属性约简,精选影响航煤10%馏出温度A10%的关键敏感变量的具体步骤包括:
(1)选取32个正常样本,样本中具有32个初始敏感变量,则样本空间可以表示为:
Figure GDA0003482988900000191
其中oij(i=1,2,...,32;j=1,2,...,32)表示第i个正常样本第j个敏感变量的数据。
对正常样本数据进行标准化:
Figure GDA0003482988900000192
其中
Figure GDA0003482988900000193
表示第i个正常样本第j个辅助变量的标准化数据。
计算所有正常样本的余弦马氏距离:
CMDi=αMDi+βCSi
其中MDi表示样本的马氏距离,用以描述样本距离的相似度;CSi表示样本的余弦相似度,用于描述样本方向的相似度;α、β为权重系数。
计算样本的马氏距离MDi
Figure GDA0003482988900000194
其中S为正常样本的相关系数矩阵,
Figure GDA0003482988900000195
计算样本的余弦相似度:
Figure GDA0003482988900000201
其中
Figure GDA0003482988900000202
为第i个样本第j个辅助变量的数据,
Figure GDA0003482988900000203
为第j个辅助变量数据的均值。
根据正常样本的马氏距离变异程度和余弦相似度变异程度确定余弦马氏距离的权重,具体公式如下:
Figure GDA0003482988900000204
Figure GDA0003482988900000205
Figure GDA0003482988900000206
其中ξ1为正常样本马氏距离的变异系数,sMDi为正常样本马氏距离的标准差,μMDi为正常样本马氏距离的均值;ξ2为正常样本余弦相似度的变异系数,sCSi为正常样本余弦相似度的标准差,μCSi为正常样本余弦相似度的均值。表2为加权余弦马氏基准空间部分显示结果。
表2加权余弦马氏基准空间
Figure GDA0003482988900000207
由表2可知正常样本的余弦马氏距离基本在1附近波动,均值为0.9020。
(2)对异常样本进行标准化,然后分别计算异常样本的马氏距离、异常样本与正常样本均值的余弦相似度和余弦马氏距离,结果如表3所示。
表3异常样本余弦马氏距离
Figure GDA0003482988900000211
由表3可知异常样本的余弦马氏距离均远大于1,均值为205.5255,因此构建的加权余弦马氏基准空间可以很好的区分正常样本与异常样本。其中异常样本3为特意挑选的离群点异常样本,其马氏距离为1.6571,如果按照传统马田***仅根据马氏距离判别样本,样本3为正常样本,与实际情况不符;而样本3的余弦相似度为5.5180,余弦马氏距离为2.2362,此时加权余弦马田***将样本3判别为异常样本,相较于传统马田***,加权余弦马田***可以更好的区分正常样本与异常样本。
(3)优化基准空间:设计表4所示的正交表,水平1表示使用辅助变量,水平2表示不使用辅助变量,并计算信噪比。正交表中每行对应一个基准空间,计算在每个基准空间中异常样本的余弦马氏距离和信噪比,计算公式如下:
Figure GDA0003482988900000221
其中CMDp为异常样本的马氏距离。对辅助变量而言,
Figure GDA0003482988900000222
表示使用该敏感变量时信噪比的均值;
Figure GDA0003482988900000223
表示未使用该敏感变量时信噪比的均值。信噪比增量用ΔSNj表示。
Figure GDA0003482988900000224
针对加氢裂化过程航煤10%馏出温度,基于专家知识设定信噪比增量阈值为0.3,选取阈值范围内的所有敏感变量为关键敏感变量(括号内序号为机理筛选辅助变量敏感性指数表中变量序号)。
表4二水平正交表和信噪比
Figure GDA0003482988900000225
32个敏感变量的信噪比增量直方图如图2所示,变量21(原机理筛选辅助变量25)、28(原机理筛选辅助变量33)和32(原机理筛选辅助变量37)的信噪比增量为负,说明这些辅助变量对建模无效;变量26(原机理筛选辅助变量30)的信噪比增量较小,说明该辅助变量对建模作用较小,可以忽略不计。最终得到28个可用于预测建模的关键敏感变量。
d、采用局部加权偏最小二乘(LWPLS)方法建立预测模型,用于建模的数据共有1610组,其中966组作为训练集,644作为测试集,分别将辅助变量集合按照机理筛选变量集合、敏感变量集合和关键敏感变量集合用于建模且模型参数完全相同,预测结果如图3-5所示,预测误差如图6-8所示,均方根误差RMSE如表5所示。由图3和图6可知,利用关键敏感变量进行预测建模,其预测结果较其他两种辅助变量集合可以更好地跟踪航煤10%馏出温度的实际值,预测误差更小,且其预测的均方根误差RMSE为3.0390,较其他两种辅助变量集合分别提高了5.81%和3.94%,验证了本发明所提方法的有效性。
表53种变量集合预测建模的均方根误差RMSE
Figure GDA0003482988900000231
此外,本发明还分别采用偏最小二乘(PLS)、支持向量机(SVM)和局部加权核主元回归(LWKPCR)3种方法验证了本发明所提方法的有效性,三种方法的均方根误差如表6所示。
表63种变量集合不同预测建模的均方根误差RMSE
Figure GDA0003482988900000232
最后,上述实施例仅仅是为了清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其他不同形式的变化或变动。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (2)

1.一种基于分步约简筛选复杂工业过程中影响产品质量的敏感变量的方法,其特征在于,包括以下步骤:
S1.基于生产过程,通过机理分析和专家知识,初步选取若干影响产品质量的辅助变量,并收集若干组辅助变量值和对应时刻产品质量值作为样本;
S2.综合考量辅助变量与产品质量的相关性与辅助变量对工况变化的敏感性计算辅助变量敏感性指标,根据敏感性指标初步筛选影响产品质量的敏感变量:
S21.对收集的辅助变量值样本进行离群点剔除、小波去噪和标准化处理,其中,所述标准化处理采用如下方式:
zij=(xiji)/Si
其中,zij表示标准化处理后的第i个辅助变量或敏感变量的第j个样本值,xij表示第i个辅助变量或敏感变量的第j个样本值,μi表示第i个辅助变量或敏感变量的均值,si表示第i个辅助变量或敏感变量的标准差;
S22.利用皮尔逊相关分析法计算辅助变量与产品质量的相关系数矩阵,并根据所述相关系数矩阵计算辅助变量与产品质量的偏相关系数,其中,所述相关系数矩阵计算如下:
Figure FDA0003482988890000011
其中,
Figure FDA0003482988890000012
所述偏相关系数计算如下:
Figure FDA0003482988890000021
其中,cik为所述Mcc的逆矩阵
Figure FDA0003482988890000022
中元素:
Figure FDA0003482988890000023
S23.计算辅助变量的均值、标准差和方差,进而计算辅助变量的变异系数,其中,所述辅助变量的变异系数计算如下:
Figure FDA0003482988890000024
其中,μi表示第i个辅助变量或敏感变量的均值,si表示第i个辅助变量或敏感变量的标准差,σi表示第i个辅助变量或敏感变量的方差;
S24.以辅助变量与产品质量的偏相关系数和辅助变量的变异系数的乘积作为辅助变量的敏感性指标,根据步骤S22和S23所述的辅助变量偏相关系数和变异系数计算得到辅助变量敏感性指数,其中,所述辅助变量敏感性指数计算如下:
Figure FDA0003482988890000025
其中ηik表示第i个辅助变量对第k个主导变量的敏感性指数,rik表示第i个辅助变量与第k个主导变量的偏相关系数,μi表示第i个辅助变量或敏感变量的均值;
S25.根据生产过程对象及产品质量,基于专家知识对敏感性指标设定不同的阈值,选取阈值范围内的辅助变量作为敏感变量;
S3.构建加权余弦马田***,从距离和方向两个角度对初选的敏感变量进行属性约简,精确筛选出影响产品质量的敏感变量作为关键敏感变量:
S31.对收集的敏感变量样本,通过机理分析和专家知识,将其分为正常样本和异常样本两类,并对两类样本进行标准化处理,其中对所述异常样本数据标准化处理时的均值和标准差均等同于正常样本数据;
S32.分别计算所有正常样本的马氏距离;
S321.选取n个正常样本,假设样本中具有q个初始的敏感变量,则样本空间可以表示为:
Figure FDA0003482988890000031
其中oli表示第l个正常样本第i个辅助变量或敏感变量的数据,其中,l=1,2,…,n;i=1,2,…,q;
S322.对正常样本数据进行标准化处理:
Figure FDA0003482988890000041
其中
Figure FDA0003482988890000042
表示第l个正常样本第i个辅助变量或敏感变量的标准化数据,其中,l=1,2,...,n;i=1,2,...,q;
S323.马氏距离为:
Figure FDA0003482988890000043
其中,MDl为第l个正常样本的马氏距离,S为正常样本的相关系数矩阵,
Figure FDA0003482988890000044
其中,
Figure FDA0003482988890000045
表示标准化处理后的正常样本数据矩阵的转置,S-1表示正常样本相关系数矩阵的逆矩阵,q表示初始的敏感变量的个数;
S33.分别计算所有正常样本的夹角余弦值,进而分别计算所有正常样本的余弦相似度,其中,所述余弦相似度为:
Figure FDA0003482988890000046
其中
Figure FDA0003482988890000047
为第l个正常样本第i个辅助变量或敏感变量的标准化数据,
Figure FDA0003482988890000048
为第i个辅助变量或敏感变量数据的均值;
S34.分别计算正常样本的马氏距离和余弦相似度的变异系数,根据马氏距离和余弦相似度变异系数分别占总变异系数的比值确定余弦马氏距离权重,其中,所述余弦马氏距离的权重计算方法为:
Figure FDA0003482988890000051
Figure FDA0003482988890000052
Figure FDA0003482988890000053
其中ξ1为正常样本马氏距离的变异系数,sMDl为正常样本马氏距离的标准差,μMDl为正常样本马氏距离的均值;ξ2为正常样本余弦相似度的变异系数,sCSl为正常样本余弦相似度的标准差,μCSl为正常样本余弦相似度的均值;
S35.基于正常样本的余弦马氏距离构建加权余弦马氏基准空间,其中,所述余弦马氏距离计算如下:
CMDl=αMDl+βCSl
其中MDl表示第l个正常样本的马氏距离,用以描述样本距离的相似度;CSl表示第l个正常样本的余弦相似度,用于描述样本方向的相似度;
S36.设计正交表,正交表中每行对应一个加权余弦马氏基准空间,计算在每个基准空间中异常样本的余弦马氏距离,根据构建的加权余弦马氏基准空间,计算异常样本的余弦马氏距离,验证构建的余弦马氏基准空间的有效性,若该加权余弦马氏基准空间可以区分正常样本和异常样本的余弦马氏距离,则构建的加权余弦马氏基准空间有效;否则,进入步骤S3,重新构建加权余弦马田***;
S37.选用望大特性信噪比计算每个基准空间中异常样本的信噪比,其中,所述信噪比计算方法如下:
Figure FDA0003482988890000061
CMDu表示异常样本的马氏距离,v表示异常样本的个数,对辅助变量而言;
S38.分别计算使用和未使用该敏感变量时信噪比的均值,然后计算其信噪比增量,根据专家知识对信噪比增量设定一定阈值,选取阈值范围内的所有敏感变量为关键敏感变量,其中,所述信噪比增量用ΔSNi表示:
Figure FDA0003482988890000062
其中,
Figure FDA0003482988890000063
表示使用该敏感变量时信噪比的均值;
Figure FDA0003482988890000064
表示未使用该敏感变量时信噪比的均值;
采用局部加权偏最小二乘方法建立产品质量预测模型,验证选取的关键敏感变量的有效性和准确性。
2.根据权利要求1所述的基于分步约简筛选复杂工业过程中影响产品质量的敏感变量的方法,其特征在于:所述复杂工业过程为加裂生产过程;所述产品为航煤10%馏出温度。
CN201910880769.XA 2019-06-19 2019-09-18 一种基于分步约简筛选复杂工业过程中影响产品质量的敏感变量的方法 Active CN110490496B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201910529924 2019-06-19
CN2019105299243 2019-06-19

Publications (2)

Publication Number Publication Date
CN110490496A CN110490496A (zh) 2019-11-22
CN110490496B true CN110490496B (zh) 2022-03-11

Family

ID=68558550

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910880769.XA Active CN110490496B (zh) 2019-06-19 2019-09-18 一种基于分步约简筛选复杂工业过程中影响产品质量的敏感变量的方法

Country Status (1)

Country Link
CN (1) CN110490496B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112101458B (zh) * 2020-09-16 2024-04-19 河海大学常州校区 一种基于田口函数-信噪比的特性度量方法和装置
CN112465044B (zh) * 2020-12-03 2022-12-27 上海卫星工程研究所 基于敏感参数多证据融合的卫星工况识别与分割方法及***
CN114186879A (zh) * 2021-12-15 2022-03-15 中国地质大学(北京) 地质参数对资源量计算误差影响的评估方法及设备
CN116306931B (zh) * 2023-05-24 2023-08-04 典基网络科技(上海)有限公司 一种应用工业领域的知识图谱构建方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106872658A (zh) * 2017-01-22 2017-06-20 华南理工大学 一种基于向量时间序列模型的污水cod负荷预测的方法
CN109164794A (zh) * 2018-11-22 2019-01-08 中国石油大学(华东) 基于偏f值selm的多变量工业过程故障分类方法
CN109307749A (zh) * 2018-11-06 2019-02-05 重庆大学 一种曝气扰动下黑臭河道水质指标的相关性分析方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2962828B1 (fr) * 2010-07-19 2012-08-17 Advanced Track & Trace Procedes et dispositifs de marquage et d'authentification d'un produit par un consommateur.
US9918630B2 (en) * 2015-09-01 2018-03-20 Ou Tan Systems and methods of glaucoma diagnosis based on frequency analysis of inner retinal surface profile measured by optical coherence tomography
CN108776831A (zh) * 2018-05-15 2018-11-09 中南大学 一种基于动态卷积神经网络的复杂工业过程数据建模方法
CN110210687A (zh) * 2019-06-13 2019-09-06 中南大学 一种基于局部加权慢特征回归的非线性动态生产过程产品质量预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106872658A (zh) * 2017-01-22 2017-06-20 华南理工大学 一种基于向量时间序列模型的污水cod负荷预测的方法
CN109307749A (zh) * 2018-11-06 2019-02-05 重庆大学 一种曝气扰动下黑臭河道水质指标的相关性分析方法
CN109164794A (zh) * 2018-11-22 2019-01-08 中国石油大学(华东) 基于偏f值selm的多变量工业过程故障分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"东北三省循环经济效率评价及其影响因素分析";王一帆;《中国优秀博士学位论文全文数据库(博士) 经济与管理科学辑》;20160831;全文 *

Also Published As

Publication number Publication date
CN110490496A (zh) 2019-11-22

Similar Documents

Publication Publication Date Title
CN110490496B (zh) 一种基于分步约简筛选复杂工业过程中影响产品质量的敏感变量的方法
CN106845796B (zh) 一种加氢裂化流程产品质量在线预测方法
CN108549908B (zh) 基于多采样概率核主成分模型的化工过程故障检测方法
CN109685366A (zh) 基于异变数据的装备健康状态评估方法
CN111382542A (zh) 一种面向全寿命周期的公路机电设备寿命预测***
CN110794093B (zh) 一种蒸发过程出料苛性碱浓度测量装置精度补偿方法
CN110083860B (zh) 一种基于相关变量选择的工业故障诊断方法
CN114297918A (zh) 基于全注意力深度网络和动态集成学习的航空发动机剩余寿命预测方法
CN116383636A (zh) 一种基于pca与lstm融合算法的磨煤机故障预警方法
CN113642754A (zh) 一种基于rf降噪自编码信息重构和时间卷积网络的复杂工业过程故障预测方法
CN113743016B (zh) 基于自编码器和回声状态网络的发动机剩余寿命预测方法
CN112507479B (zh) 一种基于流形学习和softmax的石油钻机健康状态评估方法
CN116380445B (zh) 基于振动波形的设备状态诊断方法及相关装置
CN109298633A (zh) 基于自适应分块非负矩阵分解的化工生产过程故障监测方法
Gao et al. A process fault diagnosis method using multi‐time scale dynamic feature extraction based on convolutional neural network
WO2021114320A1 (zh) 一种oica和rnn融合模型的污水处理过程故障监测方法
CN105868164A (zh) 一种基于有监督的线性动态***模型的软测量建模方法
Wang et al. A novel sliding window PCA-IPF based steady-state detection framework and its industrial application
CN112395684A (zh) 一种高速列车走行部***智能故障诊断方法
CN117009899A (zh) 一种时序性海洋生态环境监测数据中的异常点检测方法
CN114638039B (zh) 一种基于低秩矩阵恢复的结构健康监测特征数据解释方法
CN116842358A (zh) 一种基于多尺度卷积和自适应特征融合的软测量建模方法
CN116339275A (zh) 基于全结构动态自回归隐变量模型的多尺度过程故障检测方法
CN111931574B (zh) 一种气动调节阀鲁棒故障诊断方法
CN115186584A (zh) 一种融合注意力机制和自适应构图的宽度学习半监督软测量建模方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant