CN113642247A - 一种基于深度图网络分析的发酵过程软测量方法 - Google Patents

一种基于深度图网络分析的发酵过程软测量方法 Download PDF

Info

Publication number
CN113642247A
CN113642247A CN202110999583.3A CN202110999583A CN113642247A CN 113642247 A CN113642247 A CN 113642247A CN 202110999583 A CN202110999583 A CN 202110999583A CN 113642247 A CN113642247 A CN 113642247A
Authority
CN
China
Prior art keywords
data
model
fgcn
fermentation process
mutual information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110999583.3A
Other languages
English (en)
Inventor
刘毅
贾明伟
朱佳良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN202110999583.3A priority Critical patent/CN113642247A/zh
Publication of CN113642247A publication Critical patent/CN113642247A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种基于深度图网络分析的发酵过程软测量方法,所述方法包括以下步骤:(1)数据的获取和整合;(2)数据选择;(3)建模训练;(4)模型预测。本发明方法采用基于图网络的发酵过程软测量模型,提高了发酵过程关键产品质量的预测效果,具有普遍性和通用性。

Description

一种基于深度图网络分析的发酵过程软测量方法
技术领域
本发明涉及发酵过程软测量技术领域,具体涉及一种基于深度图网络分析的发酵过程软测量方法。
背景技术
发酵过程是有生物参与并在合适的PH值、温度、搅拌等发酵条件下生成目标产物的过程,广泛的存在于各种工业过程中,有固有的强非线性和机理过程的复杂性。其理论建模和过程控制都存在较大困难,尤其是缺乏合适的在线传感器来在线分析关键产品质量,如青霉素发酵过程中的关键产品质量,只能偶尔以离线的方式进行分析,这在很大程度上限制了发酵过程的控制和优化。
随着数据驱动建模的方法在工业过程中体现出巨大优势,同时为了克服难以分析关键产品质量的问题,越来越多的人采用数据驱动建模的方法从其他可在线测量的变量中来估计关键产品质量。发酵过程由于其产品质量和操作变量之间存在强非线性,因此基于发酵过程的数据驱动建模方法主要分为统计方法、浅层机器学习方法和深度学习方法。其中,统计方法主要包括主成分分析(Principal Component Analysis,PCA)、偏最小二乘法(Partial Least squares,PLS)。浅层机器学习方法是指深度学习以外的传统机器学习模型,包括浅层人工神经网络(Artificial Neural Network,ANN)、支持向量机(SupportVector Machine,SVM)、高斯过程模型(Gaussian Process Model,GPM)。深度学习主要包括各种三层以上的深度神经网络(Deep Neural Network,DNN),深度神经网络已经被证明能够逼近任何非线性***并广泛应用于过程建模中。
图神经网络自提出以来飞速发展,在很多领域表现出令人满意的学习能力,另一方面,基于图神经网络(Graph Neural Network,GNN)的方法可以处理非网格数据,因此可以捕捉到特征之间的相互关系。本软件基于图卷积神经网络(Graph ConvolutionNetwork,GCN)提出发酵图卷积神经网络(Fermentation Graph Convolution Network,FGCN)。FGCN将发酵过程中的所有特征作为输入,对关键产品质量进行预测。此外,在训练阶段,特征之间的关系矩阵、时间关联矩阵与其他参数一起被优化。这样,网络能够基于给定的训练数据来学习和决定特征之间的关系,从而给予更精确的预测结果。
发明内容
针对现有技术中存在的问题,本发明提供了设计合理的一种基于深度图网络分析的发酵过程软测量方法。
本发明的技术方案如下:
一种基于深度图网络分析的发酵过程软测量方法,包括以下步骤:
1)数据的获取和整合:
使用仿真平台pensim获取不同工况下的青霉素发酵过程,并且以四小时为一批次对数据进行划分、收集和整合。
2)数据选择:
根据最大互信息准则(Maximum Mutual Information,MMI)对数据进行选择,去除冗余无用的数据。
3)建模训练:
构建基于图网络的发酵过程软测量方法的算法模型FGCN,模型的输入为经过选择保留的数据;然后利用FGCN模型对所整合的数据进行学习训练。
4)模型预测:
将训练后的FGCN模型用于青霉素发酵过程产物出口浓度预测,并给出预测结果。
进一步,所述步骤1)的过程为:
步骤1.1:设定pensim仿真过程,获得仿真平台变量的输出数据;
步骤1.2:将数据根据设定的比例划分成训练集、验证集和测试集;
步骤1.3:由于不同特征变量之间数据差异性较大,因此有必要对数据进行标准化处理,以便于模型进行处理和运算,具体公式如下所示:
Figure BDA0003235232370000031
其中,X'是经标准化处理后的数据,X是未经标准化处理的原数据,μ是数据的均值,σ是数据的标准差。
进一步,所述步骤2)的过程为:
步骤2.1:使用最大互信息原则进行数据特征选择,最大互信息以互信息为基础,以下为互信息公式:
Figure BDA0003235232370000032
其中p(X,Y)表示随机变量X,Y之间的联合概率分布;根据互信息公式计算出所需互信息;
步骤2.2:由互信息(Mutual Information,MI)可以导出最大互信息系数的公式为:
Figure BDA0003235232370000041
其中B=N0.55~0.6,N为样本集的大小,将计算好的互信息带入公式确定最大互信息;
步骤2.3:根据最大互信息对特征进行排序,选取前k个特征,完成特征选择过程。
进一步,所述步骤3)的过程为:
步骤3.1:FGCN是依托相关算法构建发酵过程出口浓度预测模型;FGCN主要基于图卷积网络(GCN)和时间卷积网络(Temporal Convolutional Network,TCN)构建;GCN是一种在非欧空间上对数据进行卷积的算法。GCN可以表示为:
Figure BDA0003235232370000042
其中H为当前层特征向量,令H(0)=Xin,Xin表示输入数据,l表示层数,W为权重矩阵,σ(.)为激活函数,
Figure BDA0003235232370000043
表示输入的邻接矩阵,其中
Figure BDA0003235232370000044
表示卷积核,
Figure BDA0003235232370000045
表示邻接矩阵A的度矩阵;
TCN是一种对时序数据进行跨时间步提取特征的算法,可以对输入t时刻的数据xt给定一个对应的yt;TCN的算法可以表示为:
Figure BDA0003235232370000046
X表示输入数据,Y表示输出数据,TCN(.)表示时间卷积网络。时间卷积网络的过程如图1所示;
步骤3.2:将GCN和TCN结合称为时空卷积网络(Spatio-Temporal ConvolutionNetwork,STGCN),堆叠三层STGCN,最后结合特征选择部分,形成FGCN,通过FGCN对青霉素发酵过程产物出口浓度进行准确预测。图2为FGCN框架;
步骤3.3:使用训练数据训练FGCN,使用验证数据对FGCN进行超参数选择,最后得到一个训练后的FGCN模型。
进一步,所述步骤(4)的过程为:
步骤4.1:将测试数据输入训练后的FGCN模型。使用均方误差RMSE作为评估指标,计算公式如下:
Figure BDA0003235232370000051
其中,
Figure BDA0003235232370000052
表示真实数据,yi表示模型的输出,n表示测试集包含样本个数。一般来说,RMSE越小,意味着模型的预测值与真实值越接近,即模型的预测效果越好。
本发明的有益效果:本发明提出了一种基于深度图网络分析的发酵过程软测量方法,发酵过程关键产品质量的预测准确度。该方法利用图卷积网络和时间卷积网络,在时间和空间维度上对数据进行提取,增加了模型的泛化性,本方法可以对不同发酵过程的关键产品质量进行精准测量。
附图说明
图1是本发明时间卷积层结构图;
图2是本发明的模型框架图;
图3是本发明的预测结果和真实结果对比图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1-3,一种基于深度图网络分析的发酵过程软测量方法,具体步骤如下:
1)获取青霉素发酵过程数据集:
步骤1.1:设置pensim仿真平台,每隔1小时进行1次变量测量,同时设置10组不同工况,重复仿真过程10次,最终获得10个工况下16个变量400个时刻10×16×400的数据;
步骤1.2:根据划分标准将数据分成6×16×400、2×16×400和2×16×400三个部分,分别为训练集、验证集和测试集。
步骤1.3:根据标准化公式对每个数据进行处理。
2)进行青霉素发酵过程数据集数据选择,过程如下:
步骤2.1:根据互信息公式计算出每个变量的互信息数值。
步骤2.2:根据互信息数值计算出最大互信息数值。
步骤2.3:根据最大互信息数值对变量进行排序,保留前5个变量:基底进给速率(VSF)、生物量浓度(EB)、溶解氧浓度(EDO)、二氧化碳浓度(ECO2)、生成热量(TG)。
3)进行FGCN模型训练,过程如下:
步骤3.1:将训练集输入模型,获得模型第一次预测值。
步骤3.2:根据预测值和输出值的差值,对模型的参数进行调整,使得预测值与真实值之间的差值减小。
步骤3.3:将验证集输入模型,获得模型对于验证集的输出结果。
步骤3.4:根据模型在验证集上的输出结果,对模型的超参数进行重新设定调招。
步骤3.5:重复步骤3.1~3.4,直到模型的预测值和真实值之间的差值达到允许误差之内。
4)使用测试数据对模型进行测试,过程如下:
步骤4.1:使用图卷积网络(GCN)、支持向量机(SVM)和最小二乘法(PLS)进行对照实验。其中SVM和PLS为时序数据常用模型。将训练数据输入训练后的模型中,分别得到FGCN、GCN、SVM和PLS在测试集上的预测值。
步骤4.2:计算测试集的预测值和真实值之间的RMSE,对FGCN、GCN、SVM和性能进行评估。评估结果如表1所示:
表1 FGCN和GCN的RMSE对比
Figure BDA0003235232370000071
从上述对比结果可以看出,本发明对于青霉素发酵过程的关键产品质量预测效果优于传统预测模型。图3为本发明预测结果和真实结果对比。
本发明方法采用基于图网络的发酵过程软测量模型,提高了发酵过程关键产品质量的预测效果,具有普遍性和通用性。
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

Claims (5)

1.一种基于深度图网络分析的发酵过程软测量方法,其特征在于,所述方法包括以下步骤:
1)数据的获取和整合:
使用仿真平台pensim获取不同工况下的青霉素发酵过程,并且对数据进行划分、收集和整合;
2)数据选择:
根据最大互信息准则MMI对数据进行选择,去除冗余无用的数据;
3)建模训练:
构建基于图网络的发酵过程软测量方法的算法模型FGCN,模型的输入为经过选择保留的数据;然后利用FGCN模型对所整合的数据进行学习训练;
4)模型预测:
将训练后的FGCN模型用于青霉素发酵过程产物出口浓度预测,并给出预测结果,根据RMSE进行模型性能评估。
2.如权利要求1所述的一种基于深度图网络分析的发酵过程软测量方法,其特征在于,所述步骤1)的过程为:
步骤1.1)设定pensim仿真过程,获得仿真平台变量的输出数据;
步骤1.2)将数据根据设定比例划分成训练集、验证集和测试集;
步骤1.3)由于不同特征变量之间数据差异性较大,需要对数据进行标准化处理,以便于模型进行处理和运算,具体公式如下所示:
Figure FDA0003235232360000021
其中,X'是经标准化处理后的数据,X是未经标准化处理的原数据,μ是数据的均值,σ是数据的标准差。
3.如权利要求1所述的一种基于深度图网络分析的发酵过程软测量方法,其特征在于,所述步骤2)的过程为:
步骤2.1)使用最大互信息准则进行数据特征选择,最大互信息以互信息为基础,以下为互信息公式:
Figure FDA0003235232360000022
其中p(X,Y)表示随机变量X,Y之间的联合概率分布,根据互信息公式计算出所需互信息;p(X)表示随机变量X的概率分布,p(Y)表示随机变量Y的概率分布;
步骤2.2)由互信息MI导出最大互信息系数的公式为:
Figure FDA0003235232360000023
其中B=N0.55~0.6,N为样本集的大小;将计算好的互信息带入公式确定最大互信息;
步骤2.3)根据最大互信息对特征进行排序,选取前k个特征,完成特征选择过程。
4.如权利要求1所述的一种基于深度图网络分析的发酵过程软测量方法,其特征在于,所述步骤3)的过程为:
步骤3.1)FGCN是依托相关算法构建发酵过程出口浓度预测模型;FGCN主要基于图卷积网络GCN和时间卷积网络TCN构建;图卷积网络GCN是一种在非欧空间上对数据进行卷积的算法,图卷积网络GCN表示为:
Figure FDA0003235232360000031
其中H为当前层特征向量,令H(0)=X,X表示输入数据,l表示层数,W为权重矩阵,σ(.)为激活函数,
Figure FDA0003235232360000032
表示输入的邻接矩阵,其中
Figure FDA0003235232360000033
表示卷积核,D=∑Aij表示邻接矩阵A的度矩阵;
时间卷积网络TCN是一种对时序数据进行跨时间步提取特征的算法,可以对输入t时刻的数据xt给定一个对应的yt;时间卷积网络TCN的算法表示为:
Figure FDA0003235232360000034
X表示输入数据,Y表示输出数据,TCN(.)表示时间卷积网络;
步骤3.2)将图卷积网络GCN和时间卷积网络TCN结合称为时空卷积网络STGCN,堆叠三层时空卷积网络STGCN,最后结合特征选择部分,形成FGCN,通过FGCN对青霉素发酵过程产物出口浓度进行准确预测;
步骤3.3)使用训练数据训练构建好的FGCN,使用验证数据对FGCN进行超参数选择,最后得到一个训练好的FGCN模型。
5.如权利要求1所述的一种基于深度图网络分析的发酵过程软测量方法,其特征在于,所述步骤4)的过程为:
步骤4.1:将测试数据输入训练后的FGCN模型,使用均方误差RMSE作为评估指标,计算公式如下:
Figure FDA0003235232360000035
其中,
Figure FDA0003235232360000036
表示真实数据,yi表示模型的输出,n表示测试集包含样本个数;RMSE越小,意味着模型的预测值与真实值越接近,即模型的预测效果越好。
CN202110999583.3A 2021-08-29 2021-08-29 一种基于深度图网络分析的发酵过程软测量方法 Pending CN113642247A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110999583.3A CN113642247A (zh) 2021-08-29 2021-08-29 一种基于深度图网络分析的发酵过程软测量方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110999583.3A CN113642247A (zh) 2021-08-29 2021-08-29 一种基于深度图网络分析的发酵过程软测量方法

Publications (1)

Publication Number Publication Date
CN113642247A true CN113642247A (zh) 2021-11-12

Family

ID=78424321

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110999583.3A Pending CN113642247A (zh) 2021-08-29 2021-08-29 一种基于深度图网络分析的发酵过程软测量方法

Country Status (1)

Country Link
CN (1) CN113642247A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111784041A (zh) * 2020-06-28 2020-10-16 中国电力科学研究院有限公司 一种基于图卷积神经网络的风电功率预测方法及***
CN111933220A (zh) * 2020-08-25 2020-11-13 中国计量大学 一种基于动态贝叶斯网络的青霉素发酵过程软测量方法
CN112001115A (zh) * 2020-07-17 2020-11-27 西安理工大学 一种半监督动态软测量网络的软测量建模方法
CN112949281A (zh) * 2021-01-28 2021-06-11 北京航空航天大学 一种图神经网络的增量社交事件检测方法
CN113011102A (zh) * 2021-04-01 2021-06-22 河北工业大学 基于多元时间序列的Attention-LSTM的青霉素发酵过程故障预测方法
CN113110398A (zh) * 2021-05-13 2021-07-13 浙江理工大学 基于动态时间归整和图卷积网络的工业过程故障诊断方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111784041A (zh) * 2020-06-28 2020-10-16 中国电力科学研究院有限公司 一种基于图卷积神经网络的风电功率预测方法及***
CN112001115A (zh) * 2020-07-17 2020-11-27 西安理工大学 一种半监督动态软测量网络的软测量建模方法
CN111933220A (zh) * 2020-08-25 2020-11-13 中国计量大学 一种基于动态贝叶斯网络的青霉素发酵过程软测量方法
CN112949281A (zh) * 2021-01-28 2021-06-11 北京航空航天大学 一种图神经网络的增量社交事件检测方法
CN113011102A (zh) * 2021-04-01 2021-06-22 河北工业大学 基于多元时间序列的Attention-LSTM的青霉素发酵过程故障预测方法
CN113110398A (zh) * 2021-05-13 2021-07-13 浙江理工大学 基于动态时间归整和图卷积网络的工业过程故障诊断方法

Similar Documents

Publication Publication Date Title
CN107451101B (zh) 一种分层集成的高斯过程回归软测量建模对脱丁烷塔底丁烷浓度进行预测的方法
CN111079836B (zh) 基于伪标签方法和弱监督学习的过程数据故障分类方法
CN109002686B (zh) 一种自动生成样本的多牌号化工过程软测量建模方法
CN109214581B (zh) 一种考虑风向和置信区间的铁路沿线风速预测方法
CN107220734A (zh) 基于决策树的数控车床车削过程能耗预测***
CN111506835B (zh) 一种融合用户时间特征和个性特征的数据特征提取方法
CN108334943A (zh) 基于主动学习神经网络模型的工业过程半监督软测量建模方法
CN109635245A (zh) 一种鲁棒宽度学习***
CN111768000A (zh) 在线自适应微调深度学习的工业过程数据建模方法
CN113435707B (zh) 基于深度学习和计权型多因子评价的测土配方施肥方法
CN107622276B (zh) 一种基于机器人仿真与物理采样结合的深度学习训练方法
CN115906954A (zh) 一种基于图神经网络的多变量时间序列预测方法及装置
CN108960421A (zh) 改进基于bp神经网络的水面无人艇航速在线预报方法
CN113012766A (zh) 一种基于在线选择性集成的自适应软测量建模方法
CN111191726A (zh) 一种基于弱监督学习多层感知器的故障分类方法
CN115482877A (zh) 一种基于时序图网络的发酵过程软测量建模方法
CN114330549A (zh) 一种基于深度图网络的化工过程故障诊断方法
CN114692507A (zh) 基于堆叠泊松自编码器网络的计数数据软测量建模方法
Souza et al. Co-evolutionary genetic multilayer perceptron for feature selection and model design
CN106599391B (zh) 基于三角形角度值动态加权的关联向量机软测量建模方法
CN117313516A (zh) 一种基于时空图嵌入的发酵产物预测方法
CN113642247A (zh) 一种基于深度图网络分析的发酵过程软测量方法
CN116541767A (zh) 一种基于图神经网络的多元温室环境参数预测方法及***
CN115206455B (zh) 基于深度神经网络的稀土元素组分含量预测方法及***
CN116665039A (zh) 基于两阶段因果干预的小样本目标识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination