CN116798506B - 一种毕赤酵母发酵过程中菌体浓度的预测方法 - Google Patents
一种毕赤酵母发酵过程中菌体浓度的预测方法 Download PDFInfo
- Publication number
- CN116798506B CN116798506B CN202310291867.6A CN202310291867A CN116798506B CN 116798506 B CN116798506 B CN 116798506B CN 202310291867 A CN202310291867 A CN 202310291867A CN 116798506 B CN116798506 B CN 116798506B
- Authority
- CN
- China
- Prior art keywords
- data
- target domain
- source domain
- pichia pastoris
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000004151 fermentation Effects 0.000 title claims abstract description 53
- 238000000855 fermentation Methods 0.000 title claims abstract description 51
- 241000235058 Komagataella pastoris Species 0.000 title claims abstract description 42
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000009826 distribution Methods 0.000 claims abstract description 77
- 230000015654 memory Effects 0.000 claims abstract description 35
- 238000013528 artificial neural network Methods 0.000 claims abstract description 34
- 230000006978 adaptation Effects 0.000 claims abstract description 30
- 238000012549 training Methods 0.000 claims abstract description 13
- 241001052560 Thallis Species 0.000 claims abstract description 11
- 239000011159 matrix material Substances 0.000 claims description 21
- 230000009466 transformation Effects 0.000 claims description 12
- 238000005457 optimization Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 5
- 238000000354 decomposition reaction Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 description 9
- 210000004027 cell Anatomy 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000013526 transfer learning Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000009655 industrial fermentation Methods 0.000 description 2
- 230000007787 long-term memory Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 108090000623 proteins and genes Proteins 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Biotechnology (AREA)
- Mathematical Optimization (AREA)
- Bioinformatics & Computational Biology (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Computational Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Physiology (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Algebra (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种毕赤酵母发酵过程中菌体浓度的预测方法,属于毕赤酵母发酵技术领域,包括:获取毕赤酵母的源域数据训练源域长短时记忆神经网络;将源域长短时记忆神经网络的模型参数迁移到目标域长短时记忆神经网络中;获取毕赤酵母的目标域数据;使用平衡分布适配算法适配源域数据与目标域数据;固定源域长短时记忆神经网络的第一层参数,利用平衡分布适配后的源域数据辅助目标域数据训练目标域长短时记忆神经网络的剩余层参数,最终获得精准的目标域预测模型;利用目标域预测模型对新工况下的毕赤酵母在发酵过程中的菌体浓度进行预测。该方法能够对不同工况下的毕赤酵母发酵过程中的菌体浓度进行预测。
Description
技术领域
本发明属于毕赤酵母发酵技术领域,具体涉及一种毕赤酵母发酵过程中菌体浓度的预测方法。
背景技术
巴斯德毕赤酵母表达***是近十年发展起来的真核表达体系,是最为成功的外源蛋白表达***之一,与现有的其它表达***相比,巴斯德毕赤酵母在表达产物的加工、外分秘、翻译后修饰以及糖基化修饰等方面有明显的优势,现已广泛用于外源蛋白的表达。然而毕赤酵母发酵过程具有多变量、强耦合、非线性且发酵过程数据多等特点,很难建立精确的数学模型。同时,不同工况发酵过程数据分布存在差异,传统软测量建模方法没有考虑到这一情况,进行不同工况发酵过程建模耗费时间长且容易污染菌体。解决上述问题是毕赤酵母发酵过程控制的主要任务。
传统的建模方法比如支持向量机(SVM)只能用于小样本数据学习。而长短时记忆神经网络(LSTM)建模具有许多优点,非常适合解决复杂的工业过程控制问题。毕赤酵母菌发酵数据具有高度复杂的非线性和时间序列特点,这与长短时记忆网络学习机制有较强的契合度,目前长短时记忆网络模型在生物发酵关键生物参数的预测方向正逐渐兴起。但是这并没有考虑到不同发酵工况下的影响,在毕赤酵母菌实际工业化发酵过程中,由于工况的不同,导致发酵各阶段关键参量的变化趋势不同,所以数据分布存在差异,从而造成训练好的模型失效,预测精度降低。
总之,现有技术存在在不同工况下,用于预测毕赤酵母发酵过程中菌体浓度的模型失效,预测精度降低的问题。
发明内容
为了克服上述现有技术存在的不足,本发明提供了一种毕赤酵母发酵过程中菌体浓度的预测方法。
为了实现上述目的,本发明提供如下技术方案:
一种毕赤酵母发酵过程中菌体浓度的预测方法,包括:
获取包含菌体浓度数据的毕赤酵母的初始发酵数据,作为源域数据;
将源域数据中除了菌体浓度数据以外的数据输入长短时记忆神经网络中对长短时记忆神经网络进行训练,当长短时记忆神经网络输出的数据与初始发酵数据中的菌体浓度数据数值相同时,停止对长短时记忆神经网络的训练,得到最佳源域预测模型;
将最佳源域预测模型的模型参数迁移到目标域长短时记忆神经网络中;
获取毕赤酵母在新工况下的发酵数据,作为目标域数据;
使用平衡分布适配算法,适配源域数据与目标域数据,减小源域和目标域间的边缘概率分布差异和条件概率分布差异;
固定目标域长短时记忆神经网络的第一层参数,利用适配后的源域数据与目标域数据共同训练目标域长短时记忆神经网络的剩余层参数,获得最终的目标域预测模型;
利用最终的目标域预测模型,对新工况下的毕赤酵母在发酵过程中的菌体浓度进行预测。
进一步,所述使用平衡分布适配算法适配源域数据与目标域数据的表达式为:
DISTANCE(Ds,Dt)≈(1-μ)DISTANCE(P(Xs),P(Xt))+μDISTANCE(P(ys|Xs),P(yt|Xt)
式中,μ∈[0,1]表示平衡因子;DISTANCE(P(Xs),P(Xt))为源域数据与目标域数据的边缘概率分布的距离,DISTANCE(P(ys|Xs),P(yt|Xt))为源域数据与目标域数据的条件概率分布的距离;
当μ→0时表示源域和目标域数据本身存在较大的差异性,此时,边缘分布适配更重要;当μ→1时,表示源域和目标域数据集有较高的相似性。
进一步,源域数据与目标域数据的边缘概率分布的距离为:
式中,A为最优变换矩阵,M0为:
式中,n,m分别是源域和目标域样本的个数。
进一步,源域数据与目标域数据的条件概率分布的距离为:
式中,A为最优变换矩阵,Mc为:
式中,nc,mc分别表示源域和目标域中来自第c类的样本个数;分别表示源域和目标域中属于类别c的样本。
进一步,所述减小源域和目标域间的边缘概率分布差异和条件概率分布差异的最优化问题为:
式中,tr()表示矩阵的迹;s.t.表示约束条件;是正则项;XHXT是均方差矩阵;I是单位矩阵。
进一步,利用拉格朗日乘子法解决减小源域和目标域间的边缘概率分布差异和条件概率分布差异的最优化问题,其包括:
取拉格朗日乘子为Φ=(φ1,φ2,...φm),将式(12)的拉格朗日函数变为:
令得到广义特征值分解:
求解公式(14)的m个最小的特征向量得到最优变换矩阵A,通过最优变换矩阵A来缩小源域与目标域数据分布差异。
本发明提供的一种毕赤酵母发酵过程中菌体浓度的预测方法具有以下有益效果:
本发明固定了LSTM网络的低层参数作为各工况下的通用参数以节省模型训练时间,选取新工况发酵过程中少量数据作为目标域数据即可,同时能够防止菌体遭受污染,然后通过平衡分布适配算法减小源域与目标域之间的数据分布差异,最终新工况下的毕赤酵母软测量模型通过平衡适配后的源域数据辅助实际发酵过程的少量数据得以快速建立。本方法不仅能够有效提高毕赤酵母发酵过程软测量模型精度并且适应于变工况下毕赤酵母菌体浓度的预测,而且可以节省大量模型训练的时间。解决了现有技术中,在不同工况下,用于预测毕赤酵母发酵过程中菌体浓度的模型失效,预测精度降低的问题。
附图说明
为了更清楚地说明本发明实施例及其设计方案,下面将对本实施例所需的附图作简单地介绍。下面描述中的附图仅仅是本发明的部分实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的一种毕赤酵母发酵过程中菌体浓度的预测方法示意图;
图2为本发明实施例的LSTM的基本单元结构示意图。
具体实施方式
为了使本领域技术人员更好的理解本发明的技术方案并能予以实施,下面结合附图和具体实施例对本发明进行详细说明。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
实施例:
本发明提供了一种毕赤酵母发酵过程中菌体浓度的预测方法,具体如图1所示,包括:获取包含菌体浓度数据的毕赤酵母的初始发酵数据,作为源域数据;将源域数据中除了菌体浓度数据以外的数据输入长短时记忆神经网络中对长短时记忆神经网络进行训练,当长短时记忆神经网络输出的数据与初始发酵数据中的菌体浓度数据数值相同时,停止对长短时记忆神经网络的训练,得到最佳源域预测模型;将最佳源域预测模型的模型参数迁移到目标域长短时记忆神经网络中;获取毕赤酵母在新工况下的发酵数据,作为目标域数据;使用平衡分布适配算法,适配源域数据与目标域数据,减小源域和目标域间的边缘概率分布差异和条件概率分布差异;固定目标域长短时记忆神经网络的第一层参数,利用适配后的源域数据与目标域数据共同训练目标域长短时记忆神经网络的剩余层参数,获得最终的目标域预测模型;利用最终的目标域预测模型,对新工况下的毕赤酵母在发酵过程中的菌体浓度进行预测。
需要注意的是,对于长短时记忆神经网络的训练,其输出的菌体浓度数据数值并不会完全与初始发酵数据中的数值相同,而是当数值在一定的阈值范围内,我们认定其相同。
以下为本发明实施细节:
1.1长短时记忆神经网络结构
长短时记忆神经网络由输入层、记忆单元层(细胞层)、全连接层和输出层组成。输入层接受输入数据,记忆单元层学习时间序列数据的周期特征,全连接层进行数据维度的转换,输出层传递预测数据。LSTM是基于循环神经网络(recurrent neural network,RNN)改进的一种深度学习算法,弥补了普通RNN在跨长时间步长时容易产生梯度消失和***问题并且长期记忆能力不足等问题,从而能够真正有效的利用长距离的时效信息,非常适用于文本序列数据的任务。
LSTM单元主要由输入门、遗忘门、输出门组成,其中ht-1,ht表示LSTM在前一时刻以及当前时刻的输出,ct-1,ct表示前一时刻和上一时刻的存储单元状态,xt表示输入。其具体结构如图2所示。
1)计算遗忘门ft。遗忘门决定t-1时刻单元状态有多少保留到当前单元状态中;
ft=σ(Wf[ht-1,xt]+bf) (1)
2)计算输入门it。输入门决定从新获得的信息中有多少信息需要更新,计算结果将成为更新神经元状态ct的一部分;
it=σ(Wi[ht-1,xt]+bi) (2)
3)计算输出门ot。输出门决定在更新后的神经元状态ct中有多少信息变为隐藏层状态变量ht;
ot=σ(Wo[ht-1,xt]+bo) (5)
ht=ot⊙tanh(ct) (6)
式中,Wf、Wi、Wc、Wo为相应控制门的权重矩阵,bf、bi、bc、bo为相应偏置向量;σ为Sigmoid激活函数,其取值范围为[0,1],0表示全部舍弃,1表示全部保留;tanh为双曲正切激活函数,⊙表示矩阵元素的乘积。借助3个控制门和存储单元,LSTM可以读取、重置和更新长时间的信息。
1.2平衡分布适配算法(BDA)
多工况情况下,传统软测量模型恶化的原因是实时数据与训练数据的概率分布失配,如果通过一种变化方法使得不同工况的数据在新的空间达到边缘分布和条件分布适配,则可以将源领域的模型或知识迁移到新的工况。
平衡分布适配(Balanced Distribution Adaptation,BDA)用于在降维过程中共同适应源域与目标域的边缘分布与条件分布,但是对于分布差异较大的情况并不能使其分布完全适配。鉴于此,本发明综合各个工况下数据分布的差异、适配后的数据分布差异,提出使用最大均值差异-平衡分布适配的迁移学习方法。
BDA能够根据特定的数据领域,自适应的调整分布适配过程中边缘分布和条件分布的重要性。准确而言,BDA通过采用一种平衡因子μ来动态调整两个分布之间的距离。
DISTANCE(Ds,Dt)≈(1-μ)DISTANCE(P(Xs),P(Xt))+μDISTANCE(P(ys|Xs),P(yt|Xt) (7)
式中,μ∈[0,1]表示平衡因子。当μ→0,这表示源域和目标域数据本身存在较大的差异性,因此,边缘分布适配更重要;当μ→1时,这表示源域和目标域数据集有较高的相似性,因此,条件概率分布适配更加重要。
综合上面的分析可知,平衡因子可以根据实际数据分布的情况,动态地调节每个分布的重要性,并取得良好的分布适配效果。平衡分布适配主要思想就是寻找一个变换矩阵A,当数据经过变化矩阵变换后,P(ATXs)和P(ATXt)的距离,以及P(ys|ATXs)和P(yt|ATXt)之间的距离都能尽可能地接近。
1.2.1边缘分布适配
为了减小P(Xs),P(Xt)的分布差异,采用最大均值差异来计算源域和目标域边缘概率分布的距离,即:
式中,M0为MMD矩阵:
式中,n,m分别是源域和目标域样本的个数。通过最小化式(9)使得式(8)最小化,域间的边缘分布在新特征表示下更加接近。
1.2.2条件分布适配
目标域中存在大量的无标签数据,导致条件分布P(ys|Xs)和P(yt|Xt)不能直接建模。采用(xs,ys)来训练一个简单的分类器,到xt上直接进行预测,总能够得到一些伪标签之后根据伪标签来计算。根据伪标签,可以近似匹配预测空间Y中每一标签c∈{1,2,…,C}的条件分布P(ys=c|Xs)和P(yt=c|Xt),通过MMD来测量条件分布的距离,即
式中,Mc为:
nc,mc分别表示源域和目标域中来自第c类的样本个数;分别表示源域和目标域中属于类别c的样本。通过最小化式(11)使得式(10)最小,在新的特征表示下域间的条件分布更加接近。
1.2.3最优化问题
为了提高BDA的迁移学习有效性和鲁棒性,需要同时最小化领域间的边缘分布和条件分布,因此BDA的最优化问题为:
式中,的是正则项,使得模型是良好定义的,约束条件表示转换后的数据ATX能够保证原始数据的内部属性。
1.2.4特征变换
解决平衡分布适配最优化问题采用拉格朗日乘子法,取拉格朗日乘子为Φ=(φ1,φ2,...φm),则式(12)的拉格朗日函数为:
令得到广义特征值分解:
最后,通过求解公式(14)的m个最小的特征向量即可求解最优适应矩阵A,通过最优适应矩阵A来缩小源域与目标域数据分布差异。
1.3基于平衡分布适配的长短期记忆神经网络软测量建模
由于毕赤酵母实际工业化发酵过程中工况的不同,导致发酵各阶段关键参量的变化趋势不同,从而造成训练好的LSTM模型失效,预测精度降低。工况发生变化主要有两种原因,一种是由于操作工艺的不断更新,产物原材料的更替造成;第二种是环境参量的变化造成。工况的变化比如罐体压力、搅拌转速、溶解氧浓度以及pH值等环境参量的大小都会对发酵过程中的关键参量菌体浓度的变化有所影响,从而使得源域数据与目标域数据分布存在差异,以至于原始的LSTM软测量模型失效。
为了解决这一问题,本发明利用迁移学***衡分布适配的方法对已知的信息进行充分的利用并且加以迁移,改善了软测量模型对不同分布数据预测的泛化能力,提高模型的预测精度。同时考虑LSTM网络中LSTM层作为特征提取器,用于提取输入时间序列数据的特征,由于神经网络越到高层提取的信息越有专有化,而前几层的信息则比较通用所以固定第一层参数,只对后边几层参数借助平衡分布适配后的源域数据以及目标域数据对模型进行训练,提出了固定通用参数层并基于最大均值差异迁移学***衡分布适配的软测量建模策略,如图1所示。
以上所述实施例仅为本发明较佳的具体实施方式,本发明的保护范围不限于此,任何熟悉本领域的技术人员在本发明披露的技术范围内,可显而易见地得到的技术方案的简单变化或等效替换,均属于本发明的保护范围。
Claims (6)
1.一种毕赤酵母发酵过程中菌体浓度的预测方法,其特征在于,包括:
获取包含菌体浓度数据的毕赤酵母的初始发酵数据,作为源域数据;
将源域数据中除了菌体浓度数据以外的数据输入长短时记忆神经网络中对长短时记忆神经网络进行训练,当长短时记忆神经网络输出的数据与初始发酵数据中的菌体浓度数据数值相同时,停止对长短时记忆神经网络的训练,得到最佳源域预测模型;
将最佳源域预测模型的模型参数迁移到目标域长短时记忆神经网络中;
获取毕赤酵母在新工况下的发酵数据,作为目标域数据;
使用平衡分布适配算法,适配源域数据与目标域数据,减小源域和目标域间的边缘概率分布差异和条件概率分布差异;
固定目标域长短时记忆神经网络的第一层参数,利用适配后的源域数据与目标域数据共同训练目标域长短时记忆神经网络的剩余层参数,获得最终的目标域预测模型;
利用最终的目标域预测模型,对新工况下的毕赤酵母在发酵过程中的菌体浓度进行预测。
2.根据权利要求1所述的一种毕赤酵母发酵过程中菌体浓度的预测方法,其特征在于,所述使用平衡分布适配算法适配源域数据与目标域数据的表达式为:
DISTANCE(Ds,Dt)≈(1-μ)DISTANCE(P(Xs),P(Xt))+μDISTANCE(P(ys|Xs),P(yt|Xt)
式中,μ∈[0,1]表示平衡因子;DISTANCE(P(Xs),P(Xt))为源域数据与目标域数据的边缘概率分布的距离,DISTANCE(P(ys|Xs),P(yt|Xt))为源域数据与目标域数据的条件概率分布的距离;
当μ→0时表示源域和目标域数据本身存在较大的差异性,此时,边缘分布适配更重要;当μ→1时,表示源域和目标域数据集有较高的相似性。
3.根据权利要求2所述的一种毕赤酵母发酵过程中菌体浓度的预测方法,其特征在于,源域数据与目标域数据的边缘概率分布的距离为:
式中,A为最优变换矩阵,M0为:
式中,n,m分别是源域和目标域样本的个数。
4.根据权利要求3所述的一种毕赤酵母发酵过程中菌体浓度的预测方法,其特征在于,源域数据与目标域数据的条件概率分布的距离为:
式中,A为最优变换矩阵,Mc为:
式中,nc,mc分别表示源域和目标域中来自第c类的样本个数;分别表示源域和目标域中属于类别c的样本。
5.根据权利要求4所述的一种毕赤酵母发酵过程中菌体浓度的预测方法,其特征在于,所述减小源域和目标域间的边缘概率分布差异和条件概率分布差异的最优化问题为:
式中,tr()表示矩阵的迹;s.t.表示约束条件;是正则项;XHXT是均方差矩阵;I是单位矩阵。
6.根据权利要求5所述的一种毕赤酵母发酵过程中菌体浓度的预测方法,其特征在于,利用拉格朗日乘子法解决减小源域和目标域间的边缘概率分布差异和条件概率分布差异的最优化问题,其包括:
取拉格朗日乘子为Φ=(φ1,φ2,...φm),将式(12)的拉格朗日函数变为:
令得到广义特征值分解:
求解公式(14)的m个最小的特征向量得到最优变换矩阵A,通过最优变换矩阵A来缩小源域与目标域数据分布差异。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310291867.6A CN116798506B (zh) | 2023-03-23 | 2023-03-23 | 一种毕赤酵母发酵过程中菌体浓度的预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310291867.6A CN116798506B (zh) | 2023-03-23 | 2023-03-23 | 一种毕赤酵母发酵过程中菌体浓度的预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116798506A CN116798506A (zh) | 2023-09-22 |
CN116798506B true CN116798506B (zh) | 2024-03-22 |
Family
ID=88046924
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310291867.6A Active CN116798506B (zh) | 2023-03-23 | 2023-03-23 | 一种毕赤酵母发酵过程中菌体浓度的预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116798506B (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101561442A (zh) * | 2009-05-11 | 2009-10-21 | 江南大学 | 一种基于人工神经网络的重组毕赤酵母表达期两阶段在线故障诊断方法 |
CN104450499A (zh) * | 2014-12-22 | 2015-03-25 | 江南大学 | 一种基于支持向量机的毕赤酵母发酵过程预警方法 |
CN104596984A (zh) * | 2015-01-05 | 2015-05-06 | 北京中医药大学 | 一种六神曲发酵过程近红外在线质量检测方法 |
CN108090500A (zh) * | 2017-11-22 | 2018-05-29 | 江苏大学 | 食用菌发酵生产过程关键参量的软测量方法 |
CN110849627A (zh) * | 2019-11-27 | 2020-02-28 | 哈尔滨理工大学 | 一种宽度迁移学习网络及基于宽度迁移学习网络的滚动轴承故障诊断方法 |
CN111705003A (zh) * | 2020-07-20 | 2020-09-25 | 贵州大学 | 一种莱氏野村菌Nr19菌株液体发酵优化工艺 |
CN112241608A (zh) * | 2020-10-13 | 2021-01-19 | 国网湖北省电力有限公司电力科学研究院 | 一种基于lstm网络和迁移学习的锂电池寿命预测方法 |
CN112883994A (zh) * | 2020-12-28 | 2021-06-01 | 重庆邮电大学 | 一种均衡分布适配的旋转机械变工况故障诊断方法 |
CN113869563A (zh) * | 2021-09-14 | 2021-12-31 | 北京化工大学 | 一种基于故障特征迁移的航空涡扇发动机剩余寿命预测方法 |
CN114091349A (zh) * | 2021-11-30 | 2022-02-25 | 东南大学 | 一种基于多源领域自适应的滚动轴承寿命预测方法 |
CN114417720A (zh) * | 2022-01-19 | 2022-04-29 | 江苏大学 | 一种毕赤酵母发酵过程多模型预测控制方法 |
CN114500325A (zh) * | 2022-01-27 | 2022-05-13 | 重庆邮电大学 | 一种基于无监督迁移学习的sdn控制器故障自适应智能检测方法 |
CN115274004A (zh) * | 2022-07-26 | 2022-11-01 | 江南大学 | 一种基于知识复用的发酵过程菌体浓度预测方法及*** |
CN115482877A (zh) * | 2022-05-15 | 2022-12-16 | 浙江工业大学 | 一种基于时序图网络的发酵过程软测量建模方法 |
-
2023
- 2023-03-23 CN CN202310291867.6A patent/CN116798506B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101561442A (zh) * | 2009-05-11 | 2009-10-21 | 江南大学 | 一种基于人工神经网络的重组毕赤酵母表达期两阶段在线故障诊断方法 |
CN104450499A (zh) * | 2014-12-22 | 2015-03-25 | 江南大学 | 一种基于支持向量机的毕赤酵母发酵过程预警方法 |
CN104596984A (zh) * | 2015-01-05 | 2015-05-06 | 北京中医药大学 | 一种六神曲发酵过程近红外在线质量检测方法 |
CN108090500A (zh) * | 2017-11-22 | 2018-05-29 | 江苏大学 | 食用菌发酵生产过程关键参量的软测量方法 |
CN110849627A (zh) * | 2019-11-27 | 2020-02-28 | 哈尔滨理工大学 | 一种宽度迁移学习网络及基于宽度迁移学习网络的滚动轴承故障诊断方法 |
CN111705003A (zh) * | 2020-07-20 | 2020-09-25 | 贵州大学 | 一种莱氏野村菌Nr19菌株液体发酵优化工艺 |
CN112241608A (zh) * | 2020-10-13 | 2021-01-19 | 国网湖北省电力有限公司电力科学研究院 | 一种基于lstm网络和迁移学习的锂电池寿命预测方法 |
CN112883994A (zh) * | 2020-12-28 | 2021-06-01 | 重庆邮电大学 | 一种均衡分布适配的旋转机械变工况故障诊断方法 |
CN113869563A (zh) * | 2021-09-14 | 2021-12-31 | 北京化工大学 | 一种基于故障特征迁移的航空涡扇发动机剩余寿命预测方法 |
CN114091349A (zh) * | 2021-11-30 | 2022-02-25 | 东南大学 | 一种基于多源领域自适应的滚动轴承寿命预测方法 |
CN114417720A (zh) * | 2022-01-19 | 2022-04-29 | 江苏大学 | 一种毕赤酵母发酵过程多模型预测控制方法 |
CN114500325A (zh) * | 2022-01-27 | 2022-05-13 | 重庆邮电大学 | 一种基于无监督迁移学习的sdn控制器故障自适应智能检测方法 |
CN115482877A (zh) * | 2022-05-15 | 2022-12-16 | 浙江工业大学 | 一种基于时序图网络的发酵过程软测量建模方法 |
CN115274004A (zh) * | 2022-07-26 | 2022-11-01 | 江南大学 | 一种基于知识复用的发酵过程菌体浓度预测方法及*** |
Non-Patent Citations (3)
Title |
---|
Model optimization of SVM for a fermentation soft sensor;Guo hai Liu.et al;《Expert Systems with appications》;第37卷(第4期);全文 * |
基于人工神经网络的重组毕赤酵母表达期菌体浓度模型;许哲军等;《化工自动化及仪表》(第01期);全文 * |
基于生物网络的磷酸化位点特异激酶预测研究;郭昕昀;《中国优秀硕士学位论文全文数据库 信息科技辑》(第03期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116798506A (zh) | 2023-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yuan et al. | Nonlinear dynamic soft sensor modeling with supervised long short-term memory network | |
CN110298501B (zh) | 基于长短时记忆神经网络的电负荷预测方法 | |
Pratama et al. | Data driven modeling based on dynamic parsimonious fuzzy neural network | |
CN110580496A (zh) | 一种基于熵最小化的深度迁移学习***及方法 | |
CN111105008A (zh) | 模型训练方法、数据识别方法和数据识别装置 | |
CN111680786B (zh) | 一种基于改进权重门控单元的时序预测方法 | |
CN115494865B (zh) | 基于时空图卷积网络的无人机集群态势分析方法及介质 | |
CN111626785A (zh) | 一种基于结合注意力的cnn-lstm网络基金价格预测方法 | |
CN108009571A (zh) | 一种新的直推式半监督数据分类方法及*** | |
CN114512191A (zh) | 一种基于迁移成分分析的青霉素浓度预测方法 | |
Tan et al. | Support vector machine algorithm for artificial intelligence optimization | |
CN111709550A (zh) | 一种基于深度学习的联络线计划编制方法及*** | |
Zhu et al. | Parallel interaction spatiotemporal constrained variational autoencoder for soft sensor modeling | |
CN113420815B (zh) | 半监督rsdae的非线性pls间歇过程监测方法 | |
CN116798506B (zh) | 一种毕赤酵母发酵过程中菌体浓度的预测方法 | |
Du et al. | The innovation of ideological and political education integrating artificial intelligence big data with the support of wireless network | |
WO2021258482A1 (zh) | 基于迁移与弱监督的美丽预测方法、装置及存储介质 | |
Wang et al. | An soft-sensor method for the biochemical reaction process based on LSTM and transfer learning | |
Wang et al. | Intelligent explicit model predictive control based on machine learning for microbial desalination cells | |
CN115129029A (zh) | 基于子领域适配字典学习的工业***故障诊断方法和*** | |
Zhou et al. | Deep learning with PID residual elimination network for time-series prediction of water quality in aquaculture industry | |
CN116484723B (zh) | 一种基于动态多层域自适应的发酵过程软测量建模方法 | |
Mayfrank et al. | End-to-end reinforcement learning of koopman models for economic nonlinear model predictive control | |
Zhu et al. | A soft sensor model of Pichia pastoris cell concentration based on IBDA-RELM | |
Gong et al. | Beyond Imitation: A Life-long Policy Learning Framework for Path Tracking Control of Autonomous Driving |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |