CN113450882A - 一种基于人工智能的基础培养基配方开发方法及*** - Google Patents

一种基于人工智能的基础培养基配方开发方法及*** Download PDF

Info

Publication number
CN113450882A
CN113450882A CN202011033081.7A CN202011033081A CN113450882A CN 113450882 A CN113450882 A CN 113450882A CN 202011033081 A CN202011033081 A CN 202011033081A CN 113450882 A CN113450882 A CN 113450882A
Authority
CN
China
Prior art keywords
formula
culture medium
basic
basic culture
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011033081.7A
Other languages
English (en)
Other versions
CN113450882B (zh
Inventor
陈亮
张祥涛
梁楚亨
梁国龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Taili Biotechnology Co.,Ltd.
Original Assignee
Dongguan Taili Biological Engineering Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongguan Taili Biological Engineering Co ltd filed Critical Dongguan Taili Biological Engineering Co ltd
Priority to CN202011033081.7A priority Critical patent/CN113450882B/zh
Publication of CN113450882A publication Critical patent/CN113450882A/zh
Priority to PCT/CN2021/131105 priority patent/WO2022063341A1/zh
Priority to EP21871710.6A priority patent/EP4220646A1/en
Application granted granted Critical
Publication of CN113450882B publication Critical patent/CN113450882B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/90Programming languages; Computing architectures; Database systems; Data warehousing

Landscapes

  • Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Theoretical Computer Science (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种基于人工智能的基础培养基配方开发方法及***。所述方法包括:(1)建立样本配方数据库;(2)获得样本配方培养数据库;(3)采用步骤(2)中获得的样本配方培养数据库,针对优化目标对机器学习模型进行训练,获得基础培养基配方培养效果预测模型;(4)在待优化的基础培养基配方中的每一成分的添加比例的搜索空间内采用步骤(3)获得的基础培养基配方培养效果预测模型针对优化目标进行培养效果回归预测,并推荐基础培养基配方。所述***包括:样本配方生成模块、样本配方培养数据库、回归模型训练模块、配方推荐模块。本发明同时分析配方中所有成分,避免传统方法中多次DOE试验,从而加快研发速度,节省基础培养基配方开发时间。

Description

一种基于人工智能的基础培养基配方开发方法及***
技术领域
本发明属于生物技术领域,更具体地,涉及一种基于人工智能的基础培养基配方开发方法及***。
背景技术
各种微生物、细胞等生物样本的营养要求虽不相同,但多数生物样本需要的基本营养物质相同。按一般生物样本生长繁殖所需要的基本营养物质配制的培养基即成为基础培养基。无血清无动物来源、化学成分明确的基础培养基由碳源、氨基酸、维生素、微量金属离子、脂类、缓冲试剂和其他添加试剂组成。
传统的培养基配方开发方法以某一种或几种经典培养基为基础(比如DEME/F12),通过添加多种不同成分,采用单因素试验或DOE筛选试验找到关键组分,然后再用响应曲面等多种DOE实验设计,优化各组分浓度,以获得最佳配方;或根据细胞代谢分析、基因组学分析和蛋白质组学分析找到各组分在细胞生长过程中变化情况及对目标产物产量和质量的影响来优化配方。
现有的基础培养基优化方法,不能同时对所有的成分进行全局优化,因此获得的配方并非最优。同时配方设计人员需要根据特定的优化目标,利用其掌握的基础化学、生化与分子生物学、细胞生物学等较多专业理论知识,进行试验,每次试验不能包含所有成分,费时较长,设计门槛高、人力成本、时间成本巨大。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种基于人工智能的基础培养基配方开发方法及***,其目的在于将机器学习算法应用于复杂的配方优化过程,通过构建质量良好、数量充足的样本配方数据库,选择合适的机器学习算法及优化算法,在短时间内推荐最有可能具备良好培养效果的基础培养基配方,降低配方开发门槛,由此解决现有的基础培养基成分复杂导致的开发速度慢、开发成本高的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种基于人工智能的基础培养基配方开发方法,其包括以下步骤:
(1)建立样本配方数据库:获取备选的基础培养基配方成分,对于其中每一成分确定其添加比例的搜索空间,并在各成分的搜索空间内进行搜索形成基础培养基样本配方,收集所述基础培养基样本配方建立样本配方数据库;
(2)获得样本配方培养数据库:对于步骤(1)中获得的样本配方数据库中存储的基础培养基样本配方,按照开发目的进行实验验证获得每一基础培养基样本配方的培养效果,收集关联有培养效果的基础培养基样本配方数据作为样本配方培养数据库;
(3)采用步骤(2)中获得的样本配方培养数据库,针对开发目标对机器学习模型进行训练,获得基础培养基配方培养效果预测模型;
(4)在待优化的基础培养基配方中的每一成分的添加比例的搜索空间内采用步骤(3)获得的基础培养基配方培养效果预测模型针对开发目标进行培养效果回归预测,并根据预测的培养效果择优推荐基础培养基配方。
优选地,所述基于人工智能的基础培养基配方开发方法,其所述在各成的搜索空间内进行搜索形成训练配方,包括但不限于以下四种方法:随机生成配方、DOE实验设计配方、混合形成配方、历史AI推荐配方。
优选地,所述基于人工智能的基础培养基配方开发方法,其所述随机生成配方,即对于基础培养基配方中的每一成分,在其搜索空间内随机取值,形成基础培养基样本配方;
所述DOE实验设计配方,包括以下步骤:
S1、对于基础培养基中的各成分的最低添加比例进行聚类,获得多个添加量级;对于基础培养基中的各成分按照功能划分为功能类别,所述功能类别包括氨基酸、微量金属离子、维生素、脂类、缓冲剂等;
S2、将步骤S1获取的不同添加量级和功能类别组合形成DOE实验因子,采用空间填充DOE实验设计形成基础样本配方;所述空间填充DOE实验设计为球填充法、拉丁超立方法、均匀法和最低潜能法;优选拉丁超立方法设计配方;
所述混合形成配方,即对于已有的基础培养基样本配方进行筛选及组合,获得更新的基础培养基样本配方;优选地,按照以下方法对与已有的基础培养基样本配方进行筛选及组合:
验证已有的基础培养基样本配方的培养效果,选择细胞活率较高、细胞密度较高或蛋白表达较高的配方采用两两混合或三种以上配方按照随机或预设比例混合配制成新的配方;
所述历史AI推荐配方,包括按照本发明的配方开发方法基于人工智能开发得到的基础培养基配方。
优选地,所述基于人工智能的基础培养基配方开发方法,其所述样本配方数据库中随机生成配方和DOE实验设计配方的数量比在1~4:10之间。
优选地,所述基于人工智能的基础培养基配方开发方法,其所述样本配方数据库样本总量在1000个以上,其中包括随机生成配方100至200个、DOE实验设计配方50至200个、以及历史AI推荐配方,余量为混合培养基。
优选地,所述基于人工智能的基础培养基配方开发方法,其步骤(1)所述成分的添加比例为该成分添加值与添加最大值的比值,其搜索空间为最低添加比例至100%,所述最低添加比例为该成分的添加最小值与最大值的比值。
优选地,所述基于人工智能的基础培养基配方开发方法,其步骤(2)所述按照优化目的进行实验验证获得每一基础培养基样本配方的培养效果,具体为:
采用该基础培养基样本配方对目标细胞进行培养,培养过程按照时间点取样检测细胞状态,所述细胞状态包括细胞活率、细胞密度、和/或生化指标,所述生化指标为:蛋白质表达量、葡萄糖、乳酸、氨、和/或谷氨酰胺含量;对细胞活率可进行拟合获得该基础培养基样本配方的关于培养时间的细胞活率曲线,对细胞密度进行拟合获得该基础培养基样本配方的关于培养时间的细胞生长曲线;所述基础培养基样本配方的培养效果为该基础培养基关于培养时间的细胞生长曲线、细胞活率曲线、特定时间点的细胞密度、细胞活率、以及生化指标中的一个或多个目标,又或者多个目标的综合。
优选地,所述基于人工智能的基础培养基配方开发方法,其步骤(3)所述机器学习模型包括但不限于:支持向量机回归模型、K最近邻模型、XGBoost、岭回归、LightGBM、随机森林、GBDT、或深度学习模型;所述深度学习模型包括但不限于:全连接神经网络、卷积神经网络、或循环神经网络;优选为支持向量机回归模型。
优选地,所述基于人工智能的基础培养基配方开发方法,其步骤(4)采用全局优化算法或启发式算法在搜索空间内搜索基础营养即配方进行培养效果回归预测;所述启发式算法包括但不限于:遗传算法、贪心算法、退火算法、蚁群算法、粒子群算法、人工蜂群算法、人工鱼群算法、混洗蛙跳算法、烟花算法、细菌觅食优化算法、以及萤火虫算法;所述全局优化算法包括但不限于:牛顿法、拟牛顿法、共轭梯度法、以及深度学习常用的梯度下降法;优选梯度下降法,所述梯度下降法优选为SGD、Momentum、Adagrad、RMSprop、Adam、Nadam。
按照本发明的另一个方面,提供了一种基于人工智能的基础培养基配方开发***,其包括:样本配方生成模块、样本配方培养数据库、回归模型训练模块、配方推荐模块;
所述样本配方生成模块,用于待优化的基础培养基配方中的每一成分的添加比例搜索空间内进行搜索形成基础培养基样本配方,并建立样本配方数据库;
所述样本配方培养数据库,存储有所述样本配方数据库中每一基础培养基样本配方及其关联的培养效果数据;
所述回归模型训练模块,用于选择回归模型并采用所述样本配方培养数据库中存储的基础培养基样本配方及其关联的培养效果数据进行回归模型训练,获得基础培养基配方培养效果预测模型并保存;
所述配方推荐模块,用于将所述回归模型训练模块存储的基础培养基配方培养效果预测模型应用于搜索空间内的基础培养基配方培养效果预测,并择优推荐基础培养基配方。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
本发明提供的基于人工智能的基础培养基配方开发方法,通过计算机AI技术建立的回归模型,将配方中所有成分同时进行分析,避免传统方法中多次DOE试验,提高分析效率和准确度,从而加快研发速度,节省基础培养基配方开发时间,可以大大缩短不同细胞株配方开发时间,将原本需要9个月以上的基础培养基开发周期,缩短至5个月左右,对于已有数据库的情况下,甚至可以缩短至半个月至1个月。
另一方面,采用人工智能技术降低人才学习成本,并且避免因知识贫乏导致劣质配方出现,提高试验的准确率,避免无效浪费,同时可胜任同时进行多个不同细胞株、分别针对多个优化目标、同时针对多优化目标的配方开发,为每一个细胞株均提供一个或多个最佳配方。
附图说明
图1是本发明提供的基于人工智能的基础培养基配方开发方法流程示意图;
图2是15折交叉验证下各类机器学习模型对于样本配方数据库的七天内最大细胞密度预测准确度评价;
图3是15折交叉验证下各类机器学习模型对于样本配方数据库的第五天细胞密度预测准确度评价;
图4是本发明实施例的基础培养基配方开发方法流程示意图;
图5是本发明实施例针对七天内最大细胞密度推荐的基础培养基配方培养结果预测值与实际值数据对比图;
图6是本发明实施例针对七天内最大细胞密度推荐的基础培养基配方的细胞生长曲线;
图7是本发明实施例针对第五天细胞密度推荐的基础培养基配方培养结果预测值与实际值数据对比图;
图8是本发明实施例针对第五天细胞密度推荐的基础培养基配方的细胞生长曲线。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
本发明提供的基于人工智能的基础培养基配方开发方法,如图1所示,包括以下步骤:
(1)建立样本配方数据库:对于待开发的基础培养基配方中的每一成分,确定其添加比例的搜索空间,并在各成分的搜索空间内进行搜索形成基础培养基样本配方,收集所述基础培养基样本配方建立样本配方数据库;该成分的添加比例为该成分添加值与添加最大值的比值,其搜索空间为最低添加比例至100%,所述最低添加比例为该成分的添加最小值与最大值的比值;
所述在各成分的搜索空间内进行搜索形成训练配方,包括但不限于以下四种方法:随机生成配方、DOE实验设计配方、混合形成配方、历史AI推荐配方;
所述随机生成配方,即对于基础培养基配方中的每一成分,在其搜索空间内随机取值,形成基础培养基样本配方;
所述DOE实验设计配方,包括以下步骤:
S1、对于基础培养基中的各成分的最低添加比例进行聚类,获得多个添加量级;对于基础培养基中的各成分按照功能划分为功能类别,所述功能类别包括氨基酸、微量金属离子、维生素、脂类、缓冲剂等;
S2、将步骤S1获取的不同添加量级和功能类别组合形成DOE实验因子,采用空间填充DOE实验设计形成基础样本配方,所述空间填充DOE实验设计为球填充法、拉丁超立方法、均匀法和最低潜能法;优选拉丁超立方法设计配方。
所述混合形成配方,即对于已有的基础培养基样本配方进行筛选及组合,获得更新的基础培养基样本配方;优选地,按照以下方法对与已有的基础培养基样本配方进行筛选及组合;验证已有的基础培养基样本配方的培养效果,选择细胞活率较高、细胞密度较高、或蛋白表达较高的配方采用两两混合或三种以上配方按照随机或预设比例混合配制成新的配方。
所述历史AI推荐配方,包括按照本发明的配方开发方法基于人工智能能开发得到的基础培养基配方。
基础培养基样本配方的质量和数量是人工智能优化基础培养基优化效果的关键和前提。基础培养基样本配方需要达到上百个,供机器学习进行较准确的模型训练,同时基础培养基样本配方应覆盖已知、未知的不同维度、不同的效果,而在效果较佳的高维空间区域内、变化明显的高维空间区域内具有分布更多的基础培养基样本配方。故为了提升数量,且在效果较佳的高维空间区域内、变化明显的高维空间区域内更加密集的选取基础培养基样本配方,本发明更优先倾向于DOE实验设计配方,同时为了提高对不同维度、不同的效果的样本配方的覆盖,增加随机生成基础培养基样本配方,并且辅助混合形成配方的方式。实验显示,结合以上三种方法建立的样本配方数据库,具有更佳的机器学习模型训练效果。
优选地,所述样本配方数据库中随机生成配方和DOE实验设计配方的数量比在1~4:10之间;随机生成配方保证了本方法的泛化能力,DOE实验设计配方能更好的提高预测精度。
样本配方数据库样本总量在100个以上,即能实现本发明提供的人工智能的基础培养基配方开发方法,优选地,所述样本配方数据库样本总量在1000个以上,其中包括随机生成配方100至200个,DOE实验设计配方50至200个,以控制配制培养基产生的时间成本,历史AI推荐配方由于在不断的实验过程中将必然进行配制和培养效果验证,因此不会额外增加配制培养基和验证培养效果的成本;余量为混合培养基,由于采用已完成配制的培养基进行混合,能大幅削减配制培养基的时间成本。
(2)获得样本配方培养数据库:对于步骤(1)中获得的样本配方数据库中存储的基础培养基样本配方,按照优化目的进行实验验证获得每一基础培养基样本配方的培养效果,收集关联有培养效果的基础培养基样本配方数据作为样本配方培养数据库;所述按照优化目的进行实验验证获得每一基础培养基样本配方的培养效果,具体为:
采用该基础培养基样本配方对目标细胞进行培养,培养过程按照时间点取样检测细胞状态,所述细胞状态包括细胞活率、细胞密度、和/或生化指标,所述生化指标为:蛋白质表达量、葡萄糖、乳酸、氨、和/或谷氨酰胺含量;对细胞活率可进行拟合获得该基础培养基样本配方的关于培养时间的细胞活率曲线,对细胞密度进行拟合获得该基础培养基样本配方的关于培养时间的细胞生长曲线;所述基础培养基样本配方的培养效果为该基础培养基关于培养时间的细胞生长曲线、细胞活率曲线、或特定时间点的细胞密度、细胞活率、生化指标,亦可是上述多个指标(对应采用多目标优化的机器学习模型),或者是上述多个指标的综合指标(例如特定多个指标的加权和)。
(3)采用步骤(2)中获得的样本配方培养数据库,针对优化目标对机器学习模型进行训练,获得基础培养基配方培养效果预测模型;
所述机器学习模型包括但不限于:支持向量机回归模型、K最近邻模型、XGBoost、岭回归、LightGBM、随机森林、GBDT、或深度学习模型;所述深度学习模型包括但不限于:全连接神经网络、卷积神经网络、或循环神经网络;
其中支持向量机回归模型效果较优。根据15折交叉验证发现,如图2与图3所示,支持向量机回归模型拥有更好的模型表现,并且该模型是连续可微模型,在之后推荐最优配方也有较大的优势。其余的机器学***移不变性的数据,如图像处理,而循环神经网络适合序列型数据,如语音文本处理,在预测最优配方上不具有特别大的优势。另外深度学习模型需要大量的数据,成本也更高。因此综合来说,支持向量机回归模型均方根误差最低是优选模型。
(4)在待优化的基础培养基配方中的每一成分的添加比例的搜索空间内采用步骤(3)获得的基础培养基配方培养效果预测模型针对优化目标进行培养效果回归预测,并根据预测的培养效果择优推荐基础培养基配方。具体地:
优选采用全局优化算法或启发式算法在搜索空间内搜索基础培养基配方进行培养效果回归预测;所述启发式算法包括但不限于:遗传算法、贪心算法、退火算法、蚁群算法、粒子群算法、人工蜂群算法、人工鱼群算法、混洗蛙跳算法、烟花算法、细菌觅食优化算法、萤火虫算法;所述全局优化算法包括但不限于:牛顿法、拟牛顿法、共轭梯度法、以及深度学习常用的梯度下降法,常用梯度下降法变种有SGD、Momentum、Adagrad、RMSprop、Adam、Nadam等等。
从空间复杂度来说大部分启发式算法如遗传算法、蚁群算法、粒子群算法、人工蜂群算法、人工鱼群算法、混洗蛙跳算法、烟花算法、细菌觅食优化算法、萤火虫算法等群类优化算法需要占用大量缓存,以及需要大量的计算量。而贪心算法在推荐多种成分含量配方的这类多因素相互影响的问题上,不容易达到全局最优值。而退火算法单单以增量作为评价指标,不如以梯度作为评价指标的梯度下降法。另外牛顿法、拟牛顿法、共轭梯度法这类算法则采用了二阶梯度近似,理论上比梯度下降法的一阶梯度近似更优秀,但由于配方复杂,这类方法计算力的负担更大。因此优选梯度下降法的各类变种方法。
本发明提供的基于人工智能的基础培养基配方开发***,包括:样本配方生成模块、样本配方培养数据库、回归模型训练模块、配方推荐模块;
所述样本配方生成模块,用于在待优化的基础培养基配方中的每一成分的添加比例搜索空间内进行搜索形成基础培养基样本配方,并建立样本配方数据库;
所述样本配方培养数据库,存储有所述样本配方数据库中每一基础培养基样本配方及其关联的培养效果数据;
所述回归模型训练模块,用于选择回归模型并采用所述样本配方培养数据库中存储的基础培养基样本配方及其关联的培养效果数据进行回归模型训练,获得基础培养基配方培养效果预测模型并保存;
所述配方推荐模块,用于将所述回归模型训练模块存储的基础培养基配方培养效果预测模型应用于搜索空间内的基础培养基配方培养效果预测,并择优推荐基础培养基配方。
以下为实施例:
一种基于人工智能的基础培养基配方开发方法,以少量配方成分为例:包括以下步骤:
(1)建立样本配方数据库:L-色氨酸、L-半胱氨酸、L-甘氨酸、L-丙氨酸、硫酸锰一水合物、六水氯化钴、盐酸吡哆醛、乙醇胺、碳酸氢钠、poloxamer 188,确定每一成分添加比例的搜索空间,并在各成分的搜索空间内进行搜索形成基础培养基样本配方,收集所述基础培养基样本配方建立样本配方数据库;该成分的添加比例为该成分添加值与添加最大值的比值,其搜索空间为最低添加比例至100%,所述最低添加比例为该成分的添加最小值与最大值的比例;
所述在各成分的搜索空间内进行搜索形成训练配方,包括以下四种方法:随机生成配方、DOE实验设计配方、混合形成配方、历史AI推荐配方;
所述随机生成配方,即对于基础培养基配方中的每一成分,在其搜索空间内随机取值,形成基础培养基样本配方;
本实施例采用所述DOE实验设计配方,具体如下:
将配方中少量不变的成分除外(比如葡萄糖),其他所有组分按照氨基酸、微量金属离子、维生素、脂类、缓冲试剂等其他物质分成5大类,在每个大类中,每个成分以最大添加值为100%,最小值除以最大值为配方中最低添加百分比,选择最低添加百分比接近的成分组成新的一类,在5大类的基础上形成9个大类,即九个因子,采用空间填充DOE实验设计中拉丁超立方法设计出90个配方。
本实施例采用的混合形成配方,具体如下:验证已有的基础培养基样本配方的培养效果,选择细胞活率较高、细胞密度较高、或蛋白表达较高的配方采用两两混合或三种以上配方按照随机比例混合配制成新的配方。
所述历史AI推荐配方,包括按照本发明的配方优化方法基于人工智能能优化得到的基础培养基配方。
本实施例最终建立的样本配方数据库的包括1000-1500基础培养基配方,其中包括DOE实验设计配方90个,随机配方200个、历史AI推荐配方100-200个、其余为混合配方,在500-700个之间。
(2)获得样本配方培养数据库:对于步骤(1)中获得的样本配方数据库中存储的基础培养基样本配方,按照优化目的进行实验验证获得每一基础培养基样本配方的培养效果,收集关联有培养效果的基础培养基样本配方数据作为样本配方培养数据库;所述按照优化目的进行实验验证获得每一基础培养基样本配方的培养效果,本实施例具体为:
采用批培养的方式进行,批培养的方法:按照0.5×106cells/mL的细胞密度接种,培养体积为10mL,培养容器为50mL mini bioreactor,摇床转速为180rpm,培养时间为七天,培养过程中分别在第三天、第五天和第七天取样,计数细胞密度,检测葡萄糖、乳酸、氨、谷氨酰胺、蛋白质表达量等生化参数,根据葡萄糖的消耗情况补加葡萄糖至4~5g/L。为了获得完整试验数据,会在每一天取样。
AI构建模型时,可以只采用某一取样点细胞活率或细胞密度或生化参数进行单目标建模或多目标建模;也可以采用细胞活率曲线图或细胞密度曲线图构建回归模型。
本实施例获得以下数据:每个取样点的细胞密度,七天内最大细胞密度,用细胞密度数据绘制成的细胞生长曲线图。
将配方中各个成分的含量,培养基配制过程中的数据和培养效果等相关信息记录在培养数据库中保存。
(3)采用步骤(2)中获得的样本配方培养数据库,对回归模型进行训练,获得基础培养基配方培养效果预测模型;具体地:
采用python语言,加载支持向量机回归模型,采用RBF(高斯)核函数,进行15折交叉验证;针对七天内最大细胞密度获得配方培养效果预测模型1,平均均方根误差保留两位小数约等于0.39;针对及第五天的细胞密度获得配方培养基效果预测模型2,平均均方根误差保留两位小数约等于0.41;力求模型能够完美预测培养基配方的各个成分在不同含量下培养细胞的产量与质量。
如果训练结果不符合标准,则重复步骤(1)~(2)增加训练样本数据量。
(4)在待优化的基础培养基配方中的每一成分的添加比例的搜索空间内采用步骤(3)获得的基础培养基配方培养效果预测模型针对优化目标进行培养效果回归预测,并根据预测的培养效果择优推荐基础培养基配方。本实施例具体地:
基于以上的七天内最大细胞密度、以及第五天的细胞密度,深度挖掘模型信息,在计算机数值模拟各个成分在不同含量下最可能会出现的细胞培养效果。模拟计算采取梯度下降方法,梯度即每个成分在特定含量增加一个单位对细胞的培养效果的变化影响,该梯度分为正负两种,正梯度表明提升该成分含量有利于细胞的培养效果,负梯度表明提升该成分有害于细胞的培养效果。基于以上模拟结果,逐步修正成分含量(正梯度就增加成分含量,负梯度则减少成分含量,增减成分的含量值与梯度值成正比),再重复模拟计算,然后根据梯度调整成分。重复以上过程,直到数值模拟发现,梯度无限接近于0,无法进一步通过修正成分含量使得细胞模拟的培养效果得到提升,则该培养基配方为模型模拟下的最优配方。上述梯度下降方法在算法上形式有SGD,Momentum,Adagrad,RMSprop,Adam等。
成功搭建以上的机器学习模型,便可成功度量每个成分对细胞的培养效果的影响。如机器学习模型在训练时出现无法收敛或者准确率太低、泛化能力不佳等问题,则判断数据不足够,返回重复步骤(1)至(3)继续随机生成、DOE配方设计、或混合配方形成更多的基础培养基样本配方,扩充数据、优化机器学习模型。
将以上经过机器学习后数值模拟得到推荐的最优配方包括详细明确各个成分的含量,根据配方可配制培养基并进行批培养实验,如果细胞培养的培养效果不符合实验要求,则重复步骤(4)。通过以上机器学习构建模型后,调整成分后的推荐配方经过检验,分别针对七天内最大细胞密度,生成基础培养基配方,细胞接种培养基后进行批培养。细胞活率保持稳定,七天养死率0%,细胞密度极高,模型预测值与实际值接近,预测配方可靠,具体配方数据如下表所示,培养细胞预测值与实际值数据对比如图5,细胞生长曲线如图6所示。
Figure BDA0002704365650000141
针对第五天细胞密度,生成基础培养基配方,细胞接种培养基后进行批培养。细胞活率保持稳定,七天养死率0%,细胞密度极高,模型预测值与实际值接近,预测配方可靠,具体配方数据如下表所示,培养细胞预测值与实际值数据对比如图7,细胞生长曲线如图8所示。
Figure BDA0002704365650000142
本实施例配方优化周期为:若包含构建样本配方培养数据库(1000+配方)和进行机器学习模型训练在内,周期在5个月左右;使用时,进行及其学习模型训练、配方推荐及效果验证,仅需半个月就能针对数据库中已经包含的培养效果进行配方开发,大大缩短了基础培养基的开发周期、降低了基础培养基的开发门槛。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于人工智能的基础培养基配方开发方法,其特征在于,包括以下步骤:
(1)建立样本配方数据库:获取备选的基础培养基配方成分,对于其中每一成分确定其添加比例的搜索空间,并在各成分的搜索空间内进行搜索形成基础培养基样本配方,收集所述基础培养基样本配方建立样本配方数据库;
(2)获得样本配方培养数据库:对于步骤(1)中获得的样本配方数据库中存储的基础培养基样本配方,按照开发目的进行实验验证获得每一基础培养基样本配方的培养效果,收集关联有培养效果的基础培养基样本配方数据作为样本配方培养数据库;
(3)采用步骤(2)中获得的样本配方培养数据库,针对开发目标对机器学习模型进行训练,获得基础培养基配方培养效果预测模型;
(4)在待优化的基础培养基配方中的每一成分的添加比例的搜索空间内采用步骤(3)获得的基础培养基配方培养效果预测模型针对开发目标进行培养效果回归预测,并根据预测的培养效果择优推荐基础培养基配方。
2.如权利要求1所述的基于人工智能的基础培养基配方开发方法,其特征在于,所述在各成分的搜索空间内进行搜索形成训练配方,包括但不限于以下四种方法:随机生成配方、DOE实验设计配方、混合形成配方、历史AI推荐配方。
3.如权利要求2所述的基于人工智能的基础培养基配方开发方法,其特征在于,所述随机生成配方,即对于基础培养基配方中的每一成分,在其搜索空间内随机取值,形成基础培养基样本配方;
所述DOE实验设计配方,包括以下步骤:
S1、对于基础培养基中的各成分的最低添加比例进行聚类,获得多个添加量级;对于基础培养基中的各成分按照功能划分为功能类别,所述功能类别包括氨基酸、微量金属离子、维生素、脂类、缓冲剂等;
S2、将步骤S1获取的不同添加量级和功能类别组合形成DOE实验因子,采用空间填充DOE实验设计形成基础样本配方;所述空间填充DOE实验设计为球填充法、拉丁超立方法、均匀法和最低潜能法;优选拉丁超立方法;
所述混合形成配方,即对于已有的基础培养基样本配方进行筛选及组合,获得更新的基础培养基样本配方;优选地,按照以下方法对与已有的基础培养基样本配方进行筛选及组合;
验证已有的基础培养基样本配方的培养效果,选择细胞活率较高、细胞密度较高或蛋白表达较高的配方采用两两混合或三种以上配方按照随机或预设比例混合配制成新的配方;
所述历史AI推荐配方,包括按照本发明的配方开发方法基于人工智能方法推荐得到的基础培养基配方。
4.如权利要求2所述的基于人工智能的基础培养基配方开发方法,其特征在于,所述样本配方数据库中随机生成配方和DOE实验设计配方的数量比在1~4:10之间。
5.如权利要求2所述的基于人工智能的基础培养基配方开发方法,其特征在于,所述样本配方数据库样本总量在1000个或以上,其中包括随机生成配方100至200个、DOE实验设计配方50至200个、以及历史AI推荐配方,余量为混合培养基。
6.如权利要求1所述的基于人工智能的基础培养基配方开发方法,其特征在于,步骤(1)所述成分的添加比例为该成分添加值与添加最大值的比值,其搜索空间为最低添加比例至100%,所述最低添加比例为该成分的添加最小值与最大值的比值。
7.如权利要求1所述的基于人工智能的基础培养基配方开发方法,其特征在于,步骤(2)所述按照开发目的进行实验验证获得每一基础培养基样本配方的培养效果,具体为:
采用该基础培养基样本配方对目标细胞进行培养,培养过程按照时间点取样检测细胞状态,所述细胞状态包括细胞活率、细胞密度、和/或生化指标,所述生化指标为:蛋白质表达量、葡萄糖、乳酸、氨、和/或谷氨酰胺含量;对细胞活率可进行拟合获得该基础培养基样本配方的关于培养时间的细胞活率曲线,对细胞密度进行拟合获得该基础培养基样本配方的关于培养时间的细胞生长曲线;所述基础培养基样本配方的培养效果为该基础培养基关于培养时间的细胞生长曲线、细胞活率曲线、特定时间点的细胞密度、细胞活率、以及生化指标中的一个或多个或者多个的综合。
8.如权利要求1所述的基于人工智能的基础培养基配方开发方法,其特征在于,步骤(3)所述机器学习模型包括但不限于:支持向量机回归模型、K最近邻模型、XGBoost、岭回归、LightGBM、随机森林、GBDT、或深度学习模型;所述深度学习模型包括但不限于:全连接神经网络、卷积神经网络、或循环神经网络;优选为支持向量机回归模型。
9.如权利要求1所述的基于人工智能的基础培养基配方开发方法,其特征在于,步骤(4)采用全局优化算法或启发式算法在搜索空间内搜索基础培养基配方进行培养效果回归预测;所述启发式算法包括但不限于:遗传算法、贪心算法、退火算法、蚁群算法、粒子群算法、人工蜂群算法、人工鱼群算法、混洗蛙跳算法、烟花算法、细菌觅食优化算法、以及萤火虫算法;所述全局优化算法包括但不限于:牛顿法、拟牛顿法、共轭梯度法、以及深度学习常用的梯度下降法;优选梯度下降法,所述梯度下降法优选为SGD、Momentum、Adagrad、RMSprop、Adam、Nadam。
10.一种基于人工智能的基础培养基配方开发***,其特征在于,包括:样本配方生成模块、样本配方培养数据库、回归模型训练模块、配方推荐模块;
所述样本配方生成模块,用于待优化的基础培养基配方中的每一成分的添加比例搜索空间内进行搜索形成基础培养基样本配方,并建立样本配方数据库;
所述样本配方培养数据库,存储有所述样本配方数据库中每一基础培养基样本配方及其关联的培养效果数据;
所述回归模型训练模块,用于选择回归模型并采用所述样本配方培养数据库中存储的基础培养基样本配方及其关联的培养效果数据进行回归模型训练,获得基础培养基配方培养效果预测模型并保存;
所述配方推荐模块,用于将所述回归模型训练模块存储的基础培养基配方培养效果预测模型应用于搜索空间内的基础培养基配方培养效果预测,并择优推荐基础培养基配方。
CN202011033081.7A 2020-09-27 2020-09-27 一种基于人工智能的基础培养基配方开发方法及*** Active CN113450882B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202011033081.7A CN113450882B (zh) 2020-09-27 2020-09-27 一种基于人工智能的基础培养基配方开发方法及***
PCT/CN2021/131105 WO2022063341A1 (zh) 2020-09-27 2021-11-17 基础培养基开发方法、基础培养基配方开发方法及***
EP21871710.6A EP4220646A1 (en) 2020-09-27 2021-11-17 Basal culture medium development method, basal culture medium formulation and development, and system thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011033081.7A CN113450882B (zh) 2020-09-27 2020-09-27 一种基于人工智能的基础培养基配方开发方法及***

Publications (2)

Publication Number Publication Date
CN113450882A true CN113450882A (zh) 2021-09-28
CN113450882B CN113450882B (zh) 2022-03-01

Family

ID=77808569

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011033081.7A Active CN113450882B (zh) 2020-09-27 2020-09-27 一种基于人工智能的基础培养基配方开发方法及***

Country Status (1)

Country Link
CN (1) CN113450882B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113450868A (zh) * 2020-11-26 2021-09-28 东莞太力生物工程有限公司 一种基于培养指标评价的基础培养基开发方法
CN114121163A (zh) * 2021-11-30 2022-03-01 深圳太力生物技术有限责任公司 基于整合学习的培养基预测***、训练及培养基预测方法
WO2022063341A1 (zh) * 2020-09-27 2022-03-31 深圳太力生物技术有限责任公司 基础培养基开发方法、基础培养基配方开发方法及***
CN114325777A (zh) * 2021-11-11 2022-04-12 中航机载***共性技术有限公司 一种周跳探测和修复方法、装置及设备
CN115982178A (zh) * 2023-03-21 2023-04-18 佛山市恒益环保建材有限公司 一种蒸压加气混凝土制品智能配方配料方法及***
CN117121949A (zh) * 2023-09-22 2023-11-28 广州麦乐生物科技有限公司 一种重建及强化人体免疫功能的成人配方奶粉
US11837333B1 (en) 2022-12-20 2023-12-05 Dow Global Technologies Llc Simulation guided inverse design for material formulations
CN117497038A (zh) * 2023-11-28 2024-02-02 上海倍谙基生物科技有限公司 一种基于核方法的快速优化培养基配方的方法
CN118098338A (zh) * 2024-04-29 2024-05-28 福瑞莱环保科技(深圳)股份有限公司 一种基于深度学习的微生物培养条件预测方法及***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080108553A1 (en) * 2006-11-08 2008-05-08 Yen-Tung Luan Rationally designed media for cell culture
CN102994441A (zh) * 2012-09-19 2013-03-27 上海瀚康生物医药科技有限公司 一种细胞培养基及其制备方法和用途
CN105018409A (zh) * 2014-04-22 2015-11-04 中国科学院沈阳应用生态研究所 甲基营养型芽孢杆菌产芽孢发酵培养基及其培养方法
CN106096077A (zh) * 2016-05-26 2016-11-09 新乡医学院 培养基优化方法
CN111063391A (zh) * 2019-12-20 2020-04-24 海南大学 一种基于生成式对抗网络原理的不可培养微生物筛选***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080108553A1 (en) * 2006-11-08 2008-05-08 Yen-Tung Luan Rationally designed media for cell culture
CN102994441A (zh) * 2012-09-19 2013-03-27 上海瀚康生物医药科技有限公司 一种细胞培养基及其制备方法和用途
CN105018409A (zh) * 2014-04-22 2015-11-04 中国科学院沈阳应用生态研究所 甲基营养型芽孢杆菌产芽孢发酵培养基及其培养方法
CN106096077A (zh) * 2016-05-26 2016-11-09 新乡医学院 培养基优化方法
CN111063391A (zh) * 2019-12-20 2020-04-24 海南大学 一种基于生成式对抗网络原理的不可培养微生物筛选***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FU-GANG HU等: "Modeling of multilayered media using effective medium theory", 《IEEE》 *
杜琳: "北冬虫夏草培养基优化及活性成分研究", 《中国优秀博硕士学位论文全文数据库(硕士)农业科技辑》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022063341A1 (zh) * 2020-09-27 2022-03-31 深圳太力生物技术有限责任公司 基础培养基开发方法、基础培养基配方开发方法及***
CN113450868B (zh) * 2020-11-26 2022-07-08 深圳太力生物技术有限责任公司 一种基于培养指标评价的基础培养基开发方法
CN113450868A (zh) * 2020-11-26 2021-09-28 东莞太力生物工程有限公司 一种基于培养指标评价的基础培养基开发方法
CN114325777A (zh) * 2021-11-11 2022-04-12 中航机载***共性技术有限公司 一种周跳探测和修复方法、装置及设备
CN114325777B (zh) * 2021-11-11 2023-10-13 中航机载***共性技术有限公司 一种周跳探测和修复方法、装置及设备
CN114121163B (zh) * 2021-11-30 2023-10-27 深圳太力生物技术有限责任公司 基于整合学习的培养基预测***、训练及培养基预测方法
CN114121163A (zh) * 2021-11-30 2022-03-01 深圳太力生物技术有限责任公司 基于整合学习的培养基预测***、训练及培养基预测方法
US11837333B1 (en) 2022-12-20 2023-12-05 Dow Global Technologies Llc Simulation guided inverse design for material formulations
CN115982178B (zh) * 2023-03-21 2023-07-25 佛山市恒益环保建材有限公司 一种蒸压加气混凝土制品智能配方配料方法及***
CN115982178A (zh) * 2023-03-21 2023-04-18 佛山市恒益环保建材有限公司 一种蒸压加气混凝土制品智能配方配料方法及***
CN117121949A (zh) * 2023-09-22 2023-11-28 广州麦乐生物科技有限公司 一种重建及强化人体免疫功能的成人配方奶粉
CN117497038A (zh) * 2023-11-28 2024-02-02 上海倍谙基生物科技有限公司 一种基于核方法的快速优化培养基配方的方法
CN118098338A (zh) * 2024-04-29 2024-05-28 福瑞莱环保科技(深圳)股份有限公司 一种基于深度学习的微生物培养条件预测方法及***
CN118098338B (zh) * 2024-04-29 2024-07-16 福瑞莱环保科技(深圳)股份有限公司 一种基于深度学习的微生物培养条件预测方法及***

Also Published As

Publication number Publication date
CN113450882B (zh) 2022-03-01

Similar Documents

Publication Publication Date Title
CN113450882B (zh) 一种基于人工智能的基础培养基配方开发方法及***
Choon et al. Differential bees flux balance analysis with OptKnock for in silico microbial strains optimization
CN113450868B (zh) 一种基于培养指标评价的基础培养基开发方法
Otwinowski et al. Genotype to phenotype mapping and the fitness landscape of the E. coli lac promoter
CN108090500B (zh) 食用菌发酵生产过程关键参量的软测量方法
EP4220646A1 (en) Basal culture medium development method, basal culture medium formulation and development, and system thereof
CN114360652B (zh) 细胞株相似性评价方法及相似细胞株培养基配方推荐方法
Ginovart et al. Digital image analysis of yeast single cells growing in two different oxygen concentrations to analyze the population growth and to assist individual-based modeling
Knijnenburg et al. Exploiting combinatorial cultivation conditions to infer transcriptional regulation
US20240209306A1 (en) Methods and Systems for Optimizing Culture Conditions in a Culture Process
CN114678085A (zh) 一种基于代谢参数的补料培养基开发方法及***
CN103164631A (zh) 一种智能协同表达基因分析仪
Scott Jr et al. Curation and analysis of a Saccharomyces cerevisiae genome-scale metabolic model for predicting production of sensory impact molecules under enological conditions
Ginovart et al. Analysis of the effect of inoculum characteristics on the first stages of a growing yeast population in beer fermentations by means of an individual-based model
Ferreira et al. Protein constraints in genome‐scale metabolic models: Data integration, parameter estimation, and prediction of metabolic phenotypes
Zilio et al. Predicting evolution in experimental range expansions of an aquatic model system
CN114121161B (zh) 一种基于迁移学习的培养基配方开发方法及***
Cheng et al. Machine learning for metabolic pathway optimization: A review
Bai et al. Advances and applications of machine learning and intelligent optimization algorithms in genome-scale metabolic network models
Giordano et al. Application of pareto-optimal front as an option to desirability function for the optimization of a microbiological process
Prats et al. Individual-based modelling and simulation of microbial processes: yeast fermentation and multi-species composting
CN114611386A (zh) 一种培养基混合比例优化方法、装置、设备及介质
Portell et al. INDISIM-Saccha, an individual-based model to tackle Saccharomyces cerevisiae fermentations
Metcalf et al. Rhythm of the Night (and Day): Predictive Metabolic Modeling of Diurnal Growth in Chlamydomonas
Mesquita et al. In silico metabolic flux data flexibilization for advanced bioreactor control applications

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220125

Address after: 518048 No. 323-m, third floor, comprehensive Xinxing phase I, No. 1, Haihong Road, Fubao community, Fubao street, Futian District, Shenzhen, Guangdong Province

Applicant after: Shenzhen Taili Biotechnology Co.,Ltd.

Address before: 523570 buildings 3 and 4, gaobao green technology city, Tutang Industrial Zone, Changping Town, Dongguan City, Guangdong Province

Applicant before: DONGGUAN TAILI BIOLOGICAL ENGINEERING CO.,LTD.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant