CN115049019B - 金属有机框架对砷的吸附性能评估方法、装置及相关设备 - Google Patents
金属有机框架对砷的吸附性能评估方法、装置及相关设备 Download PDFInfo
- Publication number
- CN115049019B CN115049019B CN202210875620.4A CN202210875620A CN115049019B CN 115049019 B CN115049019 B CN 115049019B CN 202210875620 A CN202210875620 A CN 202210875620A CN 115049019 B CN115049019 B CN 115049019B
- Authority
- CN
- China
- Prior art keywords
- data
- model
- performance evaluation
- adsorption
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/20—Metals
- G01N33/204—Structure thereof, e.g. crystal structure
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C60/00—Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Biochemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Food Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating And Analyzing Materials By Characteristic Methods (AREA)
- Solid-Sorbent Or Filter-Aiding Compositions (AREA)
Abstract
本发明公开了一种金属有机框架对砷的吸附性能评估方法、装置、设备及介质,包括:采集测试信息数据;对测试信息数据进行预处理,并将预处理后的数据按比例划分为训练集和测试集,确定模型输入特征;基于BP神经网络算法构建初始性能评估模型;采用提前停止算法在训练集上训练初始性能评估模型,并采用验证集对初始性能评估模型进行交叉验证,通过自动调参算法根据交叉验证误差调整优化初始性能评估模型的超参数,得到目标性能评估模型;采用预设的评价指标对目标性能评估模型进行评估,得到评估值;基于评估值和Shapley值法,确定各个模型输入特征吸附砷的性能,采用本发明提高了金属有机框架对砷的吸附性能评估的效率和准确性。
Description
技术领域
本发明涉及材料吸附性能评估领域,尤其涉及一种金属有机框架对砷的吸附性能评估方法、装置、计算机设备及介质。
背景技术
近年来随着我国人口的增长和工业的发展,水污染的情况不断加重,水污染事故频频发生,水污染防治成为人们日益关注的重点问题。水质污染不仅严重影响人类的健康,还会造成生物多样性减少、生态***失衡等一系列问题,其中砷污染是水污染中一个急需解决的问题。
吸附技术是用于去除水体中污染物的常用修复手段之一,高效吸附剂的选择是该技术的关键。金属有机框架(MOFs)材料被广泛用于水中砷的去除,已经研制出的MOFs材料以及类MOFs材料已近上万种,不同的MOFs材料对砷的吸附能力有所差异,选择一个高效的MOFs材料用于处理含砷污水,将使得水污染治理成效事半功倍。
目前用于吸附含砷污水的金属有机框架材料的选择依赖于传统的实验筛选,然而通过实验来探索具有一定的盲目性,需要消耗实验人员大量的时间、精力和财力。此外,该试错过程还很难对所有可能的材料进行效果检测。
机器学习在材料性能预测方面虽然已经有了一些成功的应用,但是在材料的水体污染物吸附性能预测方面的模型研究较少,仅有少数关于生物碳材料的吸附预测模型,由于金属有机框架(MOFs)材料与碳材料在结构性能等方面存在较大差异,现有预测模型难以直接套用。
金属有机框架(MOFs)材料的性质结构和吸附能力有很强的相关性,材料的几何构型、表面结构及官能团等均影响着水体中砷污染物在其表面和内部的传质效率。同时吸附条件如时间、温度、pH等对吸附效果也有较大影响,但是通过简单的实验操作很难对各种特征的影响大小进行定量描述。
发明内容
本发明实施例提供一种金属有机框架对砷的吸附性能评估方法、装置、计算机设备和存储介质,以提高金属有机框架对砷的吸附性能评估准确性和效率。
为了解决上述技术问题,本申请实施例提供一种金属有机框架对砷的吸附性能评估方法,所述金属有机框架对砷的吸附性能评估方法包括:
采集金属有机框架对砷吸附的测试信息数据,所述测试信息数据包括材料结构信息、吸附条件信息、污染物特性信息和吸附量信息;
对所述测试信息数据进行预处理,并将预处理后的数据按比例划分为训练集和测试集,确定模型输入特征;
基于BP神经网络算法构建初始性能评估模型,将训练集分为训练集和验证集;
采用提前停止算法在训练集上训练所述初始性能评估模型,并采用验证集对所述初始性能评估模型进行交叉验证,通过自动调参算法根据交叉验证误差调整优化所述初始性能评估模型的超参数,得到目标性能评估模型;
采用预设的评价指标对所述目标性能评估模型进行评估,得到评估值;
基于所述评估值和Shapley值法,确定各个模型输入特征吸附砷的性能。
可选地,所述材料结构信息为比表面积、材料极化性、材料电负性、材料零电荷点、官能团密度、碳不饱和度中的一种或多种;所述吸附条件信息为污染物初始浓度、温度、溶液pH、共存离子中的一种或多种;所述污染物特性信息为污染物类型、污染物解离常数pka1、污染物解离常数pka2、污染物解离常数pka3、亲水性、主要官能团中的一种或多种;所述吸附量信息为最大吸附量、吸附系数kd中的一种或多种。
可选地,所述预处理包括数据初筛和数据标准化操作,其中,
所述数据初筛包括删除冗余数据、平均值填充缺失值和删除异常值;
采用如下公式进行数据标准化:
式中,为归一化数据,xi为原始数据,为原始数据中每一维数据中的均值,σ为原始数据中每一维数据中的标准差。经过处理的数据符合标准正态分布,即均值为0,标准差为1。
可选地,所述确定模型输入特征包括:
采用如下公式计算皮尔森相关系数:
式中,Xi和Yi是两个变量的第i个数据,是变量X的平均值,是变量Y的平均值,r为两个变量X和Y的相关系数;
基于所述相关系数进行特征选择,确定所述模型输入特征。
可选地,所述BP人工神经网络采用五层神经层,其中包含了三层隐藏层,激活函数选择ReLU函数,损失函数选择均方差损失函数,所述采用验证集对所述初始性能评估模型进行交叉验证,通过自动调参算法根据交叉验证误差调整优化所述初始性能评估模型的超参数,得到目标性能评估模型包括:
使用Adam优化算法进行参数和权重的更新,采用前馈误差-反向传播算法训练神经网络,利用梯度的一阶矩估计和二阶矩估计动态调整每个参数;
将训练集输入到初步建立的BP神经网络中进行训练学习,并进行十折交叉验证;
在每一次交叉验证中采用提前停止算法训练预测模型,监测验证集的损失值,当验证集损失值在达到预设阈值次数的训练周期中都没有得到降低时,则停止模型训练,否则训练到设置的最大迭代次数后为止。
使用网格搜索或Hyperopt自动化超参数调优算法,根据交叉验证误差不断调整优化预测模型的超参数,得到所述目标性能评估模型。
可选地,所述评价指标为决定系数R2和均方根误差RMSE中的一种或多种。
可选地,采用如下公式计算决定系数R2:
采用如下公式计算均方根误差RMSE:
式中,和分别表示测试值和预测值,是测试的平均值。
为了解决上述技术问题,本申请实施例还提供一种金属有机框架对砷的吸附性能评估装置,包括:
数据采集模块,用于采集金属有机框架对砷吸附的测试信息数据,所述测试信息数据包括材料结构信息、吸附条件信息、污染物特性信息和吸附量信息;
数据预处理模块,用于对所述测试信息数据进行预处理,并将预处理后的数据按比例划分为训练集和测试集,确定模型输入特征;
初始模型构建模块,用于基于BP神经网络算法构建初始性能评估模型,将训练集分为训练集和验证集;
目标模型训练模块,用于采用提前停止算法在训练集上训练所述初始性能评估模型,并采用验证集对所述初始性能评估模型进行交叉验证,通过自动调参算法根据交叉验证误差调整优化所述初始性能评估模型的超参数,得到目标性能评估模型;
评估值计算模块,用于采用预设的评价指标对所述目标性能评估模型进行评估,得到评估值;
性能评估模块,用于基于所述评估值和Shapley值法,确定各个模型输入特征吸附砷的性能。
可选地,所述预处理包括数据初筛和数据标准化操作,其中,所述数据初筛包括删除冗余数据、平均值填充缺失值和删除异常值;
第一计算单元,用于采用如下公式进行数据标准化:
式中,为归一化数据,xi为原始数据,为原始数据中每一维数据中的均值,σ为原始数据中每一维数据中的标准差。经过处理的数据符合标准正态分布,即均值为0,标准差为1。
可选地,所述数据预处理模块包括:
第二计算单元,用于采用如下公式计算皮尔森相关系数:
式中,Xi和Yi是两个变量的第i个数据,是变量X的平均值,是变量Y的平均值,r为两个变量X和Y的相关系数;
特征确定单元,用于基于所述相关系数进行特征选择,确定所述模型输入特征。
可选地,所述BP人工神经网络采用五层神经层,其中包含了三层隐藏层,激活函数选择ReLU函数,损失函数选择均方差损失函数,所述目标模型训练模块包括:
参数调整单元,用于使用Adam优化算法进行参数和权重的更新,采用前馈误差-反向传播算法训练神经网络,利用梯度的一阶矩估计和二阶矩估计动态调整每个参数;
交叉验证单元,用于将训练集输入到初步建立的BP神经网络中进行训练学习,并进行十折交叉验证;
迭代条件判断单元,用于在每一次交叉验证中采用提前停止算法训练预测模型,监测验证集的损失值,当验证集损失值在达到预设阈值次数的训练周期中都没有得到降低时,则停止模型训练,否则训练到设置的最大迭代次数后为止。
模型优化单元,用于使用网格搜索或Hyperopt自动化超参数调优算法,根据交叉验证误差不断调整优化预测模型的超参数,得到所述目标性能评估模型。
可选地,所述装置还包括:
第三计算单元,用于采用如下公式计算决定系数R2:
第四计算单元,用于采用如下公式计算均方根误差:
式中,和分别表示测试值和预测值,是测试的平均值。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述金属有机框架对砷的吸附性能评估方法的步骤。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述金属有机框架对砷的吸附性能评估方法的步骤。
本发明实施例提供的金属有机框架对砷的吸附性能评估方法、装置、计算机设备及存储介质,通过采集金属有机框架对砷吸附的测试信息数据,测试信息数据包括材料结构信息、吸附条件信息、污染物特性信息和吸附量信息;对测试信息数据进行预处理,并将预处理后的数据按比例划分为训练集和测试集,确定模型输入特征;基于BP神经网络算法构建初始性能评估模型,将训练集分为训练集和验证集;采用提前停止算法在训练集上训练初始性能评估模型,并采用验证集对初始性能评估模型进行交叉验证,通过自动调参算法根据交叉验证误差调整优化初始性能评估模型的超参数,得到目标性能评估模型;采用预设的评价指标对目标性能评估模型进行评估,得到评估值;基于评估值和Shapley值法,确定各个模型输入特征吸附砷的性能,实现了准确快速地预测不同金属有机框架材料在不同吸附条件下对砷污染物的吸附效果,具有较好的泛化能力和较强的鲁棒性,提高了金属有机框架对砷的吸附性能评估的效率和准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请的金属有机框架对砷的吸附性能评估方法的一个实施例的流程图;
图2为本申请的性能评估模型在验证集的预测结果图;
图3为本申请的性能评估模型在测试集的预测结果图;
图4为本申请的性能评估模型在测试集的预测值与实验值散点图;
图5为本申请的性能评估模型解释的影响材料吸附砷污染物效果的主要特征图;
图6为本申请的性能评估模型解释的特征总体分析图。
图7是根据本申请的金属有机框架对砷的吸附性能评估装置的一个实施例的结构示意图;
图8是根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,图1示出本发明实施例提供的一种金属有机框架对砷的吸附性能评估方法,详述如下:
S201:采集金属有机框架对砷吸附的测试信息数据,测试信息数据包括材料结构信息、吸附条件信息、污染物特性信息和吸附量信息。
其中,材料结构信息包括但不限于比表面积、材料极化性、材料电负性、材料零电荷点、官能团密度、碳不饱和度等中的一种或多种。
其中,吸附条件信息包括但不限于污染物初始浓度、温度、溶液pH、共存离子等中的一种或多种。
其中,污染物特性信息包括但不限于污染物类型、污染物解离常数pka1、污染物解离常数pka2、污染物解离常数pka3、亲水性、主要官能团中的一种或多种;吸附量信息为最大吸附量、吸附系数kd等中的一种或多种。
在一具体实施方式中,收集已知的金属有机框架对砷吸附的实验信息作为数据构建数据库,本实施例收集到1573条金属有机框架对砷吸附的实验信息,其中材料结构信息为比表面积、材料极化性、材料电负性、材料零电荷点;吸附条件信息为污染物初始浓度溶液pH;污染物特性信息为污染物类型、污染物解离常数pka1、污染物解离常数pka2、污染物解离常数pka3;吸附量信息为最大吸附量。
S202:对测试信息数据进行预处理,并将预处理后的数据按比例划分为训练集和测试集,确定模型输入特征。
具体地,对采集到的测试信息数据进行预处理,并对预处理后的数据按比例划分为训练集和测试集。
可选地,预处理包括数据初筛和数据标准化操作。
其中,数据初筛包括删除冗余数据、平均值填充缺失值和删除异常值;
进一步地,对初筛后数据进行标准化处理,标准化处理后的数据符合标准正态分布,即均值为0,标准差为1,具体采用如下公式进行数据标准化:
式中,为归一化数据,xi为原始数据,为原始数据中每一维数据中的均值,σ为原始数据中每一维数据中的标准差。
优选地,本实施例采用随机划分的方法将数据按照9:1的比例划分为两份,其中占比90%的作为训练集、占比10%的作为测试集;训练集用于性能评估模型的训练及调优,测试集用于评价最终的性能评估模型。
进一步地,确定模型输入特征包括:
采用如下公式计算皮尔森相关系数:
式中,Xi和Yi是两个变量的第i个数据,是变量X的平均值,是变量Y的平均值,r为两个变量X和Y的相关系数;
基于相关系数进行特征选择,确定模型输入特征。
具体地,采用皮尔森相关系数进行特征选择,皮尔森相关系数也叫皮尔森积差相关系数,是用来反应两个变量X和Y相似程度的统计量,即线性相关程度,其数值介于-1到1之间,绝对值越大表明相关性越强。根据上述计算出的皮尔森相关系数选择有意义的特征输入初始性能评估模型进行训练,在一具体实施方式中确定了11个模型输入特征。
S203:基于BP神经网络算法构建初始性能评估模型,将训练集分为训练集和验证集。
S204:采用提前停止算法在训练集上训练初始性能评估模型,并采用验证集对初始性能评估模型进行交叉验证,通过自动调参算法根据交叉验证误差调整优化初始性能评估模型的超参数,得到目标性能评估模型。
本实施中,采用网格搜索、随机搜索、Hyperopt自动化超参数调优算法或遗传算法粒子群等优化算法获取最优的超参数。
本案例使用网格搜索,网格搜索法是指定参数值的一种穷举搜索方法,也就是说,将各个参数可能的取值进行排列组合,列出所有可能的组合结果生成“网格”。本案例主要调优的超参数是学习率和隐藏层的神经元个数(总共三层隐藏层,每层神经元个数相同),最终得到最优的学习率为0.001,隐藏层神经元为180。
可选地,BP人工神经网络采用五层神经层,其中包含了三层隐藏层,激活函数选择ReLU函数,损失函数选择均方差损失函数,采用验证集对初始性能评估模型进行交叉验证,通过自动调参算法根据交叉验证误差调整优化初始性能评估模型的超参数,得到目标性能评估模型包括:
使用Adam优化算法进行参数和权重的更新,采用前馈误差-反向传播算法训练神经网络,利用梯度的一阶矩估计和二阶矩估计动态调整每个参数;
将训练集输入到初步建立的BP神经网络中进行训练学习,并进行十折交叉验证;
在每一次交叉验证中采用提前停止算法训练预测模型,监测验证集的损失值,当验证集损失值在达到预设阈值次数的训练周期中都没有得到降低时,则停止模型训练,否则训练到设置的最大迭代次数后为止。
使用网格搜索或Hyperopt自动化超参数调优算法,根据交叉验证误差不断调整优化预测模型的超参数,得到目标性能评估模型。
其中,损失值为实验值与预测值的均方误差MSE。
本实施例中,BP人工神经网络采用五层神经层,其中包含了三层隐藏层,激活函数选择ReLU函数,损失函数选择均方差损失函数,并且设置学习率初始值为0.001,监听损失函数的值,当损失函数值增长超过五次,则减少学习率,同时采用dropout技术,在每次训练中随机使10%的每一隐藏层的神经元失活,防止过拟合。
进一步地,将训练集输入到初步建立的BP神经网络中进行训练学习,并进行十折交叉验证具体实现如下:
随机地将数据集(初始训练集)切分为10个互不相交的大小相同的子集;
将9个子集当成训练集训练模型,剩下的1个子集当验证集评估模型;
将上一步对可能的10种选择重复进行(每次挑1个不同的子集做验证集);
每个模型都在相应的验证集上计算验证误差,得到了10个验证误差,计算平均验证误差(交叉验证误差)来评估当前参数下的模型性能,
在一具体实施方式中,模型在验证集上的预测值与实验值散点图如图2 所示,模型预测值与实际值之间的决定系数R2达到0.951,均方根误差RMSE 约为0.216。
优选地,将预设阈值次数设置为20次,防止过拟合,将模型迭代次数最大值为300。
S205:采用预设的评价指标对目标性能评估模型进行评估,得到评估值。
可选地,评价指标为决定系数R2和均方根误差RMSE中的一种或多种。
进一步地,采用如下公式计算决定系数R2:
采用如下公式计算均方根误差RMSE:
式中,和分别表示测试值和预测值,是测试的平均值。
在一具体示例中,使用最优的超参数构建目标性能评估模型,对测试集的数据进行预测,预测结果如图3所示,预测模型在测试集的预测值与实验值散点图如图4所示,模型预测值与实际值之间的决定系数R2达到0.952,均方根误差RMSE约为0.229。
S206:基于评估值和Shapley值法,确定各个模型输入特征吸附砷的性能。
具体地,基于Shapley值建立一个解释器,对预测模型进行解释,并深入分析金属有机框架的材料结构特性和吸附环境等影响因素与预测结果之间的复杂关系,找到影响材料吸附砷污染物效果的主要因子,具体实现如下:
步骤A:Shapley值的核心思想是计算每个特征对模型输出的边际贡献, Shapley值的计算公式如下:
式中,N是参与成员的集合;n是参与成员的总数;S表示为N的任意子集,即一个联盟;|S|表示联盟S中所含成员个数;υ(S)是评估每个联盟S效用水平的特征函数,(S-i)集合表示S中除了i之外的其他成员组成的联盟,为成员对联盟S的边际贡献,前面的分数为加权因子;υi为第i位成员的应得分配,即 Shapley值。在一具体实施方式中,假设有4个成员A,B,C,D,N是参与成员的集合{A,B,C,D},S是N的任意子集{A},{B},{C},{AB},{CD},{ABC},{ACD} 每个联盟的划分依据为属于参与成员的集合N的子集即可。
步骤B:通过计算出的Shapley值,对各种特征的影响大小进行定量分析,将一个特征对目标变量影响程度的绝对值的均值作为这个特征的重要性,如图5所示,影响材料吸附砷污染物效果的主要特征为污染物初始浓度、污染物解离常数pka3、金属极化性、比表面积等。
步骤C:通过对特征的总体分析,如图6所示,每一行代表一个特征,横坐标为SHAP值(Shapley值)。一个点代表一个样本,颜色越红说明特征本身数值越大,颜色越蓝说明特征本身数值越小。从图中我们可以直观地看出污染物初始浓度与最大吸附量预测值是呈正相关,而污染物解离常数pka3与最大吸附量预测值呈负相关的。
通过计算出的Shapley值,将一个特征对目标变量影响程度的绝对值的均值作为这个特征对预测值的贡献,也即该特征的重要性。按照贡献大小排序就可以得到图5的结果。
本实施例中,通过采集金属有机框架对砷吸附的测试信息数据,测试信息数据包括材料结构信息、吸附条件信息、污染物特性信息和吸附量信息;对测试信息数据进行预处理,并将预处理后的数据按比例划分为训练集和测试集,确定模型输入特征;基于BP神经网络算法构建初始性能评估模型,将训练集分为训练集和验证集;采用提前停止算法在训练集上训练初始性能评估模型,并采用验证集对初始性能评估模型进行交叉验证,通过自动调参算法根据交叉验证误差调整优化初始性能评估模型的超参数,得到目标性能评估模型;采用预设的评价指标对目标性能评估模型进行评估,得到评估值;基于评估值和Shapley值法,确定各个模型输入特征吸附砷的性能,实现了准确快速地预测不同金属有机框架材料在不同吸附条件下对砷污染物的吸附效果,具有较好的泛化能力和较强的鲁棒性,提高了金属有机框架对砷的吸附性能评估的效率和准确性。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图7示出与上述实施例金属有机框架对砷的吸附性能评估方法一一对应的金属有机框架对砷的吸附性能评估装置的原理框图。如图7所示,该金属有机框架对砷的吸附性能评估装置包括数据采集模块31、数据预处理模块32、初始模型构建模块33、目标模型训练模块34、评估值计算模块35和性能评估模块36。各功能模块详细说明如下:
数据采集模块31,用于采集金属有机框架对砷吸附的测试信息数据,测试信息数据包括材料结构信息、吸附条件信息、污染物特性信息和吸附量信息;
数据预处理模块32,用于对测试信息数据进行预处理,并将预处理后的数据按比例划分为训练集和测试集,确定模型输入特征;
初始模型构建模块33,用于基于BP神经网络算法构建初始性能评估模型,将训练集分为训练集和验证集;
目标模型训练模块34,用于采用提前停止算法在训练集上训练初始性能评估模型,并采用验证集对初始性能评估模型进行交叉验证,通过自动调参算法根据交叉验证误差调整优化初始性能评估模型的超参数,得到目标性能评估模型;
评估值计算模块35,用于采用预设的评价指标对目标性能评估模型进行评估,得到评估值;
性能评估模块36,用于基于评估值和Shapley值法,确定各个模型输入特征吸附砷的性能。
可选地,预处理包括数据初筛和数据标准化操作,其中,数据初筛包括删除冗余数据、平均值填充缺失值和删除异常值;
第一计算单元,用于采用如下公式进行数据标准化:
式中,为归一化数据,xi为原始数据,为原始数据中每一维数据中的均值,σ为原始数据中每一维数据中的标准差。经过处理的数据符合标准正态分布,即均值为0,标准差为1。
可选地,数据预处理模块32包括:
第二计算单元,用于采用如下公式计算皮尔森相关系数:
式中,Xi和Yi是两个变量的第i个数据,是变量X的平均值,是变量Y的平均值,r为两个变量X和Y的相关系数;
特征确定单元,用于基于相关系数进行特征选择,确定模型输入特征。
可选地,BP人工神经网络采用五层神经层,其中包含了三层隐藏层,激活函数选择ReLU函数,损失函数选择均方差损失函数,目标模型训练模块 34包括:
参数调整单元,用于使用Adam优化算法进行参数和权重的更新,采用前馈误差-反向传播算法训练神经网络,利用梯度的一阶矩估计和二阶矩估计动态调整每个参数;
交叉验证单元,用于将训练集输入到初步建立的BP神经网络中进行训练学习,并进行十折交叉验证;
迭代条件判断单元,用于在每一次交叉验证中采用提前停止算法训练预测模型,监测验证集的损失值,当验证集损失值在达到预设阈值次数的训练周期中都没有得到降低时,则停止模型训练,否则训练到设置的最大迭代次数后为止。
模型优化单元,用于使用网格搜索或Hyperopt自动化超参数调优算法,根据交叉验证误差不断调整优化预测模型的超参数,得到目标性能评估模型。
可选地,该装置还包括:
第三计算单元,用于采用如下公式计算决定系数R2:
第四计算单元,用于采用如下公式计算均方根误差:
式中,和分别表示测试值和预测值,是测试的平均值。
关于金属有机框架对砷的吸附性能评估装置的具体限定可以参见上文中对于金属有机框架对砷的吸附性能评估方法的限定,在此不再赘述。上述金属有机框架对砷的吸附性能评估装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图8,图8为本实施例计算机设备基本结构框图。
所述计算机设备4包括通过***总线相互通信连接存储器41、处理器42、网络接口43。需要指出的是,图中仅示出了具有组件连接存储器41、处理器 42、网络接口43的计算机设备4,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器41至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或D界面显示存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器41可以是所述计算机设备4的内部存储单元,例如该计算机设备4的硬盘或内存。在另一些实施例中,所述存储器41也可以是所述计算机设备4的外部存储设备,例如该计算机设备4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器 41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中,所述存储器41通常用于存储安装于所述计算机设备4的操作***和各类应用软件,例如金属有机框架对砷的吸附性能评估的程序代码等。此外,所述存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器42在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42 通常用于控制所述计算机设备4的总体操作。本实施例中,所述处理器42用于运行所述存储器41中存储的程序代码或者处理数据,例如运行金属有机框架对砷的吸附性能评估的控制的程序代码。
所述网络接口43可包括无线网络接口或有线网络接口,该网络接口43 通常用于在所述计算机设备4与其他电子设备之间建立通信连接。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有界面显示程序,所述界面显示程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的金属有机框架对砷的吸附性能评估方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。
Claims (10)
1.一种金属有机框架对砷的吸附性能评估方法,其特征在于,应用于金属有机框架材料的材料结构信息、吸附条件信息、污染物特性信息和吸附量信息对砷的吸附性能的定性评估,所述金属有机框架对砷的吸附性能评估方法包括:
采集金属有机框架对砷吸附的测试信息数据,所述测试信息数据包括材料结构信息、吸附条件信息、污染物特性信息和吸附量信息;
对所述测试信息数据进行预处理,并将预处理后的数据按比例划分为训练集和测试集,确定模型输入特征;
基于BP神经网络算法构建初始性能评估模型,将训练集分为训练集和验证集;
采用提前停止算法在训练集上训练所述初始性能评估模型,并采用验证集对所述初始性能评估模型进行交叉验证,通过自动调参算法根据交叉验证误差调整优化所述初始性能评估模型的超参数,得到目标性能评估模型,其中,所述自动调参算法为网格搜索法,所述网格搜索法用于将各个参数的取值进行排列组合,列出所有的组合结果生成网格,所述超参数为学习率和隐藏层的神经元个数;
采用预设的评价指标对所述目标性能评估模型进行评估,得到评估值;
基于所述评估值和Shapley值法,确定各个模型输入特征吸附砷的性能。
2.如权利要求1所述的金属有机框架对砷的吸附性能评估方法,其特征在于,所述材料结构信息为比表面积、材料极化性、材料电负性、材料零电荷点、官能团密度、碳不饱和度中的一种或多种;所述吸附条件信息为污染物初始浓度、温度、溶液pH、共存离子中的一种或多种;所述污染物特性信息为污染物类型、污染物解离常数pka1、污染物解离常数pka2、污染物解离常数pka3、亲水性、主要官能团中的一种或多种;所述吸附量信息为最大吸附量、吸附系数kd中的一种或多种。
3.如权利要求1所述的金属有机框架对砷的吸附性能评估方法,其特征在于,所述预处理包括数据初筛和数据标准化操作,其中,
所述数据初筛包括删除冗余数据、平均值填充缺失值和删除异常值;
所述数据标准化采用如下公式:
式中,为标准化数据,xi为原始数据,为原始数据中每一维数据中的均值,σ为原始数据中每一维数据中的标准差,经过处理的数据符合标准正态分布,即均值为0,标准差为1。
4.如权利要求1所述的金属有机框架对砷的吸附性能评估方法,其特征在于,所述确定模型输入特征包括:
采用如下公式计算皮尔森相关系数:
式中,Xi和Yi是两个变量的第i个数据,是变量X的平均值,是变量Y的平均值,r为两个变量X和Y的相关系数;
基于所述相关系数进行特征选择,确定所述模型输入特征。
5.如权利要求1所述的金属有机框架对砷的吸附性能评估方法,其特征在于,所述BP神经网络采用五层神经层,其中包含了三层隐藏层,激活函数选择ReLU函数,损失函数选择均方差损失函数,所述采用验证集对所述初始性能评估模型进行交叉验证,通过自动调参算法根据交叉验证误差调整优化所述初始性能评估模型的超参数,得到目标性能评估模型包括:
使用Adam优化算法进行参数和权重的更新,采用前馈误差-反向传播算法训练神经网络,利用梯度的一阶矩估计和二阶矩估计动态调整每个参数;
将训练集输入到初步建立的BP神经网络中进行训练学习,并进行十折交叉验证;
在每一次交叉验证中采用提前停止算法训练预测模型,监测验证集的损失值,当验证集损失值在达到预设阈值次数的训练周期中都没有得到降低时,则停止模型训练,否则训练到设置的最大迭代次数后为止;
使用网格搜索或Hyperopt自动化超参数调优算法,根据交叉验证误差不断调整优化预测模型的超参数,得到所述目标性能评估模型。
6.如权利要求1所述的金属有机框架对砷的吸附性能评估方法,其特征在于,所述评价指标为决定系数R2和均方根误差RMSE中的一种或多种。
7.如权利要求6所述的金属有机框架对砷的吸附性能评估方法,其特征在于,采用如下公式计算决定系数R2:
采用如下公式计算均方根误差RMSE:
式中,Yi exp和Yi pred分别表示测试值和预测值,是测试的平均值。
8.一种金属有机框架对砷的吸附性能评估装置,其特征在于,应用于金属有机框架材料的材料结构信息、吸附条件信息、污染物特性信息和吸附量信息对砷的吸附性能的定性评估,所述金属有机框架对砷的吸附性能评估装置包括:
数据采集模块,用于采集金属有机框架对砷吸附的测试信息数据,所述测试信息数据包括材料结构信息、吸附条件信息、污染物特性信息和吸附量信息;
数据预处理模块,用于对所述测试信息数据进行预处理,并将预处理后的数据按比例划分为训练集和测试集,确定模型输入特征;
初始模型构建模块,用于基于BP神经网络算法构建初始性能评估模型,将训练集分为训练集和验证集;
目标模型训练模块,用于采用提前停止算法在训练集上训练所述初始性能评估模型,并采用验证集对所述初始性能评估模型进行交叉验证,通过自动调参算法根据交叉验证误差调整优化所述初始性能评估模型的超参数,得到目标性能评估模型,其中,所述自动调参算法为网格搜索法,所述网格搜索法用于将各个参数的取值进行排列组合,列出所有的组合结果生成网格,所述超参数为学习率和隐藏层的神经元个数;
评估值计算模块,用于采用预设的评价指标对所述目标性能评估模型进行评估,得到评估值;
性能评估模块,用于基于所述评估值和Shapley值法,确定各个模型输入特征吸附砷的性能。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的金属有机框架对砷的吸附性能评估方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的金属有机框架对砷的吸附性能评估方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210875620.4A CN115049019B (zh) | 2022-07-25 | 2022-07-25 | 金属有机框架对砷的吸附性能评估方法、装置及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210875620.4A CN115049019B (zh) | 2022-07-25 | 2022-07-25 | 金属有机框架对砷的吸附性能评估方法、装置及相关设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115049019A CN115049019A (zh) | 2022-09-13 |
CN115049019B true CN115049019B (zh) | 2023-04-07 |
Family
ID=83168249
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210875620.4A Active CN115049019B (zh) | 2022-07-25 | 2022-07-25 | 金属有机框架对砷的吸附性能评估方法、装置及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115049019B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116306321B (zh) * | 2023-05-18 | 2023-08-18 | 湖南工商大学 | 基于粒子群的吸附水处理方案优化方法、装置及设备 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117686555B (zh) * | 2024-02-04 | 2024-05-14 | 南京邮电大学 | 一种基于机器学习的lc湿度传感器漂移补偿方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108494620B (zh) * | 2018-02-28 | 2021-07-27 | 南京邮电大学 | 一种网络业务流特征选择与分类方法 |
US20200104678A1 (en) * | 2018-09-27 | 2020-04-02 | Google Llc | Training optimizer neural networks |
CN114202060A (zh) * | 2021-11-25 | 2022-03-18 | 浙江工业大学 | 基于深度神经网络的生物质活性炭吸附亚甲基蓝性能预测方法 |
-
2022
- 2022-07-25 CN CN202210875620.4A patent/CN115049019B/zh active Active
Non-Patent Citations (1)
Title |
---|
孙晓蒙.金属有机骨架化合物吸附去除水体中砷、磷、氟等污染物.第十八届全国分子筛学术大会(上海).2015,第1页. * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116306321B (zh) * | 2023-05-18 | 2023-08-18 | 湖南工商大学 | 基于粒子群的吸附水处理方案优化方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN115049019A (zh) | 2022-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115049019B (zh) | 金属有机框架对砷的吸附性能评估方法、装置及相关设备 | |
CN110738564A (zh) | 贷后风险评估方法及装置、存储介质 | |
CN111814956B (zh) | 一种基于多维度二次特征提取的多任务学习的空气质量预测方法 | |
CN107729241B (zh) | 一种基于变异体分组的软件变异测试数据进化生成方法 | |
CN112508243A (zh) | 电力信息***多故障预测网络模型的训练方法及装置 | |
CN113094988A (zh) | 一种基于数据驱动的浆液循环泵运行优化方法及*** | |
CN113449919B (zh) | 一种基于特征和趋势感知的用电量预测方法及*** | |
CN111784061A (zh) | 一种电网工程造价预测模型的训练方法、装置和设备 | |
CN111709585A (zh) | 一种空调负荷预测方法、装置及存储介质 | |
CN116306321B (zh) | 基于粒子群的吸附水处理方案优化方法、装置及设备 | |
CN113762591A (zh) | 一种基于gru和多核svm对抗学习的短期电量预测方法及*** | |
CN116303786B (zh) | 一种基于多维数据融合算法的区块链金融大数据管理*** | |
CN109784417B (zh) | 黑毛猪肉图像的识别方法 | |
CN112133383B (zh) | 基于遗传符号回归预测钙钛矿比表面积的方法 | |
CN114511078A (zh) | 基于多策略麻雀搜索算法的bp神经网络预测方法及装置 | |
CN114864015A (zh) | 水体富营养化检测方法、装置、设备及存储介质 | |
Panoutsos et al. | An incremental learning structure using granular computing and model fusion with application to materials processing | |
Takeuchi et al. | Evaluating the performance of neutrality tests of a local community using a niche‐structured simulation model | |
Darvish et al. | Discovering dynamic regulatory pathway by applying an auto regressive model to time series DNA microarray data | |
CN117454077A (zh) | 温度传感器故障诊断方法、***、设备及介质 | |
CN117540855A (zh) | 基于HP-EEMD-CSOGSA-MTS-Mixers组合模型的变压器油中溶解气体浓度预测方法及*** | |
CN115953031A (zh) | 风险预测模型的训练方法及装置、计算机可读存储介质 | |
CN115618725A (zh) | 一种基于机器学习的综合能源***多元负荷预测方法 | |
CN113837815A (zh) | 报价预测模型构建方法、预测方法、***、设备及介质 | |
CN114330416A (zh) | 基于增量数据动态更新的反窃电知识图谱优化方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |