CN116305939A - 陆地生态***碳水通量高精度反演方法、***及电子设备 - Google Patents

陆地生态***碳水通量高精度反演方法、***及电子设备 Download PDF

Info

Publication number
CN116305939A
CN116305939A CN202310266948.0A CN202310266948A CN116305939A CN 116305939 A CN116305939 A CN 116305939A CN 202310266948 A CN202310266948 A CN 202310266948A CN 116305939 A CN116305939 A CN 116305939A
Authority
CN
China
Prior art keywords
super
parameters
parameter
water flux
search space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310266948.0A
Other languages
English (en)
Inventor
张文强
罗格平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xinjiang Institute of Ecology and Geography of CAS
Original Assignee
Xinjiang Institute of Ecology and Geography of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xinjiang Institute of Ecology and Geography of CAS filed Critical Xinjiang Institute of Ecology and Geography of CAS
Priority to CN202310266948.0A priority Critical patent/CN116305939A/zh
Publication of CN116305939A publication Critical patent/CN116305939A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Geometry (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种陆地生态***碳水通量高精度反演方法、***及电子设备,属于机器学习领域。本发明采用基因二进制编码方式将待优化的超参数和解释变量的一种选择子集同时编码到同一条染色体上,将每条染色体再解码为机器学习模型可利用的超参数和解释变量,使用自适应遗传算法训练机器学习模型,同步优化超参数和解释变量,获得陆地生态***碳水通量高精度反演模型,显著提升机器学习算法精度和减少机器学习算法运行时间,进而提高反演陆地生态***碳水通量的精度。

Description

陆地生态***碳水通量高精度反演方法、***及电子设备
技术领域
本发明涉及机器学习领域,特别是涉及一种陆地生态***碳水通量高精度反演方法、***及电子设备。
背景技术
机器学习算法因其擅长挖掘高维数据之间的非线性关系并能取得较高的预测精度,在医疗、航空航天、生态地理、工程等众多领域得到了广泛的应用。但机器学习超参数众多,不同的超参数设置会产生不同精度的结果。此外,作为数据导向的建模方法,机器学习有着庞大的数据需求,但不同数据变量之间冗余度较高,变量的筛选能够有效减少机器学习算法训练时间并提高其精度。
对于机器学习超参数的优化方法,使用较多的包括机器学习使用者手动调参、网格搜索算法以及随机搜索算法。手动调参要求使用者对机器学习相当熟悉,凭经验判断超参数如何进行设置能够获得更高的模型准确性,这一方法依赖大量的经验,并且十分耗时,因此发展出了很多自动化调参方法。网格搜索算法是最基本的超参数优化算法,它根据每个超参数的搜索空间构建多维网格矩阵,暴力循环测试每种超参数集合的可能,评估并选择产生最佳结果的模型和超参数,该算法随着超参数个数增加,计算量呈指数级增长。随机搜索算法是针对网格搜索算法的暴力搜索方式提出的改进算法,在一定的搜索区间内,不断随机地而不是有倾向性产生随机点,并计算其约束函数和目标函数的值,对满足约束条件的点,逐个比较其目标函数的值,将坏的点抛弃,保留好的点,最后便得到最优解的近似解。
对于解释变量的筛选,大多数用户通过计算解释变量与预测变量之间的相关系数,以显著性为标准,挑选显著相关的解释变量参与模型构建,但该方法只能定量化两个变量之间的依赖性,没有考虑环境变量的组合效应对预测目标的协同或抑制作用。还有的用户基于部分机器学习算法的特征重要性排序方法筛选参与建模的解释变量,经过筛选,模型的精度均有不同程度的提高且模型的可解释能力增强,但该方法显然受到所采用机器学习算法及其超参数影响。
基于以上分析,在应用机器学习算法时,应当谨慎对待机器学习超参数和解释变量的筛选,超参数优化旨在找到使机器学习算法在验证数据集上表现最佳的超参数,变量选择可以消除不相关或冗余的变量,以减少变量数量,提高模型精度并减少运行时间。这两个因素至关重要,因为特征子集(解释变量)的选择会影响适当的超参数,反之亦然。先前的研究仅单独优化了特征子集选择或超参数,这大大限制了提高机器学习性能的潜力。然而,对这两个因素进行协同优化以搜索每一种可能的组合是一项计算成本高昂的任务。
发明内容
本发明的目的是提供一种陆地生态***碳水通量高精度反演方法、***及电子设备,可同步优化超参数和解释变量,提高反演陆地生态***碳水通量的精度。
为实现上述目的,本发明提供了如下方案:
一种陆地生态***碳水通量高精度反演方法,包括:
确定反演陆地生态***碳水通量所使用的机器学习模型中待优化的超参数;
收集与陆地生态***碳水通量相关的解释变量;
采用基因二进制编码方式将待优化的超参数和所述解释变量的一种选择子集同时编码到同一条染色体上,获得多条染色体;多条所述染色体构成搜索空间,一条染色体代表搜索空间中的一个潜在候选解决方案;
将每条染色体解码为机器学习模型可利用的超参数和解释变量;
基于解码后的超参数和解释变量,使用自适应遗传算法训练所述机器学习模型,同步优化超参数和解释变量,获得优化后的超参数和筛选的解释变量;
将优化后的超参数带入所述机器学习模型,获得陆地生态***碳水通量高精度反演模型;
将筛选的解释变量的实时数据输入陆地生态***碳水通量高精度反演模型,输出反演的陆地生态***碳水通量。
一种陆地生态***碳水通量高精度反演***,包括:
超参数确定模块,用于确定反演陆地生态***碳水通量所使用的机器学习模型中待优化的超参数;
解释变量收集模块,用于收集与陆地生态***碳水通量相关的解释变量;
编码模块,用于采用基因二进制编码方式将待优化的超参数和所述解释变量的一种选择子集同时编码到同一条染色体上,获得多条染色体;多条所述染色体构成搜索空间,一条染色体代表搜索空间中的一个潜在候选解决方案;
解码模块,用于将每条染色体解码为机器学习模型可利用的超参数和解释变量;
同步优化模块,用于基于解码后的超参数和解释变量,使用自适应遗传算法训练所述机器学习模型,同步优化超参数和解释变量,获得优化后的超参数和筛选的解释变量;
反演模型获得模块,用于将优化后的超参数带入所述机器学习模型,获得陆地生态***碳水通量高精度反演模型;
反演模块,用于将筛选的解释变量的实时数据输入陆地生态***碳水通量高精度反演模型,输出反演的陆地生态***碳水通量。
一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如前述的陆地生态***碳水通量高精度反演方法。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明公开一种陆地生态***碳水通量高精度反演方法、***及电子设备,采用基因二进制编码方式将待优化的超参数和所述解释变量的一种选择子集同时编码到同一条染色体上,将每条染色体再解码为机器学习模型可利用的超参数和解释变量,使用自适应遗传算法训练机器学习模型,同步优化超参数和解释变量,获得陆地生态***碳水通量高精度反演模型,显著提升机器学习算法精度和减少机器学习算法运行时间,进而提高反演陆地生态***碳水通量的精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种陆地生态***碳水通量高精度反演方法的流程图;
图2为本发明实施例提供的遗传算法基因、染色体和种群的示意图;
图3为本发明实施例提供的自适应遗传算法的选择、交叉和变异示意图;图3中的(a)为选择示意图,图3中的(b)为交叉示意图,图3中的(c)为变异示意图;
图4为本发明实施例提供的自适应遗传算法工作流程示意图;
图5为本发明实施例提供的超参数和解释变量编码示意图;
图6为本发明实施例提供的解码过程示意图;
图7为本发明实施例提供的对8种机器学习模型优化结果示意图;图7中的(a)为广义回归神经网络优化结果示意图,图7中的(b)为最邻近分类模型优化结果示意图,图7中的(c)为核岭回归模型优化结果示意图,图7中的(d)为多元自适应回归模型优化结果示意图,图7中的(e)为多层感知机优化结果示意图,图7中的(f)为随机森林模型优化结果示意图,图7中的(g)为支持向量机的回归模型优化结果示意图,图7中的(h)为XGB模型优化结果示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种陆地生态***碳水通量高精度反演方法、***及电子设备,可同步优化超参数和解释变量,提高反演陆地生态***碳水通量的精度。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明实施例提供了一种陆地生态***碳水通量高精度反演方法,包括:
步骤1:确定反演陆地生态***碳水通量所使用的机器学习模型中待优化的超参数。
明确机器学习训练任务,确定要进行优化的机器学习超参数及其对应的搜索空间。
示例性的,以随机森林模型预测碳水通量为例,选择n_estimators,criterion和max_depth等三个对模拟结果有显著影响的超参数进行了优化。
步骤2:收集与陆地生态***碳水通量相关的解释变量。
收集并处理相应的解释变量和预测变量,使其满足机器学习方法使用要求。继续以步骤1的随机森林模型预测碳水通量为例,针对解释变量,共收集了气象、遥感和地形等104个解释变量。
步骤3:采用基因二进制编码方式将待优化的超参数和所述解释变量的一种选择子集同时编码到同一条染色体上,获得多条染色体;多条所述染色体构成搜索空间,一条染色体代表搜索空间中的一个潜在候选解决方案。
使用类似于基因的二进制“0”和“1”将机器学习的超参数和解释变量同时编码到同一条染色体上,如图5所示。染色体的长度=超参数个数×每个超参数基因片段长度+解释变量个数。对于数值型超参数来说,用户只需给定该超参数的搜索空间(集合形式,如[10,1000]),而对于字符型参数来说,用户需同时给定字符型的搜索空间和对应的字符个数的搜索空间。
采用基因二进制编码方式将待优化的超参数和所述解释变量的一种选择子集同时编码到同一条染色体上,具体步骤为:
获取超参数的搜索空间;
根据超参数的搜索空间,采用二进制编码方式确定每个待优化的超参数的多种基因片段;
对每个解释变量的选择状态进行二进制编码,并将所有解释变量编码后的二进制选择状态任意组合,形成解释变量的多种基因片段;二进制的“1”对应的选择状态为:选择了解释变量,二进制的“0”对应的选择状态为:没有选择解释变量;
将所有超参数的任意一种基因片段顺次连接后,与解释变量的任意一种基因片段连接,形成一条染色体;所述染色体的长度=超参数个数×每个超参数基因片段长度+解释变量个数。
步骤4:将每条染色体解码为机器学习模型可利用的超参数和解释变量。
参照图6,将步骤3中的用基因表示的染色体进行解码,使机器学习算法能够识别。(1)数值型超参数:首先将该参数的二进制基因片段转换为十进制数字,然后根据二进制基因片段的长度将该十进制数字归一化到[0,1]区间内,最后该超参数值=归一化后的十进制数*(参数搜索空间上限–参数搜索空间下限)+参数搜索空间下限。(2)字符型超参数的解码与数值型基本类似,区别在于要求用户提供所有字符型参数及对应的字符型参数的个数作为搜索空间,最后将计算得到的值取整映射到字符型参数列表中对应位置即可。(3)解释变量:染色体解释变量部分的基因片段中每个基因对应一个解释变量,“1”表示选择该解释变量,“0”表示不选择该解释变量。
(1)染色体中数值型超参数的解码方式为:
将数值型超参数二进制的基因片段转换为十进制数字;
根据数值型超参数二进制的基因片段长度,利用公式w=m/(2n-1),将所述十进制数字归一化到[0,1]区间内,获得数值型超参数的归一化数值;式中,w为数值型超参数的归一化数值,m为数值型超参数的十进制数字,n为基因片段长度;
利用公式a=w×(zmax-zmin)+zmin,将归一化数值解码为数值型超参数的值;式中,a为数值型超参数的值,zmax为数值型超参数的搜索空间上限,zmin为数值型超参数的搜索空间下限。
图6示出一种数值型超参数的解码过程:数值型超参数的搜索空间为[1.500],数值型超参数的基因片段为1010,转换为十进制的10,归一化10/(24-1)≈0.666667,再利用公式0.6667*(500-1)+1≈333.667。
(2)染色体中字符型超参数的解码方式为:
将所有字符型超参数按照在染色体中的位置顺序构成字符型参数列表;
根据字符型超参数的搜索空间和字符型超参数的字符个数的搜索空间,从染色体中提取每个字符型超参数的基因片段;
将每个字符型超参数的基因片段转换为十进制数字后归一化,获得每个字符型超参数的归一化数值;
根据字符型超参数的搜索空间和字符型超参数的归一化数值,利用公式a'=w'×(z'max-z'min)+z'min,取整获得字符型超参数的序号;式中,a'为字符型超参数的序号,w'为字符型超参数的归一化数值,z'max为字符型超参数的搜索空间上限,z'min为字符型超参数的搜索空间下限;
将序号映射至字符型参数列表中的对应位置,获得解码后的字符型超参数。
图6示出一种字符型超参数的解码过程:字符型参数列表(超参数列表)为['linear','poly','rbf','sigmoid'],字符型超参数的搜索空间为[1,4],字符型超参数的基因片段为1010,转换为十进制的10,归一化10/(24-1)≈0.666667,计算0.6667*(4-1)+1=3.0001,取整为3.0,在字符型参数列表中的第3个超参数为'rbf”rbf'
步骤5:基于解码后的超参数和解释变量,使用自适应遗传算法训练所述机器学习模型,同步优化超参数和解释变量,获得优化后的超参数和筛选的解释变量。
遗传算法(GeneticAlgorithm,GA)是一种随机全局搜索优化算法,它模拟自然选择和遗传过程(如选择、交叉和突变)的生物进化过程,以确定全局最优解。首先使用类似于基因的二进制“0”和“1”将机器学习的超参数和解释变量的子集编码到染色体(也称为个体)中,其中“1”表示选择了超参数或变量。每个染色体代表给定问题搜索空间中的潜在候选解决方案。所有候选解决方案的组合形成种群(图2),即解决方案的搜索空间。GA从初始种群开始,然后根据适应度函数值随机选择(图3中的a)、交叉(图3中的b)和变异(图3中的c)种群中的个体,以产生一组更适合环境的个体,这使得种群进化到搜索空间中的更好区域。通过这种方式,种群继续繁殖和进化,最终收敛到一组最适合环境的个体,从而获得给定问题的全局最优解。标准遗传算法中交叉和变异的概率是一个常数,而自适应遗传算法(AdaptiveGeneticAlgorithm,AGA)的改进是根据适应度函数自适应地调整遗传参数,这将保持种群的多样性,提高计算效率,加快算法的收敛。此外,本发明还采用了精英保存策略,将种群进化过程中的最佳个体直接复制到下一代,而无需进行遗传操作,这可以有效防止下一代最佳个体的丢失,提高标准遗传算法的全局收敛能力。自适应遗传算法的工作流程如图4所示。
参照图4,根据优化后的超参数和解释变量,对选定的机器学习模型进行训练,若达到迭代终止条件,则输出当前超参数和解释变量;若没有达到终止条件,则对种群中的染色体进行选择、交叉、变异等遗传操作,对当前种群进行更新以进行下一次迭代。
在使用自适应遗传算法训练所述机器学习模型,达到迭代终止条件时,获取此时的解释变量的最优基因片段,并将最优基因片段中为“1”的解释变量确定为筛选的解释变量。
步骤6:将优化后的超参数带入所述机器学习模型,获得陆地生态***碳水通量高精度反演模型。
步骤7:将筛选的解释变量的实时数据输入陆地生态***碳水通量高精度反演模型,输出反演的陆地生态***碳水通量。
机器学习模型为广义回归神经网络(GRNN)、最邻近分类模型(KNN)、核岭回归模型(KRR)、多元自适应回归模型(MARS)、多层感知机(MLP)、随机森林模型(RF)、XGB模型或支持向量机的回归模型(SVR)。图7展示了对8种机器学习模型优化结果。图7中的(a)为广义回归神经网络优化结果示意图,图7中的(b)为最邻近分类模型优化结果示意图,图7中的(c)为核岭回归模型优化结果示意图,图7中的(d)为多元自适应回归模型优化结果示意图,图7中的(e)为多层感知机优化结果示意图,图7中的(f)为随机森林模型优化结果示意图,图7中的(g)为支持向量机的回归模型优化结果示意图,图7中的(h)为XGB模型优化结果示意图。图7中的横坐标Numberof iteration表示迭代次数,纵坐标R2表示优化后的精度。
仍以步骤1和步骤2的随机森林模型预测碳水通量为例:经过自适应遗传算法的优化,最后共104个解释变量中选择了53个进行建模,对应的n_estimators优化为2694,criterion优化为’mae’,max_depth优化为116。优化后的精度R2=0.72。
机器学习超参数和解释变量优选是显著提高机器学习性能和减少机器学习计算时间的两个有效途径,同时这两个步骤也是进行机器学习训练必不可少的一步。但目前针对机器学习超参数和解释变量优选往往分开进行,这忽视了二者之间的协同和依赖关系,特征变量的子集会影响相应的超参数,反之亦然。针对这个问题,本发明使用自适应遗传算法对机器学习超参数和解释变量进行了同步筛选,该方法克服了传统优化方法忽视超参数和解释变量之间协同变化的缺点,获得了比传统优化方法精度更高的结果。实现自适应遗传算法的关键是将超参数和解释变量同时编码到一条染色体上,同时针对数值型超参数和字符型超参数,提出了不同的解码策略。本发明还对遗传算法中的关键过程进行了优化,加快算法搜索效率,反复迭代,使算法朝最优解方向演化。本发明提出的自适应遗传算法,可以应用于任何类型的机器学习算法,用户可以设定任意多的超参数和解释变量个数,用户还可设定不同的算法终止条件来控制算法的运行。
因此,本发明提出的自适应遗传算法,基于当前的输入数据,能够获得有效的机器学习超参数和特征变量子集,具备显著提升机器学习算法精度和减少机器学习算法运行时间的潜力。这对机器学习算法性能提升以及机器学习的推广具有重要意义,并能为机器学习使用者提供合理的参数化方案。
本发明实施例提供了一种陆地生态***碳水通量高精度反演***,包括:
超参数确定模块,用于确定反演陆地生态***碳水通量所使用的机器学习模型中待优化的超参数;
解释变量收集模块,用于收集与陆地生态***碳水通量相关的解释变量;
编码模块,用于采用基因二进制编码方式将待优化的超参数和所述解释变量的一种选择子集同时编码到同一条染色体上,获得多条染色体;多条所述染色体构成搜索空间,一条染色体代表搜索空间中的一个潜在候选解决方案;
解码模块,用于将每条染色体解码为机器学习模型可利用的超参数和解释变量;
同步优化模块,用于基于解码后的超参数和解释变量,使用自适应遗传算法训练所述机器学习模型,同步优化超参数和解释变量,获得优化后的超参数和筛选的解释变量;
反演模型获得模块,用于将优化后的超参数带入所述机器学习模型,获得陆地生态***碳水通量高精度反演模型;
反演模块,用于将筛选的解释变量的实时数据输入陆地生态***碳水通量高精度反演模型,输出反演的陆地生态***碳水通量。
本发明实施例提供的陆地生态***碳水通量高精度反演***与上述实施例所述的陆地生态***碳水通量高精度反演方法,其工作原理和有益效果类似,故此处不再详述,具体内容可参见上述方法实施例的介绍。
本发明还提供一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如前述的陆地生态***碳水通量高精度反演方法。
此外,上述的存储器中的计算机程序通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的***而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种陆地生态***碳水通量高精度反演方法,其特征在于,包括:
确定反演陆地生态***碳水通量所使用的机器学习模型中待优化的超参数;
收集与陆地生态***碳水通量相关的解释变量;
采用基因二进制编码方式将待优化的超参数和所述解释变量的一种选择子集同时编码到同一条染色体上,获得多条染色体;多条所述染色体构成搜索空间,一条染色体代表搜索空间中的一个潜在候选解决方案;
将每条染色体解码为机器学习模型可利用的超参数和解释变量;
基于解码后的超参数和解释变量,使用自适应遗传算法训练所述机器学习模型,同步优化超参数和解释变量,获得优化后的超参数和筛选的解释变量;
将优化后的超参数带入所述机器学习模型,获得陆地生态***碳水通量高精度反演模型;
将筛选的解释变量的实时数据输入陆地生态***碳水通量高精度反演模型,输出反演的陆地生态***碳水通量。
2.根据权利要求1所述的陆地生态***碳水通量高精度反演方法,其特征在于,所述采用基因二进制编码方式将待优化的超参数和所述解释变量的一种选择子集同时编码到同一条染色体上,具体包括:
获取超参数的搜索空间;
根据超参数的搜索空间,采用二进制编码方式确定每个待优化的超参数的多种基因片段;
对每个解释变量的选择状态进行二进制编码,并将所有解释变量编码后的二进制选择状态任意组合,形成解释变量的多种基因片段;二进制的“1”对应的选择状态为:选择了解释变量,二进制的“0”对应的选择状态为:没有选择解释变量;
将所有超参数的任意一种基因片段顺次连接后,与解释变量的任意一种基因片段连接,形成一条染色体;所述染色体的长度=超参数个数×每个超参数基因片段长度+解释变量个数。
3.根据权利要求2所述的陆地生态***碳水通量高精度反演方法,其特征在于,所述超参数包括:数值型超参数和字符型超参数;
若所述超参数为数值型超参数,则获取的超参数的搜索空间为数值型超参数的搜索空间;
若所述超参数为字符型超参数,则获取的超参数的搜索空间为字符型超参数的搜索空间和字符型超参数的字符个数的搜索空间。
4.根据权利要求3所述的陆地生态***碳水通量高精度反演方法,其特征在于,所述染色体中数值型超参数的解码方式为:
将数值型超参数二进制的基因片段转换为十进制数字;
根据数值型超参数二进制的基因片段长度,利用公式w=m/(2n-1),将所述十进制数字归一化到[0,1]区间内,获得数值型超参数的归一化数值;式中,w为数值型超参数的归一化数值,m为数值型超参数的十进制数字,n为基因片段长度;
利用公式a=w×(zmax-zmin)+zmin,将归一化数值解码为数值型超参数的值;式中,a为数值型超参数的值,zmax为数值型超参数的搜索空间上限,zmin为数值型超参数的搜索空间下限。
5.根据权利要求4所述的陆地生态***碳水通量高精度反演方法,其特征在于,所述染色体中字符型超参数的解码方式为:
将所有字符型超参数按照在染色体中的位置顺序构成字符型参数列表;
根据字符型超参数的搜索空间和字符型超参数的字符个数的搜索空间,从染色体中提取每个字符型超参数的基因片段;
将每个字符型超参数的基因片段转换为十进制数字后归一化,获得每个字符型超参数的归一化数值;
根据字符型超参数的搜索空间和字符型超参数的归一化数值,利用公式a'=w'×(z'max-z'min)+z'min,取整获得字符型超参数的序号;式中,a'为字符型超参数的序号,w'为字符型超参数的归一化数值,z'max为字符型超参数的搜索空间上限,z'min为字符型超参数的搜索空间下限;
将序号映射至字符型参数列表中的对应位置,获得解码后的字符型超参数。
6.根据权利要求1所述的陆地生态***碳水通量高精度反演方法,其特征在于,所述自适应遗传算法中根据适应度函数值动态调整交叉概率和变异概率;
所述自适应遗传算法采用了精英保存策略,将种群进化过程中的最佳个体直接复制到下一代,无需进行遗传操作。
7.根据权利要求1所述的陆地生态***碳水通量高精度反演方法,其特征在于,获得筛选的解释变量,具体包括:
在使用自适应遗传算法训练所述机器学习模型,达到迭代终止条件时,获取此时的解释变量的最优基因片段,并将最优基因片段中为“1”的解释变量确定为筛选的解释变量。
8.根据权利要求1所述的陆地生态***碳水通量高精度反演方法,其特征在于,所述机器学习模型为广义回归神经网络、最邻近分类模型、核岭回归模型、多元自适应回归模型、多层感知机、随机森林模型、XGB模型或支持向量机的回归模型。
9.一种陆地生态***碳水通量高精度反演***,其特征在于,包括:
超参数确定模块,用于确定反演陆地生态***碳水通量所使用的机器学习模型中待优化的超参数;
解释变量收集模块,用于收集与陆地生态***碳水通量相关的解释变量;
编码模块,用于采用基因二进制编码方式将待优化的超参数和所述解释变量的一种选择子集同时编码到同一条染色体上,获得多条染色体;多条所述染色体构成搜索空间,一条染色体代表搜索空间中的一个潜在候选解决方案;
解码模块,用于将每条染色体解码为机器学习模型可利用的超参数和解释变量;
同步优化模块,用于基于解码后的超参数和解释变量,使用自适应遗传算法训练所述机器学习模型,同步优化超参数和解释变量,获得优化后的超参数和筛选的解释变量;
反演模型获得模块,用于将优化后的超参数带入所述机器学习模型,获得陆地生态***碳水通量高精度反演模型;
反演模块,用于将筛选的解释变量的实时数据输入陆地生态***碳水通量高精度反演模型,输出反演的陆地生态***碳水通量。
10.一种电子设备,其特征在于,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至8中任一项所述的陆地生态***碳水通量高精度反演方法。
CN202310266948.0A 2023-03-17 2023-03-17 陆地生态***碳水通量高精度反演方法、***及电子设备 Pending CN116305939A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310266948.0A CN116305939A (zh) 2023-03-17 2023-03-17 陆地生态***碳水通量高精度反演方法、***及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310266948.0A CN116305939A (zh) 2023-03-17 2023-03-17 陆地生态***碳水通量高精度反演方法、***及电子设备

Publications (1)

Publication Number Publication Date
CN116305939A true CN116305939A (zh) 2023-06-23

Family

ID=86793844

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310266948.0A Pending CN116305939A (zh) 2023-03-17 2023-03-17 陆地生态***碳水通量高精度反演方法、***及电子设备

Country Status (1)

Country Link
CN (1) CN116305939A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117689011A (zh) * 2023-12-28 2024-03-12 杭州汇健科技有限公司 一种模型调整方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117689011A (zh) * 2023-12-28 2024-03-12 杭州汇健科技有限公司 一种模型调整方法、装置、设备及存储介质
CN117689011B (zh) * 2023-12-28 2024-05-03 杭州汇健科技有限公司 一种模型调整方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
Zhang et al. Binary differential evolution with self-learning for multi-objective feature selection
Zhang et al. Cost-sensitive feature selection using two-archive multi-objective artificial bee colony algorithm
Sahebi et al. GeFeS: A generalized wrapper feature selection approach for optimizing classification performance
Zang et al. A cloud model based DNA genetic algorithm for numerical optimization problems
Lobato et al. Multi-objective genetic algorithm for missing data imputation
Zhou et al. A correlation guided genetic algorithm and its application to feature selection
Pernía-Espinoza et al. Stacking ensemble with parsimonious base models to improve generalization capability in the characterization of steel bolted components
Zhang et al. PS-Tree: A piecewise symbolic regression tree
Nigam et al. JANUS: parallel tempered genetic algorithm guided by deep neural networks for inverse molecular design
Szwarcman et al. Quantum-inspired evolutionary algorithm applied to neural architecture search
CN116305939A (zh) 陆地生态***碳水通量高精度反演方法、***及电子设备
Tan et al. Knowledge transfer in evolutionary multi-task optimization: A survey
Pahariya et al. Software cost estimation using computational intelligence techniques
Zhao et al. A hybrid learning method for constructing compact rule-based fuzzy models
Huang et al. Harnessing deep learning for population genetic inference
Wei et al. MoCo4SRec: A momentum contrastive learning framework for sequential recommendation
CN111126560A (zh) 一种基于云遗传算法优化bp神经网络的方法
CN117974221A (zh) 基于人工智能的电动车充电站选址方法及***
CN112819062B (zh) 基于混合粒子群和连续投影的荧光光谱二次特征选择方法
Zhu et al. An Efficient Hybrid Feature Selection Method Using the Artificial Immune Algorithm for High‐Dimensional Data
Mateo et al. Approximate k-NN delta test minimization method using genetic algorithms: Application to time series
CN111831955A (zh) 一种锂离子电池剩余寿命预测方法及***
CN116522194A (zh) 一种基于和声搜索-Stacking的分类方法
Fonseca et al. A similarity-based surrogate model for enhanced performance in genetic algorithms
CN112819161B (zh) 变长基因遗传算法的神经网络构建***、方法及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination