CN115458071A - 土壤重金属含量预测方法、装置与设备 - Google Patents

土壤重金属含量预测方法、装置与设备 Download PDF

Info

Publication number
CN115458071A
CN115458071A CN202210943187.3A CN202210943187A CN115458071A CN 115458071 A CN115458071 A CN 115458071A CN 202210943187 A CN202210943187 A CN 202210943187A CN 115458071 A CN115458071 A CN 115458071A
Authority
CN
China
Prior art keywords
soil
heavy metal
metal content
data set
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210943187.3A
Other languages
English (en)
Other versions
CN115458071B (zh
Inventor
王占刚
张文帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Information Science and Technology University
Original Assignee
Beijing Information Science and Technology University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Information Science and Technology University filed Critical Beijing Information Science and Technology University
Priority to CN202210943187.3A priority Critical patent/CN115458071B/zh
Publication of CN115458071A publication Critical patent/CN115458071A/zh
Application granted granted Critical
Publication of CN115458071B publication Critical patent/CN115458071B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种土壤重金属含量预测方法、装置与设备,包括:获取目标区域内各采样点的土壤数据以及目标区域内各污染源的位置信息,土壤数据包括土壤重金属含量信息和位置信息;根据各采样点的土壤数据和各污染源的位置信息对土壤重金属含量预测模型进行训练,得到训练好的土壤重金属含量预测模型,土壤重金属含量预测模型包括融合空间信息的图卷积网络;根据训练好的土壤重金属含量预测模型确定目标区域内各个位置点处的土壤重金属含量信息。通过目标区域内有限数量采样点便可以预测出目标区域内任意位置处的土壤重金属含量信息,可以大幅降低采样成本;融合了采样点的空间位置信息且综合考虑了污染源的位置信息,有助于进一步提高预测的准确性。

Description

土壤重金属含量预测方法、装置与设备
技术领域
本发明实施例涉及土壤数据分析技术领域,具体涉及一种土壤重金属含量预测方法、装置与设备。
背景技术
随着工业化和城市化的不断推进,土壤生态环境面临着十分严重的考验和压力,土壤重金属污染问题尤其让人担忧。土壤质量主要受各类重金属的影响,铅、铜、汞、砷、镍、镉等重金属皆可能造成土壤污染,其中镉为土壤中的首要重金属污染物。土壤中的重金属通常难以被细菌、真菌、放线菌等微生物分解,这将会导致土壤中的重金属不断累积。当土壤重金属含量超过一定值时,不仅植物的生长会受到严重影响,而且重金属还会通过各种农副产品进入人体,严重威胁人体的身体健康。土壤重金属含量是对土壤污染状态进行风险评价分级、科学规划土地、土壤污染防治以及农副产品安全生产的重要依据,因此获取土壤重金属含量具有重要意义。
通过对土壤进行采样,对采样样本进行检测化验是获取土壤重金属含量的重要方法之一。若要全面掌握土壤中的重金属含量,则需要对土壤进行高密度、高频率地采样,然而采样及检测化验成本高,且会产生二次污染,可行性较低,因此亟需一种行之有效地获取土壤重金属含量的方法。
发明内容
本发明实施例提供一种土壤重金属含量预测方法、装置与设备,用以解决现有获取土壤重金属含量的方法成本高的问题。
第一方面,本发明实施例提供一种土壤重金属含量预测方法,包括:
获取目标区域内各采样点的土壤数据以及目标区域内各污染源的位置信息,土壤数据包括土壤重金属含量信息和位置信息;
根据各采样点的土壤数据和各污染源的位置信息对土壤重金属含量预测模型进行训练,得到训练好的土壤重金属含量预测模型,土壤重金属含量预测模型包括融合空间信息的图卷积网络;
根据训练好的土壤重金属含量预测模型确定目标区域内各个位置点处的土壤重金属含量信息。
一种实施例中,根据各采样点的土壤数据和各污染源的位置信息对土壤重金属含量预测模型进行训练之前,所述方法还包括:
根据各采样点的土壤数据是否完备将其划分为完备数据集和残缺数据集;
根据完备数据集对残缺数据集中缺失的数据进行补充和/或对残缺数据集中异常的数据进行校正,得到各采样点的完备土壤数据;
根据各采样点的完备土壤数据和各污染源的位置信息对土壤重金属含量预测模型进行训练。
一种实施例中,根据完备数据集对残缺数据集中缺失的数据进行补充和/或对残缺数据集中异常的数据进行校正包括:
采用改进的麻雀搜索算法对深度极限学习机进行迭代优化,得到改进的深度极限学习机;
采用所述改进的深度极限学习机,根据完备数据集对残缺数据集中缺失的数据进行补充和/或对残缺数据集中异常的数据进行校正。
一种实施例中,采用改进的麻雀搜索算法对深度极限学习机进行迭代优化,得到改进的深度极限学习机包括:
采用Singer混沌映射初始化麻雀种群;
计算麻雀种群的适应度值并进行排序,确定出最优值;
采用余弦权重因子更新发现者、加入者以及注意到危险的麻雀位置;
对最优值进行柯西-高斯变异自适应扰动,产生新解;
将最优值和新解进行比较,在新解优于最优值时,将最优值更新为新解;
进行迭代操作直到达到最大迭代次数,得到全局最优值和最佳适应度值;
将全局最优值和最佳适应度值作为深度极限学习机的输入,利用完备数据集不断训练深度极限学习机,直至总误差小于预设期望误差,得到改进的深度极限学习机。
一种实施例中,土壤重金属含量预测模型包括空间信息编码器,空间信息编码器用于学习空间坐标上下文感知信息,根据各采样点的土壤数据和各污染源的位置信息对土壤重金属含量预测模型进行训练包括:
对目标区域中的采样点进行随机抽样,得到训练数据集;
根据训练数据集中各采样点的位置信息确定空间坐标矩阵,采用k近邻算法构建空间图,得到邻接矩阵;
将空间坐标矩阵输入空间信息编码器,得到坐标嵌入矩阵;
确定节点特征,节点特征包括采样点的土壤重金属含量信息、采样点的位置信息和污染源的位置信息;
将坐标嵌入矩阵和节点特征进行拼接,作为融合空间信息的图卷积网络的输入,对融合空间信息的图卷积网络进行训练;
根据邻接矩阵确定局部莫兰指数;
采用局部莫兰指数对融合空间信息的图卷积网络的预测结果进行调整;
对融合空间信息的图卷积网络进行训练迭代训练,直至融合空间信息的图卷积网络的损失函数值满足预设要求。
一种实施例中,空间信息编码器包括正余弦函数和全连接神经网络,将空间坐标矩阵输入空间信息编码器,得到坐标嵌入矩阵包括:
空间坐标矩阵C={c1,...cn},ci为第i个采样点的经纬度坐标,空间信息编码器SE(C)=NN(PE(g)(C)),其中
Figure BDA0003786589390000031
为S个串联的多尺度正余弦函数,其中
Figure BDA0003786589390000032
分别处理C的空间维度v,v包括纬度和经度,NN表示全连接神经网络,使得:
Figure BDA0003786589390000033
式中,λmin表示最小网格尺度、λmax表示最大网格尺度,
Figure BDA0003786589390000034
将PE(g)(C)的输出通过全连接神经网络进行处理,得到坐标嵌入矩阵。
一种实施例中,根据邻接矩阵确定局部莫兰指数,包括:
根据如下表达式确定局部莫兰指数:
Figure BDA0003786589390000035
其中,
Figure BDA0003786589390000036
表示训练数据集中所有采样点土壤重金属含量的均值,
Figure BDA0003786589390000037
为方差,xi表示训练数据集中第i个采样点的土壤重金属含量,xj表示训练数据集中第j个采样点的土壤重金属含量,n表示训练数据集中采样点的总数目,wij表示邻接矩阵的空间权重矩阵中第i行第j列的元素。
第二方面,本发明实施例提供一种土壤重金属含量预测装置,包括:
获取模块,用于获取目标区域内各采样点的土壤数据以及目标区域内各污染源的位置信息,土壤数据包括土壤重金属含量信息和位置信息;
训练模块,用于根据各采样点的土壤数据和各污染源的位置信息对土壤重金属含量预测模型进行训练,得到训练好的土壤重金属含量预测模型,土壤重金属含量预测模型包括融合空间信息的图卷积网络;
预测模块,用于根据训练好的土壤重金属含量预测模型确定目标区域内各个位置点处的土壤重金属含量信息。
第三方面,本发明实施例提供一种土壤重金属含量预测设备,包括:
至少一个处理器和存储器;
存储器存储计算机执行指令;
至少一个处理器执行存储器存储的计算机执行指令,使得至少一个处理器执行如第一方面任一项所述的土壤重金属含量预测方法。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现如第一方面任一项所述的土壤重金属含量预测方法。
本发明实施例提供的土壤重金属含量预测方法、装置与设备,通过获取目标区域内各采样点的土壤数据以及目标区域内各污染源的位置信息,土壤数据包括土壤重金属含量信息和位置信息;然后根据各采样点的土壤数据和各污染源的位置信息对土壤重金属含量预测模型进行训练,得到训练好的土壤重金属含量预测模型,土壤重金属含量预测模型包括融合空间信息的图卷积网络;最后根据训练好的土壤重金属含量预测模型确定目标区域内各个位置点处的土壤重金属含量信息,实现了通过目标区域内有限数量采样点便可以预测出目标区域内任意位置处的土壤重金属含量信息,可以大幅降低采样成本;且融合了采样点的空间位置信息且综合考虑了污染源的位置信息,有助于进一步提高预测的准确性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1为本发明提供的土壤重金属含量预测方法一实施例的流程图;
图2为本发明提供的土壤重金属含量预测方法又一实施例的流程图;
图3为本发明提供的土壤重金属含量预测方法另一实施例的流程图;
图4为本发明提供的土壤重金属含量预测方法又一实施例的流程图;
图5为本发明提供的土壤重金属含量预测装置一实施例的结构示意图;
图6为本发明提供的土壤重金属含量预测设备一实施例的结构示意图。
通过上述附图,已示出本发明明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本发明构思的范围,而是通过参考特定实施例为本领域技术人员说明本发明的概念。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。而本申请所说“连接”、“联接”,如无特别说明,均包括直接和间接连接(联接)。
土壤重金属污染治理修复周期长而且修复成本高,所以目前土壤防治治理措施主要以预防为主,恢复为辅。土壤重金属污染在传递上有着严重的滞后性,如何及时发现土壤污染情况变得尤为重要。土壤重金属的采样、检测化验成本高,且会产生二次污染,因此如何利用有限的土壤重金属数据去预测分析土壤中的重金属含量成为污染管控修复的重中之重。为了实现该目标,本申请采用了能够很好地对非线性特征进行提取的深度学习方法,综合考虑污染源的位置信息并融合采样点的空间信息,对土壤重金属含量进行预测,可以对污染防治、城市规划和农业生产等起到指导作用,为土地的利用、污染研究、治理等方面提供技术支撑。下面将结合具体的实施例来进行详细说明。
图1为本发明提供的土壤重金属含量预测方法一实施例的流程图。如图1所示,本实施例提供的土壤重金属含量预测方法可以包括:
S101、获取目标区域内各采样点的土壤数据以及目标区域内各污染源的位置信息,土壤数据包括土壤重金属含量信息和位置信息。
一种可选的实施方式中,可以以预设的采样密度在目标区域内设置采样点,例如可以采用10个/平方千米的采样密度来设置采样点,然后采集采样点处的土壤样本进行检测化验,以获取采样点的土壤重金属含量信息。采样点的位置信息例如可以采用经度和纬度来表示。
另一种可选的实施方式中,还可以综合考量目标区域内的地形地貌信息,在便于进行采样的位置设置采样点,以降低获取采样点土壤重金属含量信息的人力成本。
可以理解的是,靠近污染源的土壤中重金属含量较高,而远离污染源的土壤中重金属含量较低,即污染源的位置是影响土壤重金属含量的因素之一。
S102、根据各采样点的土壤数据和各污染源的位置信息对土壤重金属含量预测模型进行训练,得到训练好的土壤重金属含量预测模型,土壤重金属含量预测模型包括融合空间信息的图卷积网络(Graph Convolutional Network,GCN)。
本实施例中基于融合空间信息的图卷积网络来构建土壤重金属含量预测模型,融合污染源的位置信息和采样点的位置信息。以采样点的土壤数据和各污染源的位置信息作为训练数据,完成对土壤重金属含量预测模型的训练。
S103、根据训练好的土壤重金属含量预测模型确定目标区域内各个位置点处的土壤重金属含量信息。
本实施例中在得到训练好的土壤重金属含量预测模型之后,将目标区域内任意位置处的位置信息输入训练好的土壤重金属含量预测模型,便可以得到该位置处的土壤重金属含量信息。
本实施例提供的土壤重金属含量预测方法,通过获取目标区域内各采样点的土壤数据以及目标区域内各污染源的位置信息,土壤数据包括土壤重金属含量信息和位置信息;然后根据各采样点的土壤数据和各污染源的位置信息对土壤重金属含量预测模型进行训练,得到训练好的土壤重金属含量预测模型,土壤重金属含量预测模型包括融合空间信息的图卷积网络;最后根据训练好的土壤重金属含量预测模型确定目标区域内各个位置点处的土壤重金属含量信息,实现了通过目标区域内有限数量采样点便可以预测出目标区域内任意位置处的土壤重金属含量信息,可以大幅降低采样成本;且融合了采样点的空间位置信息且综合考虑了污染源的位置信息,有助于进一步提高预测的准确性。
获取到的目标区域中各采样点的土壤数据可能会存在部分缺失或者数据异常的情况,若将这些数据直接用于对模型进行训练,无疑会降低模型的预测准确性,而若将这些数据直接丢弃,无疑白白浪费了获取这些数据的成本。因此,为了提升数据的可用性,在根据各采样点的土壤数据和各污染源的位置信息对土壤重金属含量预测模型进行训练之前,对各采样点的土壤数据进行预处理,以消除数据中的缺失和异常现象。如图2所示,本实施例提供的土壤重金属含量预测方法,在根据各采样点的土壤数据和各污染源的位置信息对土壤重金属含量预测模型进行训练之前,还可以包括:
S201、根据各采样点的土壤数据是否完备将其划分为完备数据集和残缺数据集。
本实施例中可以通过人工筛查的方式或者通过机器智能筛查的方式来对各采样点的土壤数据进行划分。其中,残缺数据集包括了目标区域中存在数据缺失和/或数据异常的所有采样点的土壤数据。
S202、根据完备数据集对残缺数据集中缺失的数据进行补充和/或对残缺数据集中异常的数据进行校正,得到各采样点的完备土壤数据。
例如可以根据完备数据集采用插值的方式对残缺数据集中缺失的数据进行补充和/或对残缺数据集中异常的数据进行校正;或者也可以基于深度学习的方法,根据完备数据集训练数据模型,采用训练好的数据模型来对残缺数据集中缺失的数据进行补充和/或对残缺数据集中异常的数据进行校正。
S203、根据各采样点的完备土壤数据和各污染源的位置信息对土壤重金属含量预测模型进行训练。
在得到各采样点的完备土壤数据之后,根据完备数据进行模型训练,无疑可以提高模型的准确性,进而可以提高土壤重金属含量预测模型的预测准确性。
本实施例提供的土壤重金属含量预测方法,在上述实施例的基础上,进一步地通过采样点中的完备数据集对残缺数据集中缺失的数据进行补充和/或对残缺数据集中异常的数据进行校正,得到各采样点的完备土壤数据,然后根据各采样点的完备土壤数据和各污染源的位置信息对土壤重金属含量预测模型进行训练。一方面可以提高数据的可用性,另一方面可以提高土壤重金属含量预测模型的预测准确性。
一种可选的实施方式中,根据完备数据集对残缺数据集中缺失的数据进行补充和/或对残缺数据集中异常的数据进行校正具体可以包括:采用改进的麻雀搜索算法(Improved Sparrow Search Algorithm,ISSA)对深度极限学习机(Deep ExtremeLearning Machine,DELM)进行迭代优化,得到改进的深度极限学习机;采用改进的深度极限学习机,根据完备数据集对残缺数据集中缺失的数据进行补充和/或对残缺数据集中异常的数据进行校正。DELM的随机输入权重和偏置会影响其训练效果,故引入了ISSA来优化DELM的参数。以DELM为基础,利用ISSA迭代寻优DELM的预训练过程中的各输入权重与偏置,以此来提升DELM的精确度。ISSA-DELM算法结合了ISSA算法的全局搜索能力和局部开发能力以及DELM的非线性特征随机映射能力,能够避免模型陷入局部最值。因此采用ISSA-DELM对残缺数据集中缺失的数据进行补充和/或对残缺数据集中异常的数据进行校正,可以进一步提高准确性。
图3为本发明提供的土壤重金属含量预测方法另一实施例的流程图。如图3所示,本实施例中采用改进的麻雀搜索算法对深度极限学习机进行迭代优化,得到改进的深度极限学习机可以包括:
S2021、采用Singer混沌映射初始化麻雀种群。
在采用Singer混沌映射初始化麻雀种群之前,还可以对ISSA-DELM的相关参数进行初始化。
S2022、计算麻雀种群的适应度值并进行排序,确定出最优值。
S2023、采用余弦权重因子更新发现者、加入者以及注意到危险的麻雀位置;
S2024、对最优值进行柯西-高斯变异自适应扰动,产生新解。
S2025、将最优值和新解进行比较,在新解优于最优值时,将最优值更新为新解。
S2026、进行迭代操作直到达到最大迭代次数,得到全局最优值和最佳适应度值。
S2027、将全局最优值和最佳适应度值作为深度极限学习机的输入,利用完备数据集不断训练深度极限学习机,直至总误差小于预设期望误差,得到改进的深度极限学习机。
本实施例提供的土壤重金属含量预测方法,充分利用了ISSA算法的全局搜索能力和局部开发能力以及DELM的非线性特征随机映射能力,可以进一步提高对残缺数据集中缺失的数据进行补充和/或对残缺数据集中异常的数据进行校正的准确性。
一种可选的实施方式中,土壤重金属含量预测模型可以包括空间信息编码器,用于学习空间坐标上下文感知信息。构建土壤重金属含量预测模型时,将采样点的土壤数据和污染源的位置信息融合作为整个模型的输入,然后将空间信息编码器返回的坐标嵌入矩阵与其他节点特征(采样点的土壤重金属含量信息、采样点的位置信息和污染源的位置信息)连接起来,为GCN提供训练数据。采用表示空间自相关性的局部莫兰(Moran's I)指数为GCN的预测结果提供辅助学习。具体过程请参考图4,本实施例提供的土壤重金属含量预测方法中,根据各采样点的土壤数据和各污染源的位置信息对土壤重金属含量预测模型进行训练可以包括:
S1021、对目标区域中的采样点进行随机抽样,得到训练数据集。
通过随机抽样,可以使得每次进行训练的训练数据集不完全相同,这样在使用不同批次的训练数据集进行训练时,中心点在不同的训练迭代中可能有不同的邻域,这样中心点的Moran's I指数在整个迭代过程中也能不断变化,可以反映与更远或更近的邻域,这样有助于克服Moran's I的尺度敏感性。
S1022、根据训练数据集中各采样点的位置信息确定空间坐标矩阵,采用k近邻算法构建空间图,得到邻接矩阵。
S1023、将空间坐标矩阵输入空间信息编码器,得到坐标嵌入矩阵。
一种可选的实施方式中,空间信息编码器包括正余弦函数和全连接神经网络,将空间坐标矩阵输入空间信息编码器,得到坐标嵌入矩阵可以包括:
空间坐标矩阵C={c1,...cn},ci为第i个采样点的经纬度坐标,空间信息编码器SE(C)=NN(PE(g)(C)),其中
Figure BDA0003786589390000101
为S个串联的多尺度正余弦函数,其中
Figure BDA0003786589390000102
分别处理C的空间维度v,v包括纬度和经度,NN表示全连接神经网络,使得:
Figure BDA0003786589390000103
式中,λmin表示最小网格尺度、λmax表示最大网格尺度,
Figure BDA0003786589390000104
将PE(g)(C)的输出通过全连接神经网络进行处理,得到坐标嵌入矩阵。
S1024、确定节点特征,节点特征包括采样点的土壤重金属含量信息、采样点的位置信息和污染源的位置信息。
S1025、将坐标嵌入矩阵和节点特征进行拼接,作为融合空间信息的图卷积网络的输入,对融合空间信息的图卷积网络进行训练。
本实施例中可以将空间信息编码器输出的坐标嵌入矩阵
Figure BDA0003786589390000105
与节点特征XB连接起来,作为融合空间信息的图卷积网络(Spatial Encoder-Graph ConvolutionalNetwork,SE-GCN)的第一层输入:
Figure BDA0003786589390000106
对SE-GCN进行训练。
S1026、根据邻接矩阵确定局部莫兰指数。
一种可选的实施方式中,根据邻接矩阵确定局部莫兰指数可以包括:
根据如下表达式确定局部莫兰指数:
Figure BDA0003786589390000107
其中,
Figure BDA0003786589390000108
表示训练数据集中所有采样点土壤重金属含量的均值,
Figure BDA0003786589390000109
为方差,xi表示训练数据集中第i个采样点的土壤重金属含量,xj表示训练数据集中第j个采样点的土壤重金属含量,n表示训练数据集中采样点的总数目,wij表示邻接矩阵的空间权重矩阵中第i行第j列的元素。
S1027、采用局部莫兰指数对融合空间信息的图卷积网络的预测结果进行调整。
S1028、对融合空间信息的图卷积网络进行训练迭代训练,直至融合空间信息的图卷积网络的损失函数值满足预设要求。
为了整合局部莫兰指数对SE-GCN的辅助,通过邻接矩阵AB空间权重,根据局部Moran's I指数公式在每次训练开始时计算结果变量YB的度量I(YB)。最后预测YB=H(l)
Figure BDA0003786589390000111
SE-GCN的损失函数可以用任何回归标准来计算,例如可以采用均方误差(MSE):loss=MSE(YB,YB)+λMSE(I(YB),I(YB))。
本实施例提供的土壤重金属含量预测方法,通过将空间自相关的莫兰指数作为辅助学习和GCN的预测结果共同构建新的预测结果,且融合了采样点的土壤数据和污染源的位置信息作为整个模型的输入,可以更加准确有效地预测目标区域内各个位置点处的土壤重金属含量。
本发明实施例还提供一种土壤重金属含量预测装置,请参见图5所示,本发明实施例仅以图5为例进行说明,并不表示本发明仅限于此。图5为本发明提供的土壤重金属含量预测装置一实施例的结构示意图。如图5所示,本实施例提供的土壤重金属含量预测装置50可以包括:获取模块501、训练模块502和预测模块503。
获取模块501,用于获取目标区域内各采样点的土壤数据以及目标区域内各污染源的位置信息,土壤数据包括土壤重金属含量信息和位置信息;
训练模块502,用于根据各采样点的土壤数据和各污染源的位置信息对土壤重金属含量预测模型进行训练,得到训练好的土壤重金属含量预测模型,土壤重金属含量预测模型包括融合空间信息的图卷积网络;
预测模块503,用于根据训练好的土壤重金属含量预测模型确定目标区域内各个位置点处的土壤重金属含量信息。
本实施例的装置,可以用于执行图1所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
一种实施方式中,土壤重金属含量预测装置50还可以包括预处理模块(图中未示出),用于在根据各采样点的土壤数据和各污染源的位置信息对土壤重金属含量预测模型进行训练之前,根据各采样点的土壤数据是否完备将其划分为完备数据集和残缺数据集;根据完备数据集对残缺数据集中缺失的数据进行补充和/或对残缺数据集中异常的数据进行校正,得到各采样点的完备土壤数据;根据各采样点的完备土壤数据和各污染源的位置信息对土壤重金属含量预测模型进行训练。
一种实施方式中,预处理模块用于根据完备数据集对残缺数据集中缺失的数据进行补充和/或对残缺数据集中异常的数据进行校正具体可以包括:采用改进的麻雀搜索算法对深度极限学习机进行迭代优化,得到改进的深度极限学习机;采用改进的深度极限学习机,根据完备数据集对残缺数据集中缺失的数据进行补充和/或对残缺数据集中异常的数据进行校正。
一种实施方式中,预处理模块用于采用改进的麻雀搜索算法对深度极限学习机进行迭代优化,得到改进的深度极限学习机具体可以包括:
采用Singer混沌映射初始化麻雀种群;
计算麻雀种群的适应度值并进行排序,确定出最优值;
采用余弦权重因子更新发现者、加入者以及注意到危险的麻雀位置;
对最优值进行柯西-高斯变异自适应扰动,产生新解;
将最优值和新解进行比较,在新解优于最优值时,将最优值更新为新解;
进行迭代操作直到达到最大迭代次数,得到全局最优值和最佳适应度值;
将全局最优值和最佳适应度值作为深度极限学习机的输入,利用完备数据集不断训练深度极限学习机,直至总误差小于预设期望误差,得到改进的深度极限学习机。
一种实施方式中,土壤重金属含量预测模型包括空间信息编码器,空间信息编码器用于学习空间坐标上下文感知信息,训练模块502用于根据各采样点的土壤数据和各污染源的位置信息对土壤重金属含量预测模型进行训练具体可以包括:
对目标区域中的采样点进行随机抽样,得到训练数据集;
根据训练数据集中各采样点的位置信息确定空间坐标矩阵,采用k近邻算法构建空间图,得到邻接矩阵;
将空间坐标矩阵输入空间信息编码器,得到坐标嵌入矩阵;
确定节点特征,节点特征包括采样点的土壤重金属含量信息、采样点的位置信息和污染源的位置信息;
将坐标嵌入矩阵和节点特征进行拼接,作为融合空间信息的图卷积网络的输入,对融合空间信息的图卷积网络进行训练;
根据邻接矩阵确定局部莫兰指数;
采用局部莫兰指数对融合空间信息的图卷积网络的预测结果进行调整;
对融合空间信息的图卷积网络进行训练迭代训练,直至融合空间信息的图卷积网络的损失函数值满足预设要求。
一种可选的实施方式中,空间信息编码器包括正余弦函数和全连接神经网络,将空间坐标矩阵输入空间信息编码器,得到坐标嵌入矩阵可以包括:
空间坐标矩阵C={c1,...cn},ci为第i个采样点的经纬度坐标,空间信息编码器SE(C)=NN(PE(g)(C)),其中
Figure BDA0003786589390000131
为S个串联的多尺度正余弦函数,其中
Figure BDA0003786589390000132
分别处理C的空间维度v,v包括纬度和经度,NN表示全连接神经网络,使得:
Figure BDA0003786589390000133
式中,λmin表示最小网格尺度、λmax表示最大网格尺度,
Figure BDA0003786589390000134
将PE(g)(C)的输出通过全连接神经网络进行处理,得到坐标嵌入矩阵。
一种可选的实施方式中,根据邻接矩阵确定局部莫兰指数可以包括:
根据如下表达式确定局部莫兰指数:
Figure BDA0003786589390000135
其中,
Figure BDA0003786589390000136
表示训练数据集中所有采样点土壤重金属含量的均值,
Figure BDA0003786589390000137
为方差,xi表示训练数据集中第i个采样点的土壤重金属含量,xj表示训练数据集中第j个采样点的土壤重金属含量,n表示训练数据集中采样点的总数目,wij表示邻接矩阵的空间权重矩阵中第i行第j列的元素。
本发明实施例还提供一种土壤重金属含量预测设备,请参见图6所示,本发明实施例仅以图6为例进行说明,并不表示本发明仅限于此。图6为本发明提供的土壤重金属含量预测设备一实施例的结构示意图。如图6所示,本实施例提供的土壤重金属含量预测设备60包括:存储器601、处理器602和总线603。其中,总线603用于实现各元件之间的连接。
存储器601中存储有计算机程序,计算机程序被处理器602执行时可以实现上述任一方法实施例的技术方案。
其中,存储器601和处理器602之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可以通过一条或者多条通信总线或信号线实现电性连接,如可以通过总线603连接。存储器601中存储有实现土壤重金属含量预测方法的计算机程序,包括至少一个可以软件或固件的形式存储于存储器601中的软件功能模块,处理器602通过运行存储在存储器601内的软件程序以及模块,从而执行各种功能应用以及数据处理。
存储器601可以是,但不限于,随机存取存储器(Random Access Memory,简称:RAM),只读存储器(Read Only Memory,简称:ROM),可编程只读存储器(ProgrammableRead-Only Memory,简称:PROM),可擦除只读存储器(Erasable Programmable Read-OnlyMemory,简称:EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,简称:EEPROM)等。其中,存储器601用于存储程序,处理器602在接收到执行指令后,执行程序。进一步地,上述存储器601内的软件程序以及模块还可包括操作***,其可包括各种用于管理***任务(例如内存管理、存储设备控制、电源管理等)的软件组件和/或驱动,并可与各种硬件或软件组件相互通信,从而提供其他软件组件的运行环境。
处理器602可以是一种集成电路芯片,具有信号的处理能力。上述的处理器602可以是通用处理器,包括中央处理器(Central Processing Unit,简称:CPU)、网络处理器(Network Processor,简称:NP)等。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。可以理解,图6的结构仅为示意,还可以包括比图6中所示更多或者更少的组件,或者具有与图6所示不同的配置。图6中所示的各组件可以采用硬件和/或软件实现。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行以实现上述任一方法实施例的技术方案。
本公开中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
本公开的保护范围不限于上述的实施例,显然,本领域的技术人员可以对本公开进行各种改动和变形而不脱离本公开的范围和精神。倘若这些改动和变形属于本公开权利要求及其等同技术的范围,则本公开的意图也包含这些改动和变形在内。

Claims (10)

1.一种土壤重金属含量预测方法,其特征在于,包括:
获取目标区域内各采样点的土壤数据以及所述目标区域内各污染源的位置信息,所述土壤数据包括土壤重金属含量信息和位置信息;
根据所述各采样点的土壤数据和所述各污染源的位置信息对土壤重金属含量预测模型进行训练,得到训练好的土壤重金属含量预测模型,所述土壤重金属含量预测模型包括融合空间信息的图卷积网络;
根据所述训练好的土壤重金属含量预测模型确定所述目标区域内各个位置点处的土壤重金属含量信息。
2.根据权利要求1所述的方法,其特征在于,所述根据所述各采样点的土壤数据和所述各污染源的位置信息对土壤重金属含量预测模型进行训练之前,所述方法还包括:
根据所述各采样点的土壤数据是否完备将其划分为完备数据集和残缺数据集;
根据所述完备数据集对所述残缺数据集中缺失的数据进行补充和/或对所述残缺数据集中异常的数据进行校正,得到各采样点的完备土壤数据;
根据所述各采样点的完备土壤数据和所述各污染源的位置信息对土壤重金属含量预测模型进行训练。
3.根据权利要求2所述的方法,其特征在于,所述根据所述完备数据集对所述残缺数据集中缺失的数据进行补充和/或对所述残缺数据集中异常的数据进行校正包括:
采用改进的麻雀搜索算法对深度极限学习机进行迭代优化,得到改进的深度极限学习机;
采用所述改进的深度极限学习机,根据所述完备数据集对所述残缺数据集中缺失的数据进行补充和/或对所述残缺数据集中异常的数据进行校正。
4.根据权利要求3所述的方法,其特征在于,所述采用改进的麻雀搜索算法对深度极限学习机进行迭代优化,得到改进的深度极限学习机包括:
采用Singer混沌映射初始化麻雀种群;
计算所述麻雀种群的适应度值并进行排序,确定出最优值;
采用余弦权重因子更新发现者、加入者以及注意到危险的麻雀位置;
对最优值进行柯西-高斯变异自适应扰动,产生新解;
将最优值和新解进行比较,在新解优于最优值时,将最优值更新为新解;
进行迭代操作直到达到最大迭代次数,得到全局最优值和最佳适应度值;
将全局最优值和最佳适应度值作为深度极限学习机的输入,利用所述完备数据集不断训练所述深度极限学习机,直至总误差小于预设期望误差,得到改进的深度极限学习机。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述土壤重金属含量预测模型包括空间信息编码器,所述空间信息编码器用于学习空间坐标上下文感知信息,所述根据所述各采样点的土壤数据和所述各污染源的位置信息对土壤重金属含量预测模型进行训练包括:
对所述目标区域中的采样点进行随机抽样,得到训练数据集;
根据所述训练数据集中各采样点的位置信息确定空间坐标矩阵,采用k近邻算法构建空间图,得到邻接矩阵;
将所述空间坐标矩阵输入所述空间信息编码器,得到坐标嵌入矩阵;
确定节点特征,所述节点特征包括采样点的土壤重金属含量信息、采样点的位置信息和污染源的位置信息;
将所述坐标嵌入矩阵和所述节点特征进行拼接,作为所述融合空间信息的图卷积网络的输入,对所述融合空间信息的图卷积网络进行训练;
根据所述邻接矩阵确定局部莫兰指数;
采用所述局部莫兰指数对所述融合空间信息的图卷积网络的预测结果进行调整;
对所述融合空间信息的图卷积网络进行训练迭代训练,直至所述融合空间信息的图卷积网络的损失函数值满足预设要求。
6.根据权利要求5所述的方法,其特征在于,所述空间信息编码器包括正余弦函数和全连接神经网络,所述将所述空间坐标矩阵输入所述空间信息编码器,得到坐标嵌入矩阵包括:
空间坐标矩阵C={c1,...cn},ci为第i个采样点的经纬度坐标,空间信息编码器SE(C)=NN(PE(g)(C)),其中
Figure FDA0003786589380000021
为S个串联的多尺度正余弦函数,其中
Figure FDA0003786589380000022
分别处理C的空间维度v,v包括纬度和经度,NN表示全连接神经网络,使得:
Figure FDA0003786589380000031
式中,λmin表示最小网格尺度、λmax表示最大网格尺度,
Figure FDA0003786589380000032
将PE(g)(C)的输出通过全连接神经网络进行处理,得到坐标嵌入矩阵。
7.根据权利要求5所述的方法,其特征在于,所述根据所述邻接矩阵确定局部莫兰指数,包括:
根据如下表达式确定所述局部莫兰指数:
Figure FDA0003786589380000033
其中,
Figure FDA0003786589380000034
表示所述训练数据集中所有采样点土壤重金属含量的均值,
Figure FDA0003786589380000035
为方差,xi表示所述训练数据集中第i个采样点的土壤重金属含量,xj表示所述训练数据集中第j个采样点的土壤重金属含量,n表示所述训练数据集中采样点的总数目,wij表示所述邻接矩阵的空间权重矩阵中第i行第j列的元素。
8.一种土壤重金属含量预测装置,其特征在于,包括:
获取模块,用于获取目标区域内各采样点的土壤数据以及所述目标区域内各污染源的位置信息,所述土壤数据包括土壤重金属含量信息和位置信息;
训练模块,用于根据所述各采样点的土壤数据和所述各污染源的位置信息对土壤重金属含量预测模型进行训练,得到训练好的土壤重金属含量预测模型,所述土壤重金属含量预测模型包括融合空间信息的图卷积网络;
预测模块,用于根据所述训练好的土壤重金属含量预测模型确定所述目标区域内各个位置点处的土壤重金属含量信息。
9.一种土壤重金属含量预测设备,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1-7任一项所述的土壤重金属含量预测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-7任一项所述的土壤重金属含量预测方法。
CN202210943187.3A 2022-08-08 2022-08-08 土壤重金属含量预测方法、装置与设备 Active CN115458071B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210943187.3A CN115458071B (zh) 2022-08-08 2022-08-08 土壤重金属含量预测方法、装置与设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210943187.3A CN115458071B (zh) 2022-08-08 2022-08-08 土壤重金属含量预测方法、装置与设备

Publications (2)

Publication Number Publication Date
CN115458071A true CN115458071A (zh) 2022-12-09
CN115458071B CN115458071B (zh) 2024-02-02

Family

ID=84296786

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210943187.3A Active CN115458071B (zh) 2022-08-08 2022-08-08 土壤重金属含量预测方法、装置与设备

Country Status (1)

Country Link
CN (1) CN115458071B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117633661A (zh) * 2024-01-26 2024-03-01 西南交通大学 一种基于进化图自监督学习的运渣车高危污染源分类方法
CN118132964A (zh) * 2024-05-06 2024-06-04 农芯科技(北京)有限责任公司 土壤空间温湿度预测方法、装置、设备、介质及程序产品

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111612246A (zh) * 2020-05-18 2020-09-01 武汉轻工大学 农田土壤的重金属含量预测方法、装置、设备及存储介质
CN112529296A (zh) * 2020-12-11 2021-03-19 联通(浙江)产业互联网有限公司 水质预测方法、装置及服务器
CN112561191A (zh) * 2020-12-22 2021-03-26 北京百度网讯科技有限公司 预测模型的训练、预测方法、装置、设备、程序和介质
CN112712169A (zh) * 2021-01-08 2021-04-27 中国科学院地理科学与资源研究所 基于图卷积的全残差深度网络的模型建立方法及应用
CN112926256A (zh) * 2021-01-28 2021-06-08 武汉轻工大学 基于深度强化学习的土壤重金属含量预测方法及***
CN112927767A (zh) * 2021-02-22 2021-06-08 中国地质大学(武汉) 基于图注意力自编码的多元地球化学异常识别方法
CN114118613A (zh) * 2021-12-06 2022-03-01 中国科学院地理科学与资源研究所 一种焦化土壤污染空间分布预测优化方法及***
CN114298270A (zh) * 2021-12-03 2022-04-08 北京彩云环太平洋科技有限公司 融合领域知识的污染物浓度预测方法及其相关设备
CN114509556A (zh) * 2022-01-10 2022-05-17 北京科技大学 一种预测场地重金属污染物浓度的方法
CN114826947A (zh) * 2022-03-18 2022-07-29 华南师范大学 一种基于自动编码器的流量矩阵恢复预测方法及***

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111612246A (zh) * 2020-05-18 2020-09-01 武汉轻工大学 农田土壤的重金属含量预测方法、装置、设备及存储介质
CN112529296A (zh) * 2020-12-11 2021-03-19 联通(浙江)产业互联网有限公司 水质预测方法、装置及服务器
CN112561191A (zh) * 2020-12-22 2021-03-26 北京百度网讯科技有限公司 预测模型的训练、预测方法、装置、设备、程序和介质
CN112712169A (zh) * 2021-01-08 2021-04-27 中国科学院地理科学与资源研究所 基于图卷积的全残差深度网络的模型建立方法及应用
CN112926256A (zh) * 2021-01-28 2021-06-08 武汉轻工大学 基于深度强化学习的土壤重金属含量预测方法及***
CN112927767A (zh) * 2021-02-22 2021-06-08 中国地质大学(武汉) 基于图注意力自编码的多元地球化学异常识别方法
CN114298270A (zh) * 2021-12-03 2022-04-08 北京彩云环太平洋科技有限公司 融合领域知识的污染物浓度预测方法及其相关设备
CN114118613A (zh) * 2021-12-06 2022-03-01 中国科学院地理科学与资源研究所 一种焦化土壤污染空间分布预测优化方法及***
CN114509556A (zh) * 2022-01-10 2022-05-17 北京科技大学 一种预测场地重金属污染物浓度的方法
CN114826947A (zh) * 2022-03-18 2022-07-29 华南师范大学 一种基于自动编码器的流量矩阵恢复预测方法及***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XIYUE ZHANG ET AL.: "Forecastion traffic flow with spatial-temporal concolutional graph attention networks", 《NEURAL COMPUTING AND APPLICATIONS》, vol. 34, no. 2022, pages 15457 - 15479 *
张文帅 等: "基于改进麻雀算法优化深度极限学习机的缺失数据预测", 《电子测量技术》, vol. 45, no. 15, pages 63 - 67 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117633661A (zh) * 2024-01-26 2024-03-01 西南交通大学 一种基于进化图自监督学习的运渣车高危污染源分类方法
CN117633661B (zh) * 2024-01-26 2024-04-02 西南交通大学 一种基于进化图自监督学习的运渣车高危污染源分类方法
CN118132964A (zh) * 2024-05-06 2024-06-04 农芯科技(北京)有限责任公司 土壤空间温湿度预测方法、装置、设备、介质及程序产品

Also Published As

Publication number Publication date
CN115458071B (zh) 2024-02-02

Similar Documents

Publication Publication Date Title
Galelli et al. An evaluation framework for input variable selection algorithms for environmental data-driven models
Khajavi et al. Predicting the carbon dioxide emission caused by road transport using a Random Forest (RF) model combined by Meta-Heuristic Algorithms
Froelich et al. Evolutionary learning of fuzzy grey cognitive maps for the forecasting of multivariate, interval-valued time series
Coad et al. Proactive management of estuarine algal blooms using an automated monitoring buoy coupled with an artificial neural network
CN110969345A (zh) 一种基于土壤重金属污染途径分析的风险评估方法
CN111382929A (zh) 一种构建河流硅藻水华预警模型的方法及装置
CN108960421B (zh) 改进基于bp神经网络的水面无人艇航速在线预报方法
Duforet-Frebourg et al. Nonstationary patterns of isolation-by-distance: inferring measures of local genetic differentiation with Bayesian kriging
CN115458071B (zh) 土壤重金属含量预测方法、装置与设备
Zamani et al. Forecasting water quality variable using deep learning and weighted averaging ensemble models
Yusri et al. Water quality classification using SVM and XGBoost method
Zhou et al. Functional networks and applications: A survey
CN114997036A (zh) 基于深度学习的网络拓扑重构方法、装置和设备
CN117557121A (zh) 一种港口建设项目环境影响的评价方法
KR101635623B1 (ko) 해양 저서생태계 변화 예측 시스템
Mohammadi et al. Deep learning based simulators for the phosphorus removal process control in wastewater treatment via deep reinforcement learning algorithms
CN109657907B (zh) 地理国情监测数据的质量控制方法、装置和终端设备
CN116822366A (zh) 一种径流污染负荷计算模型构建和径流污染负荷计算方法
Hoan et al. Novel time series bagging based hybrid models for predicting historical water levels in the Mekong delta region, Vietnam
Tabassum et al. Performance analysis of machine learning techniques for predicting water quality index using physiochemical parameters
CN114267422B (zh) 地表水质参数预测方法、***、计算机设备及存储介质
Faugeras et al. An advection-diffusion-reaction size-structured fish population dynamics model combined with a statistical parameter estimation procedure: application to the Indian Ocean skipjack tuna fishery
Buevich et al. Modeling of surface dust concentrations using neural networks and kriging
CN112651168B (zh) 基于改进神经网络算法的建设用地面积预测方法
JP2018000044A (ja) 分子識別方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant