CN115292890A - 基于多源辅助数据开发的场地土壤污染物浓度三维空间预测方法 - Google Patents
基于多源辅助数据开发的场地土壤污染物浓度三维空间预测方法 Download PDFInfo
- Publication number
- CN115292890A CN115292890A CN202210760419.1A CN202210760419A CN115292890A CN 115292890 A CN115292890 A CN 115292890A CN 202210760419 A CN202210760419 A CN 202210760419A CN 115292890 A CN115292890 A CN 115292890A
- Authority
- CN
- China
- Prior art keywords
- dimensional
- target area
- auxiliary data
- pollutant concentration
- grid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000003802 soil pollutant Substances 0.000 title claims abstract description 88
- 238000000034 method Methods 0.000 title claims abstract description 70
- 238000011161 development Methods 0.000 title claims abstract description 22
- 238000009795 derivation Methods 0.000 claims abstract description 6
- 238000005527 soil sampling Methods 0.000 claims description 40
- 238000001514 detection method Methods 0.000 claims description 30
- 239000002689 soil Substances 0.000 claims description 26
- 230000005674 electromagnetic induction Effects 0.000 claims description 19
- 238000012549 training Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 10
- 238000012795 verification Methods 0.000 claims description 9
- 238000010801 machine learning Methods 0.000 claims description 6
- 238000005553 drilling Methods 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000012706 support-vector machine Methods 0.000 claims description 5
- 238000003325 tomography Methods 0.000 claims description 5
- 238000012847 principal component analysis method Methods 0.000 claims description 3
- 239000003344 environmental pollutant Substances 0.000 abstract description 18
- 231100000719 pollutant Toxicity 0.000 abstract description 18
- 230000000704 physical effect Effects 0.000 abstract description 7
- 238000013461 design Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000005259 measurement Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000003900 soil pollution Methods 0.000 description 3
- 239000002699 waste material Substances 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 244000286663 Ficus elastica Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000004070 electrodeposition Methods 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/10—Numerical modelling
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Computer Hardware Design (AREA)
- Evolutionary Computation (AREA)
- Geometry (AREA)
- General Engineering & Computer Science (AREA)
- Geophysics And Detection Of Objects (AREA)
Abstract
本发明涉及基于多源辅助数据开发的场地土壤污染物浓度三维空间预测方法,针对功能区布局、地下物性等场地污染多源辅助数据,利用不同衍生方法进行进一步开发,获得更多表征污染物浓度三维空间分布先验信息的衍生辅助数据,进而建立衍生辅助数据与污染物浓度之间的定量关系模型,实现场地土壤污染物浓度的三维空间预测。本发明解决了现有技术中原始辅助数据与土壤污染物浓度间相关性弱、以及辅助数据中所隐含的场地污染先验信息没有得到充分开发和利用的问题,显著提高了场地土壤污染物浓度三维空间预测精度。
Description
技术领域
本发明涉及基于多源辅助数据开发的场地土壤污染物浓度三维空间预测方法,属于土壤污染预测技术领域。
背景技术
现有场地土壤污染物浓度三维空间分布预测,主要利用三维反距离加权插值(IDW)、三维克里格插值等传统空间插值方法来实现,但预测结果平滑效应强(高浓度值被低估、低浓度值被高估)、精度偏低等问题依然突出。同时,现有空间插值法预测场地土壤污染浓度三维分布中,仅仅利用了钻孔土壤污染物浓度数据,缺乏场地污染辅助数据的整合,这也进一步制约了其预测精度的提升。
场地功能区布局以及地下物性等多源辅助数据,提供了大量关于污染物浓度空间分布的先验信息,并且这些辅助数据与场地土壤污染物浓度之间具有一定的空间关联性。比如,功能区布局能够反映场地污染源(生产过程、废弃物堆放等)对污染物浓度空间分布的影响;电磁感应(EM)、电阻率层析成像(ERT)等地球物理勘探方法获取的地下介质电磁数据能够反映污染与未污染土壤的电磁特性差异等。此外,相较钻孔采样获取的土壤污染物浓度数据而言,这些辅助数据空间覆盖的密集性和完整性更高,数据获取成本更低、速度更快。因此,基于辅助数据与污染物浓度之间的定量关系实现三维空间预测,是克服传统空间插值法预测场地土壤物污染浓度三维分布局限性的潜在技术途径之一。然而,利用功能区布局以及地下物性等辅助数据与场地土壤物污染浓度之间的定量关系,来预测污染物浓度三维空间分布仍存在以下问题:
(1)功能区布局及地下物性原始数据与土壤污染物浓度之间的相关性可能较弱,从而导致空间预测精度降低,甚至低于传统插值法预测精度。比如,场地空间十分复杂,地面杂物、土壤特性、地质条件等均会对EM及ERT探测结果产生影响,从而削弱电导率、电阻率等地下物性原始辅助数据与土壤污染物浓度之间的相关性,导致空间预测精度偏低;
(2)辅助数据中所隐含的场地污染先验信息没有得到充分开发和利用。比如,功能区布局为二维离散型数据,目前单纯地以哑变量的方式来识别其与土壤污染物浓度之间定量关系的方法还难以全面反映其对污染物浓度三维空间分布的影响强度等。
发明内容
本发明所要解决的技术问题是提供基于多源辅助数据开发的场地土壤污染物浓度三维空间预测方法,采用全新设计策略,能够有效提高土壤污染物浓度三维空间分布预测效率。
本发明为了解决上述技术问题采用以下技术方案:本发明设计了基于多源辅助数据开发的场地土壤污染物浓度三维空间预测方法,通过步骤A至步骤D,获得目标区域的土壤污染物浓度三维预测模型,通过步骤i,应用土壤污染物浓度三维预测模型,实现目标区域地下空间的土壤污染物浓度三维分布预测;
步骤A. 获得目标区域内预设各钻孔位置下各预设深度土壤样点的土壤污染物浓度实测值,以及目标区域对应包含预设各数据类型的多源辅助数据集,然后进入步骤B;
步骤B. 基于目标区域地下空间预设的三维栅格,通过空间插值方法,针对目标区域所对应多源辅助数据集进行预处理,更新目标区域所对应多源辅助数据集,然后进入步骤C;
步骤C. 根据目标区域地下空间预设的三维栅格,针对目标区域所对应多源辅助数据集,执行数据衍生处理,获得目标区域三维衍生辅助数据,然后进入步骤D;
步骤D. 基于目标区域三维衍生辅助数据,获得各土壤样点分别对应的衍生辅助数据,以土壤样点所对应衍生辅助数据为预测变量,土壤样点所对应土壤污染物浓度实测值为目标变量,针对预设机器学习模型进行训练,获得目标区域的土壤污染物浓度三维预测模型;
步骤i,分别针对目标区域地下空间的各个栅格,获得栅格所对应的衍生辅助数据,应用土壤污染物浓度三维预测模型,获得各栅格的土壤污染物浓度预测值,进而实现对目标区域地下空间的土壤污染物浓度三维预测。
作为本发明的一种优选技术方案:还包括步骤E如下,执行完步骤D之后,进入步骤E;
步骤E. 应用独立验证方法,计算基于土壤污染物浓度三维预测模型所获土壤样点土壤污染物浓度预测值与其对应的土壤污染物浓度实测值之间的均方根误差,即获得土壤污染物浓度三维预测模型的预测精度。
作为本发明的一种优选技术方案:所述步骤A中目标区域对应包含预设各数据类型的多源辅助数据集,包括目标区域中预设各类功能区的区域范围、目标区域对应预设各电磁探测频率下的电导率二维测点数据、以及目标区域对应预设各测线位置的二维断面反演电阻率数据。
作为本发明的一种优选技术方案:通过电磁感应法EM测量目标区域地下电导率,获得目标区域对应预设各电磁探测频率下的电导率二维测点数据。
作为本发明的一种优选技术方案:通过电阻率层析成像ERT测量目标区域地下电阻率,获得目标区域对应预设各测线位置的二维断面反演电阻率数据。
作为本发明的一种优选技术方案:所述步骤B中,基于多源辅助数据集中目标区域对应预设各电磁探测频率下的电导率二维测点数据,通过空间插值方法,针对目标区域地下空间三维栅格水平方向的二维栅格进行插值处理,获得目标区域对应各电磁探测频率下的土壤电导率二维空间分布;
基于多源辅助数据集中目标区域对应预设各测线位置的二维断面反演电阻率数据,通过空间插值方法,针对目标区域地下空间三维栅格进行插值处理,获得目标区域所对应电阻率三维空间分布。
作为本发明的一种优选技术方案:所述步骤B中的空间插值方法为IDW插值方法或克里格插值方法。
作为本发明的一种优选技术方案:所述步骤C包括如下步骤C1至步骤C4;
步骤C1. 基于目标区域中预设各类功能区的区域范围,针对目标区域中的各个栅格,若栅格位于预设功能区内,则针对该栅格赋值为1,如该栅格未位于预设功能区内,则针对该栅格赋值为0,完成对目标区域中各栅格的赋值,即构成目标区域所对应功能区类型三维衍生辅助数据;同时分别针对目标区域中的各个栅格,计算栅格分别到各功能区边缘的最近欧式距离,即获得目标区域中各栅格分别到各功能区边缘的最近欧式距离,构成目标区域所对应功能区距离三维衍生辅助数据;然后进入步骤C2;
步骤C2. 基于目标区域对应各电磁探测频率下的电导率二维空间分布,获得目标区域水平方向各栅格分别对应各电磁探测频率下电导率之间的最小值、最大值、中值、均值和方差,构成目标区域所对应电导率统计量二维衍生辅助数据;同时基于预设各尺寸大小二维滑动窗口在目标区域水平方向上的滑动,获得各电磁探测频率下各二维滑动窗口中各栅格电导率之间最小值、最大值、中值、均值、方差、以及二维方向上的梯度,构成目标区域所对应滑动窗口电导率统计量二维衍生辅助数据;然后进入步骤C3;
步骤C3. 基于目标区域所对应电阻率三维空间分布,获得目标区域水平方向各栅格各深度电阻率之间最小值、最大值、中值、均值和方差,构成目标区域所对应各深度间电阻率统计量二维衍生辅助数据;同时基于预设各尺寸大小三维滑动窗口在目标区域地下空间三维栅格上的滑动,获得各三维滑动窗口中各栅格电阻率之间的最小值、最大值、中值、均值、方差、以及三维方向上的梯度,构成目标区域所对应滑动窗口电阻率统计量三维衍生辅助数据;然后进入步骤C4;
步骤C4. 针对目标区域所对应的电导率统计量二维衍生辅助数据、滑动窗口电导率统计量二维衍生辅助数据、以及各深度间电阻率统计量二维衍生辅助数据,沿三维栅格深度方向进行复制,获得目标区域所对应的各深度间电导率统计量三维衍生辅助数据、滑动窗口电导率统计量三维衍生辅助数据、以及电阻率三维衍生辅助数据,并结合目标区域所对应功能区类型三维衍生辅助数据、功能区距离三维衍生辅助数据、滑动窗口电阻率统计量三维衍生辅助数据,构成目标区域三维衍生辅助数据,然后进入步骤D。
作为本发明的一种优选技术方案:所述步骤D中包括如下步骤D1至步骤D3;
步骤D1. 针对目标区域三维衍生辅助数据进行标准化,并利用主成分分析法,获得衍生辅助数据中各主成分数据,然后进入步骤D2;
步骤D2. 基于目标区域三维衍生辅助数据,获得各土壤样点分别对应各主成分数据类型的数据,构成各土壤样点分别对应的衍生辅助数据,然后进入步骤D3;
步骤D3. 基于各土壤样点,以土壤样点所对应衍生辅助数据为预测变量,土壤样点所对应土壤污染物浓度实测值为目标变量,针对支持向量机回归模型进行训练,获得目标区域的土壤污染物浓度三维预测模型。
本发明所述基于多源辅助数据开发的场地土壤污染物浓度三维空间预测方法,采用以上技术方案与现有技术相比,具有以下技术效果:
本发明所设计基于多源辅助数据开发的场地土壤污染物浓度三维空间预测方法,针对功能区布局、以及地下物性等场地污染多源辅助数据,利用不同的衍生方法进行进一步开发,得到更多表征土壤污染物浓度三维空间分布先验信息的衍生辅助数据,进而利用机器学***滑效应强、预测精度偏低问题。
附图说明
图1是本发明基于多源辅助数据开发的场地土壤污染物浓度三维空间预测方法的实施流程图;
图2是本发明实施例场地的功能区布局以及钻孔采样点分布图;
图3是本发明实施例场地的ERT电阻率三维空间插值图;
图4 是功能区布局三维衍生辅助数据示例(左)及电阻率三维衍生辅助数据示例(右);
图5是本发明(左)与传统IDW插值(右)预测的实施例场地土壤Zn浓度三维空间分布的对比。
具体实施方式
下面结合说明书附图对本发明的具体实施方式作进一步详细的说明。
本发明设计了基于多源辅助数据开发的场地土壤污染物浓度三维空间预测方法,如图1所示,实际应用当中,具体执行步骤A至步骤D,获得目标区域的土壤污染物浓度三维预测模型。
步骤A. 获得目标区域内预设各钻孔位置下各预设深度土壤样点的土壤污染物浓度实测值,以及目标区域对应包含预设各数据类型的多源辅助数据集,然后进入步骤B。
应用中,关于多源辅助数据集所包含的预设各数据类型,具体设计包括目标区域中预设各类功能区的区域范围、目标区域对应预设各电磁探测频率下的电导率二维测点数据、以及目标区域对应预设各测线位置的二维断面反演电阻率数据。
其中在实际应用中,利用高分辨率遥感影像、并结合场地踏勘,解译场地各功能区的类型和边界,得到预设各类功能区的区域范围;通过电磁感应法EM测量目标区域地下电导率,获得目标区域对应预设各电磁探测频率下的电导率二维测点数据,电磁感应法EM是在地表通过电流产生原生磁场,该原生磁场会在介质不均匀的场地土壤中产生次生感应磁场,通过地表接收这种次生感应磁场进而可以反演获得地下介质的导电性信息。不同探测频率的导电性信息反映了不同探测深度内地下介质的电导率情况,探测频率越低时其探测的深度也越深。电磁感应法EM在污染场地调查中已经广泛应用,且其探测成本极低,因此,电磁感应法EM二维测点设置应尽可能均匀覆盖目标场地。
并且关于二维断面反演电阻率数据,应用中具体设计通过电阻率层析成像ERT测量目标区域地下电阻率,获得目标区域对应预设各测线位置的二维断面反演电阻率数据,土壤污染物浓度变化往往会改变电阻率,电阻率层析成像ERT法是将直流电通入地下,然后观测供电电流强度与测量电极之间的电位差来计算视电阻率,测量时记录电极的地理坐标(x,y)、电极间隔以及电极装置等信息,从而通过反演得到不同ERT测线位置的二维断面电阻率数据。不同ERT测线反演后的二维断面电阻率数据需要与各电极的地理坐标(x,y)及反演深度z相关联,从而得到电阻率三维散点数据。ERT探测的成本亦较低,因此,测线设置也应尽可能均匀覆盖目标场地。
步骤B. 基于目标区域地下空间预设的三维栅格,通过空间插值方法,针对目标区域所对应多源辅助数据集进行预处理,更新目标区域所对应多源辅助数据集,然后进入步骤C。
上述步骤B具体实施中,基于多源辅助数据集中目标区域对应预设各电磁探测频率下的电导率二维测点数据,通过诸如IDW插值方法或克里格插值方法的空间插值方法,针对目标区域地下空间三维栅格水平方向的二维栅格进行插值处理,获得目标区域对应各电磁探测频率下的土壤电导率二维空间分布。
基于多源辅助数据集中目标区域对应预设各测线位置的二维断面反演电阻率数据,通过诸如IDW插值方法或克里格插值方法的空间插值方法,针对目标区域地下空间三维栅格进行插值处理,获得目标区域所对应电阻率三维空间分布。
步骤C. 根据目标区域地下空间预设的三维栅格,针对目标区域所对应多源辅助数据集,执行数据衍生处理,获得目标区域三维衍生辅助数据,然后进入步骤D。
具体实际应用当中,上述步骤C包括如下步骤C1至步骤C4。
步骤C1. 基于目标区域中预设各类功能区的区域范围,针对目标区域中的各个栅格,若栅格位于预设功能区内,则针对该栅格赋值为1,如该栅格未位于预设功能区内,则针对该栅格赋值为0,完成对目标区域中各栅格的赋值,即构成目标区域所对应功能区类型三维衍生辅助数据;同时分别针对目标区域中的各个栅格,计算栅格分别到各功能区边缘的最近欧式距离,即获得目标区域中各栅格分别到各功能区边缘的最近欧式距离,构成目标区域所对应功能区距离三维衍生辅助数据;不同功能区类型及与功能区边缘的距离反映了潜在污染源对场地土壤污染物浓度的影响强度,例如,废渣堆放区及生产车间,其土壤特征污染物浓度往往较高,且与其距离越近物污染浓度通常越高,然后进入步骤C2。
步骤C2. 基于目标区域对应各电磁探测频率下的电导率二维空间分布,获得目标区域水平方向各栅格分别对应各电磁探测频率下电导率之间的最小值、最大值、中值、均值和方差,构成目标区域所对应电导率统计量二维衍生辅助数据;同时基于预设各尺寸大小二维滑动窗口在目标区域水平方向上的滑动,获得各电磁探测频率下各二维滑动窗口中各栅格电导率之间最小值、最大值、中值、均值、方差、以及二维方向上的梯度,构成目标区域所对应滑动窗口电导率统计量二维衍生辅助数据;然后进入步骤C3。
步骤C3. 基于目标区域所对应电阻率三维空间分布,获得目标区域水平方向各栅格各深度电阻率之间最小值、最大值、中值、均值和方差,构成目标区域所对应各深度间电阻率统计量二维衍生辅助数据;同时基于预设各尺寸大小三维滑动窗口在目标区域地下空间三维栅格上的滑动,获得各三维滑动窗口中各栅格电阻率之间的最小值、最大值、中值、均值、方差、以及三维方向上的梯度,构成目标区域所对应滑动窗口电阻率统计量三维衍生辅助数据;然后进入步骤C4。
步骤C4. 针对目标区域所对应的电导率统计量二维衍生辅助数据、滑动窗口电导率统计量二维衍生辅助数据、以及各深度间电阻率统计量二维衍生辅助数据,沿三维栅格深度方向进行复制,获得目标区域所对应的各深度间电导率统计量三维衍生辅助数据、滑动窗口电导率统计量三维衍生辅助数据、以及电阻率三维衍生辅助数据,并结合目标区域所对应功能区类型三维衍生辅助数据、功能区距离三维衍生辅助数据、滑动窗口电阻率统计量三维衍生辅助数据,构成目标区域三维衍生辅助数据,然后进入步骤D。
步骤C的目的是进一步挖掘二维及三维辅助数据中所隐含的与污染物浓度空间分布相关性更强的信息,以便利用其建立空间预测模型,提高污染物浓度预测精度。
步骤D. 基于目标区域三维衍生辅助数据,获得各土壤样点分别对应的衍生辅助数据,以土壤样点所对应衍生辅助数据为预测变量,土壤样点所对应土壤污染物浓度实测值为目标变量,针对预设机器学习模型进行训练,获得目标区域的土壤污染物浓度三维预测模型,然后进入步骤E。
实际应用当中,上述步骤D具体执行如下步骤D1至步骤D3。
步骤D1. 由于机器学习预测模型容易受到预测变量的数量级影响,因此,在污染物浓度三维预测模型构建之前,首先需要对衍生辅助数据进行标准化,以便消除不同衍生辅助数据的数量级差异,因此,针对目标区域三维衍生辅助数据进行标准化,并利用主成分分析法,获得衍生辅助数据中各主成分数据,然后进入步骤D2。
步骤D2. 基于目标区域三维衍生辅助数据,获得各土壤样点分别对应各主成分数据类型的数据,构成各土壤样点分别对应的衍生辅助数据,然后进入步骤D3。
步骤D3. 基于各土壤样点,以土壤样点所对应衍生辅助数据为预测变量,土壤样点所对应土壤污染物浓度实测值为目标变量,针对支持向量机回归模型进行训练,获得目标区域的土壤污染物浓度三维预测模型。
支持向量机回归可以将低维数据映射到高维特征空间,进而通过寻找满足回归的超平面来实现预测,模型构建时,利用训练集数据的交叉验证来确定模型参数的最优值。
步骤E. 应用独立验证方法,计算基于土壤污染物浓度三维预测模型所获土壤样点土壤污染物浓度预测值与其对应的土壤污染物浓度实测值之间的均方根误差,即获得土壤污染物浓度三维预测模型的预测精度。
基于目标区域的土壤污染物浓度三维预测模型的获得,进一步通过步骤i,应用土壤污染物浓度三维预测模型,实现目标区域地下空间的土壤污染物浓度三维分布预测。
步骤i,分别针对目标区域地下空间的各个栅格,获得栅格所对应的衍生辅助数据,应用土壤污染物浓度三维预测模型,获得各栅格的土壤污染物浓度预测值,进而实现对目标区域地下空间的土壤污染物浓度三维预测。
上述设计方法在实际应用当中,以某橡胶厂场地为对象实施例,采用本发明对土壤Zn浓度的三维空间分布进行预测,实施的流程如图1所示,具体的实施方式详细说明如下:
步骤A. 获得目标区域内预设各钻孔位置下各预设深度土壤样点的土壤污染物浓度实测值,以及目标区域对应包含预设各数据类型的多源辅助数据集,然后进入步骤B。
(1.1)在实例场地中进行钻孔采样,共采集不同深度的土壤样品共282个,记录土壤采样点三维坐标(x,y,z),并进行实验室分析,测定土壤Zn浓度;
(1.2)利用实例场地范围内的高分二号遥感影像,并结合该场地的现场踏勘调查,解译识别各功能区的类别及边界,得到场地功能区布局图,如图2所示;
(1.3)利用多频电磁探测仪采集该场地地下电导率二维测点数据,其中,EM测量中共采用了5个探测频率,分别为474Hz、1625Hz, 5475Hz, 18575Hz和63025Hz,分别获得5个探测频率的EM电导率二维测点数据;
(1.4)利用高密度电阻率仪测量该场地地下视电阻率,在该场地上共布设了14条ERT测线,测线最短130m,最长150m,电极间距为2m,采用Wenner-Schlumberger电极装置测定视电阻率,并记录电极位置的地理坐标(x, y),采用AGI EarthImager软件对每条ERT测线的视电阻率数据进行反演,得到14个二维断面的电阻率数据。
步骤B. 基于目标区域地下空间预设的三维栅格,通过空间插值方法,针对目标区域所对应多源辅助数据集进行预处理,更新目标区域所对应多源辅助数据集,然后进入步骤C。
(2.1)根据场地水平及垂直方向的范围,栅格分辨率设置为2m×2m×1m(长度×宽度×深度),将场地地下空间离散化为三维网格,后续的辅助数据预处理、衍生开发和土壤Zn浓度三维空间预测均基于此三维网格;
(2.2)以三维网格水平方向的二维网格为待插值栅格点位置,利用IDW插值将5个探测频率的电导率二维测点数据分别插值为二维栅格数据,得到5个电导率二维栅格数据,作为二维辅助数据;以三维网格为待插值栅格点位置,利用三维克里格插值,将14个二维断面的电阻率数据插值为1个三维栅格数据,如图3所示,作为三维辅助数据。
步骤C. 根据目标区域地下空间预设的三维栅格,针对目标区域所对应多源辅助数据集,执行数据衍生处理,获得目标区域三维衍生辅助数据,然后进入步骤D。
(3.1)对于场地功能区布局图,首先将10个功能区类型分别转化为0-1二值化的离散型数据,进而,对三维网格中的栅格分别进行赋值,即,对于某个功能区类型,当栅格点处于该类别功能区地下范围之内时,赋值为1,否则赋值为0,遍历10个功能区类型,共得到功能区类型三维衍生辅助数据10个;其次,分别计算三维网格中栅格点到10个功能区多边形边缘的最近欧式距离,共得到功能区距离三维衍生辅助数据10个,如图4(左)显示了三维网格中的栅格与胶化车间欧氏距离的三维分布;
(3.2)对于5个探测频率的EM电导率二维空间分布数据,首先,计算不同探测频率电导率间的最小值、最大值、中值、均值和方差,共得到电导率二维衍生辅助数据5个;其次,设定大小分别为3×3、9×9和11×11的3个二维滑动窗口,对于每个探测频率的EM电导率二维空间分布数据,分别计算不同滑动窗口内电导率数据的最小值、最大值、中值、均值、方差、以及x和y方向的梯度,共得到EM电导率二维衍生辅助数据105个;
(3.3)对于ERT电阻率三维空间分布数据,首先,提取不同深度的电阻率二维分布数据,计算不同深度电阻率之间的最小值、最大值、中值、均值和方差,共得到电阻率二维衍生辅助数据5个;其次,设定大小分别为3×3×3、9×9×3、11×11×3的三维滑动窗口3个,进而计算不同滑动窗口下,滑动窗口内电阻率数据的最小值、最大值、中值、均值、方差、以及x、y和z方向的梯度,共得到电阻率滑动窗口统计量三维衍生辅助数据24个,其中,如图4(右)显示了电阻率11×11×3滑动窗口最大值的三维空间分布;
(3.4)对于110个EM电导率二维衍生辅助数据以及5个按深度计算的电阻率二维衍生辅助数据,按照三维网格深度层数分别依次进行复制,分别将其扩展至三维空间,从而与定义的地下三维网格保持一致。
经过以上步骤,本实施例中共得到三维衍生辅助数据159个(即,159个三维栅格数据),其中,功能区布局衍生辅助数据20个,EM电导率衍生辅助数据110个,ERT电阻率衍生辅助数据29个。
步骤D. 基于目标区域三维衍生辅助数据,获得各土壤样点分别对应的衍生辅助数据,以土壤样点所对应衍生辅助数据为预测变量,土壤样点所对应土壤污染物浓度实测值为目标变量,针对预设机器学习模型进行训练,获得目标区域的土壤污染物浓度三维预测模型。
(4.1)首先对衍生辅助数据(即,159个三维栅格数据)分别进行标准化,以便消除不同变量间的数量级差异,随后,利用主成分分析方法对衍生辅助数据进行降维,共得到特征值≥1的主成分14个,其方差累计贡献率为96%;
(4.2)提取282个土壤采样点位置对应的衍生辅助数据主成分得分,以Zn浓度数据和14个主成分构建土壤样点数据集,并按8:2的比例将土壤样点数据集随机划分为训练集和验证集;
(4.3)基于土壤样点训练集,以衍生辅助数据主成分得分为预测变量、土壤Zn浓度为目标变量,利用支持向量机回归建立土壤Zn浓度三维空间预测模型,模型构建过程中,其最优参数通过训练集数据5折交叉验证结果进行设置,具体如下:核函数设置为高斯径向基函数,惩罚因子C设置为100,不敏感损失函数gamma设置为0.1。
步骤E. 应用独立验证方法,计算基于土壤污染物浓度三维预测模型所获土壤样点土壤污染物浓度预测值与其对应的土壤污染物浓度实测值之间的均方根误差,即获得土壤污染物浓度三维预测模型的预测精度。
(5.1)利用第四步中构建的土壤Zn浓度三维预测模型,对定义的三维网格中的栅格位置逐一进行预测,得到该场地土壤Zn浓度的三维空间分布图,如图5(左)所示;
(5.2)利用第四步中构建的土壤Zn浓度三维预测模型,对验证集中土壤样点位置的Zn浓度进行预测,并计算验证集中土壤样点位置Zn浓度预测值与实测值之间的均方根误差(RMSE),用于评价空间预测精度。
本实施例中,电阻率三维分布原始数据(图3)与土壤Zn浓度之间的相关系数仅为0.29,而经辅助数据开发后得到的电阻率11×11×3滑动窗口最大值衍生辅助数据(图4右)以及3×3×3滑动窗口方差衍生辅助数据,其与土壤Zn浓度间的相关系数分别提高到0.5和0.51;此外,电阻率z方向(即,垂直方向)梯度衍生辅助数据与Zn浓度间的相关系数则提高到0.31。相较于原始辅助数据,衍生辅助数据与土壤污染浓度间的相关性得到了显著提升。
本实施例中,土壤Zn浓度三维预测独立验证的RMSE为175.01 mg/kg,而采用相同的独立验证数据集,传统IDW空间插值法的RMSE则高达242.33 mg/kg,相较传统IDW插值法而言,本发明方法的预测误差降低了约28%。此外,本发明方法(图5 左)与传统IDW插值方法(图5 右)预测的Zn浓度最大值分别为841.00 mg/kg和861.00 mg/kg,最小值则分别为3.15mg/kg和42.6 mg/kg,证明本发明能够显著降低污染物浓度的“低值高估”效应,从而减少平滑效应、更好的刻画污染物浓度的三维空间分布细节特征。
本实施例可以证明,通过对功能区布局及地下物性等场地污染辅助数据进行进一步开发,可以提高其与污染物浓度的相关性,并实现辅助数据中所隐含的场地污染先验信息的充分利用,从而提高场地土壤污染物浓度的三维空间预测精度、降低预测结果的平滑效应。
上面结合附图对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。
Claims (9)
1.基于多源辅助数据开发的场地土壤污染物浓度三维空间预测方法,其特征在于:通过步骤A至步骤D,获得目标区域的土壤污染物浓度三维预测模型,通过步骤i,应用土壤污染物浓度三维预测模型,实现目标区域地下空间的土壤污染物浓度三维分布预测;
步骤A. 获得目标区域内预设各钻孔位置下各预设深度土壤样点的土壤污染物浓度实测值,以及目标区域对应包含预设各数据类型的多源辅助数据集,然后进入步骤B;
步骤B. 基于目标区域地下空间预设的三维栅格,通过空间插值方法,针对目标区域所对应多源辅助数据集进行预处理,更新目标区域所对应多源辅助数据集,然后进入步骤C;
步骤C. 根据目标区域地下空间预设的三维栅格,针对目标区域所对应多源辅助数据集,执行数据衍生处理,获得目标区域三维衍生辅助数据,然后进入步骤D;
步骤D. 基于目标区域三维衍生辅助数据,获得各土壤样点分别对应的衍生辅助数据,以土壤样点所对应衍生辅助数据为预测变量,土壤样点所对应土壤污染物浓度实测值为目标变量,针对预设机器学习模型进行训练,获得目标区域的土壤污染物浓度三维预测模型;
步骤i,分别针对目标区域地下空间的各个栅格,获得栅格所对应的衍生辅助数据,应用土壤污染物浓度三维预测模型,获得各栅格的土壤污染物浓度预测值,进而实现对目标区域地下空间的土壤污染物浓度三维预测。
2.根据权利要求1所述基于多源辅助数据开发的场地土壤污染物浓度三维空间预测方法,其特征在于:还包括步骤E如下,执行完步骤D之后,进入步骤E;
步骤E. 应用独立验证方法,计算基于土壤污染物浓度三维预测模型所获土壤样点土壤污染物浓度预测值与其对应的土壤污染物浓度实测值之间的均方根误差,即获得土壤污染物浓度三维预测模型的预测精度。
3.根据权利要求1所述基于多源辅助数据开发的场地土壤污染物浓度三维空间预测方法,其特征在于:所述步骤A中目标区域对应包含预设各数据类型的多源辅助数据集,包括目标区域中预设各类功能区的区域范围、目标区域对应预设各电磁探测频率下的电导率二维测点数据、以及目标区域对应预设各测线位置的二维断面反演电阻率数据。
4.根据权利要求3所述基于多源辅助数据开发的场地土壤污染物浓度三维空间预测方法,其特征在于:通过电磁感应法EM测量目标区域地下电导率,获得目标区域对应预设各电磁探测频率下的电导率二维测点数据。
5.根据权利要求3所述基于多源辅助数据开发的场地土壤污染物浓度三维空间预测方法,其特征在于:通过电阻率层析成像ERT测量目标区域地下电阻率,获得目标区域对应预设各测线位置的二维断面反演电阻率数据。
6.根据权利要求1所述基于多源辅助数据开发的场地土壤污染物浓度三维空间预测方法,其特征在于:所述步骤B中,基于多源辅助数据集中目标区域对应预设各电磁探测频率下的电导率二维测点数据,通过空间插值方法,针对目标区域地下空间三维栅格水平方向的二维栅格进行插值处理,获得目标区域对应各电磁探测频率下的土壤电导率二维空间分布;
基于多源辅助数据集中目标区域对应预设各测线位置的二维断面反演电阻率数据,通过空间插值方法,针对目标区域地下空间三维栅格进行插值处理,获得目标区域所对应电阻率三维空间分布。
7.根据权利要求6所述基于多源辅助数据开发的场地土壤污染物浓度三维空间预测方法,其特征在于:所述步骤B中的空间插值方法为IDW插值方法或克里格插值方法。
8.根据权利要求1所述基于多源辅助数据开发的场地土壤污染物浓度三维空间预测方法,其特征在于:所述步骤C包括如下步骤C1至步骤C4;
步骤C1. 基于目标区域中预设各类功能区的区域范围,针对目标区域中的各个栅格,若栅格位于预设功能区内,则针对该栅格赋值为1,如该栅格未位于预设功能区内,则针对该栅格赋值为0,完成对目标区域中各栅格的赋值,即构成目标区域所对应功能区类型三维衍生辅助数据;同时分别针对目标区域中的各个栅格,计算栅格分别到各功能区边缘的最近欧式距离,即获得目标区域中各栅格分别到各功能区边缘的最近欧式距离,构成目标区域所对应功能区距离三维衍生辅助数据;然后进入步骤C2;
步骤C2. 基于目标区域对应各电磁探测频率下的电导率二维空间分布,获得目标区域水平方向各栅格分别对应各电磁探测频率下电导率之间的最小值、最大值、中值、均值和方差,构成目标区域所对应电导率统计量二维衍生辅助数据;同时基于预设各尺寸大小二维滑动窗口在目标区域水平方向上的滑动,获得各电磁探测频率下各二维滑动窗口中各栅格电导率之间最小值、最大值、中值、均值、方差、以及二维方向上的梯度,构成目标区域所对应滑动窗口电导率统计量二维衍生辅助数据;然后进入步骤C3;
步骤C3. 基于目标区域所对应电阻率三维空间分布,获得目标区域水平方向各栅格各深度电阻率之间最小值、最大值、中值、均值和方差,构成目标区域所对应各深度间电阻率统计量二维衍生辅助数据;同时基于预设各尺寸大小三维滑动窗口在目标区域地下空间三维栅格上的滑动,获得各三维滑动窗口中各栅格电阻率之间的最小值、最大值、中值、均值、方差、以及三维方向上的梯度,构成目标区域所对应滑动窗口电阻率统计量三维衍生辅助数据;然后进入步骤C4;
步骤C4. 针对目标区域所对应的电导率统计量二维衍生辅助数据、滑动窗口电导率统计量二维衍生辅助数据、以及各深度间电阻率统计量二维衍生辅助数据,沿三维栅格深度方向进行复制,获得目标区域所对应的各深度间电导率统计量三维衍生辅助数据、滑动窗口电导率统计量三维衍生辅助数据、以及电阻率三维衍生辅助数据,并结合目标区域所对应功能区类型三维衍生辅助数据、功能区距离三维衍生辅助数据、滑动窗口电阻率统计量三维衍生辅助数据,构成目标区域三维衍生辅助数据,然后进入步骤D。
9.根据权利要求1所述基于多源辅助数据开发的场地土壤污染物浓度三维空间预测方法,其特征在于:所述步骤D中包括如下步骤D1至步骤D3;
步骤D1. 针对目标区域三维衍生辅助数据进行标准化,并利用主成分分析法,获得衍生辅助数据中各主成分数据,然后进入步骤D2;
步骤D2. 基于目标区域三维衍生辅助数据,获得各土壤样点分别对应各主成分数据类型的数据,构成各土壤样点分别对应的衍生辅助数据,然后进入步骤D3;
步骤D3. 基于各土壤样点,以土壤样点所对应衍生辅助数据为预测变量,土壤样点所对应土壤污染物浓度实测值为目标变量,针对支持向量机回归模型进行训练,获得目标区域的土壤污染物浓度三维预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210760419.1A CN115292890A (zh) | 2022-06-29 | 2022-06-29 | 基于多源辅助数据开发的场地土壤污染物浓度三维空间预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210760419.1A CN115292890A (zh) | 2022-06-29 | 2022-06-29 | 基于多源辅助数据开发的场地土壤污染物浓度三维空间预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115292890A true CN115292890A (zh) | 2022-11-04 |
Family
ID=83823170
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210760419.1A Pending CN115292890A (zh) | 2022-06-29 | 2022-06-29 | 基于多源辅助数据开发的场地土壤污染物浓度三维空间预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115292890A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116167285A (zh) * | 2023-02-27 | 2023-05-26 | 北京市生态环境保护科学研究院 | 有机污染物运移的预测方法、装置和电子设备 |
CN116773781A (zh) * | 2023-08-18 | 2023-09-19 | 北京建工环境修复股份有限公司 | 一种用于土壤中全氟化合物的污染分析方法、***及介质 |
-
2022
- 2022-06-29 CN CN202210760419.1A patent/CN115292890A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116167285A (zh) * | 2023-02-27 | 2023-05-26 | 北京市生态环境保护科学研究院 | 有机污染物运移的预测方法、装置和电子设备 |
CN116773781A (zh) * | 2023-08-18 | 2023-09-19 | 北京建工环境修复股份有限公司 | 一种用于土壤中全氟化合物的污染分析方法、***及介质 |
CN116773781B (zh) * | 2023-08-18 | 2023-12-05 | 北京建工环境修复股份有限公司 | 一种用于土壤中全氟化合物的污染分析方法、***及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Linde et al. | Geological realism in hydrogeological and geophysical inverse modeling: A review | |
Auken et al. | A review of airborne electromagnetic methods with focus on geotechnical and hydrological applications from 2007 to 2017 | |
Cheng | Spatial and scaling modelling for geochemical anomaly separation | |
Fernández-Martínez et al. | Particle swarm optimization applied to solving and appraising the streaming-potential inverse problem | |
He et al. | Transition probability‐based stochastic geological modeling using airborne geophysical data and borehole data | |
Tronicke et al. | Crosshole traveltime tomography using particle swarm optimization: A near-surface field example | |
Fienen et al. | An interactive Bayesian geostatistical inverse protocol for hydraulic tomography | |
CN115292890A (zh) | 基于多源辅助数据开发的场地土壤污染物浓度三维空间预测方法 | |
MX2007000380A (es) | Metodo basado en computadora para modelar y visualizar mientras se preforan formaciones terrestres subterraneas en capas. | |
Wang et al. | Anisotropic singularity: A novel way to characterize controlling effects of geological processes on mineralization | |
Allroggen et al. | Attribute-based analysis of time-lapse ground-penetrating radar data | |
Jaumann et al. | Soil hydraulic material properties and layered architecture from time-lapse GPR | |
CN110286416B (zh) | 一种基于物性函数的快速二维密度反演方法 | |
CN110133644B (zh) | 基于插值尺度函数法的探地雷达三维正演方法 | |
Bortolozo et al. | VES/TEM 1D joint inversion by using Controlled Random Search (CRS) algorithm | |
CN117274520A (zh) | 一种地质勘探的测绘方法 | |
Jaumann et al. | Effect of unrepresented model errors on estimated soil hydraulic material properties | |
Pang et al. | 3D multi-scale resistivity inversion method applied in the tunnel face to borehole observations for tunnel-ahead prospecting | |
CN115857028A (zh) | 基于非接触观测法的水文地质参数的时空定量表达方法 | |
CN115293024A (zh) | 整合多源协同变量的场地土壤污染物浓度三维空间插值方法 | |
CN115420778A (zh) | 一种浅层土壤污染快速调查定位方法及*** | |
Christensen | Interpretation attributes derived from airborne electromagnetic inversion models using the continuous wavelet transform | |
Stephan et al. | Adding realistic noise models to synthetic ground‐penetrating radar data | |
CN113406707A (zh) | 一种大地电磁多尺度、多时段探测方法 | |
Ley-Cooper et al. | Inversion of legacy airborne electromagnetic datasets to inform the hydrogeological understanding of the northern Eyre Peninsula, South Australia |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |