CN116108758B - 滑坡易发性评价方法 - Google Patents

滑坡易发性评价方法 Download PDF

Info

Publication number
CN116108758B
CN116108758B CN202310368406.4A CN202310368406A CN116108758B CN 116108758 B CN116108758 B CN 116108758B CN 202310368406 A CN202310368406 A CN 202310368406A CN 116108758 B CN116108758 B CN 116108758B
Authority
CN
China
Prior art keywords
landslide
learner
preliminary
sample set
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310368406.4A
Other languages
English (en)
Other versions
CN116108758A (zh
Inventor
石岩
樊泽
王达
陈炳蓉
刘宝举
邓敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN202310368406.4A priority Critical patent/CN116108758B/zh
Publication of CN116108758A publication Critical patent/CN116108758A/zh
Application granted granted Critical
Publication of CN116108758B publication Critical patent/CN116108758B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Testing Or Calibration Of Command Recording Devices (AREA)
  • Pit Excavations, Shoring, Fill Or Stabilisation Of Slopes (AREA)

Abstract

本发明公开了一种滑坡易发性评价方法,包括获取已有的滑坡数据信息;筛选滑坡灾害影响因子;构建样本集;构建滑坡易发性评价模型并训练得到训练后的滑坡易发性评价模型;采用训练后的评价模型对待分析区域的滑坡易发性进行评价。本发明提供的这种滑坡易发性评价方法,通过强化负样本策略得到可靠的负样本集,通过构建的滑坡易发性评价模型,提高了滑坡易发性评价结果的准确率;因此本发明的可靠性高、准确性好且客观科学。

Description

滑坡易发性评价方法
技术领域
本发明属于土木工程领域,具体涉及一种滑坡易发性评价方法。
背景技术
目前,已有的滑坡灾害易发性评价主要分为定性和定量两种:定性的方法,通常由滑坡灾害专家利用自身知识,评价区域滑坡灾害发生的可能性;但是这类方案的评价结果极其依赖专家的主观经验,可靠性和一致性都较差。定量的方法,有基于物理力学的方法和基于统计分析的方法;基于物理力学的方法,一般构建斜坡的力学模型,直接对斜坡的稳定性进行数值模拟求解;但是,该类方法需要详细的斜坡物理力学特征数据,计算过程十分费时,多用于小区域的斜坡单体易发性分析;基于统计分析的方法有证据权、信息量和频率比等数理统计方法和人工神经网络、支持向量机、决策树、随机森林、逻辑回归等机器学习方法;数理统计方法的计算虽然简单,但是其无法捕捉滑坡与影响因子间的非线性关系,易发性评价结果可靠性不高;机器学习模型擅长处理非线性问题,已经在地质灾害评价研究中表现出了较好的性能。
但是,尽管机器学习模型已经被广泛应用于滑坡灾害的易发性评价,但这些方案模型均面临相同的问题,即训练数据的不确定问题:没有真实的负样本(非滑坡样本)。滑坡灾害易发性评价研究中,正样本(滑坡样本)往往来自历史滑坡资料中真实发生过的部分滑坡事件,而负样本通常选择研究区内暂未发生滑坡的区域。然而,由于滑坡事件记录不完备,此方法难以保证负样本区域从未发生滑坡,同时也无法确保未发生滑坡区域完全不存在滑坡风险。因此,在这种负样本集充满不确定性的情况下,现有的滑坡灾害易发性评价方法极易将滑坡区域错误地划分为非滑坡区域,导致最终生成的滑坡易发性评价结果出现高风险区被严重低估问题。
发明内容
本发明的目的在于提供一种可靠性高、准确性好且客观科学的滑坡易发性评价方法。
本发明提供的这种滑坡易发性评价方法,包括如下步骤:
S1. 获取已有的滑坡数据信息;
S2. 将研究区域划分为设定大小的栅格,根据各个栅格的历史滑坡数据选取初步影响因子,并构建正样本集和负样本集;然后基于初步影响因子之间的相关性和因子探测值筛选得到滑坡灾害影响因子;
S3. 基于随机森林分类器,进行负样本的强化,从而得到样本集;
S4. 构建滑坡易发性评价模型:模型包括第一层基学习器和第二层元学习器,第二层元学习器对第一层基学习器的输出结果进行融合增强;基于CART决策树、支持向量机和BP神经网络构建第一层基学习器,基于逻辑回归构建第二层元学习器;
S5. 采用步骤S3得到的样本集,对步骤S4构建的评价模型进行训练,得到训练后的滑坡易发性评价模型;
S6. 采用步骤S5得到的评价模型,对待分析区域的滑坡易发性进行评价。
所述的步骤S2,具体包括如下步骤:
将研究区域划分为若干个栅格;
根据研究区域内各个栅格的滑坡情况,选取若干个初步影响因子,并提取对应的初步影响因子栅格数据;
计算各个初步影响因子之间的相关性;同时计算因子探测值,用于度量初步影响因子对滑坡灾害标签的空间分异的控制程度;
最后,根据计算得到的相关性和因子探测值对初步影响因子进行过滤,得到最终的影响因子。
所述的步骤S2,具体包括如下步骤:
设置栅格单元大小为
Figure SMS_1
;将研究区域按照设定的栅格单元大小划分为若干个栅格单元;
根据获取的研究区域的滑坡数据信息和滑坡成因情况,选取N个初步影响因子;N为设定值;
根据研究区域的历史滑坡坐标,提取滑坡坐标对应位置的初步影响因子栅格数据构成正样本集
Figure SMS_2
;同时,在研究区域内,随机选取与正样本集/>
Figure SMS_3
中元素数量相同的未发生滑坡的栅格,并提取对应的初步影响因子栅格数据构成负样本集/>
Figure SMS_4
采用如下算式计算任意两个初步影响因子x1和x2之间的相关性
Figure SMS_5
Figure SMS_6
式中/>
Figure SMS_7
为初步影响因子x1和x2之间的协方差;
Figure SMS_8
为初步影响因子x1的标准差;/>
Figure SMS_9
为初步影响因子x2的标准差;
采用如下算式计算因子探测值q,用于度量初步影响因子对滑坡灾害标签的空间分异的控制程度:
Figure SMS_10
式中l为变量属性的分类数;/>
Figure SMS_11
为类h的栅格数;
Figure SMS_12
为类hy值方差;N为全部的栅格数;/>
Figure SMS_13
为全局的y值方差;删除相关性值大于第一设定值的初步影响因子对,并按绝对值进行降序排列;然后,在排序后的初步影响因子对中,删除因子探测值小于第二设定值的初步影响因子/>
Figure SMS_14
,并同时删除排序在初步影响因子/>
Figure SMS_15
后且含有初步影响因子/>
Figure SMS_16
的初步影响因子对;重复本步骤直至不存在相关性值大于第一设定值的初步影响因子对,最后再删除因子探测值小于第一阈值的初步影响因子;最终,将剩余的初步影响因子作为最终的影响因子。
所述的步骤S3,具体包括如下步骤:
根据研究区域的所有网格单元集和正样本集
Figure SMS_17
,生成若干组候选负样本集,从而构建候选样本集;
将候选样本集划分为训练集和测试集;每次采用一组训练集训练随机森林分类器,并根据训练结果调整随机森林分类器的参数,最终保证随机森林分类器的准确率大于设定值;
采用训练后的随机森林分类器,计算候选负样本集中每个负样本的滑坡易发概率,并根据得到的概率选择若干组样本构建负样本集;
最终,根据得到的正样本集和负样本集,构建最终的样本集。
所述的步骤S3,具体包括如下步骤:
获取研究区域的所有网格单元,构成所有网格单元集cell;将M个已知滑坡灾害所在的网络单元标记为正样本集
Figure SMS_18
;在所有网格单元集cell和正样本集/>
Figure SMS_19
的差集中,随机选择M个网络单元生成一组候选负样本,并重复本操作直至得到M组候选负样本;将M组候选负样本与正样本集/>
Figure SMS_20
构成M组候选样本集;
将候选样本集按照设定的比例划分为训练集和测试集;每次采用一组训练集训练随机森林分类器,并根据训练结果调整随机森林分类器的参数,最终保证随机森林分类器的准确率在训练集中大于第三设定值,且在测试集中大于第四设定值;
采用训练后的得到的M组随机森林分类器,分别计算候选样本集中每个负样本的滑坡易发概率,并依次提取每组候选负样本集中滑坡易发概率最低的负样本,构成强化后的负样本集
Figure SMS_21
最后,将正样本集和负样本集
Figure SMS_22
合并,得到最终的样本集SAM。
所述的步骤S4,具体包括如下步骤:
构建具有两层学习器的评价模型:基于CART决策树、支持向量机和BP神经网络构建第一层基学习器,第二层元学习器由逻辑回归对基学习器的输出结果进行融合增强;
采用样本集对基学习器进行训练;
将基学习器的输出作为元学习器的输入,并结合样本集的标签完成训练。
所述的步骤S4,具体包括如下步骤:
构建具有两层学习器的评价模型:基于CART决策树、支持向量机和BP神经网络构建第一层基学习器,第二层元学习器由逻辑回归对基学习器的输出结果进行融合增强;
构建基学习器:基学习器由三个CART决策树、支持向量机和两层BP神经网络并行组成;
其中,CART决策树基于基尼不纯度减少最大化的方式进行***节点选择;采用如下算式计算数据集T的基尼不纯度
Figure SMS_24
:/>
Figure SMS_25
式中n为类别的总数;/>
Figure SMS_29
为数据集T中类i的概率;若数据集T划分为/>
Figure SMS_30
和/>
Figure SMS_31
,则采用如下算式计算基尼不纯度
Figure SMS_32
:/>
Figure SMS_33
式中T为数据集T的数据量;
Figure SMS_23
为数据集/>
Figure SMS_26
的数据量;/>
Figure SMS_27
为数据集/>
Figure SMS_28
的数据量;
设定样本集特征空间线性可分,并建立支持向量机;引入径向基核函数将低维的样本空间映射到高维空间,从而实现线性可分,进而在特征空间进行最优超平面分割:
Figure SMS_34
式中/>
Figure SMS_35
为分割超平面函数;wn维权重向量;x为样本的n维特征向量;b为偏差;/>
Figure SMS_36
归一化后,/>
Figure SMS_37
的样本为A类,/>
Figure SMS_38
的样本为B类;
BP神经网络由输入层、输出层、中间各50个节点的双层网络隐含层组成;输入层为样本,输出层为样本类别,采取误差向后传播的方法更新网络节点权重;
构建元学习器:元学习器采用逻辑回归对基学习器的输出结果进行融合增强,减轻复杂度并防止过拟合,最后直接输出滑坡灾害易发性的概率;
基学习器的训练:将样本集SAM的训练数据分为五折,每个基学习器依次利用其中的四折数据进行训练,并利用剩余的一折数据预测生成基学习器的输出;重复五次直至每折数据均被基学习器训练且预测输出;
元学习器的训练:组合三个基学习器的五折数据预测输出作为元学习器输入,结合样本集SAM的标签完成最终的训练,得到滑坡易发性的评价模型。
所述的步骤S6,具体包括如下步骤:
获取目标区域的数据信息;
根据得到的数据信息,采用得到的训练后的滑坡易发性评价模型,对目标区域的每个栅格进行滑坡易发性预测;
根据每个栅格的滑坡易发性预测结果,与设定的阈值进行比较,并根据比较结果判定目标区域中每个栅格的滑坡易发性,完成待分析区域的滑坡易发性评价。
本发明提供的这种滑坡易发性评价方法,通过强化负样本策略得到可靠的负样本集,通过构建的滑坡易发性评价模型,提高了滑坡易发性评价结果的准确率;因此本发明的可靠性高、准确性好且客观科学。
附图说明
图1为本发明方法的方法流程示意图。
图2为本发明方法的实施例中的历史滑坡点示意图。
图3为本发明方法的实施例中的影响因子相关性示意图。
图4为本发明方法的实施例中的滑坡易发性评价结果示意图。
具体实施方式
如图1所示为本发明方法的方法流程示意图:本发明提供的这种滑坡易发性评价方法,包括如下步骤:
S1. 获取已有的滑坡数据信息;
S2. 将研究区域划分为设定大小的栅格,根据各个栅格的历史滑坡数据选取初步影响因子,并构建正样本集和负样本集;然后基于初步影响因子之间的相关性和因子探测值筛选得到滑坡灾害影响因子;具体包括如下步骤:
将研究区域划分为若干个栅格;
根据研究区域内各个栅格的滑坡情况,选取若干个初步影响因子,并提取对应的初步影响因子栅格数据;
计算各个初步影响因子之间的相关性;同时计算因子探测值,用于度量初步影响因子对滑坡灾害标签的空间分异的控制程度;
最后,根据计算得到的相关性和因子探测值对初步影响因子进行过滤,得到最终的影响因子;
具体实施时,采用如下步骤进行筛选:
设置栅格单元大小为
Figure SMS_39
;将研究区域按照设定的栅格单元大小划分为若干个栅格单元;
根据获取的研究区域的滑坡数据信息和滑坡成因情况,选取N个初步影响因子;N为设定值;
根据研究区域的历史滑坡坐标,提取滑坡坐标对应位置的初步影响因子栅格数据构成正样本集
Figure SMS_40
;同时,在研究区域内,随机选取与正样本集/>
Figure SMS_41
中元素数量相同的未发生滑坡的栅格,并提取对应的初步影响因子栅格数据构成负样本集/>
Figure SMS_42
采用如下算式计算任意两个初步影响因子x1和x2之间的相关性
Figure SMS_43
Figure SMS_44
式中/>
Figure SMS_45
为初步影响因子x1和x2之间的协方差;
Figure SMS_46
为初步影响因子x1的标准差;/>
Figure SMS_47
为初步影响因子x2的标准差;
采用如下算式计算因子探测值q,用于度量初步影响因子对滑坡灾害标签的空间分异的控制程度:
Figure SMS_48
式中l为变量属性的分类数;/>
Figure SMS_49
为类h的栅格数;
Figure SMS_50
为类hy值方差;N为全部的栅格数;/>
Figure SMS_51
为全局的y值方差;
删除相关性值大于第一设定值(优选为0.4)的初步影响因子对,并按绝对值进行降序排列;然后,在排序后的初步影响因子对中,删除因子探测值小于第二设定值的初步影响因子
Figure SMS_52
,并同时删除排序在初步影响因子/>
Figure SMS_53
后且含有初步影响因子
Figure SMS_54
的初步影响因子对;重复本步骤直至不存在相关性值大于第一设定值的初步影响因子对,最后再删除因子探测值小于第一阈值(优选为0.01)的初步影响因子;最终,将剩余的初步影响因子作为最终的影响因子;
S3. 基于随机森林分类器,进行负样本的强化,从而得到样本集;具体包括如下步骤:
根据研究区域的所有网格单元集和正样本集
Figure SMS_55
,生成若干组候选负样本集,从而构建候选样本集;
将候选样本集划分为训练集和测试集;每次采用一组训练集训练随机森林分类器,并根据训练结果调整随机森林分类器的参数,最终保证随机森林分类器的准确率大于设定值;
采用训练后的随机森林分类器,计算候选负样本集中每个负样本的滑坡易发概率,并根据得到的概率选择若干组样本构建负样本集;
最终,根据得到的正样本集和负样本集,构建最终的样本集;
具体实施时,采用如下步骤得到样本集:
获取研究区域的所有网格单元,构成所有网格单元集cell;将M个已知滑坡灾害所在的网络单元标记为正样本集
Figure SMS_56
;在所有网格单元集cell和正样本集/>
Figure SMS_57
的差集中,随机选择M个网络单元生成一组候选负样本,并重复本操作直至得到M组候选负样本;将M组候选负样本与正样本集/>
Figure SMS_58
构成M组候选样本集;
将候选样本集按照设定的比例划分为训练集和测试集;每次采用一组训练集训练随机森林分类器,并根据训练结果调整随机森林分类器的参数,最终保证随机森林分类器的准确率在训练集中大于第三设定值(优选为0.9),且在测试集中大于第四设定值(优选为0.85);
采用训练后的得到的M组随机森林分类器,分别计算候选样本集中每个负样本的滑坡易发概率,并依次提取每组候选负样本集中滑坡易发概率最低的负样本,构成强化后的负样本集
Figure SMS_59
最后,将正样本集和负样本集
Figure SMS_60
合并,得到最终的样本集SAM;
S4. 构建滑坡易发性评价模型:模型包括第一层基学习器和第二层元学习器,第二层元学习器对第一层基学习器的输出结果进行融合增强;基于CART决策树、支持向量机和BP神经网络构建第一层基学习器,基于逻辑回归构建第二层元学习器;具体包括如下步骤:
构建具有两层学习器的评价模型:基于CART决策树、支持向量机和BP神经网络构建第一层基学习器,第二层元学习器由逻辑回归对基学习器的输出结果进行融合增强;
采用样本集对基学习器进行训练;
将基学习器的输出作为元学习器的输入,并结合样本集的标签完成训练;
具体实施时,采用如下步骤构建模型:
构建具有两层学习器的评价模型:基于CART决策树、支持向量机和BP神经网络构建第一层基学习器,第二层元学习器由逻辑回归对基学习器的输出结果进行融合增强;
构建基学习器:基学习器由三个CART决策树、支持向量机和两层BP神经网络并行组成;
其中,CART决策树基于基尼不纯度减少最大化的方式进行***节点选择;采用如下算式计算数据集T的基尼不纯度
Figure SMS_62
:/>
Figure SMS_63
式中n为类别的总数;/>
Figure SMS_65
为数据集T中类i的概率;若数据集T划分为/>
Figure SMS_67
和/>
Figure SMS_69
,则采用如下算式计算基尼不纯度
Figure SMS_70
:/>
Figure SMS_71
式中T为数据集T的数据量;
Figure SMS_61
为数据集/>
Figure SMS_64
的数据量;/>
Figure SMS_66
为数据集/>
Figure SMS_68
的数据量;
设定样本集特征空间线性可分,并建立支持向量机;引入径向基核函数将低维的样本空间映射到高维空间,从而实现线性可分,进而在特征空间进行最优超平面分割:
Figure SMS_72
式中/>
Figure SMS_73
为分割超平面函数;wn维权重向量;x为样本的n维特征向量;b为偏差;/>
Figure SMS_74
归一化后,/>
Figure SMS_75
的样本为A类,/>
Figure SMS_76
的样本为B类;
BP神经网络由输入层、输出层、中间各50个节点的双层网络隐含层组成;输入层为样本,输出层为样本类别,采取误差向后传播的方法更新网络节点权重;
构建元学习器:元学习器采用逻辑回归对基学习器的输出结果进行融合增强,减轻复杂度并防止过拟合,最后直接输出滑坡灾害易发性的概率;
基学习器的训练:将样本集SAM的训练数据分为五折,每个基学习器依次利用其中的四折数据进行训练,并利用剩余的一折数据预测生成基学习器的输出;重复五次直至每折数据均被基学习器训练且预测输出;
元学习器的训练:组合三个基学习器的五折数据预测输出作为元学习器输入,结合样本集SAM的标签完成最终的训练,得到滑坡易发性的评价模型;
S5. 采用步骤S3得到的样本集,对步骤S4构建的评价模型进行训练,得到训练后的滑坡易发性评价模型;
S6. 采用步骤S5得到的评价模型,对待分析区域的滑坡易发性进行评价;具体包括如下步骤:
获取目标区域的数据信息;
根据得到的数据信息,采用得到的训练后的滑坡易发性评价模型,对目标区域的每个栅格进行滑坡易发性预测;
根据每个栅格的滑坡易发性预测结果,与设定的阈值进行比较,并根据比较结果判定目标区域中每个栅格的滑坡易发性,完成待分析区域的滑坡易发性评价;
具体实施时,采用如下规则进行滑坡易发性评价:
若易发性概率大于或等于0.9,则判定对应的栅格区域属于极高风险区;
若易发性概率大于或等于0.7且小于0.9,则判定对应的栅格区域属于高风险区;
若易发性概率大于或等于0.5且小于0.7,则判定对应的栅格区域属于中风险区;
若易发性概率大于或等于0.3且小于0.5,则判定对应的栅格区域属于低风险区;
若易发性概率小于0.3,则判定对应的栅格区域属于极低风险区。
以下结合一个具体实施例,对本发明方法进行进一步说明:
采用某县的历史滑坡资料和环境数据,其中历史滑坡点数据如图2所示;
获取研究区域内数据源并选取17个影响因子:工程岩组类型、断裂距离、断裂密度、高程、坡度、坡向、地形起伏度、平面曲率、剖面曲率、斜坡形态、水系密度、水系距离、年平均降雨量、NDVI(归一化植被指数)、路网距离、路网密度和土地利用类型。设置规则的30m×30m的栅格单元将研究区域划分为约450万栅格单元,计算上述17个影响因子在每个栅格单元的具体数值;
根据研究区261个历史滑坡坐标提取对应位置的影响因子栅格数据构成正样本集p_sam;随机从全区未发生滑坡的区域提取261个栅格构成负样本集n_sam。
计算所有影响因子间的相关性,使用因子探测q值度量各影响因子对滑坡灾害的空间分异的控制程度。
基于相关性矩阵和因子探测器筛选重要性强且共线性小的影响因子。图3为对应的影响因子间的相关性数值示意图;表1为q值的计算结果示意表:
表1 q值的计算结果示意表
Figure SMS_77
根据图2和表1的数据,筛选相关性绝对值大于0.4的影响因子对并按绝对值降序排列,依次去除“地形起伏度—坡度”、“断裂密度—断层距离”等双因子对中q值小的影响因子,同时去除排序在其之后且含有该因子的其他影响因子对。最后,去除q值小于0.01的影响因子,最终筛选出工程岩组类型、断裂密度、高程、坡度、坡向、剖面曲率、斜坡形态、水系距离、年平均降雨量、NDVI、路网距离、路网密度和土地利用类型13个评价因子;
给定研究区域所有网格单元集cell,在cell和
Figure SMS_78
差集中随机选择261个网格单元生成一组候选负样本,重复此操作随机生成261组候选负样本,分别与/>
Figure SMS_79
构成261组候选样本集。
进一步以8:2分别将261组候选样本集分别划分为训练集和测试集,每次仅利用训练集构建随机森林分类器,根据准确率调整随机森林超参数并多次训练,保证分类器在训练集准确率大于0.9,在测试集准确率达到0.85以上。
接着利用训练后的261组随机森林分类器分别计算对应候选负样本集每个负样本的滑坡易发概率,依次提取每组候选负样本集中易发概率值最低的负样本作为强化后的负样本集
Figure SMS_80
最后,正样本集
Figure SMS_81
和强化负样本集/>
Figure SMS_82
合并,构成后续滑坡灾害易发性评价模型的样本集SAM;
构建具有两层学习器的堆栈泛化模型,第一层基学习器由三个学习能力较强的CART决策树、径向基函数支持向量机、两层BP神经网络模型并行组成,第二层元学习器由逻辑回归对基学习器的输出结果进行融合增强,减轻模型复杂度的同时防止过拟合,最后直接输出滑坡灾害易发性概率。
将强化样本集SAM训练数据分为五折,每个基学习器依次利用其中四折训练,利用剩余一折预测生成基学习器的输出,重复五次直到每折都被基学习器训练且预测输出。组合三个基学习器的五折预测输出作为元学习器输入,结合SAM标签最终完成训练,得到滑坡易发性评价模型。
研究区域滑坡易发性评价:利用上述训练的滑坡易发性评价模型对研究区每个栅格进行预测,并设置易发性分类阈值输出栅格所属的滑坡易发性类别,其中易发性概率大于0.9属于极高风险区、易发性概率大于0.7且小于0.9属于高风险区、易发性概率大于0.5且小于0.7属于中风险区、易发性概率大于0.3且小于0.5属于低风险区、易发性概率小于0.3属于极低风险区,以此得到研究区滑坡易发性评价结果。结果如图4所示,可见基于强化负样本和堆栈泛化模型得到的该县滑坡易发区划图中绝大部分的历史滑坡点都落在了模型预测的极高风险区和高极高风险区,与历史滑坡数据一致。

Claims (7)

1.一种滑坡易发性评价方法,其特征在于包括如下步骤:
S1. 获取已有的滑坡数据信息;
S2. 将研究区域划分为设定大小的栅格,根据各个栅格的历史滑坡数据选取初步影响因子,并构建正样本集和负样本集;然后基于初步影响因子之间的相关性和因子探测值筛选得到滑坡灾害影响因子;
S3. 基于随机森林分类器,进行负样本的强化,从而得到样本集;具体包括如下步骤:
根据研究区域的所有网格单元集和正样本集
Figure QLYQS_1
,生成若干组候选负样本集,从而构建候选样本集;
将候选样本集划分为训练集和测试集;每次采用一组训练集训练随机森林分类器,并根据训练结果调整随机森林分类器的参数,最终保证随机森林分类器的准确率大于设定值;
采用训练后的随机森林分类器,计算候选负样本集中每个负样本的滑坡易发概率,并根据得到的概率选择若干组样本构建负样本集;
最终,根据得到的正样本集和负样本集,构建最终的样本集
S4. 构建滑坡易发性评价模型:模型包括第一层基学习器和第二层元学习器,第二层元学习器对第一层基学习器的输出结果进行融合增强;基于CART决策树、支持向量机和BP神经网络构建第一层基学习器,基于逻辑回归构建第二层元学习器;
S5. 采用步骤S3得到的样本集,对步骤S4构建的评价模型进行训练,得到训练后的滑坡易发性评价模型;
S6. 采用步骤S5得到的评价模型,对待分析区域的滑坡易发性进行评价。
2.根据权利要求1所述的滑坡易发性评价方法,其特征在于所述的步骤S2,具体包括如下步骤:
将研究区域划分为若干个栅格;
根据研究区域内各个栅格的滑坡情况,选取若干个初步影响因子,并提取对应的初步影响因子栅格数据;
计算各个初步影响因子之间的相关性;同时计算因子探测值,用于度量初步影响因子对滑坡灾害标签的空间分异的控制程度;
最后,根据计算得到的相关性和因子探测值对初步影响因子进行过滤,得到最终的影响因子。
3.根据权利要求2所述的滑坡易发性评价方法,其特征在于所述的步骤S2,具体包括如下步骤:
设置栅格单元大小为
Figure QLYQS_2
;将研究区域按照设定的栅格单元大小划分为若干个栅格单元;
根据获取的研究区域的滑坡数据信息和滑坡成因情况,选取N个初步影响因子;N为设定值;
根据研究区域的历史滑坡坐标,提取滑坡坐标对应位置的初步影响因子栅格数据构成正样本集
Figure QLYQS_3
;同时,在研究区域内,随机选取与正样本集/>
Figure QLYQS_4
中元素数量相同的未发生滑坡的栅格,并提取对应的初步影响因子栅格数据构成负样本集/>
Figure QLYQS_5
采用如下算式计算任意两个初步影响因子x1和x2之间的相关性
Figure QLYQS_6
Figure QLYQS_7
式中/>
Figure QLYQS_8
为初步影响因子x1和x2之间的协方差;
Figure QLYQS_9
为初步影响因子x1的标准差;/>
Figure QLYQS_10
为初步影响因子x2的标准差;
采用如下算式计算因子探测值q,用于度量初步影响因子对滑坡灾害标签的空间分异的控制程度:
Figure QLYQS_11
式中l为变量属性的分类数;/>
Figure QLYQS_12
为类h的栅格数;
Figure QLYQS_13
为类hy值方差;N为全部的栅格数;/>
Figure QLYQS_14
为全局的y值方差;
删除相关性值大于第一设定值的初步影响因子对,并按绝对值进行降序排列;然后,在排序后的初步影响因子对中,删除因子探测值小于第二设定值的初步影响因子
Figure QLYQS_15
,并同时删除排序在初步影响因子/>
Figure QLYQS_16
后且含有初步影响因子/>
Figure QLYQS_17
的初步影响因子对;重复本步骤直至不存在相关性值大于第一设定值的初步影响因子对,最后再删除因子探测值小于第一阈值的初步影响因子;最终,将剩余的初步影响因子作为最终的影响因子。
4.根据权利要求1所述的滑坡易发性评价方法,其特征在于所述的步骤S3,具体包括如下步骤:
获取研究区域的所有网格单元,构成所有网格单元集cell;将M个已知滑坡灾害所在的网络单元标记为正样本集
Figure QLYQS_18
;在所有网格单元集cell和正样本集/>
Figure QLYQS_19
的差集中,随机选择M个网络单元生成一组候选负样本,并重复本操作直至得到M组候选负样本;将M组候选负样本与正样本集/>
Figure QLYQS_20
构成M组候选样本集;
将候选样本集按照设定的比例划分为训练集和测试集;每次采用一组训练集训练随机森林分类器,并根据训练结果调整随机森林分类器的参数,最终保证随机森林分类器的准确率在训练集中大于第三设定值,且在测试集中大于第四设定值;
采用训练后的得到的M组随机森林分类器,分别计算候选样本集中每个负样本的滑坡易发概率,并依次提取每组候选负样本集中滑坡易发概率最低的负样本,构成强化后的负样本集
Figure QLYQS_21
最后,将正样本集和负样本集
Figure QLYQS_22
合并,得到最终的样本集SAM。
5.根据权利要求1所述的滑坡易发性评价方法,其特征在于所述的步骤S4,具体包括如下步骤:
构建具有两层学习器的评价模型:基于CART决策树、支持向量机和BP神经网络构建第一层基学习器,第二层元学习器由逻辑回归对基学习器的输出结果进行融合增强;
采用样本集对基学习器进行训练;
将基学习器的输出作为元学习器的输入,并结合样本集的标签完成训练。
6.根据权利要求5所述的滑坡易发性评价方法,其特征在于所述的步骤S4,具体包括如下步骤:
构建具有两层学习器的评价模型:基于CART决策树、支持向量机和BP神经网络构建第一层基学习器,第二层元学习器由逻辑回归对基学习器的输出结果进行融合增强;
构建基学习器:基学习器由三个CART决策树、支持向量机和两层BP神经网络并行组成;
其中,CART决策树基于基尼不纯度减少最大化的方式进行***节点选择;采用如下算式计算数据集T的基尼不纯度
Figure QLYQS_24
:/>
Figure QLYQS_25
式中n为类别的总数;
Figure QLYQS_27
为数据集T中类i的概率;若数据集T划分为/>
Figure QLYQS_29
和/>
Figure QLYQS_31
,则采用如下算式计算基尼不纯度
Figure QLYQS_32
:/>
Figure QLYQS_33
式中T为数据集T的数据量;
Figure QLYQS_23
为数据集/>
Figure QLYQS_26
的数据量;/>
Figure QLYQS_28
为数据集/>
Figure QLYQS_30
的数据量;
设定样本集特征空间线性可分,并建立支持向量机;引入径向基核函数将低维的样本空间映射到高维空间,从而实现线性可分,进而在特征空间进行最优超平面分割:
Figure QLYQS_34
式中/>
Figure QLYQS_35
为分割超平面函数;wn维权重向量;x为样本的n维特征向量;b为偏差;/>
Figure QLYQS_36
归一化后,/>
Figure QLYQS_37
的样本为A类,/>
Figure QLYQS_38
的样本为B类;
BP神经网络由输入层、输出层、中间各50个节点的双层网络隐含层组成;输入层为样本,输出层为样本类别,采取误差向后传播的方法更新网络节点权重;
构建元学习器:元学习器采用逻辑回归对基学习器的输出结果进行融合增强,减轻复杂度并防止过拟合,最后直接输出滑坡灾害易发性的概率;
基学习器的训练:将样本集SAM的训练数据分为五折,每个基学习器依次利用其中的四折数据进行训练,并利用剩余的一折数据预测生成基学习器的输出;重复五次直至每折数据均被基学习器训练且预测输出;
元学习器的训练:组合三个基学习器的五折数据预测输出作为元学习器输入,结合样本集SAM的标签完成最终的训练,得到滑坡易发性的评价模型。
7.根据权利要求5所述的滑坡易发性评价方法,其特征在于所述的步骤S6,具体包括如下步骤:
获取目标区域的数据信息;
根据得到的数据信息,采用得到的训练后的滑坡易发性评价模型,对目标区域的每个栅格进行滑坡易发性预测;
根据每个栅格的滑坡易发性预测结果,与设定的阈值进行比较,并根据比较结果判定目标区域中每个栅格的滑坡易发性,完成待分析区域的滑坡易发性评价。
CN202310368406.4A 2023-04-10 2023-04-10 滑坡易发性评价方法 Active CN116108758B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310368406.4A CN116108758B (zh) 2023-04-10 2023-04-10 滑坡易发性评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310368406.4A CN116108758B (zh) 2023-04-10 2023-04-10 滑坡易发性评价方法

Publications (2)

Publication Number Publication Date
CN116108758A CN116108758A (zh) 2023-05-12
CN116108758B true CN116108758B (zh) 2023-06-27

Family

ID=86262346

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310368406.4A Active CN116108758B (zh) 2023-04-10 2023-04-10 滑坡易发性评价方法

Country Status (1)

Country Link
CN (1) CN116108758B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117312760A (zh) * 2023-11-28 2023-12-29 中国电子科技集团公司第五十四研究所 一种基于空间栅格的运动目标时空分布预测方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116881652B (zh) * 2023-06-26 2024-04-05 成都理工大学 基于优选负样本和随机森林模型的滑坡易发性评价方法
CN116561536B (zh) * 2023-07-11 2023-11-21 中南大学 一种滑坡隐患的识别方法、终端设备及介质
CN117131761A (zh) * 2023-07-28 2023-11-28 成都理工大学 水库首次蓄水期的库岸滑坡预测方法
CN117725493A (zh) * 2023-10-16 2024-03-19 中国矿业大学(北京) 基于改进型Stacking融合模型的滑坡危险性结果评价方法
CN117094234B (zh) * 2023-10-19 2024-02-02 中国测绘科学研究院 融合卷积神经网络和自注意力模型的滑坡易发性评价方法
CN117540830B (zh) * 2024-01-05 2024-04-12 中国地质科学院探矿工艺研究所 基于断层分布指数的泥石流易发性预测方法、装置及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013023891A (ja) * 2011-07-20 2013-02-04 Chugoku Electric Power Co Inc:The 地すべり保全管理システム及び地すべり保全管理方法
KR20210030031A (ko) * 2019-09-09 2021-03-17 한국지질자원연구원 사전 기상정보 연동 산사태 조기경보 방법 및 산사태 조기경보 시스템
CN114330812A (zh) * 2021-10-29 2022-04-12 西北大学 基于机器学习的滑坡灾害风险评估方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102819023B (zh) * 2012-07-27 2014-09-17 中国地质大学(武汉) 基于LiDAR的复杂地质背景区滑坡识别的方法及***
KR20160062470A (ko) * 2014-11-25 2016-06-02 대한민국(산림청 국립산림과학원장) 로지스틱 회귀모형을 이용하여 산사태를 예측하기 위한 장치 및 그 방법
CN104679951B (zh) * 2015-02-11 2018-08-21 唐子来 一种多因素空间聚类的城市街区功能区划方法
CN105225046A (zh) * 2015-09-30 2016-01-06 武汉工程大学 一种区域滑坡敏感性评估数据采样方法
CN106600574B (zh) * 2016-08-25 2019-07-23 中国科学院遥感与数字地球研究所 一种基于遥感影像与高程数据的滑坡提取方法
CN106777585B (zh) * 2016-12-01 2019-10-11 桂林理工大学 一种区域浅表滑坡时空分异规律的esda分析法
CN107092798A (zh) * 2017-04-28 2017-08-25 成都理工大学 滑坡预测模型的稳定性评价方法及装置
CN108898623A (zh) * 2018-05-24 2018-11-27 北京飞搜科技有限公司 目标跟踪方法及设备
CN111539450B (zh) * 2020-03-24 2023-10-24 中南大学 地震区滑坡易发性评价方法
CN111626269B (zh) * 2020-07-07 2021-08-27 中国科学院空天信息创新研究院 一种实用的大空间范围滑坡提取方法
CN112966722A (zh) * 2021-02-07 2021-06-15 南昌大学 基于半监督随机森林模型的区域滑坡易发性预测方法
CN113570826A (zh) * 2021-07-15 2021-10-29 长视科技股份有限公司 一种河道滑坡形变识别实现灾害预警的方法与***
CN114463643A (zh) * 2021-12-23 2022-05-10 中国科学院空天信息创新研究院 多模型决策级融合的滑坡识别方法及装置
CN114612799B (zh) * 2022-03-11 2022-09-16 应急管理部国家自然灾害防治研究院 基于滑坡/非滑坡面积比的空间自适应正负样本生成方法及***
CN115526108B (zh) * 2022-10-11 2024-01-16 重庆地质矿产研究院 一种基于多源监测数据的滑坡稳定性智能动态预测方法
CN115631162A (zh) * 2022-10-21 2023-01-20 云南省地质环境监测院(云南省环境地质研究院) 一种滑坡隐患识别方法、***、介质及设备
CN115688404B (zh) * 2022-10-24 2023-07-14 中国科学院空天信息创新研究院 基于svm-rf模型的降雨型滑坡预警方法
CN115879300A (zh) * 2022-12-08 2023-03-31 广东南方数码科技股份有限公司 滑坡诱发性估算方法、装置、电子设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013023891A (ja) * 2011-07-20 2013-02-04 Chugoku Electric Power Co Inc:The 地すべり保全管理システム及び地すべり保全管理方法
KR20210030031A (ko) * 2019-09-09 2021-03-17 한국지질자원연구원 사전 기상정보 연동 산사태 조기경보 방법 및 산사태 조기경보 시스템
CN114330812A (zh) * 2021-10-29 2022-04-12 西北大学 基于机器学习的滑坡灾害风险评估方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117312760A (zh) * 2023-11-28 2023-12-29 中国电子科技集团公司第五十四研究所 一种基于空间栅格的运动目标时空分布预测方法

Also Published As

Publication number Publication date
CN116108758A (zh) 2023-05-12

Similar Documents

Publication Publication Date Title
CN116108758B (zh) 滑坡易发性评价方法
CN112819207B (zh) 基于相似性度量的地质灾害空间预测方法、***及存储介质
CN113642849B (zh) 考虑空间分布特征的地质灾害危险性综合评价方法及装置
Oswal Predicting rainfall using machine learning techniques
CN103390154A (zh) 基于进化多特征提取的人脸识别方法
CN110969304A (zh) 数字工厂生产产能预测方法、***、装置
CN112700324A (zh) 基于CatBoost与受限玻尔兹曼机结合的用户借贷违约预测方法
CN112949189A (zh) 一种基于深度学习的多因素诱发滑坡预测的建模方法
CN107016416B (zh) 基于邻域粗糙集和pca融合的数据分类预测方法
CN112001788A (zh) 一种基于rf-dbscan算法的***违约欺诈识别方法
CN112232526A (zh) 一种基于集成策略的地质灾害易发性评价方法及***
CN114219096A (zh) 一种机器学习算法模型的训练方法、装置及存储介质
CN113537807A (zh) 一种企业智慧风控方法及设备
CN112149884A (zh) 一种面向大规模学员的学业预警监测方法
CN113837266B (zh) 一种基于特征提取和Stacking集成学习的软件缺陷预测方法
CN114519508A (zh) 基于时序深度学习和法律文书信息的信用风险评估方法
Es–SABERY et al. An improved ID3 classification algorithm based on correlation function and weighted attribute
CN117540303A (zh) 基于交叉半监督机器学习算法的滑坡易发性评估方法及***
Nazarov et al. Optimization of prediction results based on ensemble methods of machine learning
Wongkhamdi et al. A comparison of classical discriminant analysis and artificial neural networks in predicting student graduation outcomes
CN115660221B (zh) 基于混合神经网络的油气藏经济可采储量评估方法及***
CN116933947A (zh) 一种基于软投票集成分类器的滑坡易发性预测方法
CN110533341A (zh) 一种基于bp神经网络的城市宜居性评价方法
CN114549689B (zh) 一种基于图卷积神经网络的河流模式识别方法与装置
CN115906669A (zh) 一种顾及负样本选取策略的密集残差网络滑坡易发性评价方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant