CN108038081A - 基于特征函数空间滤值的滑坡灾害logistic回归分析方法 - Google Patents

基于特征函数空间滤值的滑坡灾害logistic回归分析方法 Download PDF

Info

Publication number
CN108038081A
CN108038081A CN201711425595.5A CN201711425595A CN108038081A CN 108038081 A CN108038081 A CN 108038081A CN 201711425595 A CN201711425595 A CN 201711425595A CN 108038081 A CN108038081 A CN 108038081A
Authority
CN
China
Prior art keywords
landslide
feature vector
value
sample
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711425595.5A
Other languages
English (en)
Other versions
CN108038081B (zh
Inventor
陈玉敏
李慧芳
周江
杨家鑫
张静祎
陈娒杰
方涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201711425595.5A priority Critical patent/CN108038081B/zh
Publication of CN108038081A publication Critical patent/CN108038081A/zh
Application granted granted Critical
Publication of CN108038081B publication Critical patent/CN108038081B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出了一种基于空间滤值的logistic回归滑坡灾害分析方法,即针对滑坡灾害分析研究,将空间滤值思想引入到普通logistic回归模型中,设计一种包括未滑坡点选取、致灾因子值的获取和分级、邻接矩阵构建、特征值与特征向量计算、逐步回归特征向量选取、回归建模等步骤的滑坡回归分析算法。本发明能够解决logistic回归模型受变量间的空间自相关影响而导致的模型精度不高的问题。利用选取的特征向量来构建滤值算子加入到logistic回归模型中,能够有效滤去残差的自相关影响,提高回归模型的拟合优度和预测准确度,实现对滑坡灾害的准确模拟和预测。

Description

基于特征函数空间滤值的滑坡灾害logistic回归分析方法
技术领域
本发明属于地学统计和空间分析领域,特别涉及一种基于特征函数空间滤值的滑坡灾害logistic回归分析方法。
背景技术
滑坡灾害是最为常见的地质灾害之一,滑坡灾害分析主要包括定性分析和定量分析两大类(Yalcin et al.,2011,参见背景文献1),定性分析主要是通过相关行业的研究人员基于自己的专业知识和对研究区域进行深入了解和调研后对滑坡灾害进行分析和评估,多用于小范围或某次特定事故,主要用到的方法有专家经验法、加权线性和法以及层次分析。滑坡分析的定量方法则多建立在完善的理论基础上,从宏观的角度对滑坡灾害进行分析研究,主要包括定值设计法、人工智能法和多元统计法。
Logistic回归模型是使用较为广泛的定量化分析滑坡灾害的方法之一,其作为一种广义线性统计法,以事件发生与否的概率为因变量,影响事件的因素为自变量建立回归模型,适用于二分类及多分类变量。滑坡灾害研究的过程中,由于滑坡灾害的因变量是发生滑坡和未发生滑坡即二分类数据,一般的线性回归模型无法对该类变量进行分析。而logistic回归模型的优势在于可以将二分类的变量转化为可以和几个自变量进行回归建模的logit变量(Bewick et al.,2005,参见背景文献2),从而应用于滑坡灾害分析的研究。诸多学者(Bai et al.,2010,参见背景文献3;Das et al.,2010,参见背景文献4;Mousaviet al.,2011,参见背景文献5;Budimir et al.,2014,参见背景文献6)基于GIS建立logistic回归模型,对不同地区进行滑坡灾害敏感性研究,并对模型进行评价,验证了logistic回归模型在滑坡分析中的适用性。此外logistic回归模型与神经网络、频率比,决策树,证据权重以及信息量等模型间的对比研究(Yesilnacar et al.,2005,参见背景文献7;Wang et al.,2016,参见背景文献8)、Chen et al.,2016,参见背景文献9),也说明了相对于其他研究方法logistic回归模型在适用度、模型精度、评估效果等多方面均有不错的表现。
但是地理学第一定律指出:地理事物或属性在空间分布上互为相关,存在集聚(clustering)、随机(random)、规则(Regularity)分布,且距离越近相关性越强(Miller etal.,2004,参见背景文献10)。在传统Logistic回归模型中,变量之间存在的空间相关性,会通过误差传播在Logistic回归模型的残差中体现,通常用残差的Moran’s I值作为衡量的指标( et al.,1996,参见背景文献11),而这往往会导致模型的误判,影响模型的精确性。为了解决这个问题,需要消除空间自相关的影响。
消除空间自相关影响的方法主要有地理加权回归和空间滤值(spatialfiltering)方法,空间滤值方法最早是由Getis(Getis,1995,参见背景文献12)和Griffith(Griffith,2000,参见背景文献13)提出,该方法的核心思想是,把模型中的变量分解成空间影响和非空间影响两部分,将变量的空间影响部分提取出来并将其滤去就可以利用常用的回归方法进行分析。Getis提出的空间滤值方法利用局部Gi统计将自变量通过公式进行变化,实现残差中空间影响部分的滤去,这种方法确实能滤去空间自相关影响,但是对变量的要求是必须满足为正值变量,因此不适用于比率变量或百分变量。
Griffith提出的特征函数空间滤值方法通过选取特征向量加入到自变量中构建滤值算子来代替模型残差中的自相关部分,使得剩余的残差部分只受随机误差影响,从而消除空间自相关的影响(Getis and Griffith,2002,参见背景文献14)。滤值算子相当于残差的自相关部分,故其必然需要包含地理单元间的空间关系。空间权重矩阵通过构建空间地理单元间的二进制关系,能有效地表达地理单元的空间相关性,因此可以基于空间权重矩阵来构建滤值算子。利用挑选的特征向量来构建滤值算子加入到线性回归模型中,能有效的减少受残差的空间自相关影响而导致的模型误设。Patuelli(Patuelli et al.,2011,参见背景文献15)利用空间滤值方法研究德国失业现象,发现空间滤值的加入使得回归模型对于失业现象的预测准确率提高,从实证研究的角度验证了空间滤值方法的有效性。Murakami和Griffith(Murakami et al.,2015,参见背景文献16)针对随机效应特征函数空间滤值方法在考虑空间混淆后不能有效的处理空间自相关这一问题进行了分析,文章详细的阐述了随机效应ESF的两点主要不足,并提出将残差的最大似然估计加入到扩展模型中以解决问题,进一步扩大了空间滤值方法的应用范围。Chun(Chun et al.,2016,参见背景文献17)指出虽然空间滤值方法能够有效解决空间自相关问题并且适用于不同的研究领域,但也存在算法本身较为复杂,计算效率有待提高的弊病,因而提出了一种更快更有效的生成特征向量子集的方法,使得空间滤值方法的效率大大提高。由此可见,空间滤值方法日趋成熟。
背景文献:
[1]Yalcin A,Reis S,Aydinoglu AC,et al.AGIS-based comparative study offrequency ratio,analytical hierarchy process,bivariate statistics andlogistics regression methods for landslide susceptibility mapping in Trabzon,NE Turkey[J].Catena,2011,85(3):274-287.
[2]Bewick V,Cheek L,Ball J.Statistics review 14:Logistic regression[J].Critical Care,2005,9(1):112.
[3]Bai S B,Jian W,Zhou P G,et al.GIS-based logistic regression forlandslide susceptibility mapping of the Zhongxian segment in the Three Gorgesarea,China.[J].Geomorphology,2010,115(1–2):23-31.
[4]Das I,Sahoo S,Westen C V,et al.Landslide susceptibility assessmentusing logistic regression and its comparison with a rock mass classificationsystem,along a road section in the northern Himalayas(India).[J].Geomorphology,2010,114(4):627-637.
[5]Seyedeh Zohreh Mousavi,Ataollah Kavian,Karim Soleimani,et al.GIS-based spatial prediction of landslide susceptibility using logisticregression model[J].Geomatics Natural Hazards&Risk,2011,2(1):33-50.
[6]Budimir M E A,Atkinson P M,Lewis H G.Asystematic review oflandslide probability mapping using logistic regression[J].Landslides,2015,12(3):419-436.
[7]E.Yesilnacar,T.Topal.Landslide susceptibility mapping:Acomparisonof logistic regression and neural networks methods in a medium scale study,Hendek region(Turkey)[J].Engineering Geology,2005,79(3–4):251-266.
[8]Wang L J,Guo M,Sawada K,et al.Acomparative study of landslidesusceptibility maps using logistic regression,frequency ratio,decision tree,weights of evidence and artificial neural network[J].Geosciences Journal,2016,20(1):117-136.
[9]Chen T,Niu R,Jia X.A comparison of information value and logisticregression models in landslide susceptibility mapping by using GIS[J].Environmental Earth Sciences,2016,75(10):1-16.
[10]Miller H J.Tobler's First Law and Spatial Analysis[J].Annals ofthe Association of American Geographers,2004,94(2):284–289.
[11] T.The spatial autocorrelation coefficient moran's i underheteroscedasticity.Statistics in Medicine,1996,15(7-9):887.
[12]Getis A.Spatial Filtering in a Regression Framework:ExamplesUsing Data on Urban Crime,Regional Inequality,and Government Expenditures[M]//New Directions in Spatial Econometrics.1995:172-185.
[13]Griffith D A.A linear regression solution to the spatialautocorrelation problem[J].Journal of Geographical Systems,2000,2(2):141-156
[14]Getis A,Griffith D A.Comparative Spatial Filtering in RegressionAnalysis[J].Geographical Analysis,2002,34(2):130–140.
[15]Patuelli R,Griffith D A,Tiefelsdorf M,et al.Spatial FilteringMethods For Tracing Space-Time Developments In An Open Regional System:Experiments with German Unemployment Data[M]//Societies in Motion:Innovation,Migration and Regional Transformation.2012.
[16]Murakami D,Griffith D A.Random effects specifications ineigenvector spatial filtering:a simulation study[J].Journal of GeographicalSystems,2015,17(4):1-21.
[17]Chun Y,Griffith D A,Lee M,et al.Eigenvector selection withstepwise regression techniques to construct eigenvector spatial filters[J].Journal of Geographical Systems,2016,18(1):67-85.
发明内容
为了解决Logistic回归模型应用于滑坡灾害分析时受变量间空间自相关性影响而导致模型精度不高问题,本发明提供一种基于特征函数空间滤值的滑坡灾害Logistic回归分析方法。
本发明所采用的技术方案是一种基于特征函数空间滤值的滑坡灾害logistic回归分析方法,包括以下步骤:
步骤1,对滑坡样本数据进行选择与处理,所述滑坡样本数据包括滑坡点样本和未滑坡点样本,包括获取滑坡点样本及其相应的空间位置属性和滑坡面积属性,选取与滑坡点样本相同数量的未滑坡点样本;
步骤2,对步骤1得到的滑坡样本数据进行相应的致灾因子值的获取和分级;
步骤3,对步骤1得到的滑坡样本点通过构建泰森多边形,进行样本点间空间邻接关系的判断,得到相应的空间邻接矩阵W,并对空间邻接矩阵W进行中心化操作得到矩阵C;
步骤4,对步骤3得到的矩阵C进行特征值与特征向量计算;
步骤5,针对Logistic回归,根据步骤4的得到的特征向量和特征值进行逐步回归特征向量选取,实现步骤如下,
步骤5.1,特征向量的初步筛选,包括通过对应的特征值计算每个特征向量的Moran’s I值,选取Moran’s I值大于相应预设阈值的特征向量,作为候选特征向量集En进行后续特征向量选取;
步骤5.2,针对Logistic回归模型,将步骤5.1得到的候选特征向量集En中n个候选特征向量分别加入到不含滤值算子的回归模型中,得到n个新的回归模型,计算新旧模型的似然比检验统计量LRT,选取LRT统计量最大的特征向量加入到回归模型中,并在En中剔除已选取的特征向量;
步骤5.3,对选取的特征向量进行显著性检验,若结果显著,则剔除该特征向量,并返回执行步骤5.2,若结果不显著,则执行步骤5.4;
步骤5.4,对加入特征向量的新模型的残差空间自相关进行显著性检验,若结果显著,则返回执行步骤5.2和步骤5.3,若结果不显著,则特征向量的选取结束;
步骤6,将步骤5中所选择的特征向量作为自变量加入到Logistic回归模型中,构建基于特征函数空间滤值的滑坡灾害Logistic回归模型。
而且,步骤1中,以滑坡灾害点为圆心,以滑坡影响范围为半径做缓冲区,得到滑坡影响区域,,整个滑坡研究区域减去滑坡影响区域就是未滑坡点的选取区域,在选取区域内随机选取与滑坡点样本相同数量的未滑坡点样本。
而且,选取残差Moran’s I、Prob>chi2、Pseudo R2及ROC曲线的AUC值四个指标作为评价参数对基于特征函数空间滤值的滑坡灾害Logistic回归模型进行评价。
本发明针对滑坡灾害分析研究,将空间滤值思想引入到普通logistic回归模型中,设计了一种基于特征函数空间滤值的logistic回归滑坡灾害分析方法。本发明能够解决logistic回归模型由于残差自相关性导致的模型精度不高的问题,将残差的自相关影响滤去,可有效提高回归模型的拟合优度和预测准确度,实现对滑坡灾害的准确模拟和预测。
附图说明
图1为本发明实施例的流程图。
图2为本发明实施例步骤1的子流程图。
图3为本发明实施例步骤2的子流程图。
图4为本发明实施例步骤5的子流程图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
本发明要解决的核心问题是:应用Logistic回归模型进行滑坡灾害分析时,利用特征函数空间滤值方法消除变量间的空间自相关对模型精度、拟合优度的影响。
参见附图1,进行以下步骤:
步骤1:对滑坡样本数据(滑坡点样本和未滑坡点样本的总和)进行选择与处理,包括依照实际情况获取滑坡点样本及其相应的空间位置属性和滑坡面积属性,选取与滑坡点样本相同数量的未滑坡点样本;
参见附图2,具体实施时,选取与滑坡点样本数目相同的未滑坡点样本。未滑坡点样本的选择应该符合两点原则:一是未滑坡点样本的在空间位置上选择应该距离已经发生滑坡的区域有一定距离,二是未滑坡点样本应该尽量均匀分布,避免集群效应导致的模型误差。具体的选取原则:首先利用已有的滑坡点样本及其对应滑坡面积进行相应的滑坡影响区域的计算,具体的计算方式是以滑坡灾害点为圆心,相应滑坡影响距离为半径做缓冲区,其中滑坡影响距离由滑坡面积计算确定,计算公式为:
其中R为滑坡影响距离,A为滑坡面积,ρ为比例常数,可根据具体情况自行确定。而整个滑坡研究区域减去滑坡影响区域就是未滑坡点样本的选取区域;在选取区域内随机生成等数目的未滑坡点样本。得到的未滑坡点样本与已知滑坡点样本共同构成滑坡样本数据。
步骤2:对步骤1得到的滑坡样本数据(点数据)进行相应的致灾因子值的获取和分级;
参见附图3,具体实施时,针对研究区域,选取对滑坡灾害有较强诱发作用的因素作为滑坡的致灾因子。致灾因子值获取的数据源主要包括栅格数据和矢量数据,矢量数据又可能包括线数据和面数据,因此滑坡样本数据对应致灾因子值的获取主要涉及到基于点要素提取栅格值、计算点要素到线要素距离、判断点与面的位置关系。例如,可基于数字高程模型(DEM)获取滑坡样本数据对应的高程值。
基于点要素的栅格值提取,是通过将点的地理坐标反算得到致灾因子栅格影像的行列坐标,通过读取相应的栅格值就能获取该滑坡样本的因子值。进行地理参考坐标系与栅格位置关系转换的方法主要有GCP(多控制点定位方式)和仿射转换。
计算点要素到线要素之间的距离可以转化为计算点到线段的距离,即依次计算点要素到组成线要素的线段的距离,并选取其中最小的即为点要素到线要素距离。点到线段的距离具体算法有三种,经典几何解析算法、面积算法以及向量算法。
判断点与面的相对位置是用来确定滑坡点所属的多边形并读取多边形的属性值就可以得到相应的致灾因子值。判断点是否在多边形内的算法主要有面积和判别法、夹角和判别法以及引射线法。
滑坡样本数据对应致灾因子值的分级按数据的类型来进行,量化数据的分级标准主要是依照自然间隔法,保证不同分级间的最大差异,非量化数据的分级主要是参照以往的定性研究,根据对滑坡灾害的影响大小进行分级。
步骤3:对步骤1得到的滑坡样本数据通过构建泰森多边形进行样本点间空间邻接关系的判断,得到相应的空间邻接矩阵W,并对空间邻接矩阵W进行中心化操作得到矩阵C;
具体实施时,基于样本点构建相应的泰森多边形,每个泰森多边形对应一个离散滑坡样本点,如此将点的空间邻接性判断转化为面的空间邻接性判断,如果两个空间单元相邻,那么它们之间的权重为1,否则为0,最终可以得到n*n的矩阵,即空间邻接矩阵W。建立的邻接矩阵W关于对角线对称,这将导致在之后的特征向量的计算中,特征向量结果之间相互正交,有可能引起多重共线性问题而使模型误设,因此需要对矩阵W进行中心化的操作,计算公式如下:
其中,C为中心化后的矩阵,I为单位矩阵,11T为所有元素为1的矩阵,n为邻接矩阵的行列号,行号和列号是相等的。
步骤4:对步骤3得到的矩阵C进行特征值与特征向量计算;
具体实施时,对中心化后的矩阵C,结合数值分析的计算方法和计算机程序算法来计算C的特征值与特征向量。具体实施可使用现有技术,目前常见的求解特征值与特征向量的算法有幂法、反幂法、Jacobi迭代法、QR算法。而能进行特征值与特征向量计算的软件与开源库也较多,其中较为常见的有MATLAB、Eigen库以及C#自带的math库。
步骤5:针对Logistic回归,根据步骤4的得到的特征向量和特征值进行逐步回归特征向量选取,具体的选取步骤如下:
参照附图4,具体实施如下:
步骤5.1:特征向量的初步筛选,包括通过其对应的特征值计算每个特征向量的Moran’s I值和选取Moran’s I值大于相应预设阈值(优选设为0.25)的特征向量作为候选特征向量集En进行后续特征向量选取;Moran’s I值表示莫兰指数;
具体实施时,可知特征向量应拥有与残差一致的自相关性,利用Moran’s I值来衡量特征向量的自相关性,特征向量的Moran’s I值越大,则越能代表残差的自相关。通常可以选取Moran’s I>0.25的特征向量作为候选的子集,提高后续选取效率。特征向量的Moran’s I值可通过对应的特征值计算得到,其计算公式如下:
其中,λi为对应的特征值,n是矩阵的行列号,W是原始的邻接矩阵;L是n*1的一个全部元素是1的向量。
步骤5.2:针对Logistic回归模型,设候选特征向量集En中包含n个候选特征向量,将步骤5.1得到的候选特征向量集En中n个候选特征向量Ei(i∈(1,2,…,n)),分别加入到回归模型Y=aX+b中,将自变量X替换为X=X+Ei,这里的原始自变量X指步骤2中得到的滑坡样本数据对应致灾因子值的分级数据,从而得到n个新的回归模型,计算新旧模型的似然比检验统计量LRT,选取LRT统计量最大的特征向量加入到回归模型中,并在En中剔除已选取的特征向量;
具体实施时,假设加入的特征向量对回归模型没有意义,利用似然函数作为判断指标进行假设性检验,然后构造似然比检验变量LRT:
其中,为初始的回归模型的似然函数最大值,为加入特征向量后的新回归模型的似然函数最大值。LRT值越大,说明加入的特征向量使得似然函数最大值发生的变化越大,越有理由拒绝原假设,所以选取LRT统计值最大的特征向量。
步骤5.3:对选取的特征向量进行显著性检验,若结果显著,则剔除该特征向量,并回转执行步骤5.2,重新在剩下的特征向量集中选取,若结果不显著,则执行下述步骤5.4;
具体实施时,对选取的特征向量进行显著性检验,检验特征向量参数是否具有意义。由于logistic回归模型是非线性回归模型,实施例选取显著性检验中的Wald卡方检验判断已经挑选的特征向量的回归参数的显著性,从而判断是否需要剔除该特征向量。该检验的原假设为回归模型中挑选的特征向量的参数应该为0,计算该假设条件下卡方统计量在总体概率分布的p值,若p值小于显著性水平,一般为0.05,则拒绝原假设,即不需要剔除该特征向量。相反则需剔除该特征向量,重新挑选。
步骤5.4:对加入特征向量的新模型的残差空间自相关进行显著性检验,若结果显著,说明回归模型中加入选取的该特征向量后,残差仍存在显著空间自相关性,还需要继续选取合适的特征向量加入,而此特征向量已被选取,则回转执行步骤5.2和步骤5.3,若结果不显著,则特征向量的选取结束;
通常情况下,加入数个特征向量到模型中后,一般可以达到目的,若遍历所有的特征向量都不能消除残差空间自相关,说明此方法不适用于该种情况。
具体实施时,Logistic回归残差的计算方法应用最广的是皮尔逊残差,实施例优选通过判断经过以上步骤后得到的新模型的皮尔逊残差的空间自相关的显著性来判断结束或者继续挑选特征向量。首先计算模型的皮尔逊残差e和残差的Moran’s I值,分别记作Preal和Ireal,由于皮尔逊残差及其Moran’s I值只有一个,需要对皮尔逊残差向量中的数值进行随机排列N次(预设数值为999次,一个e向量中的各个行进行随机排列,得到999个一维的e向量),将随机排列后得到的残差向量作为因变量计算新的皮尔逊残差Prnd,统计N个新的皮尔逊残差的Moran’s I值Irnd大于Ireal的次数比率即为p值,p值的计算方法为:
p大于0.05则结束空间滤值算法。
步骤6:将步骤5中所选择的特征向量作为自变量加入到Logistic回归模型中,构建基于特征函数空间滤值的滑坡灾害Logistic回归模型。即基于步骤5所选取的特征向量和原始自变量来构建回归模型。
具体实施时,加入选取的所有特征向量后的logistic回归模型可以表示为:
logit(x)=w0+w1x1+…+wnxn+Eα
其中,x1,…n为滑坡样本数据对应致灾因子值分级数据,E为选取的特征向量。利用最大似然估计法可以进行logistic回归模型的参数求解,构建基于特征函数空间滤值的Logistic回归模型,用于滑坡灾害的研究分析。
步骤7:模型评价,选择残差Moran’s I、Prob>chi2、Pseudo R2及ROC曲线的AUC值四个指标作为评价参数对步骤6构建的基于特征函数空间滤值的Logistic回归模型进行评价。
具体实施时,分别计算普通Logistic模型和基于特征函数空间滤值的Logistic回归模型的残差Moran’s I、Prob>chi2、Pseudo R2及AUC值。其中残差Moran’s I用于评价空间滤值对残差自相关处理的效果,一般残差Moran’s I低于阈值0.05,即可判断残差不存在空间自相关;Prob>chi2是卡方统计量零假设为真的概率,也就是自变量对因变量没有影响的概率,用于评价回归模型参数是否有意义,通常情况下用0.05或0.01作为参数的显著性水平,当Prob>chi2小于0.05或0.01时自变量对因变量存在有着显著的影响,认为参数有意义;Pseudo R2又称伪R2,是logistic回归模型参照线性回归模型的R-squared提出的检验量,Pseudo R2用于评价模型的拟合度,数值越大,则说明回归模型的拟合效果越好;ROC曲线又称为受试者工作特征曲线,是结合特异性、灵敏度和误判率的综合性指标,其曲线下面积即为AUC值,AUC值用于评价回归模型的预测准确率,AUC值越大,模型的预测准确率越高。
经过评价合格的模型可用于整个研究区域,通过回归,可以预测整个区域的滑坡易发性。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
以上所述仅为本发明中的一个实施例,并不用于限制本发明。凡在本发明的精神与原则之内,所做的任何修改,改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种基于特征函数空间滤值的滑坡灾害logistic回归分析方法,其特征在于,包括以下步骤:
步骤1,对滑坡样本数据进行选择与处理,所述滑坡样本数据包括滑坡点样本和未滑坡点样本,包括获取滑坡点样本及其相应的空间位置属性和滑坡面积属性,选取与滑坡点样本相同数量的未滑坡点样本;
步骤2,对步骤1得到的滑坡样本数据进行相应的致灾因子值的获取和分级;
步骤3,对步骤1得到的滑坡样本点通过构建泰森多边形,进行样本点间空间邻接关系的判断,得到相应的空间邻接矩阵W,并对空间邻接矩阵W进行中心化操作得到矩阵C;
步骤4,对步骤3得到的矩阵C进行特征值与特征向量计算;
步骤5,针对Logistic回归,根据步骤4的得到的特征向量和特征值进行逐步回归特征向量选取,实现步骤如下,
步骤5.1,特征向量的初步筛选,包括通过对应的特征值计算每个特征向量的Moran’sI值,选取Moran’s I值大于相应预设阈值的特征向量,作为候选特征向量集En进行后续特征向量选取;
步骤5.2,针对Logistic回归模型,将步骤5.1得到的候选特征向量集En中n个候选特征向量分别加入到不含滤值算子的回归模型中,得到n个新的回归模型,计算新旧模型的似然比检验统计量LRT,选取LRT统计量最大的特征向量加入到回归模型中,并在En中剔除已选取的特征向量;
步骤5.3,对选取的特征向量进行显著性检验,若结果显著,则剔除该特征向量,并返回执行步骤5.2,若结果不显著,则执行步骤5.4;
步骤5.4,对加入特征向量的新模型的残差空间自相关进行显著性检验,若结果显著,则返回执行步骤5.2和步骤5.3,若结果不显著,则特征向量的选取结束;
步骤6,将步骤5中所选择的特征向量作为自变量加入到Logistic回归模型中,构建基于特征函数空间滤值的滑坡灾害Logistic回归模型。
2.根据权利要求1所述的基于特征向量空间虑值的logistic回归滑坡灾害分析方法,其特征在于:步骤1中,以滑坡灾害点为圆心,以滑坡影响范围为半径做缓冲区,得到滑坡影响区域,,整个滑坡研究区域减去滑坡影响区域就是未滑坡点的选取区域,在选取区域内随机选取与滑坡点样本相同数量的未滑坡点样本。
3.根据权利要求1或2所述的基于特征向量空间虑值的logistic回归滑坡灾害分析方法,其特征在于:选取残差Moran’s I、Prob>chi2、Pseudo R2及ROC曲线的AUC值四个指标作为评价参数对基于特征函数空间滤值的滑坡灾害Logistic回归模型进行评价。
CN201711425595.5A 2017-12-25 2017-12-25 基于特征函数空间滤值的滑坡灾害logistic回归分析方法 Active CN108038081B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711425595.5A CN108038081B (zh) 2017-12-25 2017-12-25 基于特征函数空间滤值的滑坡灾害logistic回归分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711425595.5A CN108038081B (zh) 2017-12-25 2017-12-25 基于特征函数空间滤值的滑坡灾害logistic回归分析方法

Publications (2)

Publication Number Publication Date
CN108038081A true CN108038081A (zh) 2018-05-15
CN108038081B CN108038081B (zh) 2020-02-11

Family

ID=62101191

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711425595.5A Active CN108038081B (zh) 2017-12-25 2017-12-25 基于特征函数空间滤值的滑坡灾害logistic回归分析方法

Country Status (1)

Country Link
CN (1) CN108038081B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109784552A (zh) * 2018-12-29 2019-05-21 武汉大学 一种基于Re-ESF算法的空间变系数PM2.5浓度估算模型的构建方法
CN110188324A (zh) * 2019-05-17 2019-08-30 武汉大学 一种基于特征向量空间滤值的交通事故poisson回归分析方法
CN110569554A (zh) * 2019-08-13 2019-12-13 成都垣景科技有限公司 一种基于空间逻辑回归与地理探测器的滑坡易发性评价方法
CN112070366A (zh) * 2020-08-19 2020-12-11 核工业湖州工程勘察院有限公司 一种多源监测数据关联分析的区域滑坡风险定量测算方法
CN112181642A (zh) * 2020-09-16 2021-01-05 武汉大学 一种空间计算操作的人工智能优化方法
CN113468477A (zh) * 2020-12-23 2021-10-01 南方科技大学 一种敏感数据调查分析方法、存储介质及设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103364830A (zh) * 2013-07-24 2013-10-23 北京师范大学 一种基于多因子的地震后发生崩滑灾害位置的预测方法
CN106600578A (zh) * 2016-11-22 2017-04-26 武汉大学 基于遥感影像的特征函数空间滤值回归模型并行化方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103364830A (zh) * 2013-07-24 2013-10-23 北京师范大学 一种基于多因子的地震后发生崩滑灾害位置的预测方法
CN106600578A (zh) * 2016-11-22 2017-04-26 武汉大学 基于遥感影像的特征函数空间滤值回归模型并行化方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JONATHAN B.THAYN 等: "Accounting for Spatial Autocorrelation in Linear Regression Models Using Spatial Filtering with Eigenvectors", 《ANNALS OF THE ASSOCIATION OF AMERICAN GEOGRAPHERS》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109784552A (zh) * 2018-12-29 2019-05-21 武汉大学 一种基于Re-ESF算法的空间变系数PM2.5浓度估算模型的构建方法
CN109784552B (zh) * 2018-12-29 2022-12-13 武汉大学 一种基于Re-ESF算法的空间变系数PM2.5浓度估算模型的构建方法
CN110188324A (zh) * 2019-05-17 2019-08-30 武汉大学 一种基于特征向量空间滤值的交通事故poisson回归分析方法
CN110188324B (zh) * 2019-05-17 2023-05-30 武汉大学 一种基于特征向量空间滤值的交通事故poisson回归分析方法
CN110569554A (zh) * 2019-08-13 2019-12-13 成都垣景科技有限公司 一种基于空间逻辑回归与地理探测器的滑坡易发性评价方法
CN110569554B (zh) * 2019-08-13 2020-11-10 成都垣景科技有限公司 一种基于空间逻辑回归与地理探测器的滑坡易发性评价方法
CN112070366A (zh) * 2020-08-19 2020-12-11 核工业湖州工程勘察院有限公司 一种多源监测数据关联分析的区域滑坡风险定量测算方法
CN112070366B (zh) * 2020-08-19 2022-03-29 核工业湖州勘测规划设计研究院股份有限公司 一种多源监测数据关联分析的区域滑坡风险定量测算方法
CN112181642A (zh) * 2020-09-16 2021-01-05 武汉大学 一种空间计算操作的人工智能优化方法
CN112181642B (zh) * 2020-09-16 2024-02-02 武汉大学 一种空间计算操作的人工智能优化方法
CN113468477A (zh) * 2020-12-23 2021-10-01 南方科技大学 一种敏感数据调查分析方法、存储介质及设备
CN113468477B (zh) * 2020-12-23 2023-11-24 南方科技大学 一种敏感数据调查分析方法、存储介质及设备

Also Published As

Publication number Publication date
CN108038081B (zh) 2020-02-11

Similar Documents

Publication Publication Date Title
CN108038081A (zh) 基于特征函数空间滤值的滑坡灾害logistic回归分析方法
Ulmas et al. Segmentation of satellite imagery using u-net models for land cover classification
Feng et al. Dynamic land use change simulation using cellular automata with spatially nonstationary transition rules
Yao et al. Simulating urban land-use changes at a large scale by integrating dynamic land parcel subdivision and vector-based cellular automata
Keshtkar et al. A spatiotemporal analysis of landscape change using an integrated Markov chain and cellular automata models
Feng et al. Modeling urban growth with GIS based cellular automata and least squares SVM rules: a case study in Qingpu–Songjiang area of Shanghai, China
Jochem et al. Identifying residential neighbourhood types from settlement points in a machine learning approach
Openshaw Learning to live with errors in spatial databases
Pijanowski et al. Urban expansion simulation using geospatial information system and artificial neural networks
Wan Entropy-based particle swarm optimization with clustering analysis on landslide susceptibility mapping
Pascale et al. Landslide susceptibility mapping using artificial neural network in the urban area of Senise and San Costantino Albanese (Basilicata, Southern Italy)
Fathizad et al. Evaluating desertification using remote sensing technique and object-oriented classification algorithm in the Iranian central desert
Chu et al. Comparison of landslide susceptibility maps using random forest and multivariate adaptive regression spline models in combination with catchment map units
CN109117883A (zh) 基于长短时记忆网络的sar影像海冰分类方法及***
CN106970986B (zh) 基于深度学习的城市内涝影响程度挖掘方法及***
CN112506990A (zh) 一种基于时空信息的水文数据异常检测方法
CN106295498A (zh) 光学遥感图像目标区域检测装置与方法
CN109446894A (zh) 基于概率分割及高斯混合聚类的多光谱图像变化检测方法
Wan et al. Construction of knowledge-based spatial decision support system for landslide mapping using fuzzy clustering and KPSO analysis
Chen et al. The application of remote sensing technology to the interpretation of land use for rainfall-induced landslides based on genetic algorithms and artificial neural networks
Saha et al. Integrating the artificial intelligence and hybrid machine learning algorithms for improving the accuracy of spatial prediction of landslide hazards in Kurseong Himalayan Region
Zhao et al. Mapping landslide sensitivity based on machine learning: A case study in Ankang City, Shaanxi Province, China
Ilmy et al. Application of machine learning on *** earth engine to produce landslide susceptibility mapping (case study: Pacitan)
Wang et al. Incorporation of intra-city human mobility into urban growth simulation: A case study in Beijing
CN117540303A (zh) 基于交叉半监督机器学习算法的滑坡易发性评估方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant