CN109784552B - 一种基于Re-ESF算法的空间变系数PM2.5浓度估算模型的构建方法 - Google Patents
一种基于Re-ESF算法的空间变系数PM2.5浓度估算模型的构建方法 Download PDFInfo
- Publication number
- CN109784552B CN109784552B CN201811644669.9A CN201811644669A CN109784552B CN 109784552 B CN109784552 B CN 109784552B CN 201811644669 A CN201811644669 A CN 201811644669A CN 109784552 B CN109784552 B CN 109784552B
- Authority
- CN
- China
- Prior art keywords
- model
- concentration
- constructing
- spatial
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 20
- 238000010276 construction Methods 0.000 title description 2
- 238000000034 method Methods 0.000 claims abstract description 84
- 239000011159 matrix material Substances 0.000 claims abstract description 52
- 238000012544 monitoring process Methods 0.000 claims abstract description 36
- 239000013598 vector Substances 0.000 claims abstract description 17
- 238000002790 cross-validation Methods 0.000 claims abstract description 15
- 230000000694 effects Effects 0.000 claims abstract description 15
- 238000011156 evaluation Methods 0.000 claims abstract description 14
- 238000012360 testing method Methods 0.000 claims description 13
- 238000011160 research Methods 0.000 claims description 11
- 238000001914 filtration Methods 0.000 claims description 10
- 239000000443 aerosol Substances 0.000 claims description 7
- 238000007476 Maximum Likelihood Methods 0.000 claims description 6
- 230000003287 optical effect Effects 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 6
- 230000014509 gene expression Effects 0.000 claims description 5
- 230000004927 fusion Effects 0.000 claims description 4
- 241000630665 Hada Species 0.000 claims description 3
- 235000007164 Oryza sativa Nutrition 0.000 claims description 3
- 235000009566 rice Nutrition 0.000 claims description 3
- 238000010187 selection method Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 2
- 239000000203 mixture Substances 0.000 claims description 2
- 238000007781 pre-processing Methods 0.000 claims description 2
- 238000010200 validation analysis Methods 0.000 claims description 2
- 240000007594 Oryza sativa Species 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 2
- 238000004364 calculation method Methods 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 241000209094 Oryza Species 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000013618 particulate matter Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 239000002028 Biomass Substances 0.000 description 1
- 201000006306 Cor pulmonale Diseases 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 239000005427 atmospheric aerosol Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000000748 cardiovascular system Anatomy 0.000 description 1
- 238000002485 combustion reaction Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000013502 data validation Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000002310 reflectometry Methods 0.000 description 1
- 210000002345 respiratory system Anatomy 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于Re‑ESF算法的空间变系数PM2.5浓度估算模型的构建方法,包括以下步骤:步骤1、多源AOD产品融合;步骤2、相关影响因子与PM2.5浓度的数据处理;步骤3、获取监测站点各处自变量值与PM2.5浓度值;步骤4、构建邻接矩阵;步骤5、空间邻接矩阵中心化并计算特征值和特征向量;步骤6、求解基于Re‑ESF的SVC模型的回归系数;步骤7、判断模型中变量是否显著;步骤8、模型精度评价;步骤9、10折交叉验证;步骤10、判断邻域个数k与监测站点数n的关系;步骤11、根据精度评价选择最优模型。本发明在有效消除空间异质性和空间自相关性对PM2.5浓度建模的影响的基础上,引入随机效应和空间变系数方法,进一步提高浓度估算模型的精度和缩短模型解算时间。
Description
技术领域
本发明涉及空间统计分析服务应用技术领域,尤其涉及一种基于Re-ESF(随机效应特征向量空间滤值)算法的空间变系数PM2.5浓度估算模型的构建方法。
背景技术
PM2.5作为影响我国大多数城市的大气首要污染物,引起了人们大量的关注。PM2.5指大气颗粒中空气动力学直径≤2.5μg/m3的细颗粒物。大量研究表明,高浓度PM2.5对人类健康有不利影响,如心肺疾病的产生、呼吸***、心血管***、神经***、免疫***的影响等。
随着全国范围内的检测站的建立,使得对区域性PM2.5浓度研究成了可能。根据监测站数据,众多学者对其进行大量研究。王振波等采用反距离插值(IDW)和普通克里金的方法,根据全国监测站点进行插值得到全国的PM2.5浓度空间分布。杨勇、梅杨等采用普通时空克里金的方法,考虑PM2.5在时间和空间上的依赖性,得到区域性的PM2.5浓度分布。但在由于受限于监测站点的分布不均匀和部分地区的监测站点稀少问题,对插值所得到的结果精度具有一定影响。
由于遥感技术能够得到大范围和高精度影像,因此部分学者开始探究利用遥感数据反演空气颗粒物的污染状况。Kaufman等利用AVHRR传感器的遥感数据提出了测定气溶胶光学厚度、颗粒大小的方法,Christopher等首先利用了遥感数据反演生物质燃烧产生的大气气溶胶辐射。此后越来越多的学者,利用气溶胶光学厚度(AOT或AOD)产品进行污染颗粒物,包括如PM2.5浓度反演。Wang等人基于modis的AOT数据(也称AOD数据),发现与PM2.5日平均浓度具有很强的线性关系。在线性模型的基础上,结合混合效应进行PM2.5浓度的拟合也被广泛地提出。部分学者,张淑平等的研究指出气象因素如:相对湿度、温度、风速等对PM2.5浓度有显著影响。同时,不同结构城市绿地对大气中PM2.5和PM10的调控作用。与此相关的基于土地利用回归(LUR)的方法也被用于PM2.5浓度的拟合,数据包括但不限于人口、交通、土地利用数据等。此外,基于BP神经网络、地理加权回归、适时结构自适应模型(TSAM)的拟合PM2.5浓度的方法也被相继提出。在上述方法中,如普通线性回归、土地利用回归等很少关注空间影响因素,造成拟合模型中的残差具有较高的空间自相关性。而Zhang等人采用基于遥感数据的地面PM2.5浓度特征向量空间滤值建模方法,分别考虑了自变量中的空间影响因子和非空间影响因子。但对于模型的解算过程较为繁琐,相关系数的计算需要进行迭代操作,此外对于空间随机变异部分考虑不足。
发明内容
本发明要解决的技术问题在于针对现有技术中的缺陷,提供一种基于Re-ESF算法的空间变系数PM2.5浓度估算模型的构建方法。
本发明解决其技术问题所采用的技术方案是:
本发明提供一种基于Re-ESF算法的空间变系数PM2.5浓度估算模型的构建方法,该方法包括以下步骤:
步骤1、获取气溶胶光学厚度产品AOD影像,以AOD影像为基准进行多源产品融合,获得研究区内覆盖的AOD影像;
步骤2、进行监测站点PM2.5浓度、相关因子的数据预处理,并统一变量在时间上和空间上的尺度;
步骤3、提取监测站点各处与PM2.5浓度变化相关的自变量值,并将其与PM2.5浓度值进行匹配;
步骤4、根据监测站点数据构建空间邻接矩阵,构建邻接矩阵的方法包括:反距离法构建空间邻接矩阵,或根据k邻域法构建空间邻接矩阵;
步骤5、对空间邻接矩阵进行中心化处理,使其成为对称矩阵;在此基础上计算矩阵特征值和特征向量,并对特征值进行预选择;
步骤6、将监测站点各处自变量值和PM2.5浓度值,以及特征值和特征向量作为模型输入,求解基于随机效应特征向量空间滤值算法中的模型回归系数,得到PM2.5浓度和自变量之间的关系模型;
步骤7、判断自变量在关系模型中的显著程度,如不显著则进行剔除,重新进行步骤6;如全部显著,则进行步骤8;
步骤8、模型精度评价,计算得到的关系模型的评价指标,评价指标包括:拟合优度、调整后拟合优度、均方根误差、平均绝对误差百分比、残差莫兰指数;
步骤9、10折交叉验证,将验证用的数据分为10份,采用10折交叉验证的方法,检验该关系模型对于无站点监测地区的PM2.5浓度的估算精度;
步骤10、判断邻域个数k与监测站点数n的关系,如果k<n成立,则进行k=k+1,同时进入步骤4,重新根据k邻域法构建空间邻接矩阵;如果k<n不成立,进入步骤11;k值依次取4到n,逐个构建邻接权重矩阵进行建模,计算精度;
步骤11、根据构建的多个模型及其对应精度,选择精度最优模型作为最终模型投入应用。
进一步地,本发明的步骤1的方法具体为:
利用多源AOD产品,以某一AOD产品作为模板,使用相加区域象元值构建模板AOD产品和其余AOD产品的线性模型,在研究区内模板AOD产品缺失区域,用其余AOD产品通过线性模型拟合后的均值代替。
进一步地,本发明的步骤4中构建空间邻接矩阵的方法具体为:
步骤4.1、对于监测站点坐标,确定坐标单位,包括:经纬度、米、千米;
步骤4.2、基于反距离法构建的监测站点空间邻接矩阵,其类型包括指数、高斯、球状模型;
步骤4.3、k邻域法构建监测站点空间邻接矩阵,设置某一k值,即考虑设置的邻接矩阵中某一监测站点与它最邻接的k个其他站点是可联通的,除此k个站点,其余站点不邻接;由k邻域法,找到站点i的最近邻的k个站点,由站点的邻接关系构建二元邻接矩阵W0,若站点i和j相邻,则元素W0(i,j)=1,否则等于0。
进一步地,本发明的步骤6中的方法具体为:
基于随机效应特征向量空间滤值算法的模型表达式为:
其中,表示矩阵间的哈达马积,k表示k个自变量,αk是控制空间平滑性的k阶系数,控制着方差,其中k个系数由固定系数部分βk1,以及空间随机变异部分Eγk组成,Λ(αk)是k×k的对角矩阵,其中对角线第L个元素的值为
将表达式改写为:
其中:
进一步地,本发明的步骤8中计算评价指标的方法具体为:
计算拟合优度R2:
计算调整后拟合优度Adj.R2:
其中,p是自变量的个数;R2和Adj.R2的取值范围是[0,1],值越大说明模型精度越高;
计算均方根误差RMSE:
计算平均绝对误差百分比MAE:
计算残差莫兰指数Moran’s I:
进一步地,本发明的步骤9中的方法具体为:
对自变量和PM2.5站点数据采用10折选取的方法进行交叉验证,使用10折交叉验证的方法,评估模型对非站点位置的PM2.5浓度的预测精度;将站点采集的数据样本均分为10份,每次选9份作为训练集,进行建模,剩余的1份作为测试集,将测试集的自变量带入训练集所得模型中,计算测试集的均方根误差MSE;每份数据都做过一次测试集后,计算10个均方根误差MSE的均值,即为交叉验证的结果;MSE越小,模型的预测精度越高,其鲁棒性越强,实用价值越高。
本发明产生的有益效果是:本发明的基于Re-ESF算法的空间变系数PM2.5浓度估算模型的构建方法,基于多源气溶胶光学厚度产品(多源AOD产品),克服研究区AOD产品缺失问题,结合相关气象因子和其他因子,针对检测站点PM2.5浓度值,利用随机效应特征向量空间滤值算法构建空间变系数PM2.5浓度估算模型。该方法通过对多源AOD数据的融合,结合其他相关因子作为模型自变量。通过反距离法和k近邻法构建PM2.5监测站的空间邻接矩阵,并提取空间邻接矩阵的特征值。自变量和特征值分别构成模型系数中的固定系数部分和空间随机变异部分,形成空间变系数。相比起使用特征向量空间滤值方法构建地面PM2.5浓度估算模型,添加了随机效应的模型方法能够拥有更优的拟合结果和缩短模型求解时间。
本发明在有效消除空间异质性和空间自相关性对PM2.5浓度建模的影响的基础上,引入随机效应和空间变系数方法,进一步提高浓度估算模型的精度和缩短模型解算时间。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1为本发明实施例的流程图。
图2为本发明实施例步骤1中多源AOD产品融合的子流程图。
图3为本发明实施例步骤4的子流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明要解决的问题是:地面监测点数量不足使得难以获取大范围内连续的PM2.5浓度分布情况,并且地面PM2.5浓度受空间因素的影响,使用传统的线性回归方法,无法准确进行浓度估算。针对这些问题,本发明基于遥感影像数据,使用特征向量空间滤值方法构建地面PM2.5浓度模型,进而制作PM2.5分布图。
参见图1,本发明提供的基于遥感数据的地面PM2.5浓度特征向量空间滤值建模方法,包括以下步骤:
步骤1:多源AOD产品融合。AOD产品,即,气溶胶光学厚度,与PM2.5浓度呈线性相关,是用于建模的主要自变量之一。遥感AOD数据可以从现有气溶胶产品中获取,如MODIS、MISR和VIIRS等,也可以由地表反射率自行反演获得。旨在获取研究区内尽可能的全部覆盖的AOD影像。具体步骤参见图2。
步骤1.1:获取研究区多源AOD产品,设A1为主产品。获取多源AOD产品后,选择其中一个产品,该产品在研究区及研究时间段内应尽可能具有全图幅特征,易于用其他产品进行小部分区域的补全,此处假设选取A1作为主产品。
步骤1.2:提取其他AOD产品与A1的重叠区域。此步骤可以通过ArcGIS Desktop中的栅格计算器功能获取影像中的具有数值意义的相交部分。
步骤1.3:提取重合区域的AOD值。可选择在ArcGIS Desktop软件中使用手动创建矢量点的方法,或将影像边界转为矢量边界,同时使用“Create Random Points”的方法创建合适的矢量点。最后使用“Extract multi values to points”工具,获得该点下的各产品的数值。
步骤1.4:构建A1产品和其他产品AOD对应的值的线性模型。从步骤1.3中获得的各产品数值表,以A1产品数值作为因变量,每个产品数值作为各自模型的自变量,构建线性模型,形如:
A1=ki*A1i+bi (1)
其中A1表示A1产品数值,A1i表示第i个产品与A1产品相交区域的数值,ki表示自变量系数,bi表示常数项。
该操作可在SPSS或Matlab或R软件中进行。
步骤1.5:将产品A2,A3...与AOD产品不重合区域的值转化为A1产品的值。利用ArcGIS Desktop中的栅格计算器功能,使用步骤1.4得到的公式,将A1产品中数值缺少的区域,而其他产品中有数值的区域转化为A1中的数值。
步骤1.6:转化后的各AOD产品叠加取均值。利用ArcGIS Desktop中的栅格计算器功能,可叠加不同产品的均值到A1中待补充的区域。
步骤2:相关影响因子与PM2.5浓度的数据处理,统一时空分辨率。PM2.5数据来源于全国城市空气质量实时发布平台,平台每小时发布各监测站的实时PM2.5浓度数据。对PM2.5站点数据进行质量检查,剔除明显异常值。除了AOD产品外,气象因子:气温、气压、相对湿度、风速、降水量等,会影响PM2.5的生成与扩散过程,进而影响PM2.5浓度;其他因子:如植被覆盖状况、土地利用状况、人口、高程、工厂和道路分布密度等。上述因子包括但不限于此,在一定程度上影响PM2.5浓度,也可以作为建模自变量。
同时,根据研究内容,选择合适的时间尺度,例如原始PM2.5数据是每小时的平均浓度,可经过均值或其他方法变换为日、月、年浓度,同时其余影响因子也做上述处理统一时间分辨率。在空间分辨率上,同样依据上述要求选择合适的统一尺度,如重采样和插值操作进行空间分辨率的调整。
步骤3:获取监测站点各处自变量值与PM2.5浓度值并进行相关因子选取。使用ArcGIS中的“Extract multi values to points”工具,对步骤2得到的统一时空分辨率后的因子,获得该监测站点下的各自变量的数值。
步骤4:构建邻接矩阵。根据监测站点数据,可基于(1)反距离法构建空间邻接矩阵;(2)根据k邻域法构建空间邻接矩阵。具体步骤参见图3。
步骤4.1:确定距离单位。对于监测站点坐标,确定坐标单位,可选单位如:经纬度、米、千米等。
步骤4.2:基于反距离法构建的监测站点空间邻接矩阵W。此步骤中,可涉及步骤9的模型精度评价,详细操作在步骤9中。基于反距离法构建空间邻接矩阵的方法之一,可分为指数、高斯、球状模型,根据如下公式:
其中,式子(2)、(3)、(4)分别为指数、高斯、球状模型。i,j分别表示位置点i和位置点j。Wi,j表示位置点i和j之间的邻接性(权重)。r表示所有站点的最小生成树中的最大距离。从式子中可以发现Wi,j=Wj,i,即,如有n个监测站最后所得到结果为n×n矩阵,对角线上元素为0,其余各元素为上述式子所计算结果,且为对称矩阵。
步骤4.3:k邻域法构建监测站点空间邻接矩阵。此步骤中,可涉及步骤9的模型精度评价,详细操作在步骤9中。该方法设置某一k值,即考虑设置的邻接矩阵中某一监测站点(站点)应与它最邻接的k个其他站点是可以联通的,除此k个站点,其余站点不邻接。具体可由如下进行,由k邻域法,找到站点i的最近邻的k个站点,由站点的邻接关系构建二元邻接矩阵W0,若站点i和j相邻,则元素W0(i,j)=1,否则等于0。
在过程实施中,假设有n个站点,k值的确定,可从{4,5,6......(n-1)},选择其中一具体数值在此基础上继续进行步骤5-8。进行多次以后,根据模型精度评价,确定其中合适的k值。
步骤5:空间邻接矩阵中心化并计算特征值和特征向量,并进行预选择。
由步骤4和步骤5的空间邻接矩阵,进行矩阵中心化操作,中心化公式如下:
其中I为n维单位矩阵,11T是一个n×n的矩阵,矩阵内所有元素都等于1,n是研究区内监测站点的数量。再使用数学分解的方法,求解W1的特征值和特征向量E={E1,EZ,E3,……,En),该过程可使用Matlab、R等软件中自带函数求解特征值函数进行计算。
完成特征值计算后,进行特征向量的预选择,要求其特征值>0,同时一般遵循规律为:
其中λi表示,λmax表示最大的特征值。或者按照步骤5中确定k值的方法进行特征值的选择。或者在此处不进行预选择。
步骤6:求解基于Re-ESF的SVC模型的回归系数。此步骤中,可涉及步骤9的模型精度评价,详细操作在步骤9中。根据基于随机效应特征向量空间滤值算法,如下式子(7):
其中,表示矩阵间的哈达马积(Hadamard product),k表示k个自变量,αk是控制空间平滑性的k阶系数,控制着方差。其中k个系数由固定系数部分βk1,以及空间随机变异部分Eγk组成。Λ(αk)是k×k的对角矩阵,其中对角线第L个元素的值为
式子(7)可以写成如下形式:
其中:
步骤7:判断模型中变量是否显著。判断得到模型回归系数后,判断自变量在模型中的显著程度。如不显著则进行剔除,重新进行步骤6;如全部显著,则进行步骤8,同时关注VIF值判断自变量之间是否具有多重共线性,如存在,酌情进行自变量筛选。该步骤可以在SPSS、matlab、R等软件中实现。
步骤8:模型精度评价。计算所得模型的R2、调整后R2(Adj.R2)、均方根误差(RMSE)、平均绝对误差(MAE)以及残差的Moran’s I等作为评价指标,以验证所提出的基于随机效应特征向量空间滤值算法的空间变系数PM2.5浓度估算模型的精度。
其中p是自变量的个数;R2和Adj.R2的取值范围是[0,1],值越大说明模型精度越高。
式中参数含义同上,RMSE和MAE越小说明模型精度越高
步骤9:10折交叉验证。同时在步骤4,5,7中对自变量和PM2.5站点数据采用10折选取的方法,在此步骤中进行交叉验证。使用10折交叉验证的方法,评估模型对非站点位置的PM2.5浓度的预测精度。具体方法是:将站点采集的数据样本均分为10份,每次选9份作为训练集,按前述步骤进行建模,剩余的1份作为测试集,将测试集的自变量带入训练集所得模型中,计算测试集的均方根误差;每份数据都做过一次测试集后,计算10个均方根误差MSE的均值,即为交叉验证的结果。MSE越小,模型的预测精度越高,其鲁棒性越强,实用价值越高。
步骤10:判断邻域个数k与监测站点数n的关系。如果k<n成立,则进行k=k+1,同时进入步骤4,重新根据k邻域法构建空间邻接矩阵。如果k<n不成立,进入步骤11。k值依次取4到n,逐个构建邻接权重矩阵进行建模,计算精度。
步骤11:根据精度评价选择最优模型。针对步骤4和步骤5中的不同构造权重矩阵的方法。进行了步骤8、9的模型精度评估之后,进行比较拟合优度(R2)、调整后拟合优度(Adj.R2)、均方根误差(RMSE)、平均绝对误差百分比(MAE)、残差Moran’s I以及均方根误差MSE等评价指标。可以获得其中一个最优的模型作为最终模型。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。
Claims (6)
1.一种基于Re-ESF算法的空间变系数PM2.5浓度估算模型的构建方法,其特征在于,该方法包括以下步骤:
步骤1、获取气溶胶光学厚度产品AOD影像,以AOD影像为基准进行多源产品融合,获得研究区内覆盖的AOD影像;
步骤2、进行监测站点PM2.5浓度、相关因子的数据预处理,并统一变量在时间上和空间上的尺度;
步骤3、提取监测站点各处与PM2.5浓度变化相关的自变量值,并将其与PM2.5浓度值进行匹配;
步骤4、根据监测站点数据构建空间邻接矩阵,构建邻接矩阵的方法包括:反距离法构建空间邻接矩阵,或根据k邻域法构建空间邻接矩阵;
步骤5、对空间邻接矩阵进行中心化处理,使其成为对称矩阵;在此基础上计算矩阵特征值和特征向量,并对特征值进行预选择;
步骤6、将监测站点各处自变量值和PM2.5浓度值,以及特征值和特征向量作为模型输入,求解基于随机效应特征向量空间滤值算法中的模型回归系数,得到PM2.5浓度和自变量之间的关系模型;
步骤7、判断自变量在关系模型中的显著程度,如不显著则进行剔除,重新进行步骤6;如全部显著,则进行步骤8;
步骤8、模型精度评价,计算得到的关系模型的评价指标,评价指标包括:拟合优度、调整后拟合优度、均方根误差、平均绝对误差百分比、残差莫兰指数;
步骤9、10折交叉验证,将验证用的数据分为10份,采用10折交叉验证的方法,检验该关系模型对于无站点监测地区的PM2.5浓度的估算精度;
步骤10、判断邻域个数k与监测站点数n的关系,如果k<n成立,则进行k=k+1,同时进入步骤4,重新根据k邻域法构建空间邻接矩阵;如果k<n不成立,进入步骤11;k值依次取4到n,逐个构建邻接权重矩阵进行建模,计算精度;
步骤11、根据构建的多个模型及其对应精度,选择精度最优模型作为最终模型投入应用。
2.根据权利要求1所述的基于Re-ESF算法的空间变系数PM2.5浓度估算模型的构建方法,其特征在于,步骤1的方法具体为:
利用多源AOD产品,以某一AOD产品作为模板,使用相加区域象元值构建模板AOD产品和其余AOD产品的线性模型,在研究区内模板AOD产品缺失区域,用其余AOD产品通过线性模型拟合后的均值代替。
3.根据权利要求1所述的基于Re-ESF算法的空间变系数PM2.5浓度估算模型的构建方法,其特征在于,步骤4中构建空间邻接矩阵的方法具体为:
步骤4.1、对于监测站点坐标,确定坐标单位,包括:经纬度、米、千米;
步骤4.2、基于反距离法构建的监测站点空间邻接矩阵,其类型包括指数、高斯、球状模型;
步骤4.3、k邻域法构建监测站点空间邻接矩阵,设置某一k值,即考虑设置的邻接矩阵中某一监测站点与它最邻接的k个其他站点是可联通的,除此k个站点,其余站点不邻接;由k邻域法,找到站点i的最近邻的k个站点,由站点的邻接关系构建二元邻接矩阵W0,若站点i和j相邻,则元素W0(i,j)=1,否则等于0。
5.根据权利要求1所述的基于Re-ESF算法的空间变系数PM2.5浓度估算模型的构建方法,其特征在于,步骤8中计算评价指标的方法具体为:
计算拟合优度R2:
计算调整后拟合优度Adj.R2:
其中,p是自变量的个数;R2和Adj.R2的取值范围是[0,1],值越大说明模型精度越高;
计算均方根误差RMSE:
计算平均绝对误差百分比MAE:
计算残差莫兰指数Moran’s I:
6.根据权利要求1所述的基于Re-ESF算法的空间变系数PM2.5浓度估算模型的构建方法,其特征在于,步骤9中的方法具体为:
对自变量和PM2.5站点数据采用10折选取的方法进行交叉验证,使用10折交叉验证的方法,评估模型对非站点位置的PM2.5浓度的预测精度;将站点采集的数据样本均分为10份,每次选9份作为训练集,进行建模,剩余的1份作为测试集,将测试集的自变量带入训练集所得模型中,计算测试集的均方根误差MSE;每份数据都做过一次测试集后,计算10个均方根误差MSE的均值,即为交叉验证的结果;MSE越小,模型的预测精度越高,其鲁棒性越强,实用价值越高。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811644669.9A CN109784552B (zh) | 2018-12-29 | 2018-12-29 | 一种基于Re-ESF算法的空间变系数PM2.5浓度估算模型的构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811644669.9A CN109784552B (zh) | 2018-12-29 | 2018-12-29 | 一种基于Re-ESF算法的空间变系数PM2.5浓度估算模型的构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109784552A CN109784552A (zh) | 2019-05-21 |
CN109784552B true CN109784552B (zh) | 2022-12-13 |
Family
ID=66499600
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811644669.9A Active CN109784552B (zh) | 2018-12-29 | 2018-12-29 | 一种基于Re-ESF算法的空间变系数PM2.5浓度估算模型的构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109784552B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110210681B (zh) * | 2019-06-11 | 2023-06-27 | 西安电子科技大学 | 一种基于距离的监测站点pm2.5值的预测方法 |
CN110825754B (zh) * | 2019-10-23 | 2022-06-17 | 北京蛙鸣华清环保科技有限公司 | 基于属性的空气质量空间插值方法、***、介质及设备 |
CN110929225B (zh) * | 2019-11-25 | 2023-03-28 | 暨南大学 | 基于地理加权回归模型的近地面二氧化硫浓度估算方法 |
CN111077048A (zh) * | 2019-11-27 | 2020-04-28 | 华南师范大学 | 基于移动设备的机会式群体智能空气质量监测及评估方法 |
CN111259539B (zh) * | 2020-01-14 | 2024-07-09 | 中山大学 | 一种道路pm2.5精细化污染分布的模拟方法、***及计算机存储介质 |
CN111680404B (zh) * | 2020-05-25 | 2022-06-21 | 中国科学院城市环境研究所 | 一种基于站点监测数据构建的大气元素汞浓度预测方法 |
CN111723525B (zh) * | 2020-06-23 | 2023-10-31 | 南通大学 | 一种基于多源数据和神经网络模型的pm2.5反演方法 |
CN111859304B (zh) * | 2020-07-28 | 2023-11-21 | 行星数据科技(苏州)有限公司 | 一种基于时空自相关性的卫星气溶胶缺失预测方法及*** |
CN114974459B (zh) * | 2022-05-25 | 2024-04-16 | 武汉大学 | Pm2.5浓度估算模型的构建方法 |
CN116504330B (zh) * | 2023-06-28 | 2023-09-19 | 航天宏图信息技术股份有限公司 | 污染物浓度反演方法、装置、电子设备及可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016201789A1 (zh) * | 2015-06-16 | 2016-12-22 | 中国环境科学研究院 | 评价纳米金属氧化物健康效应的qsar毒性预测方法 |
CN108038081A (zh) * | 2017-12-25 | 2018-05-15 | 武汉大学 | 基于特征函数空间滤值的滑坡灾害logistic回归分析方法 |
CN108241779A (zh) * | 2017-12-29 | 2018-07-03 | 武汉大学 | 基于遥感数据的地面pm2.5浓度特征向量空间滤值建模方法 |
-
2018
- 2018-12-29 CN CN201811644669.9A patent/CN109784552B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016201789A1 (zh) * | 2015-06-16 | 2016-12-22 | 中国环境科学研究院 | 评价纳米金属氧化物健康效应的qsar毒性预测方法 |
CN108038081A (zh) * | 2017-12-25 | 2018-05-15 | 武汉大学 | 基于特征函数空间滤值的滑坡灾害logistic回归分析方法 |
CN108241779A (zh) * | 2017-12-29 | 2018-07-03 | 武汉大学 | 基于遥感数据的地面pm2.5浓度特征向量空间滤值建模方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109784552A (zh) | 2019-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109784552B (zh) | 一种基于Re-ESF算法的空间变系数PM2.5浓度估算模型的构建方法 | |
CN109580003B (zh) | 一种静止气象卫星热红外数据估算近地面大气温度方法 | |
CN110346517B (zh) | 一种智慧城市工业大气污染可视化预警方法及其*** | |
CN109492709B (zh) | 基于混合模型的数据预测方法及装置 | |
CN102096072B (zh) | 一种城市部件自动化测量方法 | |
CN111428942B (zh) | 基于变网格技术提取微地形因子的线路覆冰厚度预测方法 | |
CN112131731B (zh) | 一种基于空间特征向量滤波的城市生长元胞模拟方法 | |
CN110595960B (zh) | 一种基于机器学习的pm2.5浓度遥感估算方法 | |
CN110595968B (zh) | 一种基于静止轨道卫星的pm2.5浓度估算方法 | |
CN113108918B (zh) | 一种极轨气象卫星热红外遥感数据反演气温方法 | |
CN113901384A (zh) | 顾及全局空间自相关性和局部异质性的地面pm2.5浓度建模方法 | |
CN108802856B (zh) | 一种基于ai的源数据动态修正预报***及其工作方法 | |
CN112557307B (zh) | 天空地一体化湖库水质监测融合数据方法 | |
CN114881323A (zh) | 基于深度神经网络的基坑降水区地下水位预测与更新方法 | |
CN108764527B (zh) | 一种土壤有机碳库时空动态预测最优环境变量筛选方法 | |
CN115759488A (zh) | 一种基于边缘计算的碳排放监测预警分析***及其方法 | |
CN117409334A (zh) | 一种基于静止卫星遥感数据的气溶胶类型识别方法 | |
CN114417728A (zh) | 基于温度和发射率及深度学习的近地表空气温度反演方法 | |
CN112986497B (zh) | 基于气体传感器阵列指纹识别的污染气体溯源方法 | |
CN113191536A (zh) | 基于机器学习的近地面环境要素预测模型训练和预测方法 | |
CN113108949B (zh) | 一种基于模型融合的探空仪温度传感器误差预测方法 | |
CN114047563A (zh) | 一种红外高光谱的全天候同化方法 | |
CN114219176A (zh) | 一种多源算法集成的太阳辐射预报***及方法 | |
CN112528566A (zh) | 基于AdaBoost训练模型的空气质量数据实时校准方法及*** | |
CN116429648B (zh) | 改进的时空LightGBM的地表PM10估算方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |