CN113010850A - 一种基于gis的大气细颗粒物中三价砷浓度的预测方法 - Google Patents

一种基于gis的大气细颗粒物中三价砷浓度的预测方法 Download PDF

Info

Publication number
CN113010850A
CN113010850A CN202110310768.9A CN202110310768A CN113010850A CN 113010850 A CN113010850 A CN 113010850A CN 202110310768 A CN202110310768 A CN 202110310768A CN 113010850 A CN113010850 A CN 113010850A
Authority
CN
China
Prior art keywords
concentration
iii
independent variable
predicting
trivalent arsenic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110310768.9A
Other languages
English (en)
Inventor
杨孟
刁一伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Binjiang College of Nanjing University of Information Engineering
Original Assignee
Binjiang College of Nanjing University of Information Engineering
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Binjiang College of Nanjing University of Information Engineering filed Critical Binjiang College of Nanjing University of Information Engineering
Priority to CN202110310768.9A priority Critical patent/CN113010850A/zh
Publication of CN113010850A publication Critical patent/CN113010850A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/06Investigating concentration of particle suspensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/17Function evaluation by approximation methods, e.g. inter- or extrapolation, smoothing, least mean square method

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Chemical & Material Sciences (AREA)
  • Dispersion Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于GIS的大气细颗粒物中三价砷浓度的预测方法,步骤如下:S1、布设采样点,采集PM2.5样品;S2、对三价砷进行提取与分析;S3、空间分析计算自变量;S4、将单个自变量与As(III)浓度进行一元线性回归,保留回归系数与预期效应方向相符的自变量;进一步地对同一类自变量进行主成分分析和方差最大化旋转,以特征值大于1的主成分得分作为自变量;S5、采用多元线性回归方程预测PM2.5中的As(III)浓度;利用自变量以及主成分得分,使用前向逐步回归方法、AIC准则选出最佳模型;S6、回归诊断与模型校验;S7、未知点预测及空间分布图制作。本发明可以获得高空间分辨率的三价砷浓度数据。

Description

一种基于GIS的大气细颗粒物中三价砷浓度的预测方法
技术领域
本发明属于大气污染物空间分布的模拟和预测领域,具体涉及一种基于GIS的大气细颗粒物中三价砷浓度的预测方法。
背景技术
砷(As)是一种广义上的重金属元素,是国际癌症研究机构确认的致癌物质。砷元素在环境中的毒性与其赋存形态有关,不同形态的毒性具有显著差异。空气中的水溶性砷以无机形态的五价砷(As(V))和三价砷(As(III))为主,并伴有少量的有机砷。在这些形态中,As(III)的毒性最强。我国部分城市大气细颗粒物PM2.5中砷造成的致癌风险已不可忽略。为了准确评价PM2.5中砷对人体可能造成的健康风险,需要准确表征PM2.5中毒性最强的As(III)的暴露强度。而空气污染物浓度是普遍使用的空气暴露强度表征方法,污染物浓度数据的空间分辨率影响暴露强度的准确度,空间分辨率过低会降低暴露评价的准确度。也就是说,准确评价PM2.5中砷的健康风险,需要较高空间分辨率的As(III)浓度数据。
PM2.5中重金属元素的空间分布比较复杂,存在较大的空间变异性。已有的PM2.5中As(III)浓度的空间分布预测和模拟方法,主要针对包括As在内的多种重金属元素的总量浓度,没有专门针对As(III)的研究。例如,CN107121650A《基于支持向量机技术的大气颗粒物重金属磁学评估方法》,构建大气重金属污染的磁学快速评估模型;CN108169316A《基于支持向量机和树叶磁学的大气重金属污染评估方法》可用于城市大气颗粒物重金属污染的快速模拟和预测;CN107300550A《一种基于BP神经网络模型预测大气重金属浓度的方法》可对大气重金属的浓度进行评估。而专门针对大气颗粒物中砷的形态研究,主要是针对不同形态砷的提取方法,例如,CN1O5606721A《一种PM2.5中砷的分离测定方法》。《基于多采样点的南京市PM2.5中的水溶性砷分析》虽然基于多个采样点来分析As(III)的空间特征,但是并没有提供预测As(III)浓度的方法,因而也不能得到高空间分辨率的As(III)浓度数据,因此不能完全表征出As(III)的空间变异特征。
总之,由于As(III)是PM2.s中毒性最强的水溶性砷形态,以及PM2.5中重金属浓度具有复杂的空间变异特征,为了是准确评价PM2.5中砷的健康风险,这就亟需获取较高空间精度的PM2.5中As(III)浓度的数据。
发明内容
本发明针对现有技术中的不足,提供一种预测未知点的PM2.5中As(III)浓度的方法,该方法得到一种预测As(III)浓度的多元线性回归方程,并基于GIS得到As(III)浓度的空间分布图,以解决现有技术无法提供高空间分辨率的PM2.5中As(III)浓度数据的不足。
为实现上述目的,本发明采用以下技术方案:
一种基于GIS的大气细颗粒物中三价砷浓度的预测方法,包括如下步骤:
S1、在待预测区域布设N个代表性的采样点,采集PM2.5样品;
S2、对PM2.5样品中的As(III)进行提取与分析;
S3、空间分析计算自变量;
S4、自变量的初步筛选:将单个自变量与As(III)浓度进行一元线性回归,保留回归系数与预期效应方向相符的自变量,对同一类自变量进行主成分分析和方差最大化旋转,以特征值大于1的主成分得分作为自变量;
S5、前向逐步回归选出最佳的As(III)浓度预测模型:采用多元线性回归方程来预测PM2.5中的As(III)浓度,利用自变量以及主成分得分,使用前向逐步回归方法、AIC准则选出最佳预测模型;
S6、回归诊断与模型校验;
S7、未知点预测以及空间分布图制作。
为优化上述技术方案,采取的具体措施还包括:
进一步地,步骤S1中,使用中流量采样器收集PM2.5样品;采样方法具体为按季节采样,每个季节采样持续14天,采样为期一年。
进一步地,步骤S1中,采样介质为高纯度石英滤膜,采样前后滤膜恒温恒湿48h并称重,恒温条件为温度20-25℃,恒湿条件为相对湿度40-45%;采用间隔采样法,每小时采样4分钟,每个样品共采集22.4小时。
进一步地,步骤S3中,自变量包括以下6类:交通源、工业点源、土地利用、人口、高程和归一化植被指数NDVI。
进一步地,步骤S3中,利用GIS软件对自变量的空间数据进行处理,使用ArcGIS对缓冲区内的地理信息进行统计,缓冲区半径取值在25m~30km。
进一步地,步骤S5具体包括,采用多元线性回归方程来预测PM2.5中的As(III)浓度,形式如下:
C=α+∑iβi×Xi (1)
式中,C为As(III)的年平均浓度(ng·m-3),α为截,距βi为自变量的回归系数,i=0,1,...,n;Xi为自变量,i=0,1,...,n。利用自变量以及主成分得分,使用前向逐步回归方法、AIC准则选出最佳预测模型。
进一步地,步骤S5还包括,对逐步回归得到的最佳预测模型进行以下修订:(1)如果自变量方向与预期效应不符,则剔除该自变量;(2)如果自变量的回归系数不显著,则去掉该自变量后重新进行一次线性回归,如果校正R2减少超过1%,则保留该自变量,否则剔除该变量;(3)最佳预测模型中存在强影响点的处理:做As(III)与各个自变量的散点图,确定造成强影响点的自变量;检查该自变量的取值是否存在人为误差,如果存在则进行修改;如果不存在人为误差,分析这个自变量与因变量的线性关系是真实存在,根据情况决定该自变量的去留。
进一步地,步骤S6中,使用K层交叉验证方法对线性回归模型进行校验,并计算均方根误差RMSE、平均绝对误差MAE和决定系数R2来评价模型效果;
RMSE的计算公式为:
Figure BDA0002987832160000031
式中,
Figure BDA0002987832160000032
为去掉第i个点、用剩余N-1个点构建模型,用该模型预测的第i个点的浓度;yi为第i个点的观测值;N为样本容量;
MAE的计算公式为:
Figure BDA0002987832160000033
进一步地,步骤S7包括,将待预测区域离散为30m大小的网格,以网格中心点的浓度表示网格的平均As(III)浓度,利用ArcGIS的交集制表工具得到自变量的空间分布图;基于ArcGIS的栅格计算功能,根据多元线性回归方程计算各个网格的As(III)浓度,从而得到PM2.5中As(III)浓度的空间分布图。
本发明的有益效果是:本发明提供了一种预测未知点的PM2.5中As(III)浓度的方法,可以获得高空间分辨率的As(III)浓度数据,这不仅有助于提高呼吸途径的砷暴露评价的准确度,也为揭示PM2.5中As(III)空间变异的复杂性及其影响机制提供了数据基础,为空气砷污染治理提供量化和科学的支撑。
附图说明
图1为本发明As(III)浓度的预测方法的技术流程图。
图2为本发明实施例中采样点的空间分布图。
图3为本发明实施例中As(III)浓度的季节变化。
图4为本发明实施例中As(III)浓度的模拟值与观测值的对比。
图5为本发明实施例预测得到的PM2.5中As(III)浓度(ng/m3)的空间分布图。
具体实施方式
现在结合附图对本发明作进一步详细的说明。
需要注意的是,发明中所引用的如“上”、“下”、“左”、“右”、“前”、“后”等的用语,亦仅为便于叙述的明了,而非用以限定本发明可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当亦视为本发明可实施的范畴。
如附图所示,本发明实施例提供了一种预测PM2.5中As(III)浓度的方法,包括以下步骤:
S1、PM2.5采样点布设与样品采集。
在待预测区域布设20个代表性的采样点,使用中流量采样器收集PM2.5样品,采样介质为高纯度石英滤膜,采样前后滤膜恒温恒湿48h并称重,恒温条件为温度20-25℃,恒湿条件为相对湿度40-45%。
采样方法具体为按季节采样,每个季节采样持续14天。采用间隔采样法,每小时采样4分钟,每个样品共采集22.4小时。避免大风和雨雪等极端天气,采样为期一年。采用上述方法采集的样品代表性强,能有效评估一年四季PM2.5中As(III)的平均浓度。
S2、对PM2.5样品中的As(III)进行提取与分析。
用陶瓷剪刀将1/4张PM2.5采样膜剪碎后放入离心管,加入10mL超纯水,离心管在50℃水温情况超声提取1h,提取液转存至另一离心管,再重复2次此操作。提取液倒入注射器,经过0.45μm滤头过滤,注入2mL色谱进样瓶,加盖冷藏待测。利用电感耦合等离子体质谱仪和液相色谱仪联用进行测定,检出限为1ppb。分析质量控制包括:利用国家标准物质中心的亚砷酸根溶液标准物质(GBW08666)进行加标回收实验;对空白膜进行提取检测。
S3、空间分析计算自变量。
预测PM2.5中As(III)浓度的多元线性回归方程的自变量可分成以下6类:交通源、工业点源、土地利用、人口、高程和归一化植被指数(NDVI)。为了得到以上自变量,该发明需要以下空间数据。1)交通源数据,利用交通路网表征了机动车的污染排放,道路分为城市快速路、高速公路、国道、其他道路等4类,并将前三种合并后作为主干道。2)工业点源的空间分布数据。3)空间分辨率为30m的土地利用数据,土地利用类型分为草地、建设用地、林地、裸地、农田、水体和道路7类。4)空间分辨率为1km的人口数据以及居民小区的空间分布数据。5)空间分辨率90m的高程数据。6)空间分辨率为500m的NDVI月合成数据。
利用GIS软件对以上空间数据进行处理,主要包括使用ArcGIS对缓冲区内的地理信息进行统计,缓冲区半径取值在25m~30km之间。其中,缓冲区内的土地利用类型、排放源数量和道路长度的统计使用ArcGIS的交集制表工作完成;缓冲区内的人口和NDVI使用ArcGIS的焦点统计和值提取至点工具;采样点到排放源和道路的距离使用ArcGIS的近邻分析。主要自变量的定义及其与As(III)浓度的关系(预期效应)如表1所示。
表1部分自变量及其对As(III)浓度的预期效应
Figure BDA0002987832160000051
S4、自变量的初步筛选。
将单个自变量与As(III)浓度进行一元线性回归,保留回归系数与预期效应方向相符的自变量。为了避免回归模型的共线性,进一步地对同一类自变量进行主成分分析和方差最大化旋转,以特征值大于1的主成分得分作为新的自变量。以上主成分分析使用R软件的psych::principal函数进行。
S5、前向逐步回归选出最佳的As(III)浓度预测模型。
本实施例采用多元线性回归方程来预测PM2.5中的As(III)浓度;形式如下:
C=α+∑iβi×Xi (1)
式中,c为As(III)的年平均浓度(ng·m-3),α为截距,βi(i=0,1,...,n)为自变量的回归系数,Xi(i=0,1,...,n)为自变量。利用自变量以及主成分得分,使用前向逐步回归方法、AIC准则选出最佳预测模型。逐步回归利用R软件的stats::step函数实现。对逐步回归得到的最佳预测模型进行以下修订。(1)如果自变量方向与预期效应不符,则剔除该自变量。(2)如果自变量的回归系数不显著,则去掉该自变量后重新进行一次线性回归,如果校正R2减少超过1%,则保留该自变量,否则剔除该变量。(3)最佳预测模型中存在强影响点的处理:做As(III)与各个自变量的散点图,确定造成强影响点的自变量;检查该自变量的取值是否存在人为误差,如果存在则进行修改;如果不存在人为误差,分析这个自变量与因变量的线性关系是真实存在,根据情况决定该自变量的去留。
S6、回归诊断与模型校验。
对最小二乘法的基本假设进行如下检验。通过方差膨胀因子(VarianceInflation Factor,VIF)检验自变量的多重共线性。利用QQ图(Quantile-quantile plot)检验残差正态性。利用残差图定性评价残差的方差稳定性,并利用Score检验验证残差方差是否为常数。采用Cook’s Distance进行强影响点检验。
模型校验是应用线性回归模型的一个重要步骤。该发明使用K层交叉验证方法对线性回归模型进行校验,并计算均方根误差(root-mean-square error,RMSE)、平均绝对误差(mean absolute error,MAE)和决定系数R2来评价模型效果。RMSE的计算公式为:
Figure BDA0002987832160000061
上式中,
Figure BDA0002987832160000062
为去掉第i个点、用剩余N-1个点构建模型,用该模型预测的第i个点的浓度;yi为第i个点的观测值;N为样本容量。MAE的计算公式为:
Figure BDA0002987832160000063
上式中的变量含义与RMSE的计算公式相同。由RMSE和MAE的计算公式可知,RMSE、MAE约接近0,交叉验证得到的预测值与观测值的偏值越小,模型效果越好。模型交叉验证的决定系数R2越接近1,模型效果越好。利用Rstudio完成涉及的统计和绘图,使用到的包(package)主要有car、lattice以及caret。
S7、未知点预测以及空间分布图制作。
将待预测区域离散为30m大小的网格,以网格中心点的浓度表示网格的平均As(III)浓度,利用ArcGIS的交集制表工具得到自变量的空间分布图。利用R软件的psych::predict函数计算回归模型中的主成分得分。基于ArcGIS的栅格计算功能,根据多元线性回归方程计算各个网格的As(III)浓度,从而得到PM2.5中As(III)浓度的空间分布图。
在本发明的一个实施例中,如图2,在南京市布设20个采样点,根据功能区划分,20个采样点的分布为:工业区、郊区、商业区、生态园区各一个;交通区六个;居住区四个;文化教育区六个。采样点确认前先进行现场环境的调查,保证采样器周围的空气流通,与空调外机或其他排风口保持距离。采样器保持在地面1.5~3m之间,并带有一定的安保措施,避免外来人员的接触影响。树木对于污染物有一定的吸附作用,因此采样器避免茂密树叶的遮挡。
采样时间从2016年6月至2017年6月。二十个样点在四个季节各进行为期14天的采样,具体为:每个季节持续采样14天,采用间隔采样法,每小时采样4分钟,每个样品共采集22.4小时,共获得80个样品。采用青岛旭宇中流量(100L·min-1)大气颗粒物采样器(XY-2000)进行采样;在采样开始前后均对采样器进行流量校准。采样后的滤膜在-4℃进行保存。
南京市PM2.5中As(III)的浓度。利用电感耦合等离子体质谱仪和液相色谱仪联用对样品中的As(III)进行测定。测定结果的统计量如表2所示:PM2.5的平均浓度为59.79μg·m-3,PM2.5中As(III)的平均浓度为0.98ng·m-3
表2实例中PM2.5和As(III)浓度的基本统计量
Figure BDA0002987832160000071
As(III)浓度的季节变化如图3所示:As(III)在夏季浓度最高,其他3个季节的浓度差别不大。计算各个采样点的年平均浓度作为线性回归方程的因变量。
自变量的数据来源与计算。土地利用数据来自利用Landsat TM遥感影像的解译结果(空间分辨率30m)。人口数据采用Oak Ridge National Laboratory(ORNL)的2012年人口数据(空间分辨率1km)。高程数据采用CGIAR Consortium for Spatial Information(CGIAR-CSI)的2003年SRTM数字高程数据(空间分辨率90m)。排放源数据使用生态环境部2016年国家重点监控企业名单中的废气国家重点监控企业名单。从生态环境部官网获取基本信息后,然后根据其组织机构代码获取其注册地址,再从地图上获取排放源经纬度信息。NDVI数据来自地理空间数据云的中国500m的NDVI月合成产品。交通路网数据是基于Landsat TM解译的道路数据并结合Google Earth进行矢量化得到,将道路分为城市快速路、高速公路、国道、其他道路等4类,并将前三种合并后作为主干道。基于以上数据,使用ArcGIS对地理信息进行统计,提取相应的自变量。
南京市PM2.5中As(III)浓度的预测模型。对单个自变量与As(III)浓度进行一元线性回归分析,筛选出与预期效应方向相符的自变量并分为3组:第一组(G1)的8个自变量之间具有显著的相关性,包括与工业点源有关的7个自变量(PIs)以及与交通源有关的1个自变量(IDR);第二组(G2)包括4个显著相关的自变量;第3组的两个自变量之前没有相关性,也与G1和G2的变量也不相关。
对第一组(G1)的8个自变量进行主成分分析,得到特征值大于1的4个主成分,累计方差贡献率92%,如表3所示。
表3实例中第一组自变量的主成分分析结果
Figure BDA0002987832160000081
黑体数值代表载荷大于0.6。
其中,第一主成分(PC1)的方差贡献率为42%,该主成分中PI7500、PI10000和PI15000的荷载大于0.6,这反映了工业源在较大空间尺度上(7.5~15km范围内)产生的影响。第二主成分(PC2)中仅仅有IDR的荷载大于0.6,这反映了交通源产生的影响。第三主成分(PC3)中只有PI3000的荷载大于0.6。第四主成分(PC4)的方差贡献率为21%,该主成分中PI1000和PI1500的荷载大于0.6,这反映了工业源在较小空间尺度上(1~1.5km范围内)产生的影响。
利用第一组(G1)的4个主成分以及第二组(G1)和第三组(G3)的自变量进行逐步回归,得到南京市PM2.5中As(III)浓度的最佳自变量组合为PC2、PC1、PC4、RCD5000以及NDVI3000。线性回归结果,如表4所示,
表4实例中As(III)浓度(ng/m3)的多元线性回归结果
Figure BDA0002987832160000091
注:Signif.codes:0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1
根据线性回归结果,南京市PM2.5中As(III)浓度的预测模型为:
C=1.58-0.01×RCD5000-0.82×NDVI3000+0.08×PC1+0.07×PC4+0.10×PC2 (4)
模型的整体显著性检验(F检验)结果表明:P值为0.000,说明自变量与因变量存在显著的回归关系。对自变量的回归系数进行t检验的结果表明:所有自变量的P值均达到5%的显著性水平,如表4所示。
回归诊断与模型校验结果。As(III)的预测模型的多重共线性检验结果表明:5个自变量的VIF值均小于2,不存在共线性,模型的参数估计稳定可信。As(III)浓度的预测模型的残差图和残差方差的Score检验结果均表明残差具有方差齐性,残差正态性检验的QQ图表明残差来自正态总体。以上结果表明As(IID的预测模型满足最小二乘法的假定条件。强影响点检验的结果表明只有一个采样点为强影响点,该采样点的强影响是由于自变量RCD5000(5000m缓冲区内的居民小区密度)取值低造成的。该采样点位于固城湖附近的农村地区,确实存在居民小区密度低的情况,并非人为误差,因此保留该自变量。
南京市PM2.5中As(III)浓度的预测模型的决定系数R2为0.76,调整决定系数
Figure BDA0002987832160000092
为0.66,模型预测值与观测值的散点图如图4所示。预测空气污染物浓度空间分布的线性回归模型的R2通常在0.4~0.6之间。由此可知,利用该发明得到的预测模型拟合程度较好。南京市PM2.5中As(III)浓度的预测模型的k层交叉验证的决定系数R2为0.55、RMSE为0.23、MAE为0.19,表明该模型能够对未知点的As(III)浓度进行较好的预测。
南京市PM2.5中As(III)浓度的空间分布图。
基于As(III)浓度的预测模型,得到As(III)浓度的空间分布图如图5所示。从该图可以看出,高污染区域主要分布在南京北部的化工园地区,红色的高值点表示大型工业源附近的高污染点。从该图还可以看出与路网分布吻合的分布特征,这代表道路交通源的影响。在主城区存在浓度较高区域。在北部的农村地区,As(III)浓度相对较低。
本发明提供的一种基于GIS的PM2.5中三价砷浓度的预测方法,可以获得高空间分辨率的As(III)浓度数据,这不仅有助于提高呼吸途径的砷暴露评价的准确度,也为揭示PM2.5中As(III)空间变异的复杂性及其影响机制提供了数据基础,为空气砷污染治理提供量化和科学的支撑。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。

Claims (9)

1.一种基于GIS的大气细颗粒物中三价砷浓度的预测方法,其特征在于,包括如下步骤:
S1、在待预测区域布设N个代表性的采样点,采集PM2.5样品;
S2、对PM2.5样品中的As(III)进行提取与分析;
S3、空间分析计算自变量;
S4、自变量的初步筛选:将单个自变量与As(III)浓度进行一元线性回归,保留回归系数与预期效应方向相符的自变量,对同一类自变量进行主成分分析和方差最大化旋转,以特征值大于1的主成分得分作为自变量;
S5、前向逐步回归选出最佳的As(III)浓度预测模型:采用多元线性回归方程来预测PM2.5中的As(III)浓度,利用自变量以及主成分得分,使用前向逐步回归方法、AIC准则选出最佳预测模型;
S6、回归诊断与模型校验;
S7、未知点预测以及空间分布图制作。
2.根据权利要求1所述的大气细颗粒物中三价砷浓度的预测方法,其特征在于,步骤S1中,使用中流量采样器收集PM2.5样品;采样方法具体为按季节采样,每个季节采样持续14天,采样为期一年。
3.根据权利要求1所述的大气细颗粒物中三价砷浓度的预测方法,其特征在于,步骤S1中,采样介质为高纯度石英滤膜,采样前后滤膜恒温恒湿48h并称重,恒温条件为温度20-25℃,恒湿条件为相对湿度40-45%;采用间隔采样法,每小时采样4分钟,每个样品共采集22.4小时。
4.根据权利要求1所述的大气细颗粒物中三价砷浓度的预测方法,其特征在于,步骤S3中,自变量包括以下6类:交通源、工业点源、土地利用、人口、高程和归一化植被指数NDVI。
5.根据权利要求1所述的大气细颗粒物中三价砷浓度的预测方法,其特征在于,步骤S3中,利用GIS软件对自变量的空间数据进行处理,使用ArcGIS对缓冲区内的地理信息进行统计,缓冲区半径取值在25m~30km。
6.根据权利要求1所述的大气细颗粒物中三价砷浓度的预测方法,其特征在于,步骤S5包括,采用多元线性回归方程来预测PM2.5中的As(III)浓度,形式如下:
C=α+∑iβi×Xi (1)
式中,C为As(III)的年平均浓度(ng·m-3);α为截距;βi为自变量的回归系数,i=0,1,...,n;Xi为自变量,i=0,1,...,n。
7.根据权利要求1所述的大气细颗粒物中三价砷浓度的预测方法,其特征在于,步骤S5还包括,对逐步回归得到的最佳预测模型进行以下修订:(1)如果自变量方向与预期效应不符,则剔除该自变量;(2)如果自变量的回归系数不显著,则去掉该自变量后重新进行一次线性回归,如果校正R2减少超过1%,则保留该自变量,否则剔除该变量;(3)最佳预测模型中存在强影响点的处理:做As(III)与各个自变量的散点图,确定造成强影响点的自变量;检查该自变量的取值是否存在人为误差,如果存在则进行修改;如果不存在人为误差,分析这个自变量与因变量的线性关系是真实存在,根据情况决定该自变量的去留。
8.根据权利要求1所述的大气细颗粒物中三价砷浓度的预测方法,其特征在于,步骤S6中,使用K层交叉验证方法对线性回归模型进行校验,并计算均方根误差RMSE、平均绝对误差MAE和决定系数R2来评价模型效果;
RMSE的计算公式为:
Figure FDA0002987832150000021
式中,
Figure FDA0002987832150000022
为去掉第i个点、用剩余N-1个点构建模型,用该模型预测的第i个点的浓度;yi为第i个点的观测值;N为样本容量;
MAE的计算公式为:
Figure FDA0002987832150000023
9.根据权利要求1所述的大气细颗粒物中三价砷浓度的预测方法,其特征在于,步骤S7包括,将待预测区域离散为30m大小的网格,以网格中心点的浓度表示网格的平均As(III)浓度,利用ArcGIS的交集制表工具得到自变量的空间分布图;基于ArcGIS的栅格计算功能,根据多元线性回归方程计算各个网格的As(III)浓度,从而得到PM2.5中As(III)浓度的空间分布图。
CN202110310768.9A 2021-05-17 2021-05-17 一种基于gis的大气细颗粒物中三价砷浓度的预测方法 Withdrawn CN113010850A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110310768.9A CN113010850A (zh) 2021-05-17 2021-05-17 一种基于gis的大气细颗粒物中三价砷浓度的预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110310768.9A CN113010850A (zh) 2021-05-17 2021-05-17 一种基于gis的大气细颗粒物中三价砷浓度的预测方法

Publications (1)

Publication Number Publication Date
CN113010850A true CN113010850A (zh) 2021-06-22

Family

ID=76405736

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110310768.9A Withdrawn CN113010850A (zh) 2021-05-17 2021-05-17 一种基于gis的大气细颗粒物中三价砷浓度的预测方法

Country Status (1)

Country Link
CN (1) CN113010850A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117235511A (zh) * 2023-11-13 2023-12-15 北京市计量检测科学研究院 一种二次仪表校准方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117235511A (zh) * 2023-11-13 2023-12-15 北京市计量检测科学研究院 一种二次仪表校准方法
CN117235511B (zh) * 2023-11-13 2024-02-20 北京市计量检测科学研究院 一种二次仪表校准方法

Similar Documents

Publication Publication Date Title
Kuik et al. Air quality modelling in the Berlin–Brandenburg region using WRF-Chem v3. 7.1: sensitivity to resolution of model grid and input data
Huang et al. Development of land use regression models for PM2. 5, SO2, NO2 and O3 in Nanjing, China
Birmili et al. Long-term observations of tropospheric particle number size distributions and equivalent black carbon mass concentrations in the German Ultrafine Aerosol Network (GUAN)
Vignati et al. Global scale emission and distribution of sea-spray aerosol: Sea-salt and organic enrichment
Costabile et al. First results of the “Carbonaceous aerosol in Rome and Environs (CARE)” experiment: Beyond current standards for PM10
Makra et al. Airborne pollen in three European cities: Detection of atmospheric circulation pathways by applying three‐dimensional clustering of backward trajectories
González et al. High-resolution air quality modeling in a medium-sized city in the tropical Andes: Assessment of local and global emissions in understanding ozone and PM10 dynamics
CN107300550A (zh) 一种基于bp神经网络模型预测大气重金属浓度的方法
Sofowote et al. Advanced receptor modeling of near–real–time, ambient PM2. 5 and its associated components collected at an urban–industrial site in Toronto, Ontario
CN108426815B (zh) 一种近地面细颗粒物组分浓度估算方法
Kurganskiy et al. Predicting the severity of the grass pollen season and the effect of climate change in Northwest Europe
Kim et al. Sources of fine particles in the South Coast area, California
CN110989041B (zh) 一种灰霾和沙尘天气的预报方法及预报***
Guth et al. First implementation of secondary inorganic aerosols in the MOCAGE version R2. 15.0 chemistry transport model
Skiles et al. Source apportionment of PM2. 5 organic carbon in the San Joaquin Valley using monthly and daily observations and meteorological clustering
Hernandez et al. Analysis of the information obtained from PM 2.5 concentration measurements in an urban park
CN110503348B (zh) 一种基于位置匹配的个体空气污染暴露模拟测量方法
Riccio et al. Source apportion of atmospheric particulate matter: a joint Eulerian/Lagrangian approach
dos Santos et al. Analysis of atmospheric aerosol (PM2. 5) in Recife city, Brazil
CN113010850A (zh) 一种基于gis的大气细颗粒物中三价砷浓度的预测方法
Zhang et al. Impact of long-range desert dust transport on coastal East Asia: analysis of urban dust concentration and wet deposition with model simulation
Makra et al. An objective classification system of air mass types for Szeged, Hungary, with special interest in air pollution levels
Herts et al. Cloud service ThingSpeak for monitoring the surface layer of the atmosphere polluted by particulate matters
Narayan et al. Long-term statistical characteristics of air pollutants in a traffic-congested area of Ranchi, India
CN113032729A (zh) 一种预测大气颗粒物重金属健康风险空间分布的便捷方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20210622

WW01 Invention patent application withdrawn after publication