CN115510760A - 一种基于多维要素大气pm2.5浓度预测方法 - Google Patents

一种基于多维要素大气pm2.5浓度预测方法 Download PDF

Info

Publication number
CN115510760A
CN115510760A CN202211273842.5A CN202211273842A CN115510760A CN 115510760 A CN115510760 A CN 115510760A CN 202211273842 A CN202211273842 A CN 202211273842A CN 115510760 A CN115510760 A CN 115510760A
Authority
CN
China
Prior art keywords
model
data
sequence
characteristic
iaqi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211273842.5A
Other languages
English (en)
Inventor
田莉
王振波
刘希亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Geographic Sciences and Natural Resources of CAS
Original Assignee
Institute of Geographic Sciences and Natural Resources of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Geographic Sciences and Natural Resources of CAS filed Critical Institute of Geographic Sciences and Natural Resources of CAS
Priority to CN202211273842.5A priority Critical patent/CN115510760A/zh
Publication of CN115510760A publication Critical patent/CN115510760A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于多维要素大气PM2.5浓度预测方法,本方法对采集到的多站点空气污染物及气象数据进行了数据插值、特征选择等预处理作为模型输入;采用相关性分析、卷积神经网络与空间注意力机制,提取与目标站点空间强相关的站点信息;融合时间注意力机制和堆叠膨胀卷积进行时间依赖特征的提取。然后进行了模型学习率、膨胀卷积内核、滑动窗口等超参数调优实验以辅助优化模型。最后将多维特征数据集用于对该模型的训练,得出对目标站点PM2.5浓度的精确化预测值。本发明克服了RNN变种模型在时序预测中存在的梯度问题、复杂体系结构等弊端,且为PM2.5浓度细粒度预测提供了一个开放研究框架。

Description

一种基于多维要素大气PM2.5浓度预测方法
技术领域
本发明涉及空气污染物浓度预测、基于深度学习建模等技术,具体涉及一种基于多维要素大气PM2.5浓度预测方法,属于空气污染预测技术领域。
背景技术
为了促进城市公共健康和社会的可持续发展,需要一个准确、有效、稳定的PM2.5浓度预测模型。人类长期暴露在高浓度的PM2.5中会显著增加其患病风险,使人体自身的呼吸***、神经***、心血管***及生殖***遭受严重损害。如何对PM2.5浓度进行精确化预测,已成为大气环境保护和公众健康的重要研究课题。
在PM2.5浓度预测建模方面,已有很多先驱性工作。这些研究大致可以分为4类,即传统的线性统计模型和时间序列模型、浅层神经网络、基于深度学习的建模和专业模型。专业模型基于气象、物化反应等先验知识模拟并预测PM2.5的扩散与演化,但物化反应中关键知识的不足将导致模型预测表现欠佳。传统的线性统计模型和基于时间序列的方法不能反映复杂的非线性***。浅层神经网络对非线性***有一定反映能力,但不适用于对复杂函数的表达,从而制约了其泛化能力。深度学习中的LSTM、GRU等RNN变种模型利用长期记忆机制捕获时序中的时间依赖性关系,然而,这些基于RNN的序列建模存在迭代传播耗时、梯度***和梯度消失的问题。图模型可以提高预测精度,因为空间依赖关系可以通过图节点和图之间的边权值自然地表达出来。现有的图模型假设一个节点的未来信息取决于其历史信息及其邻居的历史信息,更倾向于依赖马尔可夫假设来使跨变量交互的建模更易于处理。然而在某些情况下,连接并不包含两个节点之间的相互依赖关系,更不用说图节点之间还存在连接缺失的问题。基于CNN的方法具有计算并行和梯度稳定的优势,可以通过卷积核捕获局部接收野的空间信息,通过多层卷积和池化获得全局空间特征。然而,这些方法必须堆叠许多层或使用全局池化来扩展神经网络模型的接收野,内存的需求可能成为一个潜在问题。基于卷积神经网络(CNN)的因果卷积网络(CCN)在高精度时空粒度条件下对动态非线性***具有较强的模拟和预测能力,其体系结构相对简单。然而,CCN在大气污染物浓度预测中的研究还很少。
PM2.5浓度预测研究基于地面空气监测站点的历史数据进行建模、预测、分析。在建模过程中,影响因子的选择尚未有具体标准。大量研究表明,考虑监测站点间的空间相关性可大大提升模型对目标站点PM2.5浓度的预测性能。一些研究人员通过提取目标站点与周边站点的时空相关性来预测PM2.5,取得了更准确、更稳定的预测性能。此外,多源环境因素如风、温度、湿度、大气压等会对空气污染物的扩散、演化较强的驱动作用。当前研究采用的空间相关特征提取方法无法提取全面、有代表性的空间站点信息支撑预测,另外当前研究忽略了时空影响因素与多源环境因素的融合。
发明内容
本发明解决的问题是:提出了一种基于多维要素大气PM2.5浓度预测方法。为了捕获非线性影响因子,将站点间的时空相关性、气象因子和不同污染物之间的相互作用纳入PM2.5浓度预测模型。利用注意机制和堆叠膨胀卷积重写一个基于CNN的因果卷积网络进行时空特征的提取。为PM2.5浓度预测提供一个可扩展、通用、健壮的STCCN模型,为未来研究多影响因素、多数据源和多卷积结构提供了一个开放性框架。
本发明的技术解决方案为:本发明提出了一种基于多维要素大气PM2.5浓度预测方法,该方法集成了时空特征和大气环境因素,提出了基于时空因果卷积网络(STCCN)的PM2.5浓度预测模型,以提升大气PM2.5浓度预测的精度。采用相关性分析、卷积神经网络与空间注意力机制,提取与目标站点空间强相关的站点信息;融合时间注意力机制和堆叠膨胀卷积进行时间依赖特征的提取。然后进行了模型学习率、膨胀卷积内核、滑动窗口等超参数调优实验以辅助优化PM2.5浓度预测模型。最后将多维特征数据集用于对该PM2.5浓度预测模型的训练,得出对目标站点PM2.5浓度的精确化预测值。
该方法的具体步骤如下:
(1)数据准备:将采集到的多站点空气质量指数、气象数据天级数据存储至表格文件生成站点数据,所述的站点数据包括PM2.5、AQI、PM2.5_IAQI、PM10_IAQI、CO_IAQI、SO2_IAQI、NO2_IAQI、O3_IAQI、风速、湿度共十项特征;
(2)站点数据预处理,具体步骤包括:
(a)缺失值处理。对采集到的多站点空气质量指数和气象数据中的缺失值进行填充。对于单一缺失值采用一阶拉格朗日线性插值(线性插值),对于连续多缺失值采用临近日期内相同时间段的数据进行填充,使得整体站点数据符合变化规律。
(b)特征值选择。采用斯皮尔曼相关系数来计算输入特征与PM2.5浓度的相关性,为避免输入多重共线性的影响,选择与PM2.5强相关且彼此线性无关的特征组作为模型输入。经过计算选择了AQI、PM2.5_IAQI、PM10_IAQI、CO_IAQI、SO2_IAQI、NO2_IAQI、O3_IAQI、风速、湿度作为输入PM2.5浓度预测模型的特征。
(3)采用相关性分析、卷积神经网络与空间注意力机制,提取与目标站点空间强相关的站点信息,具体步骤包括:
(a)采用斯皮尔曼秩相关分析方法分析目标站点与周边站点之间的空间相关性。计算公式如下所示:
Figure BDA0003895702540000031
Yi是第i个目标站点PM2.5历史记录的降序排列,
Figure BDA0003895702540000032
表示第i个目标站点周围第k个站点的PM2.5序列记录,N为目标站点的总数,ρ_list是计算出的目标站点与所有站点之间的相关性系数,如下所示:
ρ_list=[ρ(Y*,Y1),ρ(Y*,Y2),...,ρ(Y*,YM)] (2)
表示目标站点的PM2.5浓度序列,Y1、Y2、Ym分别第1、第2、第M个站点的PM2.5浓度序列。ρ表示斯皮尔曼秩相关分析方法,用于计算两个序列间的相关性。
将相关性系数和优化后的阈值ρth比较,最终得到与目标站点相关性系数大于ρth的所有站点数据的集合X如下:
X={Xi|ρ(Y*,Yi)>ρth,i∈1,...,N} (3)
在式(3)中,Xi∈RT×L为第i个与目标站点空间强相关站点的特征矩阵,X∈RM×T×L代表与目标站点空间强相关站点的三维特征矩阵,其中M<=N。
(b)利用一维卷积核,对X∈RM×T×L中M个通道的特征值进行线性组合进行升维操作,经过升维处理后三维矩阵为
Figure BDA0003895702540000041
其中Mnew表示通道数量,T表示历史数据的时间步长,L表示特征维数。
(c)降维处理主要针对多站点特征矩阵即经过升维处理后三维矩阵
Figure BDA0003895702540000042
Figure BDA0003895702540000043
中最重要的特征信息,提取各通道第k项特征与目标站点第k项特征的相关性系数,基于相关性系数计算权重分布。循环相关性系数计算权重分布过程将多通道信息整合成二维矩阵。
对目标站点的第k项特征与特征矩阵中第k项特征进行相关性分析,计算斯皮尔曼相关系数。计算公式如下所示:
Figure BDA0003895702540000044
在(4)式中
Figure BDA0003895702540000045
表示第m个通道第k项特征的序列与目标序列的相关性,Spearman()表示斯皮尔曼秩相关系数计算方法,
Figure BDA0003895702540000046
表示目标站点的第k项特征序列,
Figure BDA0003895702540000047
表示第m个通道的第k项特征序列。引入类似SoftMax的计算方法对相关系数进行数值变换,将原始相关系数排序成概率分布,各元素权值之和为1,计算出重要特征序列的权值
Figure BDA0003895702540000048
计算公式如下:
Figure BDA0003895702540000049
其中
Figure BDA00038957025400000410
表示第m个通道的第k个特征序列的注意力权重,j为通道序号。
最后,将各通道的第k项特征序列乘以对应的权重值再求和,将各站点第k项特征序列聚合为最终序列,由聚合后的各项特征序列构成二维特征矩阵。因此最终降维聚合后的特征序列Ak及特征矩阵A应如以下公式所示:
Figure BDA00038957025400000411
式(6)中,A1、Ak分别表示第1项、第k项特征聚合后的序列。l表示特征个数,Al表示最后一项特征聚合后的序列。
(4)融合时间注意力机制和堆叠膨胀卷积进行时间依赖特征的提取,具体步骤包括;
(a)膨胀卷积与普通卷积的卷积核大小和卷积操作是一样的,即参数的数量不变。不同的是膨胀卷积引入了扩张率,允许卷积核处理数据时跳过d个数据进行处理,即间隔采样,不需扩展网络深度就可以增大感受野获得长距离的历史数据,不仅降低了空间损失和信息损失同时使得数据分析和特征提取更全面,有利于提高预测精度。在xt处的膨胀因子为d的膨胀卷积如下所示:
Figure BDA0003895702540000051
如公式(7)所示,F=(f1,f2,···,fK)表示波虑器,序列X=(x1,x2,···,xT),*d为膨胀卷积运算符。K表示膨胀卷积内核大小,T代表历史数据时长。STCCN的PM2.5浓度预测模型的膨胀卷积内核采用超参数调优后的参数值,将膨胀卷积网络深度设置为4,且使用d=2n(n是网络深度)的膨胀因子,以此来保证预测结果覆盖到长期有效的历史数据,避免引入过多的噪声数据。
本方法考虑多源因素(空气污染物、气象因素)以及PM2.5的时空分布特征对PM2.5预测的影响,采用CNN与CCN构建端到端的PM2.5预测工作链(STCCN),并引入时空注意力机制提升模型的时空特征提取能力。STCCN能够在高精度时空粒度条件下对PM2.5具有较强的模拟和预测能力。该模型主要包含两部分:基于步骤(3)的融合卷积神经网络和空间注意力的空间特征提取模块,基于步骤(4)的融合时间注意力和堆叠膨胀卷积的时间特征提取模块。为使该模型逼近最优预测性能,基于步骤(5)中的方法对模型的超参数进行调优。
(5)超参数调优,具体步骤包括:
(a)学习率选择。设置STCCN的PM2.5浓度预测模型学习率值为0.1、0.005、0.001、0.0005和0.0001进行对比实验,通过实验结果可知,选择学习率为0.001预测表现最优;
(b)内核大小选择。设置STCCN的PM2.5浓度预测模型内核大小分别为2、3、4、5和6进行实验,通过对实验结果对比可知,STCCN的PM2.5浓度预测模型内核大小为4时模型表现最佳;
(c)滑动窗口选择。借鉴时间注意力机制的原理,将滑动窗口步长设定在3~24的范围内,筛选表现最优的滑动窗口尺寸,通过对比实验结果可知,选择滑动窗口尺寸为24进行后续的研究;
(d)以上(a)—(c)的对比实验中,每一次调整STCCN的PM2.5浓度预测模型参数时,均在数据集中进行十次随机采样。利用采样后的十组数据,在相同模型参数的条件下训练模型。十次训练得到的预测性能值取平均作为该模型参数的最终预测性能,本发明使用此方法来更精准的提取最优参数。
(6)对参数调优后的STCCN的PM2.5浓度预测模型进行训练,具体步骤包括:
(a)利用预处理后的数据集训练参数调优后的STCCN的PM2.5浓度预测模型。
(b)Baseline参数设置及实验结果对比。基于平稳时间序列的自回归模型(AR),通过F检验选择合适的阶数P=3,采用自适应的方法预测。滑动平均模型MA首先确定模型的阶P=3,其次确定历史数据与当前数据的自相关性进行预测。基于非平稳时间序列的ARMA模型经过平稳性检验、模型识别和检验确定模型,将ARMA模型的p、q阶数分别设置为5、6。人工神经网络(ANN)可将其看作是从输入空间到输出空间的一个非线性映射,ANN模型设置包含有两个隐藏层,每个隐藏层各包含50个神经元,使用ReLU激活函数与Adam随机梯度优化器等模型参数。支持向量机回归(SVR)选择适当的函数子集、判别函数以及RBF核函数和参数值C=1000完成预测。GRU模型设置舍弃率为0.2、隐藏层为1和隐藏节点数(16,25)进行实验。LSTM模型对前向信息特别是长距离前向信息有很好的保留作用,此实验采用三层隐含层,节点数分别为30、50、70,学习率为1。我们还考虑了一种名为STGCN的基于图的模型。STGCN区块三层通道分别为64、16和64。STGCN将图卷积核大小K和时间卷积核大小Kt设置为3。通过实验结果可知,STCCN的PM2.5浓度预测模型RMSE、MAE和R2性能指标均优于基准PM2.5浓度预测模型。
(7)基于前述步骤2预处理后的数据,将数据输入步骤6参数调优后的模型中,输出所有站点未来一天PM2.5浓度预测值。
本发明与现有技术相比的优点在于:本发明将站点间的时空相关性、气象因子和不同污染物之间的相互作用纳入PM2.5浓度预测模型,同时扩展了时域之间的卷积,克服了传统RNN、LSTM模型的弊端。该模型利用注意机制和堆叠膨胀卷积重写了一个基于CNN的因果卷积网络优化了时空特征的提取。为PM2.5浓度预测提供了一个可扩展、通用、健壮的STCCN模型,为未来研究多影响因素、多数据源和多卷积结构提供了一个开放性框架,可以应用于不同地区的各类空气污染物浓度预测任务,从而有效防范高浓度空气污染物对人类的危害。
附图说明
图1是本发明的整体步骤流程图。
图2是本发明空间特征提取框架图。
图3是本发明时间特征提取框架图。
图4是本发明的超参数调优中的模型性能对比图。
具体实施方式
(1)数据准备:
(a)从某地区空气监测站监测的数据中截取了2017年1月1日至2017年12月31日的空气质量指数、气候天级数据包括PM2.5、AQI、PM2.5_IAQI、PM10_IAQI、CO_IAQI、SO2_IAQI、NO2_IAQI、O3_IAQI、风速、湿度共十项特征,并存入站点数据文件,其中由id标识不同站点,每个特征的变量名为PM2.5_Concentration、AQI、PM2.5、PM10、NO2、CO、O3、SO2、humidity、wind_speed;
(2)数据预处理,具体步骤包括:
(a)缺失值的处理。各站点数据文件中的天级数据中存在缺值的情况,对于单一缺失值采用一阶拉格朗日线性插值(线性插值),对于连续多缺失值采用临近日期内相同时间段的数据进行填充,使得整体数据符合变化规律。
(b)特征值选择。采用了斯皮尔曼相关性系数来识别与PM2.5强相关的特征并剔除,首先引入Python中的state包,调用sperman()函数,依次计算AQI、PM10、NO2、CO、O3、SO2、humidity、wind_speed特征序列与PM2.5浓度的相关性系数,最终确定PM2.5_Concentration、AQI、PM2.5_IAQI、PM10_IAQI、CO_IAQI、SO2_IAQI、NO2_IAQI、O3_IAQI、风速、湿度共十项天级数据构成特征矩阵作为模型的输入。
(3)采用相关性分析、卷积神经网络与空间注意力机制,提取与目标站点空间强相关的站点信息,具体步骤包括:
(a)采用斯皮尔曼秩相关分析方法分析了目标站点与周边站点之间的空间相关性。计算公式如下所示:
Figure BDA0003895702540000081
Yi是第i个目标站点PM2.5历史记录的降序排列,
Figure BDA0003895702540000082
表示第i个目标站点周围第k个站点的PM2.5序列记录。ρ_list是我们计算出的目标站点与所有站点之间的相关系数。如下所示:
ρ_list=[ρ(Y*,Y1),ρ(Y*,Y2),...,ρ(Y*,YM)] (2)
Y*表示目标站点的PM2.5浓度序列,Y1、Y2、YM分别第1、第2、第M个站点的PM2.5浓度序列。ρ表示斯皮尔曼秩相关分析方法,用于计算两个序列间的相关性。
将相关性系数和优化后的阈值比较,最终得到与目标站点相关性系数大于ρth的所有站点数据的集合如下:
X={Xi|ρ(Y*,Yi)>ρth,i∈1,...,N} (3)
在(3)式中,Xi∈RT×L为第i个与目标站点空间强相关站点的特征矩阵,X∈RM×T×L代表与目标站点空间强相关站点的三维特征矩阵,其中M<=N。
(b)利用一维卷积核,对X∈RM×T×L中M个通道的特征值进行线性组合进行升维操作,经过升维处理后三维矩阵为
Figure BDA0003895702540000083
其中Mnew表示通道数量,T表示历史数据的时间步长,L表示特征维数。
(c)降维处理主要针对多站点特征矩阵
Figure BDA0003895702540000084
中最重要的特征信息,提取各通道第k项特征与目标站点第k项特征的相关性系数,基于相关性系数计算权重分布。循环此过程将多通道信息整合成二维矩阵。
对目标站点的第k项特征与特征矩阵中第k项特征进行相关性分析,计算斯皮尔曼相关系数。计算公式如下所示:
Figure BDA0003895702540000085
在(4)式中
Figure BDA0003895702540000086
表示第m个通道第k项特征的序列与目标序列的相关性,Spearman()表示斯皮尔曼秩相关系数计算方法,
Figure BDA0003895702540000087
表示目标站点的第k项特征序列,
Figure BDA0003895702540000091
表示第m个通道的第k项特征序列。引入类似SoftMax的计算方法对相关系数进行数值变换,将原始相关系数排序成概率分布,各元素权值之和为1,计算出重要特征序列的权值
Figure BDA0003895702540000092
计算公式如下:
Figure BDA0003895702540000093
其中
Figure BDA0003895702540000094
表示第m个通道的第k个特征序列的注意力权重,j为通道序号。
最后,将各通道的第k项特征序列乘以对应的权重值再求和,将各站点第k项特征序列聚合为最终序列,由聚合后的各项特征序列构成二维特征矩阵。因此最终降维聚合后的特征序列Ak及特征矩阵A应如以下公式所示:
Figure BDA0003895702540000095
(6)式中A1、Ak分别表示第1项、第k项特征聚合后的序列。l表示特征个数,Al表示最后一项特征聚合后的序列。
(4)融合时间注意力机制和堆叠膨胀卷积进行时间依赖特征的提取,具体步骤包括;
(a)调用Python中的torch包下的Conv2d()函数构建膨胀卷积网络。膨胀卷积与普通卷积的卷积核大小和卷积操作是一样的,即参数的数量不变。不同的是膨胀卷积引入了扩张率,允许卷积核处理数据时跳过(d-1)个数据进行处理,即间隔采样,不需扩展网络深度就可以增大感受野获得长距离的历史数据,不仅降低了空间损失和信息损失同时使得数据分析和特征提取更全面,有利于提高预测精度。在xt处的膨胀因子为d的膨胀卷积如下所示:
Figure BDA0003895702540000096
如公式(7)所示,F=(f1,f2,···,fK)表示波虑器,序列X=(x1,x2,···,xT),*d为膨胀卷积运算符。K表示膨胀卷积内核大小,T代表历史数据时长。本文中模型的膨胀卷积内核采用超参数调优后的参数值,将膨胀卷积网络深度设置为4,且使用d=2n(n是网络深度)的膨胀因子,以此来保证预测结果覆盖到长期有效的历史数据,避免引入过多的噪声数据。
(5)超参数调优,具体步骤包括:
(a)学习率选择。设置参数配置文件内模型学习率lr为0.1、0.005、0.001、0.0005和0.0001进行对比实验,通过实验结果可知,选择学习率为0.001预测表现最优;
(b)内核大小选择。设置参数配置文件内模型内核kernel_size分别为2、3、4、5和6进行实验,通过对实验结果对比可知,模型内核大小为4时模型表现最佳;
(c)滑动窗口选择。借鉴时间注意力机制的原理,将滑动窗口sliding_window步长设定在3~24的范围内,筛选表现最优的滑动窗口尺寸,通过对比实验结果可知,选择滑动窗口尺寸为24进行后续的研究;
(d)以上(a)—(c)的对比实验中,每一次调整模型参数时,均在数据集中进行十次随机采样。利用采样后的十组数据,在相同模型参数的条件下训练模型。十次训练得到的预测性能值取平均作为该模型参数的最终预测性能,本发明使用此方法来更精准的提取最优参数。
(6)对参数调优后的STCCN模型进行训练,具体步骤包括:
(a)利用预处理后的数据集训练参数调优后的STCCN模型。
(b)Baseline参数设置及实验结果对比。基于平稳时间序列的自回归模型(AR),通过F检验选择合适的阶数P=3,采用自适应的方法预测。滑动平均模型MA首先确定模型的阶P=3,其次确定历史数据与当前数据的自相关性进行预测。基于非平稳时间序列的ARMA模型经过平稳性检验、模型识别和检验确定模型,将ARMA模型的p、q阶数分别设置为5、6。人工神经网络(ANN)可将其看作是从输入空间到输出空间的一个非线性映射,ANN模型设置包含有两个隐藏层,每个隐藏层各包含50个神经元,使用ReLU激活函数与Adam随机梯度优化器等模型参数。支持向量机回归(SVR)选择适当的函数子集、判别函数以及RBF核函数和参数值C=1000完成预测。GRU模型设置舍弃率为0.2、隐藏层为1和隐藏节点数(16,25)进行实验。LSTM模型对前向信息特别是长距离前向信息有很好的保留作用,此实验采用三层隐含层,节点数分别为30、50、70,学习率为1。我们还考虑了一种名为STGCN的基于图的模型。STGCN区块三层通道分别为64、16和64。STGCN将图卷积核大小K和时间卷积核大小Kt设置为3。通过实验结果可知,STCCN模型RMSE、MAE和R2性能指标均优于基准模型。
(7)基于前述步骤2预处理后的数据,将数据输入步骤6参数调优后的模型中,输出所有站点未来一天PM2.5浓度预测值。
本发明与现有技术相比的优点在于:本发明将站点间的时空相关性、气象因子和不同污染物之间的相互作用纳入PM2.5浓度预测模型,同时扩展了时域之间的卷积,克服了传统RNN、LSTM模型的弊端。该模型利用注意机制和堆叠膨胀卷积重写了一个基于CNN的因果卷积网络优化了时空特征的提取。为PM2.5浓度预测提供了一个可扩展、通用、健壮的STCCN模型,为未来研究多影响因素、多数据源和多卷积结构提供了一个开放性框架,可以应用于不同地区的各类空气污染物浓度预测任务,从而有效防范高浓度空气污染物对人类的危害。

Claims (5)

1.一种基于多维要素大气PM2.5浓度预测方法,其特征在于:该方法的具体步骤如下:
(1)数据准备:将采集到的多站点空气质量指数、气象数据天级数据存储至表格文件生成站点数据,所述的站点数据包括PM2.5、AQI、PM2.5_IAQI、PM10_IAQI、CO_IAQI、SO2_IAQI、NO2_IAQI、O3_IAQI、风速、湿度共十项特征;
(2)站点数据预处理;
(3)采用相关性分析、卷积神经网络与空间注意力机制,提取与目标站点空间强相关的站点信息,
(4)融合时间注意力机制和堆叠膨胀卷积进行时间依赖特征的提取,具体步骤包括;
(a)膨胀卷积与普通卷积的卷积核大小和卷积操作是一样的,即参数的数量不变;膨胀卷积引入扩张率,允许卷积核处理数据时跳过d个数据进行处理,即间隔采样;在xt处的膨胀因子为d的膨胀卷积如下所示:
Figure FDA0003895702530000011
如公式(7)所示,F=(f1,f2,···,fK)表示波虑器,序列X=(x1,x2,···,xT),*d为膨胀卷积运算符;K表示膨胀卷积内核大小,T代表历史数据时长;STCCN的PM2.5浓度预测模型的膨胀卷积内核采用超参数调优后的参数值;
考虑空气污染物、气象因素以及PM2.5的时空分布特征对PM2.5预测的影响,采用CNN与CCN构建端到端的PM2.5预测工作链STCCN,包含两部分:基于步骤(3)的融合卷积神经网络和空间注意力的空间特征提取模块,基于步骤(4)的融合时间注意力和堆叠膨胀卷积的时间特征提取模块;
(5)超参数调优,具体步骤包括:
(a)学习率选择;设置STCCN的PM2.5浓度预测模型学习率值;
(b)内核大小选择;设置STCCN的PM2.5浓度预测模型内核进行实验;
(c)滑动窗口选择;将滑动窗口步长设定在3~24的范围内,筛选表现最优的滑动窗口尺寸;
(d)以上(a)—(c)的对比实验中,每一次调整STCCN的PM2.5浓度预测模型参数时,均在数据集中进行十次随机采样;利用采样后的十组数据,在相同模型参数的条件下训练模型;十次训练得到的预测性能值取平均作为该模型参数的最终预测性能,精准提取最优参数;
(6)对参数调优后的STCCN的PM2.5浓度预测模型进行训练,具体步骤包括:
(a)利用预处理后的数据集训练参数调优后的STCCN的PM2.5浓度预测模型;
(b)Baseline参数设置获得调优后的STCCN的PM2.5浓度预测模型;
(7)基于前述步骤2预处理后的数据,将数据输入步骤6参数调优后的STCCN的PM2.5浓度预测模型中,输出所有站点未来一天PM2.5浓度预测值。
2.根据权利要求1所述的一种基于多维要素大气PM2.5浓度预测方法,其特征在于:步骤(2)的具体步骤包括如下,
(a)缺失值处理;对采集到的多站点空气质量指数和气象数据中的缺失值进行填充;对于单一缺失值采用一阶拉格朗日线性插值,对于连续多缺失值采用临近日期内相同时间段的数据进行填充,使得整体站点数据符合变化规律;
(b)特征值选择;采用斯皮尔曼相关系数来计算输入特征与PM2.5浓度的相关性,选择与PM2.5强相关且彼此线性无关的特征组作为模型输入;经过计算选择AQI、PM2.5_IAQI、PM10_IAQI、CO_IAQI、SO2_IAQI、NO2_IAQI、O3_IAQI、风速、湿度作为输入PM2.5浓度预测模型的特征。
3.根据权利要求1所述的一种基于多维要素大气PM2.5浓度预测方法,其特征在于:步骤(3)的具体步骤包括如下,
(a)采用斯皮尔曼秩相关分析方法分析目标站点与周边站点之间的空间相关性;计算公式如下所示:
Figure FDA0003895702530000021
Yi是第i个目标站点PM2.5历史记录的降序排列,
Figure FDA0003895702530000022
表示第i个目标站点周围第k个站点的PM2.5序列记录,N为目标站点的总数,ρ_list是计算出的目标站点与所有站点之间的相关性系数,如下所示:
ρ_list=[ρ(Y*,Y1),ρ(Y*,Y2),...,ρ(Y*,YM)] (2)
表示目标站点的PM2.5浓度序列,Y1、Y2、YM分别第1、第2、第M个站点的PM2.5浓度序列;ρ表示斯皮尔曼秩相关分析方法,用于计算两个序列间的相关性;
将相关性系数和优化后的阈值ρth比较,最终得到与目标站点相关性系数大于ρth的所有站点数据的集合X如下:
X={Xi|ρ(Y*,Yi)>ρth,i∈1,...,N} (3)
在式(3)中,Xi∈RT×L为第i个与目标站点空间强相关站点的特征矩阵,X∈RM×T×L代表与目标站点空间强相关站点的三维特征矩阵,其中M<=N;
(b)利用一维卷积核,对X∈RM×T×L中M个通道的特征值进行线性组合进行升维操作,经过升维处理后三维矩阵为
Figure FDA0003895702530000031
其中Mnew表示通道数量,T表示历史数据的时间步长,L表示特征维数;
(c)降维处理针对多站点特征矩阵即经过升维处理后三维矩阵
Figure FDA0003895702530000032
Figure FDA0003895702530000033
中最重要的特征信息,提取各通道第k项特征与目标站点第k项特征的相关性系数,基于相关性系数计算权重分布;循环相关性系数计算权重分布过程将多通道信息整合成二维矩阵;
对目标站点的第k项特征与特征矩阵中第k项特征进行相关性分析,计算斯皮尔曼相关系数;计算公式如下所示:
Figure FDA0003895702530000034
在(4)式中
Figure FDA0003895702530000035
表示第m个通道第k项特征的序列与目标序列的相关性,Spearman()表示斯皮尔曼秩相关系数计算方法,
Figure FDA0003895702530000036
表示目标站点的第k项特征序列,
Figure FDA0003895702530000037
表示第m个通道的第k项特征序列;引入类似SoftMax的计算方法对相关系数进行数值变换,将原始相关系数排序成概率分布,各元素权值之和为1,计算出重要特征序列的权值
Figure FDA0003895702530000038
计算公式如下:
Figure FDA0003895702530000039
其中
Figure FDA00038957025300000310
表示第m个通道的第k个特征序列的注意力权重,j为通道序号;
将各通道的第k项特征序列乘以对应的权重值再求和,将各站点第k项特征序列聚合为最终序列,由聚合后的各项特征序列构成二维特征矩阵;因此最终降维聚合后的特征序列Ak及特征矩阵A应如以下公式所示:
Figure FDA0003895702530000041
式(6)中,A1、Ak分别表示第1项、第k项特征聚合后的序列;l表示特征个数,Al表示最后一项特征聚合后的序列。
4.根据权利要求1所述的一种基于多维要素大气PM2.5浓度预测方法,其特征在于:步骤(6)的Baseline参数设置中,基于平稳时间序列的自回归模型AR,通过F检验选择合适的阶数P=3,采用自适应的方法预测;滑动平均模型MA首先确定模型的阶P=3,其次确定历史数据与当前数据的自相关性进行预测;基于非平稳时间序列的ARMA模型经过平稳性检验、模型识别和检验确定模型,将ARMA模型的p、q阶数分别设置为5、6;人工神经网络ANN将其看作是从输入空间到输出空间的一个非线性映射,ANN模型设置包含有两个隐藏层,每个隐藏层各包含50个神经元,使用ReLU激活函数与Adam随机梯度优化器等模型参数;支持向量机回归SVR选择适当的函数子集、判别函数以及RBF核函数和参数值C=1000完成预测;LSTM模型采用三层隐含层,节点数分别为30、50、70,学习率为1;STGCN区块三层通道分别为64、16和64;STGCN将图卷积核大小K和时间卷积核大小Kt设置为3。
5.根据权利要求1所述的一种基于多维要素大气PM2.5浓度预测方法,其特征在于:公式7中,膨胀卷积网络深度设置为4,且使用d=2n的膨胀因子,以此来保证预测结果覆盖到长期有效的历史数据,避免引入过多的噪声数据,n是网络深度。
CN202211273842.5A 2022-10-18 2022-10-18 一种基于多维要素大气pm2.5浓度预测方法 Pending CN115510760A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211273842.5A CN115510760A (zh) 2022-10-18 2022-10-18 一种基于多维要素大气pm2.5浓度预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211273842.5A CN115510760A (zh) 2022-10-18 2022-10-18 一种基于多维要素大气pm2.5浓度预测方法

Publications (1)

Publication Number Publication Date
CN115510760A true CN115510760A (zh) 2022-12-23

Family

ID=84511408

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211273842.5A Pending CN115510760A (zh) 2022-10-18 2022-10-18 一种基于多维要素大气pm2.5浓度预测方法

Country Status (1)

Country Link
CN (1) CN115510760A (zh)

Similar Documents

Publication Publication Date Title
CN109492822B (zh) 空气污染物浓度时空域关联预测方法
US20220214322A1 (en) Air pollutants concentration forecasting method and apparatus and storage medium
CN110674604A (zh) 基于多维时序帧卷积lstm的变压器dga数据预测方法
CN112910711B (zh) 一种基于自注意力卷积网络的无线业务流量预测方法、设备及介质
CN114565124B (zh) 一种基于改进图卷积神经网络的船舶交通流预测方法
CN111275962B (zh) 车辆轨迹数据聚集效应预测方法及装置
CN110443417A (zh) 基于小波变换的多模型集成负荷预测方法
CN111047078B (zh) 交通特征预测方法、***及存储介质
CN113962489A (zh) 一种基于st-ccn-pm2.5的pm2.5浓度细粒度预测方法
CN116128141B (zh) 风暴潮预测方法、装置、存储介质及电子设备
CN114662791A (zh) 一种基于时空注意力的长时序pm2.5预测方法及***
CN114596726A (zh) 基于可解释时空注意力机制的停车泊位预测方法
CN116311921A (zh) 一种基于多空间尺度时空Transformer的交通速度预测方法
CN115879619A (zh) 一种变电站日前碳排放因子预测方法及***
CN116432861A (zh) 一种综合能源***源荷价多任务联合预测方法及***
CN117293809A (zh) 一种基于大模型的多时空尺度新能源发电功率预测方法
CN114609008A (zh) 一种气体浓度预测模型的训练方法和气体浓度预测方法
Tzoumpas et al. A data filling methodology for time series based on CNN and (Bi) LSTM neural networks
CN117154704B (zh) 一种基于多尺度时空图注意力卷积网络的光伏功率预测方法
CN111985731B (zh) 城市公共交通站点人数的预测方法及***
CN116525135B (zh) 基于气象因素的时空模型对疫情发展态势进行预测的方法
CN116187561A (zh) 一种基于空间时域卷积网络的pm10浓度精细化预测方法
CN117131654A (zh) 基于预分析初猜值条件非线性最优扰动的目标观测方法
CN115510760A (zh) 一种基于多维要素大气pm2.5浓度预测方法
CN111325384B (zh) 一种结合统计特征和卷积神经网络模型的ndvi预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination