CN115510760A

CN115510760A - 一种基于多维要素大气pm2.5浓度预测方法

Info

Publication number: CN115510760A
Application number: CN202211273842.5A
Authority: CN
Inventors: 田莉; 王振波; 刘希亮
Original assignee: Institute of Geographic Sciences and Natural Resources of CAS
Current assignee: Institute of Geographic Sciences and Natural Resources of CAS
Priority date: 2022-10-18
Filing date: 2022-10-18
Publication date: 2022-12-23

Abstract

本发明公开了一种基于多维要素大气PM_2.5浓度预测方法，本方法对采集到的多站点空气污染物及气象数据进行了数据插值、特征选择等预处理作为模型输入；采用相关性分析、卷积神经网络与空间注意力机制，提取与目标站点空间强相关的站点信息；融合时间注意力机制和堆叠膨胀卷积进行时间依赖特征的提取。然后进行了模型学习率、膨胀卷积内核、滑动窗口等超参数调优实验以辅助优化模型。最后将多维特征数据集用于对该模型的训练，得出对目标站点PM_2.5浓度的精确化预测值。本发明克服了RNN变种模型在时序预测中存在的梯度问题、复杂体系结构等弊端，且为PM_2.5浓度细粒度预测提供了一个开放研究框架。

Description

一种基于多维要素大气PM2.5浓度预测方法

技术领域

本发明涉及空气污染物浓度预测、基于深度学习建模等技术，具体涉及一种基于多维要素大气PM_2.5浓度预测方法，属于空气污染预测技术领域。

背景技术

为了促进城市公共健康和社会的可持续发展，需要一个准确、有效、稳定的PM_2.5浓度预测模型。人类长期暴露在高浓度的PM_2.5中会显著增加其患病风险，使人体自身的呼吸***、神经***、心血管***及生殖***遭受严重损害。如何对PM_2.5浓度进行精确化预测，已成为大气环境保护和公众健康的重要研究课题。

在PM_2.5浓度预测建模方面，已有很多先驱性工作。这些研究大致可以分为4类，即传统的线性统计模型和时间序列模型、浅层神经网络、基于深度学习的建模和专业模型。专业模型基于气象、物化反应等先验知识模拟并预测PM_2.5的扩散与演化，但物化反应中关键知识的不足将导致模型预测表现欠佳。传统的线性统计模型和基于时间序列的方法不能反映复杂的非线性***。浅层神经网络对非线性***有一定反映能力，但不适用于对复杂函数的表达，从而制约了其泛化能力。深度学习中的LSTM、GRU等RNN变种模型利用长期记忆机制捕获时序中的时间依赖性关系，然而，这些基于RNN的序列建模存在迭代传播耗时、梯度***和梯度消失的问题。图模型可以提高预测精度，因为空间依赖关系可以通过图节点和图之间的边权值自然地表达出来。现有的图模型假设一个节点的未来信息取决于其历史信息及其邻居的历史信息，更倾向于依赖马尔可夫假设来使跨变量交互的建模更易于处理。然而在某些情况下，连接并不包含两个节点之间的相互依赖关系，更不用说图节点之间还存在连接缺失的问题。基于CNN的方法具有计算并行和梯度稳定的优势，可以通过卷积核捕获局部接收野的空间信息，通过多层卷积和池化获得全局空间特征。然而，这些方法必须堆叠许多层或使用全局池化来扩展神经网络模型的接收野，内存的需求可能成为一个潜在问题。基于卷积神经网络(CNN)的因果卷积网络(CCN)在高精度时空粒度条件下对动态非线性***具有较强的模拟和预测能力，其体系结构相对简单。然而，CCN在大气污染物浓度预测中的研究还很少。

PM_2.5浓度预测研究基于地面空气监测站点的历史数据进行建模、预测、分析。在建模过程中，影响因子的选择尚未有具体标准。大量研究表明，考虑监测站点间的空间相关性可大大提升模型对目标站点PM_2.5浓度的预测性能。一些研究人员通过提取目标站点与周边站点的时空相关性来预测PM_2.5，取得了更准确、更稳定的预测性能。此外，多源环境因素如风、温度、湿度、大气压等会对空气污染物的扩散、演化较强的驱动作用。当前研究采用的空间相关特征提取方法无法提取全面、有代表性的空间站点信息支撑预测，另外当前研究忽略了时空影响因素与多源环境因素的融合。

发明内容

本发明解决的问题是：提出了一种基于多维要素大气PM_2.5浓度预测方法。为了捕获非线性影响因子，将站点间的时空相关性、气象因子和不同污染物之间的相互作用纳入PM_2.5浓度预测模型。利用注意机制和堆叠膨胀卷积重写一个基于CNN的因果卷积网络进行时空特征的提取。为PM_2.5浓度预测提供一个可扩展、通用、健壮的STCCN模型，为未来研究多影响因素、多数据源和多卷积结构提供了一个开放性框架。

本发明的技术解决方案为：本发明提出了一种基于多维要素大气PM_2.5浓度预测方法，该方法集成了时空特征和大气环境因素，提出了基于时空因果卷积网络(STCCN)的PM_2.5浓度预测模型，以提升大气PM_2.5浓度预测的精度。采用相关性分析、卷积神经网络与空间注意力机制，提取与目标站点空间强相关的站点信息；融合时间注意力机制和堆叠膨胀卷积进行时间依赖特征的提取。然后进行了模型学习率、膨胀卷积内核、滑动窗口等超参数调优实验以辅助优化PM_2.5浓度预测模型。最后将多维特征数据集用于对该PM_2.5浓度预测模型的训练，得出对目标站点PM_2.5浓度的精确化预测值。

该方法的具体步骤如下：

(1)数据准备：将采集到的多站点空气质量指数、气象数据天级数据存储至表格文件生成站点数据，所述的站点数据包括PM_2.5、AQI、PM_2.5_IAQI、PM₁₀_IAQI、CO_IAQI、SO₂_IAQI、NO₂_IAQI、O₃_IAQI、风速、湿度共十项特征；

(2)站点数据预处理，具体步骤包括：

(a)缺失值处理。对采集到的多站点空气质量指数和气象数据中的缺失值进行填充。对于单一缺失值采用一阶拉格朗日线性插值(线性插值)，对于连续多缺失值采用临近日期内相同时间段的数据进行填充，使得整体站点数据符合变化规律。

(b)特征值选择。采用斯皮尔曼相关系数来计算输入特征与PM_2.5浓度的相关性，为避免输入多重共线性的影响，选择与PM_2.5强相关且彼此线性无关的特征组作为模型输入。经过计算选择了AQI、PM_2.5_IAQI、PM₁₀_IAQI、CO_IAQI、SO₂_IAQI、NO₂_IAQI、O₃_IAQI、风速、湿度作为输入PM_2.5浓度预测模型的特征。

(3)采用相关性分析、卷积神经网络与空间注意力机制，提取与目标站点空间强相关的站点信息，具体步骤包括：

(a)采用斯皮尔曼秩相关分析方法分析目标站点与周边站点之间的空间相关性。计算公式如下所示：

Yⁱ是第i个目标站点PM_2.5历史记录的降序排列，

表示第i个目标站点周围第k个站点的PM_2.5序列记录，N为目标站点的总数，ρ_list是计算出的目标站点与所有站点之间的相关性系数，如下所示：

ρ_list＝[ρ(Y^*,Y₁),ρ(Y^*,Y₂),...,ρ(Y^*,Y_M)] (2)

表示目标站点的PM_2.5浓度序列，Y₁、Y₂、Y_m分别第1、第2、第M个站点的PM_2.5浓度序列。ρ表示斯皮尔曼秩相关分析方法，用于计算两个序列间的相关性。

将相关性系数和优化后的阈值ρ_th比较，最终得到与目标站点相关性系数大于ρ_th的所有站点数据的集合X如下：

X＝{X_i|ρ(Y^*,Y_i)＞ρ_th,i∈1,...,N} (3)

在式(3)中，X_i∈R^T×L为第i个与目标站点空间强相关站点的特征矩阵，X∈R^M×T×L代表与目标站点空间强相关站点的三维特征矩阵，其中M＜＝N。

(b)利用一维卷积核，对X∈R^M×T×L中M个通道的特征值进行线性组合进行升维操作，经过升维处理后三维矩阵为

其中M_new表示通道数量，T表示历史数据的时间步长，L表示特征维数。

(c)降维处理主要针对多站点特征矩阵即经过升维处理后三维矩阵

中最重要的特征信息，提取各通道第k项特征与目标站点第k项特征的相关性系数，基于相关性系数计算权重分布。循环相关性系数计算权重分布过程将多通道信息整合成二维矩阵。

对目标站点的第k项特征与特征矩阵中第k项特征进行相关性分析，计算斯皮尔曼相关系数。计算公式如下所示：

在(4)式中

表示第m个通道第k项特征的序列与目标序列的相关性，Spearman()表示斯皮尔曼秩相关系数计算方法，

表示目标站点的第k项特征序列，

表示第m个通道的第k项特征序列。引入类似SoftMax的计算方法对相关系数进行数值变换，将原始相关系数排序成概率分布，各元素权值之和为1，计算出重要特征序列的权值

计算公式如下：

其中

表示第m个通道的第k个特征序列的注意力权重，j为通道序号。

最后，将各通道的第k项特征序列乘以对应的权重值再求和，将各站点第k项特征序列聚合为最终序列，由聚合后的各项特征序列构成二维特征矩阵。因此最终降维聚合后的特征序列A^k及特征矩阵A应如以下公式所示：

式(6)中，A¹、A^k分别表示第1项、第k项特征聚合后的序列。l表示特征个数，A^l表示最后一项特征聚合后的序列。

(4)融合时间注意力机制和堆叠膨胀卷积进行时间依赖特征的提取，具体步骤包括；

(a)膨胀卷积与普通卷积的卷积核大小和卷积操作是一样的，即参数的数量不变。不同的是膨胀卷积引入了扩张率，允许卷积核处理数据时跳过d个数据进行处理，即间隔采样，不需扩展网络深度就可以增大感受野获得长距离的历史数据，不仅降低了空间损失和信息损失同时使得数据分析和特征提取更全面，有利于提高预测精度。在x_t处的膨胀因子为d的膨胀卷积如下所示：

如公式(7)所示，F＝(f₁,f₂,···,f_K)表示波虑器，序列X＝(x₁,x₂,···,x_T)，*_d为膨胀卷积运算符。K表示膨胀卷积内核大小，T代表历史数据时长。STCCN的PM_2.5浓度预测模型的膨胀卷积内核采用超参数调优后的参数值，将膨胀卷积网络深度设置为4，且使用d＝2ⁿ(n是网络深度)的膨胀因子，以此来保证预测结果覆盖到长期有效的历史数据，避免引入过多的噪声数据。

本方法考虑多源因素(空气污染物、气象因素)以及PM_2.5的时空分布特征对PM_2.5预测的影响，采用CNN与CCN构建端到端的PM_2.5预测工作链(STCCN)，并引入时空注意力机制提升模型的时空特征提取能力。STCCN能够在高精度时空粒度条件下对PM_2.5具有较强的模拟和预测能力。该模型主要包含两部分：基于步骤(3)的融合卷积神经网络和空间注意力的空间特征提取模块，基于步骤(4)的融合时间注意力和堆叠膨胀卷积的时间特征提取模块。为使该模型逼近最优预测性能，基于步骤(5)中的方法对模型的超参数进行调优。

(5)超参数调优，具体步骤包括：

(a)学习率选择。设置STCCN的PM_2.5浓度预测模型学习率值为0.1、0.005、0.001、0.0005和0.0001进行对比实验，通过实验结果可知，选择学习率为0.001预测表现最优；

(b)内核大小选择。设置STCCN的PM_2.5浓度预测模型内核大小分别为2、3、4、5和6进行实验，通过对实验结果对比可知，STCCN的PM_2.5浓度预测模型内核大小为4时模型表现最佳；

(c)滑动窗口选择。借鉴时间注意力机制的原理，将滑动窗口步长设定在3～24的范围内，筛选表现最优的滑动窗口尺寸，通过对比实验结果可知，选择滑动窗口尺寸为24进行后续的研究；

(d)以上(a)—(c)的对比实验中，每一次调整STCCN的PM_2.5浓度预测模型参数时，均在数据集中进行十次随机采样。利用采样后的十组数据，在相同模型参数的条件下训练模型。十次训练得到的预测性能值取平均作为该模型参数的最终预测性能，本发明使用此方法来更精准的提取最优参数。

(6)对参数调优后的STCCN的PM_2.5浓度预测模型进行训练，具体步骤包括：

(a)利用预处理后的数据集训练参数调优后的STCCN的PM_2.5浓度预测模型。

(b)Baseline参数设置及实验结果对比。基于平稳时间序列的自回归模型(AR)，通过F检验选择合适的阶数P＝3，采用自适应的方法预测。滑动平均模型MA首先确定模型的阶P＝3，其次确定历史数据与当前数据的自相关性进行预测。基于非平稳时间序列的ARMA模型经过平稳性检验、模型识别和检验确定模型，将ARMA模型的p、q阶数分别设置为5、6。人工神经网络(ANN)可将其看作是从输入空间到输出空间的一个非线性映射,ANN模型设置包含有两个隐藏层，每个隐藏层各包含50个神经元，使用ReLU激活函数与Adam随机梯度优化器等模型参数。支持向量机回归(SVR)选择适当的函数子集、判别函数以及RBF核函数和参数值C＝1000完成预测。GRU模型设置舍弃率为0.2、隐藏层为1和隐藏节点数(16,25)进行实验。LSTM模型对前向信息特别是长距离前向信息有很好的保留作用,此实验采用三层隐含层，节点数分别为30、50、70，学习率为1。我们还考虑了一种名为STGCN的基于图的模型。STGCN区块三层通道分别为64、16和64。STGCN将图卷积核大小K和时间卷积核大小Kt设置为3。通过实验结果可知，STCCN的PM_2.5浓度预测模型RMSE、MAE和R²性能指标均优于基准PM_2.5浓度预测模型。

(7)基于前述步骤2预处理后的数据，将数据输入步骤6参数调优后的模型中，输出所有站点未来一天PM_2.5浓度预测值。

本发明与现有技术相比的优点在于：本发明将站点间的时空相关性、气象因子和不同污染物之间的相互作用纳入PM_2.5浓度预测模型，同时扩展了时域之间的卷积，克服了传统RNN、LSTM模型的弊端。该模型利用注意机制和堆叠膨胀卷积重写了一个基于CNN的因果卷积网络优化了时空特征的提取。为PM_2.5浓度预测提供了一个可扩展、通用、健壮的STCCN模型，为未来研究多影响因素、多数据源和多卷积结构提供了一个开放性框架，可以应用于不同地区的各类空气污染物浓度预测任务，从而有效防范高浓度空气污染物对人类的危害。

附图说明

图1是本发明的整体步骤流程图。

图2是本发明空间特征提取框架图。

图3是本发明时间特征提取框架图。

图4是本发明的超参数调优中的模型性能对比图。

具体实施方式

(1)数据准备：

(a)从某地区空气监测站监测的数据中截取了2017年1月1日至2017年12月31日的空气质量指数、气候天级数据包括PM_2.5、AQI、PM_2.5_IAQI、PM₁₀_IAQI、CO_IAQI、SO₂_IAQI、NO₂_IAQI、O₃_IAQI、风速、湿度共十项特征,并存入站点数据文件，其中由id标识不同站点，每个特征的变量名为PM_2.5_Concentration、AQI、PM_2.5、PM₁₀、NO₂、CO、O₃、SO₂、humidity、wind_speed；

(2)数据预处理，具体步骤包括：

(a)缺失值的处理。各站点数据文件中的天级数据中存在缺值的情况，对于单一缺失值采用一阶拉格朗日线性插值(线性插值)，对于连续多缺失值采用临近日期内相同时间段的数据进行填充，使得整体数据符合变化规律。

(b)特征值选择。采用了斯皮尔曼相关性系数来识别与PM_2.5强相关的特征并剔除，首先引入Python中的state包，调用sperman()函数，依次计算AQI、PM₁₀、NO₂、CO、O₃、SO₂、humidity、wind_speed特征序列与PM_2.5浓度的相关性系数，最终确定PM_2.5_Concentration、AQI、PM_2.5_IAQI、PM₁₀_IAQI、CO_IAQI、SO₂_IAQI、NO₂_IAQI、O₃_IAQI、风速、湿度共十项天级数据构成特征矩阵作为模型的输入。

(a)采用斯皮尔曼秩相关分析方法分析了目标站点与周边站点之间的空间相关性。计算公式如下所示：

Yⁱ是第i个目标站点PM_2.5历史记录的降序排列，

表示第i个目标站点周围第k个站点的PM_2.5序列记录。ρ_list是我们计算出的目标站点与所有站点之间的相关系数。如下所示：

ρ_list＝[ρ(Y^*,Y₁),ρ(Y^*,Y₂),...,ρ(Y^*,Y_M)] (2)

Y^*表示目标站点的PM_2.5浓度序列，Y₁、Y₂、Y_M分别第1、第2、第M个站点的PM_2.5浓度序列。ρ表示斯皮尔曼秩相关分析方法，用于计算两个序列间的相关性。

将相关性系数和优化后的阈值比较，最终得到与目标站点相关性系数大于ρ_th的所有站点数据的集合如下：

X＝{X_i|ρ(Y^*,Y_i)＞ρ_th,i∈1,...,N} (3)

在(3)式中，X_i∈R^T×L为第i个与目标站点空间强相关站点的特征矩阵，X∈R^M×T×L代表与目标站点空间强相关站点的三维特征矩阵，其中M＜＝N。

(c)降维处理主要针对多站点特征矩阵

中最重要的特征信息，提取各通道第k项特征与目标站点第k项特征的相关性系数，基于相关性系数计算权重分布。循环此过程将多通道信息整合成二维矩阵。

在(4)式中

表示目标站点的第k项特征序列，

计算公式如下：

其中

(6)式中A¹、A^k分别表示第1项、第k项特征聚合后的序列。l表示特征个数，A^l表示最后一项特征聚合后的序列。

(a)调用Python中的torch包下的Conv2d()函数构建膨胀卷积网络。膨胀卷积与普通卷积的卷积核大小和卷积操作是一样的，即参数的数量不变。不同的是膨胀卷积引入了扩张率，允许卷积核处理数据时跳过(d-1)个数据进行处理，即间隔采样，不需扩展网络深度就可以增大感受野获得长距离的历史数据，不仅降低了空间损失和信息损失同时使得数据分析和特征提取更全面，有利于提高预测精度。在x_t处的膨胀因子为d的膨胀卷积如下所示：

如公式(7)所示，F＝(f₁,f₂,···,f_K)表示波虑器，序列X＝(x₁,x₂,···,x_T)，*_d为膨胀卷积运算符。K表示膨胀卷积内核大小，T代表历史数据时长。本文中模型的膨胀卷积内核采用超参数调优后的参数值，将膨胀卷积网络深度设置为4，且使用d＝2ⁿ(n是网络深度)的膨胀因子，以此来保证预测结果覆盖到长期有效的历史数据，避免引入过多的噪声数据。

(5)超参数调优，具体步骤包括：

(a)学习率选择。设置参数配置文件内模型学习率lr为0.1、0.005、0.001、0.0005和0.0001进行对比实验，通过实验结果可知，选择学习率为0.001预测表现最优；

(b)内核大小选择。设置参数配置文件内模型内核kernel_size分别为2、3、4、5和6进行实验，通过对实验结果对比可知，模型内核大小为4时模型表现最佳；

(c)滑动窗口选择。借鉴时间注意力机制的原理，将滑动窗口sliding_window步长设定在3～24的范围内，筛选表现最优的滑动窗口尺寸，通过对比实验结果可知，选择滑动窗口尺寸为24进行后续的研究；

(d)以上(a)—(c)的对比实验中，每一次调整模型参数时，均在数据集中进行十次随机采样。利用采样后的十组数据，在相同模型参数的条件下训练模型。十次训练得到的预测性能值取平均作为该模型参数的最终预测性能，本发明使用此方法来更精准的提取最优参数。

(6)对参数调优后的STCCN模型进行训练，具体步骤包括：

(a)利用预处理后的数据集训练参数调优后的STCCN模型。

(b)Baseline参数设置及实验结果对比。基于平稳时间序列的自回归模型(AR)，通过F检验选择合适的阶数P＝3，采用自适应的方法预测。滑动平均模型MA首先确定模型的阶P＝3，其次确定历史数据与当前数据的自相关性进行预测。基于非平稳时间序列的ARMA模型经过平稳性检验、模型识别和检验确定模型，将ARMA模型的p、q阶数分别设置为5、6。人工神经网络(ANN)可将其看作是从输入空间到输出空间的一个非线性映射,ANN模型设置包含有两个隐藏层，每个隐藏层各包含50个神经元，使用ReLU激活函数与Adam随机梯度优化器等模型参数。支持向量机回归(SVR)选择适当的函数子集、判别函数以及RBF核函数和参数值C＝1000完成预测。GRU模型设置舍弃率为0.2、隐藏层为1和隐藏节点数(16,25)进行实验。LSTM模型对前向信息特别是长距离前向信息有很好的保留作用,此实验采用三层隐含层，节点数分别为30、50、70，学习率为1。我们还考虑了一种名为STGCN的基于图的模型。STGCN区块三层通道分别为64、16和64。STGCN将图卷积核大小K和时间卷积核大小Kt设置为3。通过实验结果可知，STCCN模型RMSE、MAE和R²性能指标均优于基准模型。

Claims

1.一种基于多维要素大气PM_2.5浓度预测方法，其特征在于：该方法的具体步骤如下：

(2)站点数据预处理；

(3)采用相关性分析、卷积神经网络与空间注意力机制，提取与目标站点空间强相关的站点信息，

(a)膨胀卷积与普通卷积的卷积核大小和卷积操作是一样的，即参数的数量不变；膨胀卷积引入扩张率，允许卷积核处理数据时跳过d个数据进行处理，即间隔采样；在x_t处的膨胀因子为d的膨胀卷积如下所示：

如公式(7)所示，F＝(f₁,f₂,···,f_K)表示波虑器，序列X＝(x₁,x₂,···,x_T)，*_d为膨胀卷积运算符；K表示膨胀卷积内核大小，T代表历史数据时长；STCCN的PM_2.5浓度预测模型的膨胀卷积内核采用超参数调优后的参数值；

考虑空气污染物、气象因素以及PM_2.5的时空分布特征对PM_2.5预测的影响，采用CNN与CCN构建端到端的PM_2.5预测工作链STCCN，包含两部分：基于步骤(3)的融合卷积神经网络和空间注意力的空间特征提取模块，基于步骤(4)的融合时间注意力和堆叠膨胀卷积的时间特征提取模块；

(5)超参数调优，具体步骤包括：

(a)学习率选择；设置STCCN的PM_2.5浓度预测模型学习率值；

(b)内核大小选择；设置STCCN的PM_2.5浓度预测模型内核进行实验；

(c)滑动窗口选择；将滑动窗口步长设定在3～24的范围内，筛选表现最优的滑动窗口尺寸；

(d)以上(a)—(c)的对比实验中，每一次调整STCCN的PM_2.5浓度预测模型参数时，均在数据集中进行十次随机采样；利用采样后的十组数据，在相同模型参数的条件下训练模型；十次训练得到的预测性能值取平均作为该模型参数的最终预测性能，精准提取最优参数；

(a)利用预处理后的数据集训练参数调优后的STCCN的PM_2.5浓度预测模型；

(b)Baseline参数设置获得调优后的STCCN的PM_2.5浓度预测模型；

(7)基于前述步骤2预处理后的数据，将数据输入步骤6参数调优后的STCCN的PM_2.5浓度预测模型中，输出所有站点未来一天PM_2.5浓度预测值。

2.根据权利要求1所述的一种基于多维要素大气PM_2.5浓度预测方法，其特征在于：步骤(2)的具体步骤包括如下，

(a)缺失值处理；对采集到的多站点空气质量指数和气象数据中的缺失值进行填充；对于单一缺失值采用一阶拉格朗日线性插值，对于连续多缺失值采用临近日期内相同时间段的数据进行填充，使得整体站点数据符合变化规律；

(b)特征值选择；采用斯皮尔曼相关系数来计算输入特征与PM_2.5浓度的相关性，选择与PM_2.5强相关且彼此线性无关的特征组作为模型输入；经过计算选择AQI、PM_2.5_IAQI、PM₁₀_IAQI、CO_IAQI、SO₂_IAQI、NO₂_IAQI、O₃_IAQI、风速、湿度作为输入PM_2.5浓度预测模型的特征。

3.根据权利要求1所述的一种基于多维要素大气PM_2.5浓度预测方法，其特征在于：步骤(3)的具体步骤包括如下，

(a)采用斯皮尔曼秩相关分析方法分析目标站点与周边站点之间的空间相关性；计算公式如下所示：

Yⁱ是第i个目标站点PM_2.5历史记录的降序排列，

ρ_list＝[ρ(Y^*,Y₁),ρ(Y^*,Y₂),...,ρ(Y^*,Y_M)] (2)

表示目标站点的PM_2.5浓度序列，Y₁、Y₂、Y_M分别第1、第2、第M个站点的PM_2.5浓度序列；ρ表示斯皮尔曼秩相关分析方法，用于计算两个序列间的相关性；

X＝{X_i|ρ(Y^*,Y_i)＞ρ_th,i∈1,...,N} (3)

在式(3)中，X_i∈R^T×L为第i个与目标站点空间强相关站点的特征矩阵，X∈R^M×T×L代表与目标站点空间强相关站点的三维特征矩阵，其中M＜＝N；

其中M_new表示通道数量，T表示历史数据的时间步长，L表示特征维数；

(c)降维处理针对多站点特征矩阵即经过升维处理后三维矩阵

中最重要的特征信息，提取各通道第k项特征与目标站点第k项特征的相关性系数，基于相关性系数计算权重分布；循环相关性系数计算权重分布过程将多通道信息整合成二维矩阵；

对目标站点的第k项特征与特征矩阵中第k项特征进行相关性分析，计算斯皮尔曼相关系数；计算公式如下所示：

在(4)式中

表示目标站点的第k项特征序列，

表示第m个通道的第k项特征序列；引入类似SoftMax的计算方法对相关系数进行数值变换，将原始相关系数排序成概率分布，各元素权值之和为1，计算出重要特征序列的权值

计算公式如下：

其中

表示第m个通道的第k个特征序列的注意力权重，j为通道序号；

将各通道的第k项特征序列乘以对应的权重值再求和，将各站点第k项特征序列聚合为最终序列，由聚合后的各项特征序列构成二维特征矩阵；因此最终降维聚合后的特征序列A^k及特征矩阵A应如以下公式所示：

式(6)中，A¹、A^k分别表示第1项、第k项特征聚合后的序列；l表示特征个数，A^l表示最后一项特征聚合后的序列。

4.根据权利要求1所述的一种基于多维要素大气PM_2.5浓度预测方法，其特征在于：步骤(6)的Baseline参数设置中，基于平稳时间序列的自回归模型AR，通过F检验选择合适的阶数P＝3，采用自适应的方法预测；滑动平均模型MA首先确定模型的阶P＝3，其次确定历史数据与当前数据的自相关性进行预测；基于非平稳时间序列的ARMA模型经过平稳性检验、模型识别和检验确定模型，将ARMA模型的p、q阶数分别设置为5、6；人工神经网络ANN将其看作是从输入空间到输出空间的一个非线性映射，ANN模型设置包含有两个隐藏层，每个隐藏层各包含50个神经元，使用ReLU激活函数与Adam随机梯度优化器等模型参数；支持向量机回归SVR选择适当的函数子集、判别函数以及RBF核函数和参数值C＝1000完成预测；LSTM模型采用三层隐含层，节点数分别为30、50、70，学习率为1；STGCN区块三层通道分别为64、16和64；STGCN将图卷积核大小K和时间卷积核大小Kt设置为3。

5.根据权利要求1所述的一种基于多维要素大气PM_2.5浓度预测方法，其特征在于：公式7中，膨胀卷积网络深度设置为4，且使用d＝2ⁿ的膨胀因子，以此来保证预测结果覆盖到长期有效的历史数据，避免引入过多的噪声数据，n是网络深度。