CN115096357A - 一种基于ceemdan-pca-lstm的室内环境质量预测方法 - Google Patents
一种基于ceemdan-pca-lstm的室内环境质量预测方法 Download PDFInfo
- Publication number
- CN115096357A CN115096357A CN202210632381.XA CN202210632381A CN115096357A CN 115096357 A CN115096357 A CN 115096357A CN 202210632381 A CN202210632381 A CN 202210632381A CN 115096357 A CN115096357 A CN 115096357A
- Authority
- CN
- China
- Prior art keywords
- imf
- lstm
- representing
- indoor environment
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 52
- 238000013441 quality evaluation Methods 0.000 claims abstract description 29
- 238000000513 principal component analysis Methods 0.000 claims abstract description 14
- 230000009467 reduction Effects 0.000 claims abstract description 14
- 238000013528 artificial neural network Methods 0.000 claims abstract description 12
- 230000010354 integration Effects 0.000 claims abstract description 8
- 230000003044 adaptive effect Effects 0.000 claims abstract description 7
- 230000007787 long-term memory Effects 0.000 claims abstract description 7
- 230000006403 short-term memory Effects 0.000 claims abstract description 7
- 239000011159 matrix material Substances 0.000 claims description 26
- 230000015654 memory Effects 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 17
- 230000007613 environmental effect Effects 0.000 claims description 14
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 claims description 10
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 9
- 230000001186 cumulative effect Effects 0.000 claims description 7
- 239000013598 vector Substances 0.000 claims description 6
- 238000001303 quality assessment method Methods 0.000 claims description 4
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 3
- 230000004931 aggregating effect Effects 0.000 claims description 2
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 238000012216 screening Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 9
- 238000000605 extraction Methods 0.000 abstract description 3
- 210000004027 cell Anatomy 0.000 description 12
- 210000002569 neuron Anatomy 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000003344 environmental pollutant Substances 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 231100000719 pollutant Toxicity 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01D—MEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
- G01D21/00—Measuring or testing not otherwise provided for
- G01D21/02—Measuring two or more variables by means not covered by a single other subclass
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/02—Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Evolutionary Computation (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Algebra (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于CEEMDAN‑PCA‑LSTM的室内环境质量预测方法,其包括:对室内环境质量评价得分时间序列进行自适应噪声完备集成经验模态分解,得到多个IMF模态分量和一个残差序列;利用主成分分析对分解得到的模态分量和残差序列进行数据降维,实现主成分提取;将提取的主成分与原始室内环境质量评价得分时间序列进行组合,构成数据集;将数据集输入至长短期记忆神经网络预测模型,得到室内环境质量评价得分的预测结果。与其它预测模型相比,本发明的预测方法能够提高室内环境质量的预测精度,且预测值与真实值的拟合效果更优。
Description
技术领域
本发明涉及室内环境预测领域,尤其涉及一种基于CEEMDAN-PCA-LSTM 的室内环境质量预测方法。
背景技术
随着我国经济和工业的迅速发展,环境问题的不断出现,引起了国内外学者对室内空气质量预测的关注。正如天气预报中对未来AQI进行预报的方式,进行室内环境质量的预测具有重要指导意义,可以满足室内人员的预知需求,尽早做出防范措施。在室内环境质量预测技术发展的早期,主要通过研究室内环境参数的变化规律,从而采用统计学理论进行环境质量预测。如回归分析法,通过建立回归方程分析因变量和自变量之间的数学关系。后来,随着物理学和化学等技术的发展,从空气动力学角度分析室内气体的流动规律和伴随的物理化学反应,通过数值模拟来判断室内环境质量的变化规律。这些方法在线性分析中表现较好,但对于非线性时间序列的预测表现较差。目前,针对室内环境质量易受气候、污染物的影响,并且具有非线性、非平稳的特征,神经网络成为国内外比较流行的预测方法。
但在室内环境质量预测的研究上,存在以下问题:研究者们大多是预测环境参数,如室内温度、热舒适度和PM2.5等污染物浓度,而非直接预测室内环境质量;单一神经网络模型的预测精度较差,无法达到较优的预测效果。
发明内容
本发明针对上述方法非直接预测室内环境质量及模型预测精度的问题,提供一种能够直接预测室内环境质量结果、解决目前单一神经网络模型的预测精度较差问题、使预测值与真实值的拟合效果更优的室内环境质量预测方法。
为了达到上述目的,本发明提供了一种基于CEEMDAN-PCA-LSTM的室内环境质量预测方法,包括如下步骤:
S1:对室内环境质量评价得分时间序列进行自适应噪声完备集成经验模态分解CEEMDAN,所述自适应噪声完备集成经验模态分解CEEMDAN的过程为:
向所述室内环境质量评价得分时间序列X(t)中添加K次标准正态白噪声序列ωi(t),得到第i次参与分解的信号Xi(t),所述Xi(t)的计算公式为:
Xi(t)=X(t)+ε0ωi(t),(i=1,2,…,K) (1)
其中,ε0为所述K次标准正态白噪声序列ωi(t)的权值;
对所述信号Xi(t)进行EMD分解,得到K个第一阶IMF分量IMF1,i(t)的分解结果,计算所述K个第一阶IMF分量IMF1,i(t)的平均值,作为第一次迭代过程中CEEMDAN分解的第一阶IMF分量IMF1(t),所述IMF1(t)的计算公式为:
第一次迭代过程中的残差序列r1(t)的计算公式为:
r1(t)=X(t)-IMF1(t) (3)
将第j-1次迭代过程中的残差序列rj-1(t)添加所述K次标准正态白噪声序列ωi(t)后,继续进行EMD分解,得到第j次迭代过程中的IMF分量IMFj(t)及残差序列rj(t):
rj(t)=rj-1(t)-IMFj(t) (5)
其中,IMFj(t)为CEEMDAN分解的第j次迭代过程中的IMF分量,E1为对添加噪声分量的残差序列进行EMD分解得到的第一阶IMF分量,Ej-1(*)为经过 EMD分解得到的第j-1次迭代过程中的IMF分量,εj-1为第j-1次迭代过程中向残差序列加入的白噪声序列ωi(t)的权值系数,rj(t)为第j次迭代过程中的残差序列;
重复执行所述迭代与分解操作,直至最终的残差序列不满足EMD分解的基本假设,得到室内环境质量评价得分时间序列经CEEMDAN分解的结果:
其中,rn(t)为最后一次迭代与分解操作后得到的残差序列;
S2:利用主成分分析PCA对所述分解后的IMF分量IMFj(t)和残差序列rn(t) 进行数据降维,并提取降维后的主成分;
S3:将所述降维后的主成分与原始室内环境质量评价得分时间序列进行聚合,构成数据集;
S4:将所述数据集输入至长短期记忆LSTM神经网络预测模型,并得到室内环境质量评价得分时间序列的预测结果,所述长短期记忆LSTM神经网络预测模型为:
其中,it表示输入门的输出,ft表示遗忘门的输出,ot表示输出门的输出;Ct表示当前LSTM单元的长期记忆信息,Ct-1表示由上一LSTM单元传递的长期记忆信息;ht表示当前LSTM单元的短期记忆信息,ht-1表示由上一LSTM单元传递的短期记忆信息;xt表示当前LSTM单元的输入;Wi表示输入门的权重矩阵, Wf表示遗忘门的权重矩阵,Wo表示输出门的权重矩阵;Wc表示计算当前单元的长短期记忆候选状态时的权重矩阵;bi表示输入门的偏置值,bf表示遗忘门的偏置值,bo表示输出门的偏置值;bc表示计算长短期记忆候选状态时的偏置值;σ表示sigmoid门限函数,sigmoid函数将输出值转换为0和1之间的数值,“0”表示完全舍弃,“1”表示全部保留;输入门中的σ决定哪些新信息被存放在LSTM 细胞状态中,即哪些值将要更新;遗忘门中的σ决定从LSTM细胞状态中丢弃哪些信息;输出门中的σ决定细胞状态中的哪些信息将被输出;
S5:利用性能指标考察所述基于CEEMDAN-PCA-LSTM的室内环境质量预测方法的精度。
优选方式下,所述主成分分析PCA的步骤为:
S1:对所述分解后的IMF分量IMFj(t)和残差序列rn(t)进行标准化处理,得到标准化数据;
S2:计算所述标准化数据的协方差矩阵;
S3:计算所述协方差矩阵的特征值λi和特征向量,并将所述特征值按照由大到小的顺序进行排序;
S4:根据公式(8)、(9)计算各特征值对应的方差贡献率和累计方差贡献率;
其中,λi为第i个特征值,τi为第i个特征值的方差贡献率,pm为前m个特征值的累计方差贡献率;
S5: 筛选大于方差贡献率设定值和累计方差贡献率设定值的m个特征值,并将所述m个特征值对应的特征向量作为系数矩阵,根据公式(10)计算m个主成分的值;
其中,x1,x2,…,xn为原始室内环境质量评价得分时间序列,v1,v2,…,vm为降维后的主成分,ai1,ai2,…,ain(i=1,2,…,m)为系数矩阵。
优选方式下,所述长短期记忆LSTM神经网络预测模型的性能指标包括:均方根误差RMSE,所述均方根误差RMSE的计算公式为(11);平均绝对误差 MAE,所述平均绝对误差MAE的计算公式为(12);平均绝对百分比误差MAPE,所述平均绝对百分比误差MAPE的计算公式为(13);决定系数R2,所述决定系数R2的计算公式为(14);
优选方式下,所EMD分解的步骤为:
S1:找出信号Xi(t)的全部极值点,利用三次样条插值函数拟合极值点的上包络线u(t)和下包络线l(t)并计算上、下包络线的均值m(t),所述均值m(t)的计算公式为:
S2:信号Xi(t)减去均值m(t)得到差值h(t),所述差值h(t)的计算公式为:
h(t)=Xi(t)-m(t) (16)
S3:若差值h(t)满足IMF分量的条件,则h(t)作为第一阶IMF模态分量 IMF1,i(t),否则重复所述计算均值m(t)、差值h(t)的步骤,直至h(t)满足IMF分量的条件。
本发明的有益效果是:本发明能够实现直接预测室内环境质量结果;避免原始室内环境质量数据的非线性、非平稳特性对预测精度的影响,解决目前单一神经网络模型的预测精度较差的问题,从而提高室内环境质量的预测精度;满足室内人员对环境质量的预知需求,以便在环境质量转向恶劣变化前尽早做出防范措施。
附图说明
图1为CEEMDAN-PCA-LSTM预测方法架构图;
图2为室内环境质量评价得分的CEEMDAN分解结果图;
图3为室内环境质量评价得分的CEEMDAN-PCA-LSTM预测结果图;
图4为各模型对室内环境质量评价得分的预测结果对比图;
图5为各模型对室内环境质量评价得分的预测性能对比图。
具体实施方式
实施例:
如图1所示,本发明提供了一种基于CEEMDAN-PCA-LSTM的室内环境质量预测方法,包括如下步骤:
S1:对室内环境质量评价得分时间序列进行自适应噪声完备集成经验模态分解CEEMDAN,得到多个IMF模态分量和一个残差序列;具体地,所述自适应噪声完备集成经验模态分解CEEMDAN的过程为:
向所述室内环境质量评价得分时间序列X(t)中添加K次标准正态白噪声序列ωi(t),得到第i次参与分解的信号Xi(t),所述Xi(t)的计算公式为:
Xi(t)=X(t)+ε0ωi(t),(i=1,2,…,K) (1)
其中,ε0为所述K次标准正态白噪声序列ωi(t)的权值;
对所述信号Xi(t)进行EMD分解,得到K个第一阶IMF分量IMF1,i(t)的分解结果,计算所述K个第一阶IMF分量IMF1,i(t)的平均值,作为第一次迭代过程中CEEMDAN分解的第一阶IMF分量IMF1(t),所述IMF1(t)的计算公式为:
第一次迭代过程中的残差序列r1(t)的计算公式为:
r1(t)=X(t)-IMF1(t) (3)
将第j-1次迭代过程中的残差序列rj-1(t)添加所述K次标准正态白噪声序列ωi(t)后,继续进行EMD分解,得到第j次迭代过程中的IMF分量IMFj(t)及残差序列rj(t):
rj(t)=rj-1(t)-IMFj(t) (5)
其中,IMFj(t)为CEEMDAN分解的第j次迭代过程中的IMF分量,E1为对添加噪声分量的残差序列进行EMD分解得到的第一阶IMF分量,Ej-1(*)为经过 EMD分解得到的第j-1次迭代过程中的IMF分量,εj-1为第j-1次迭代过程中向残差序列加入的白噪声序列ωi(t)的权值系数,rj(t)为第j次迭代过程中的残差序列;
重复执行所述迭代与分解操作,直至最终的残差序列不满足EMD分解的基本假设,得到室内环境质量评价得分时间序列经CEEMDAN分解的结果:
其中,rn(t)为最后一次迭代与分解操作后得到的残差序列;
其中,所EMD分解的步骤为:
首先,找出信号Xi(t)的全部极值点,利用三次样条插值函数拟合极值点的上包络线u(t)和下包络线l(t)并计算上、下包络线的均值m(t),所述均值m(t)的计算公式为:
其次,信号Xi(t)减去均值m(t)得到差值h(t),所述差值h(t)的计算公式为:
h(t)=Xi(t)-m(t) (8)
最后,若差值h(t)满足IMF分量的条件,则h(t)作为第一阶IMF模态分量 IMF1,i(t),否则重复所述计算均值m(t)、差值h(t)的步骤,直至h(t)满足IMF分量的条件。
所述CEEMDAN分解的基础为EMD分解,所述EMD分解的基本假设如下:
(1)完整时间域内的信号至少有两个极值点;
(2)信号的局部时域特性由相邻极值点的差值唯一确定;
(3)若信号无极值点,则对信号进行一次或多次微分直至出现极值点,对微分后的新信号进行分解,最后再通过积分获得分解结果。
经所述EMD分解得到的IMF分量需要满足下面两个条件:
(1)在完整时间域内,局部极值点与零点的数量相差不能超过1;
(2)局部极大值点和极小值点构成的上、下包络线的均值为0。
具体地,数据来源为2020年11月~12月在我国北方地区某学生宿舍采集的室内环境数据,测量的环境参数包括温度、湿度、CO2、PM2.5和HCHO,每 10分钟采样1次,共计7439条记录,无缺失值。将环境数据利用模糊综合评价法进行计算,得到每条记录对应的室内环境质量评价得分。室内环境质量评价得分时间序列构成了原始数据集。
如图2所示,展示了室内环境质量评价得分数据集的CEEMDAN分解结果,实线为原始时间序列,虚线为原始时间序列分解后得到的11个模态分量IMF1~ IMF11以及1个残差序列res。每条IMF曲线都有着不同的波动幅度,且从上到下IMF曲线的波动频率逐渐降低,代表了原始时间序列中的各频率分量。
S2:利用主成分分析PCA对分解得到的模态分量和残差序列进行数据降维,实现主成分提取;
具体地,S2所述的主成分分析对室内环境质量评价得分时间序列进行标准化,消除其量纲,并且计算数据标准化后的协方差矩阵;求协方差矩阵的特征值λi和特征向量,并将特征值按照由大到小的顺序进行排序;根据公式(9)、公式(10)计算各特征值对应的方差贡献率和累计方差贡献率,决定需要保留的主成分的个数。一般情况下,保留累计方差贡献率超过85%的主成分。
其中,λi为第i个特征值,τi为第i个特征值的方差贡献率,pm为前m个特征值的累计方差贡献率;
将最大的m个特征值对应的特征向量作为系数矩阵,根据公式(11)计算m个主成分的值;
其中,x1,x2,…,xn为原始室内环境质量评价得分时间序列,v1,v2,…,vm为降维后的主成分,ai1,ai2,…,ain(i=1,2,…,m)为系数矩阵。
具体地,对各IMF分量以及残差序列进行主成分分析,计算各主成分对应的特征值以及方差贡献率,进而得到各主成分的累计方差贡献率为:
表1 主成分累积方差贡献率统计
由表1可以看出,前10个主成分的累计方差贡献率已经达到89.107%,可用来代替原有方案,达到数据降维的目的。但为了提高模型的预测性能,本发明保留前11个主成分,累计方差贡献率为95.537%。
S3:将提取的主成分与原始室内环境质量评价得分时间序列进行组合,构成数据集;具体地,将前11个主成分的特征向量矩阵与各IMF分量以及残差序列组成的特征矩阵进行矩阵乘法运算,得到各主成分的值,其与室内环境质量评价得分时间序列一起构成降维后的数据集。
S4:将数据集输入至长短期记忆LSTM神经网络预测模型,得到室内环境质量评价得分的预测结果;所述长短期记忆LSTM神经网络预测模型包括输入门、遗忘门和输出门。其中,输入门的作用是决定进入记忆单元的有用信息是哪些;遗忘门的作用是放弃之前无用的状态信息,不再将其输入到后续网络中;输出门的作用是控制网络的输出,决定记忆单元输出哪些信息。长短期记忆 LSTM神经网络预测模型的数学表达式如下:
其中,it表示输入门的输出,ft表示遗忘门的输出,ot表示输出门的输出;Ct表示当前LSTM单元的长期记忆信息,Ct-1表示由上一LSTM单元传递的长期记忆信息;ht表示当前LSTM单元的短期记忆信息,ht-1表示由上一LSTM单元传递的短期记忆信息;xt表示当前LSTM单元的输入;Wi表示输入门的权重矩阵, Wf表示遗忘门的权重矩阵,Wo表示输出门的权重矩阵;Wc表示计算当前单元的长短期记忆候选状态时的权重矩阵;bi表示输入门的偏置值,bf表示遗忘门的偏置值,bo表示输出门的偏置值;bc表示计算长短期记忆候选状态时的偏置值;σ表示sigmoid门限函数,sigmoid函数将输出值转换为0和1之间的数值,“0”表示完全舍弃,“1”表示全部保留;输入门中的σ决定哪些新信息被存放在LSTM 细胞状态中,即哪些值将要更新;遗忘门中的σ决定从LSTM细胞状态中丢弃哪些信息;输出门中的σ决定细胞状态中的哪些信息将被输出。
具体地,长短期记忆LSTM神经网络的输入为数据集中归一化的主成分,输出为室内环境质量评价得分时间序列。在数据集中选取80%的数据作为预测模型的训练集,10%的数据作为验证集,其余10%的数据作为测试集。
为了获得最优的预测效果,针对LSTM网络选用不同的超参数进行试验,试验完成后选取效果最好的一组超参数。模型超参数的设置主要包括对时间步长、样本迭代次数epochs、批处理大小batch_size和隐藏层神经元个数的调节。其它参数如损失函数为均方误差,优化器为Adam,学习率为0.001,dropout率为2%。
具体地,在进行时间步长调节前,初始化隐藏层神经元个数为50,epochs 为32,batch_size为8,时间步长的备选集为[3,6,9,12,15,18,21,24]。具体含义为若时间步长为12,则说明将使用过去12个时刻的各主成分数据预测未来1个时刻的室内环境质量评价得分。epochs的备选集为[10,50,100,150,200,250,300], batch_size的备选集为[8,16,32,64,128,256],隐藏层神经元个数的备选集为 [30,40,50,100,150,200]。通过对模型超参数的调节,得到CEEMDAN-PCA-LSTM 模型的最佳超参数组合:时间步长为15,epochs为50,batch_size为16,隐藏层神经元个数为50。
如图3所示,实线为室内环境质量评价得分的真实值,虚线为预测值,可以看出,本发明提供的CEEMDAN-PCA-LSTM方法的预测值能够较好的跟踪真实值的趋势走向,预测与真实值的拟合效果较好。
为验证本发明提供的CEEMDAN-PCA-LSTM预测方法的准确性,将该方法的预测结果分别与CEEMDAN-LSTM方法、EEMD-LSTM方法、EMD-LSTM 方法和LSTM方法的预测结果进行比较。如图4所示,展示了各方法的预测结果。可以看出,各方法的预测值均能够模拟出室内环境质量评价得分真实值的变化趋势,并且CEEMDAN-PCA-LSTM方法的预测效果最好。LSTM方法出现了预测滞后的现象,表现为将时间步长窗口内的最后一个值作为了下一时刻的预测值。因此,从图形上看,预测值左移一位后几乎与真实值重合,原因在于 LSTM方法无法精确探测复杂的非线性时间序列的波动程度。加入EMD和 EEMD分解后的EMD-LSTM方法和EEMD-LSTM方法,将原始时间序列按照时间尺度分解为多个具有单一频率的IMF分量和残差序列,有效缓解了LSTM 方法预测滞后的问题,使得预测结果更合理可靠。本发明的 CEEMDAN-PCA-LSTM方法结合了CEEMDAN分解和PCA各自的优点,一方面使得经模态分解的IMF分量间不存在模态混叠现象以及重构误差,另一方面实现了特征提取和数据降维,提高了预测效果。
S5:为考察本发明提供的CEEMDAN-PCA-LSTM预测方法的精度,采用的性能指标包括:均方根误差RMSE、平均绝对误差MAE、平均绝对百分比误差 MAPE和决定系数R2,其计算如公式(13)-(16)所示:
如图5所示,展示了各预测方法的预测性能比较结果。可以看出,本发明提供的CEEMDAN-PCA-LSTM模型在四项评价指标中,均具有最好的性能表现,其RMSE为0.5806,MAE为0.4334,MAPE为0.4557,R2为0.9764。相对于CEEMDAN-LSTM模型,RMSE降低了12.42%,MAE降低了4.98%,MAPE 降低了8.03%,提高了0.76%。相对于EEMD-LSTM模型,RMSE降低了30.54%, MAE降低了36.51%,MAPE降低了37.41%,R2提高了2.70%。相对于 EMD-LSTM模型,RMSE降低了33.36%,MAE降低了26.28%,MAPE降低了 29.05%,R2提高了3.16%。相对于LSTM模型,RMSE降低了27.97%,MAE 降低了13.94%,MAPE降低了13.92%,R2提高了2.33%。
由此可见,本发明提供的一种基于CEEMDAN-PCA-LSTM的室内环境质量预测方法,预测精度最高,拟合效果更佳,具有较高的可靠性。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (4)
1.一种基于CEEMDAN-PCA-LSTM的室内环境质量预测方法,其特征在于,包括如下步骤:
S1:对室内环境质量评价得分时间序列进行自适应噪声完备集成经验模态分解CEEMDAN,所述自适应噪声完备集成经验模态分解CEEMDAN的过程为:
向所述室内环境质量评价得分时间序列X(t)中添加K次标准正态白噪声序列ωi(t),得到第i次参与分解的信号Xi(t),所述Xi(t)的计算公式为:
Xi(t)=X(t)+ε0ωi(t),(i=1,2,…,K) (1)
其中,ε0为所述K次标准正态白噪声序列ωi(t)的权值;
对所述信号Xi(t)进行EMD分解,得到K个第一阶IMF分量IMF1,i(t)的分解结果,计算所述K个第一阶IMF分量IMF1,i(t)的平均值,作为第一次迭代过程中CEEMDAN分解的第一阶IMF分量IMF1(t),所述IMF1(t)的计算公式为:
第一次迭代过程中的残差序列r1(t)的计算公式为:
r1(t)=X(t)-IMF1(t) (3)
将第j-1次迭代过程中的残差序列rj-1(t)添加所述K次标准正态白噪声序列ωi(t)后,继续进行EMD分解,得到第j次迭代过程中的IMF分量IMFj(t)及残差序列rj(t):
rj(t)=rj-1(t)-IMFj(t) (5)
其中,IMFj(t)为CEEMDAN分解的第j次迭代过程中的IMF分量,E1为对添加噪声分量的残差序列进行EMD分解得到的第一阶IMF分量,Ej-1(*)为经过EMD分解得到的第j-1次迭代过程中的IMF分量,εj-1为第j-1次迭代过程中向残差序列加入的白噪声序列ωi(t)的权值系数,rj(t)为第j次迭代过程中的残差序列;
重复执行所述迭代与分解操作,直至最终的残差序列不满足EMD分解的基本假设,得到室内环境质量评价得分时间序列经CEEMDAN分解的结果:
其中,rn(t)为最后一次迭代与分解操作后得到的残差序列;
S2:利用主成分分析PCA对所述分解后的IMF分量IMFj(t)和残差序列rn(t)进行数据降维,并提取降维后的主成分;
S3:将所述降维后的主成分与原始室内环境质量评价得分时间序列进行聚合,构成数据集;
S4:将所述数据集输入至长短期记忆LSTM神经网络预测模型,并得到室内环境质量评价得分时间序列的预测结果,所述长短期记忆LSTM神经网络预测模型为:
其中,it表示输入门的输出,ft表示遗忘门的输出,ot表示输出门的输出;Ct表示当前LSTM单元的长期记忆信息,Ct-1表示由上一LSTM单元传递的长期记忆信息;ht表示当前LSTM单元的短期记忆信息,ht-1表示由上一LSTM单元传递的短期记忆信息;xt表示当前LSTM单元的输入;Wi表示输入门的权重矩阵,Wf表示遗忘门的权重矩阵,Wo表示输出门的权重矩阵;Wc表示计算当前单元的长短期记忆候选状态时的权重矩阵;bi表示输入门的偏置值,bf表示遗忘门的偏置值,bo表示输出门的偏置值;bc表示计算长短期记忆候选状态时的偏置值;σ表示sigmoid门限函数,sigmoid函数将输出值转换为0和1之间的数值,“0”表示完全舍弃,“1”表示全部保留;输入门中的σ决定哪些新信息被存放在LSTM细胞状态中,即哪些值将要更新;遗忘门中的σ决定从LSTM细胞状态中丢弃哪些信息;输出门中的σ决定细胞状态中的哪些信息将被输出;
S5:利用性能指标考察所述基于CEEMDAN-PCA-LSTM的室内环境质量预测方法的精度。
2.根据权利要求1所述基于CEEMDAN-PCA-LSTM的室内环境质量预测方法,其特征在于,所述主成分分析PCA的步骤为:
S1:对所述分解后的IMF分量IMFj(t)和残差序列rn(t)进行标准化处理,得到标准化数据;
S2:计算所述标准化数据的协方差矩阵;
S3:计算所述协方差矩阵的特征值λi和特征向量,并将所述特征值按照由大到小的顺序进行排序;
S4:根据公式(8)、(9)计算各特征值对应的方差贡献率和累计方差贡献率;
其中,λi为第i个特征值,τi为第i个特征值的方差贡献率,pm为前m个特征值的累计方差贡献率;
S5:筛选大于方差贡献率设定值和累计方差贡献率设定值的m个特征值,并将所述m个特征值对应的特征向量作为系数矩阵,根据公式(10)计算m个主成分的值;
其中,x1,x2,…,xn为原始室内环境质量评价得分时间序列,v1,v2,…,vm为降维后的主成分,ai1,ai2,…,ain(i=1,2,…,m)为系数矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210632381.XA CN115096357A (zh) | 2022-06-07 | 2022-06-07 | 一种基于ceemdan-pca-lstm的室内环境质量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210632381.XA CN115096357A (zh) | 2022-06-07 | 2022-06-07 | 一种基于ceemdan-pca-lstm的室内环境质量预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115096357A true CN115096357A (zh) | 2022-09-23 |
Family
ID=83288967
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210632381.XA Pending CN115096357A (zh) | 2022-06-07 | 2022-06-07 | 一种基于ceemdan-pca-lstm的室内环境质量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115096357A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116307212A (zh) * | 2023-03-24 | 2023-06-23 | 淮阴工学院 | 一种新型空气质量预测方法及*** |
CN116933152A (zh) * | 2023-06-07 | 2023-10-24 | 哈尔滨工业大学(威海) | 一种基于多维emd-pso-lstm神经网络的海浪信息预测方法及*** |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101591735B1 (ko) * | 2015-05-29 | 2016-02-11 | 주식회사 나인에코 | 실내공기질의 예측을 통한 오염 정보 제공 방법 |
CN106407659A (zh) * | 2016-08-31 | 2017-02-15 | 中国地质大学(武汉) | 一种空气质量指数预测方法和装置 |
CN109242329A (zh) * | 2018-09-21 | 2019-01-18 | 苏州数言信息技术有限公司 | 表征室内环境综合质量的综合指标计算方法 |
CN109960886A (zh) * | 2019-03-30 | 2019-07-02 | 龙马智芯(珠海横琴)科技有限公司 | 一种空气舒适度评价方法、装置及空气调节设备 |
CN110516844A (zh) * | 2019-07-25 | 2019-11-29 | 太原理工大学 | 基于emd-pca-lstm的多变量输入光伏功率预测方法 |
CN111047012A (zh) * | 2019-12-06 | 2020-04-21 | 重庆大学 | 基于深度双向长短期记忆网络的空气质量预测方法 |
CN111144286A (zh) * | 2019-12-25 | 2020-05-12 | 北京工业大学 | 一种融合emd和lstm的城市pm2.5浓度预测方法 |
KR102149495B1 (ko) * | 2019-08-19 | 2020-08-28 | 고려대학교 산학협력단 | 환경 예측 모델의 훈련지표 최적화 장치 및 그 동작방법 |
CN111798051A (zh) * | 2020-07-02 | 2020-10-20 | 杭州电子科技大学 | 基于长短期记忆神经网络的空气质量时空预测方法 |
CN113011660A (zh) * | 2021-03-23 | 2021-06-22 | 上海应用技术大学 | 空气质量预测方法、***及存储介质 |
CN113762642A (zh) * | 2021-09-23 | 2021-12-07 | 大连理工大学人工智能大连研究院 | 基于bo-emd-lstm深度学习算法的教室空气质量预测方法 |
-
2022
- 2022-06-07 CN CN202210632381.XA patent/CN115096357A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101591735B1 (ko) * | 2015-05-29 | 2016-02-11 | 주식회사 나인에코 | 실내공기질의 예측을 통한 오염 정보 제공 방법 |
CN106407659A (zh) * | 2016-08-31 | 2017-02-15 | 中国地质大学(武汉) | 一种空气质量指数预测方法和装置 |
CN109242329A (zh) * | 2018-09-21 | 2019-01-18 | 苏州数言信息技术有限公司 | 表征室内环境综合质量的综合指标计算方法 |
CN109960886A (zh) * | 2019-03-30 | 2019-07-02 | 龙马智芯(珠海横琴)科技有限公司 | 一种空气舒适度评价方法、装置及空气调节设备 |
CN110516844A (zh) * | 2019-07-25 | 2019-11-29 | 太原理工大学 | 基于emd-pca-lstm的多变量输入光伏功率预测方法 |
KR102149495B1 (ko) * | 2019-08-19 | 2020-08-28 | 고려대학교 산학협력단 | 환경 예측 모델의 훈련지표 최적화 장치 및 그 동작방법 |
CN111047012A (zh) * | 2019-12-06 | 2020-04-21 | 重庆大学 | 基于深度双向长短期记忆网络的空气质量预测方法 |
CN111144286A (zh) * | 2019-12-25 | 2020-05-12 | 北京工业大学 | 一种融合emd和lstm的城市pm2.5浓度预测方法 |
CN111798051A (zh) * | 2020-07-02 | 2020-10-20 | 杭州电子科技大学 | 基于长短期记忆神经网络的空气质量时空预测方法 |
CN113011660A (zh) * | 2021-03-23 | 2021-06-22 | 上海应用技术大学 | 空气质量预测方法、***及存储介质 |
CN113762642A (zh) * | 2021-09-23 | 2021-12-07 | 大连理工大学人工智能大连研究院 | 基于bo-emd-lstm深度学习算法的教室空气质量预测方法 |
Non-Patent Citations (2)
Title |
---|
ZHIBIN LIU; GUANGWEN WANG; LIANG ZHAO; GUANGFEI YANG: "Multi-Points Indoor Air Quality Monitoring Based on Internet of Things", 《IEEE ACCESS》 * |
袁东方: "基于CEEMDAN-PCA-LSTM模型的黄金期货价格预测", 《中国优秀硕士学位论文全文数据库 (基础科学辑)》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116307212A (zh) * | 2023-03-24 | 2023-06-23 | 淮阴工学院 | 一种新型空气质量预测方法及*** |
CN116307212B (zh) * | 2023-03-24 | 2023-12-19 | 淮阴工学院 | 一种空气质量预测方法及*** |
CN116933152A (zh) * | 2023-06-07 | 2023-10-24 | 哈尔滨工业大学(威海) | 一种基于多维emd-pso-lstm神经网络的海浪信息预测方法及*** |
CN116933152B (zh) * | 2023-06-07 | 2024-05-03 | 哈尔滨工业大学(威海) | 一种基于多维emd-pso-lstm神经网络的海浪信息预测方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112949945B (zh) | 一种改进双向长短期记忆网络的风电功率超短期预测方法 | |
CN108320016B (zh) | 一种建筑能耗短期预测方法 | |
CN109002686B (zh) | 一种自动生成样本的多牌号化工过程软测量建模方法 | |
CN111950854B (zh) | 一种基于多层神经网络的焦炭质量指标预测方法 | |
CN115096357A (zh) | 一种基于ceemdan-pca-lstm的室内环境质量预测方法 | |
CN112434848B (zh) | 基于深度信念网络的非线性加权组合风电功率预测方法 | |
CN111813084A (zh) | 一种基于深度学习的机械装备故障诊断方法 | |
CN116757534A (zh) | 一种基于神经训练网络的智能冰箱可靠性分析方法 | |
CN111626785A (zh) | 一种基于结合注意力的cnn-lstm网络基金价格预测方法 | |
CN114676822B (zh) | 一种基于深度学习的多属性融合空气质量预报方法 | |
CN112232561B (zh) | 基于约束并行lstm分位数回归的电力负荷概率预测方法 | |
CN112116162A (zh) | 基于ceemdan-qfoa-lstm的输电线覆冰厚度预测方法 | |
CN114781538A (zh) | 一种ga-bp神经网络耦合决策树的空气质量预测方法和*** | |
CN111144552A (zh) | 一种粮食品质多指标预测方法及装置 | |
CN114580545A (zh) | 一种基于融合模型的风电机组齿轮箱故障预警方法 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及*** | |
CN115948964A (zh) | 一种基于ga-bp神经网络的路面平整度预测方法 | |
CN115482877A (zh) | 一种基于时序图网络的发酵过程软测量建模方法 | |
CN112734131B (zh) | 一种基于深度学习算法的风机叶片覆冰状态预测方法 | |
CN116663404A (zh) | 一种耦合人工智能和贝叶斯理论的洪水预报方法及*** | |
CN115438309A (zh) | 基于lstm-svr的无人机发动机健康评估方法 | |
CN115759343A (zh) | 一种基于e-lstm的用户电量预测方法和装置 | |
CN115496264A (zh) | 一种风电机组发电功率的预测方法 | |
CN115293406A (zh) | 基于CatBoost和Radam-LSTM的光伏发电功率预测方法 | |
CN114386672A (zh) | 环境大数据物联网智能检测*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220923 |
|
RJ01 | Rejection of invention patent application after publication |