CN116842444A - 一种基于eemd-ceemdan结合lstm的混合时间序列数据预测方法 - Google Patents

一种基于eemd-ceemdan结合lstm的混合时间序列数据预测方法 Download PDF

Info

Publication number
CN116842444A
CN116842444A CN202310797469.1A CN202310797469A CN116842444A CN 116842444 A CN116842444 A CN 116842444A CN 202310797469 A CN202310797469 A CN 202310797469A CN 116842444 A CN116842444 A CN 116842444A
Authority
CN
China
Prior art keywords
lstm
sequence data
data
ceemdan
eemd
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310797469.1A
Other languages
English (en)
Inventor
尤佳
唐浩
郭东生
刘慧舟
高锦雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hainan University
Original Assignee
Hainan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hainan University filed Critical Hainan University
Priority to CN202310797469.1A priority Critical patent/CN116842444A/zh
Publication of CN116842444A publication Critical patent/CN116842444A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于EEMD‑CEEMDAN结合LSTM的混合时间序列数据预测方法,包括下述步骤:获取原始时间序列数据,并对所述原始时间序列数据进行预处理;对经预处理之后的时间序列数据进行信号分解,得到IMF模态分量;将得到的IMF模态分量输入到LSTM预测模型中得到最终的预测结果。本发明提出的预测模型通过EEMD‑CEEMDAN结合LSTM模型进一步改进提升时间序列数据预测准确度;提出了多步骤的信号分解方式,通过使用EEMD和CEEMDAN分别分解目标序列数据和数据集中其他各成分序列数据,提高了信号分解的效率。

Description

一种基于EEMD-CEEMDAN结合LSTM的混合时间序列数据预测 方法
技术领域
本发明属于时间序列数据预测领域,具体涉及一种基于EEMD-CEEMDAN结合LSTM的混合时间序列数据预测方法。
背景技术
随着科技的发展,工业化进程的加快,传感器使用的增加,时间序列数据的数量呈现出迸发式的增长。时间序列数据指的是按照时间发生的先后顺序进行排列的一组数据,通常是按照特定的采样频率在特定的时间内对特定的过程或者现象进行观测所获得的记录结果。时间序列数据广泛存在于我们的现实生活中,如气象,交通,金融以及网络流量等领域。例如,某地区在一段时间中的降雨量,某段路的历史车流量,某购物平台的历史交易额等。时间序列数据能够记录被观测对象随时间变化的过程,状态变化的过程又往往蕴含着变化规律。掌握这些变化规律,可以帮我们达到规避风险,优化决策,优化资源配置甚至提高生产力等目的。在日常生活中,气象学家利用空气质量数据来预测环境气候变化,交通管理部门利用交通流量时间序列数据预测交通状况来规划道路安排,金融分析师利用时间序列数据来预测未来的股价变化趋势。在工业生产中,工程师利用时间序列数据来检测产品质量,分析和预测资源使用情况。时间序列数据预测已经成为大数据分析的一个重要组成部分,对人们改造和优化各类与变化过程相关的生活生产活动具有重要意义。
在时间序列数据预测中应用最广泛的是基于LSTM的时间序列预测模型。典型的时间序列预测模型包括RCLSTM、SWALSTM以及DeepAR等,虽然基于LSTM的系列模型有着较好的预测结果,但仍有许多亟待解决的问题。比如在数据集方面:LSTM模型通常需要大量的时间序列数据来训练,才能提取出更精确的时间序列特征。如果数据量不足,模型可能存在欠拟合问题。如何对数据集进行预处理进而降低提取数据特征的难度亦是一个急需解决的问题。在模型结构上:LSTM模型的结构较为复杂,需要多个层次的嵌套结构,需要调试和优化各个结构参数时需要耗费大量时间。对时间序列的长期预测性差:LSTM模型在对长期预测进行时,可能会出现漂移现象,虽然残差结构等技术可以使得预测结果更加准确,但长期预测问题仍然需要进一步研究。
发明内容
本发明的目的是提供一种基于EEMD-CEEMDAN结合LSTM的混合时间序列数据预测方法来解决传统时间序列预测模型中的问题。
本发明的技术方案为:
一种基于EEMD-CEEMDAN结合LSTM的混合时间序列数据预测方法,包括下述步骤:
获取原始时间序列数据,并对所述原始时间序列数据进行预处理;
对经预处理之后的时间序列数据进行信号分解,得到IMF模态分量;
将得到的IMF模态分量输入到LSTM预测模型中得到最终的预测结果。
进一步的,所述预处理为:
将原始时间序列数据按照时间顺序进行排列,删除异常值和离群值,使用均值对缺失值进行填充;用最大最小值法对数据进行标准化操作,将所有数据缩放到[0,1]的范围内。
进一步的,通过EEMD和CEEMDAN来对预处理之后的时间序列数据划分为目标序列数据与其他各成分的序列数据进行信号分解,得到IMF模态分量。
进一步的,在进行信号分解时将EEMD和CEEMDAN算法中的最大本征模态函数的数量设置为6。
进一步的,利用EEMD对各成分序列数据进行信号分解,得到它们的IMF模态分量,通过计算所述IMF模态分量与目标序列数据的相关性,得到相关系数大于0.35的IMF模态分量。
进一步的,利用CEEMDAN对目标序列数据进行分解,得到目标序列数据的IMF模态分量。
进一步的,所述LSTM预测模型包含两个LSTM模块和全连接层;第一LSTM模块由第一LSTM层和第一Dropout层组成;第二LSTM模块是由第二LSTM和第二Dropout层组成。
进一步的,所述第一LSTM层有200个LSTM神经元,所述第二LSTM层有100个LSTM神经元,所述全连接层只有一个LSTM神经元。
进一步的,所有Dropout层的系数都为0.2。
进一步的,通过LSTM预测模型进行预测时,将Batch_size(用以训练的样本个数)设置为64。
本发明的技术效果:
本发明提出的预测模型通过EEMD-CEEMDAN结合LSTM模型进一步改进提升时间序列数据预测准确度;提出了多步骤的信号分解方式,通过使用EEMD和CEEMDAN分别分解目标序列数据和数据集中其他各成分序列数据,提高了信号分解的效率。
附图说明
附图大体上通过举例而不是限制的方式示出各种实施例,并且与说明书以及权利要求书一起用于对所发明的实施例进行说明。在适当的时候,在所有附图中使用相同的附图标记指代同一或相似的部分。这样的实施例是例证性的,而并非旨在作为本装置或方法的穷尽或排他实施例。
图1为本发明的基于EEMD-CEEMDAN结合LSTM的混合时间序列数据预测方法整体流程示意图;
图2为EEMD信号分解步骤流程图;
图3为CEEMDAN信号分解步骤流程图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
实施例
如图1所示,本实施例提供一种基于EEMD-CEEMDAN结合LSTM的混合时间序列数据预测方法,包括下述步骤:
S1:首先对原始数据进行预处理;
在保留原始数据关键特征的前提下,将数据按照时间顺序进行排列,检验数据的完整性,删除错误数据并将删除的数据和原本缺失的数据用整体数据的平均值进行填充;找到数据的最大值和最小值,利用最大最小值归一化的方法将数据集中所有数据缩放到[0,1]的范围内。
S2:使用EEMD和CEEMDAN分别对时间序列数据进行信号分解
EEMD分解的步骤为:1、对原始的序列信号添加高斯白噪声得到新的信号。2、对步骤1得到的信号进行EMD分解得到对应的IMF分量。3、对步骤2得到的IMF分量进行集合平均,得到最后的输出结果。
CEEMDAN分解步骤为:1、确定给原始序列信号加入的高斯白噪声的幅值和进行取平均操作的次数。2、向原始序列信号中加入高斯白噪声。3、对步骤2得到的信号进行EMD分解,计算出它们的第一阶IMF分量。4、利用原始信号f和步骤3得到的第一阶IMF分量计算第一个残值。重复上述四个步骤,得到最后的输出结果。
原始时间序列数据经预处理之后,将全部的时间序列数据划分为目标序列数据与其他各成分的序列数据,在进行目标序列数据与数据集中各成分序列数据分解时,将EEMD和CEEMDAN算法中的最大本征模态函数的数量设置为6。利用EEMD对各成分序列数据进行信号分解,得到它们的IMF模态分量,通过计算这些IMF模态分量与目标序列数据的相关性,将相关系数大于0.35的IMF模态分量筛选出来进行下一步操作。利用CEEMDAN对目标序列数据进行分解,得到目标序列数据的IMF模态分量。将所有的IMF模态分量进行合并作为预测模块的输入数据,通过LSTM网络进行预测时,将Batch_size设置为64。
S3:使用LSTM模块预测目标序列数据;
为了提高所提出的LSTM模型的分类精度,混合模型第一阶段分解信号得到的IMF模态分量作为模型第二阶段提出的LSTM预测模型的输入。
所提出的LSTM预测模型包含两个LSTM层、两个Dropout层以及一个Dense层,第一个LSTM层包含200个LSTM神经元,输入数据的尺寸为(3,23),为了防止当前模型过拟合,第一个LSTM层后面加了一个系数为0.2的Dropout层。第二个LSTM层包含100个LSTM神经元,第二个Dropout层的Dropout系数同样为0.2。最后面的Dense层包含一个神经元,用于输出特征为1的预测数据。
本发明以平均绝对误差(MeanAbsolute Error,MAE)、均方差(Mean squarederror,MSE)、平均绝对百分比误差(MeanAbsolute Percentage Error,MAPE)以及R2(RSquared):判定系数等四个指标评估预测性能。其中,平均绝对误差(MeanAbsolute Error,MAE),用于评估预测结果和真实数据集的接近程度的程度,其值越小说明拟合效果越好。均方差(Mean squared error,MSE),该指标计算的是拟合数据和原始数据对应样本点的误差的平方和的均值,其值越小说明拟合效果越好。平均绝对百分比误差(MeanAbsolutePercentage Error,MAPE):相对误差度量值,使用绝对值来避免正误差和负误差相互抵消,MAPE值越小,模型拟合效果越好。R2(R Squared):判定系数,反映模型的拟合程度,值取值范围是[0,1],越接近1效果越好。
以上所述,仅为本发明优选的具体实施方式,但本发明的保护范围不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种基于EEMD-CEEMDAN结合LSTM的混合时间序列数据预测方法,其特征在于,包括下述步骤:
获取原始时间序列数据,并对所述原始时间序列数据进行预处理;
对经预处理之后的时间序列数据进行信号分解,得到IMF模态分量;
将得到的IMF模态分量输入到LSTM预测模型中得到最终的预测结果。
2.根据权利要求1所述的混合时间序列数据预测方法,其特征在于,所述预处理为:
首先将原始时间序列数据按照统一的时间标准进行有序排列,然后使用平均值对缺失值进行填充,最后对数据进行归一化处理。
3.根据权利要求1所述的混合时间序列数据预测方法,其特征在于,通过EEMD和CEEMDAN来对预处理之后的时间序列数据划分为目标序列数据与其他各成分的序列数据进行信号分解,得到IMF模态分量。
4.根据权利要求3所述的混合时间序列数据预测方法,其特征在于,在进行信号分解时将EEMD和CEEMDAN算法中的最大本征模态函数的数量设置为6。
5.根据权利要求3所述的混合时间序列数据预测方法,其特征在于,
利用EEMD对各成分序列数据进行信号分解,得到它们的IMF模态分量,通过计算所述IMF模态分量与目标序列数据的相关性,得到相关系数大于0.35的IMF模态分量。
6.根据权利要求3所述的混合时间序列数据预测方法,其特征在于,
利用CEEMDAN对目标序列数据进行分解,得到目标序列数据的IMF模态分量。
7.根据权利要求1所述的混合时间序列数据预测方法,其特征在于,所述LSTM预测模型包含两个LSTM模块和全连接层;第一LSTM模块由第一LSTM层和第一Dropout层组成;第二LSTM模块是由第二LSTM和第二Dropout层组成。
8.根据权利要求7所述的混合时间序列数据预测方法,其特征在于,所述第一LSTM层有200个LSTM神经元,所述第二LSTM层有100个LSTM神经元,所述全连接层只有一个LSTM神经元。
9.根据权利要求7所述的混合时间序列数据预测方法,其特征在于,所有Dropout层的系数都为0.2。
10.根据权利要求1所述的混合时间序列数据预测方法,其特征在于,通过LSTM预测模型进行预测时,将用以训练的样本个数设置为64。
CN202310797469.1A 2023-07-03 2023-07-03 一种基于eemd-ceemdan结合lstm的混合时间序列数据预测方法 Pending CN116842444A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310797469.1A CN116842444A (zh) 2023-07-03 2023-07-03 一种基于eemd-ceemdan结合lstm的混合时间序列数据预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310797469.1A CN116842444A (zh) 2023-07-03 2023-07-03 一种基于eemd-ceemdan结合lstm的混合时间序列数据预测方法

Publications (1)

Publication Number Publication Date
CN116842444A true CN116842444A (zh) 2023-10-03

Family

ID=88172035

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310797469.1A Pending CN116842444A (zh) 2023-07-03 2023-07-03 一种基于eemd-ceemdan结合lstm的混合时间序列数据预测方法

Country Status (1)

Country Link
CN (1) CN116842444A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104679981A (zh) * 2014-12-25 2015-06-03 新疆大学 一种基于可变步长lms-eemd的振动信号降噪方法
CN107961007A (zh) * 2018-01-05 2018-04-27 重庆邮电大学 一种结合卷积神经网络和长短时记忆网络的脑电识别方法
CN110458341A (zh) * 2019-07-25 2019-11-15 山东大学 一种考虑气象特性的超短期风电预测方法及***
CN110619418A (zh) * 2019-07-26 2019-12-27 重庆大学 一种基于混合模型组合算法的多特征水质预测方法
CN111105321A (zh) * 2019-12-03 2020-05-05 湘潭大学 一种基于eemd二次分解的电力负荷预测方法
CN112834221A (zh) * 2020-12-31 2021-05-25 郑州航空工业管理学院 一种基于eemd-mse和多尺度一维卷积神经网络轴承故障诊断方法
CN113326966A (zh) * 2021-02-10 2021-08-31 华北电力大学 基于ceemd-lstm的综合能源***多元负荷预测方法
CN114912666A (zh) * 2022-04-24 2022-08-16 同济大学 一种基于ceemdan算法和注意力机制的短时客流量预测方法
CN115034457A (zh) * 2022-05-30 2022-09-09 江西理工大学 一种基于ceemdan-lstm的城市轨道交通短时客流预测方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104679981A (zh) * 2014-12-25 2015-06-03 新疆大学 一种基于可变步长lms-eemd的振动信号降噪方法
CN107961007A (zh) * 2018-01-05 2018-04-27 重庆邮电大学 一种结合卷积神经网络和长短时记忆网络的脑电识别方法
CN110458341A (zh) * 2019-07-25 2019-11-15 山东大学 一种考虑气象特性的超短期风电预测方法及***
CN110619418A (zh) * 2019-07-26 2019-12-27 重庆大学 一种基于混合模型组合算法的多特征水质预测方法
CN111105321A (zh) * 2019-12-03 2020-05-05 湘潭大学 一种基于eemd二次分解的电力负荷预测方法
CN112834221A (zh) * 2020-12-31 2021-05-25 郑州航空工业管理学院 一种基于eemd-mse和多尺度一维卷积神经网络轴承故障诊断方法
CN113326966A (zh) * 2021-02-10 2021-08-31 华北电力大学 基于ceemd-lstm的综合能源***多元负荷预测方法
CN114912666A (zh) * 2022-04-24 2022-08-16 同济大学 一种基于ceemdan算法和注意力机制的短时客流量预测方法
CN115034457A (zh) * 2022-05-30 2022-09-09 江西理工大学 一种基于ceemdan-lstm的城市轨道交通短时客流预测方法

Similar Documents

Publication Publication Date Title
CN111008726B (zh) 一种电力负荷预测中类图片转换方法
CN111796957B (zh) 基于应用日志的交易异常根因分析方法及***
Xu et al. Hybrid feature selection for wafer acceptance test parameters in semiconductor manufacturing
CN114048436A (zh) 一种预测企业财务数据模型构建方法及构建装置
CN117172509B (zh) 基于装修施工进度分析的施工项目分配***
CN114066073A (zh) 电网负荷预测方法
CN112803398A (zh) 基于经验模态分解和深度神经网络的负荷预测方法及***
CN111667135A (zh) 一种基于典型特征提取的负荷结构解析方法
CN115965110A (zh) 面向产业园区的企业用能画像及碳排放精准测算方法
CN112836967B (zh) 新能源汽车电池安全风险评估***
CN116883184A (zh) 一种基于大数据的财税智能化分析方法
CN116842444A (zh) 一种基于eemd-ceemdan结合lstm的混合时间序列数据预测方法
CN112348220A (zh) 一种基于企业行为模式的信用风险评估预测方法及***
CN115081514A (zh) 一种数据不平衡情况下的工业设备故障识别方法
CN115760454A (zh) 一种基于循环宽度学习的财务舞弊识别方法
CN111798237B (zh) 基于应用日志的异常交易诊断方法及***
CN111654853B (zh) 一种基于用户信息的数据分析方法
CN103678953A (zh) 基于贝叶斯组合神经网络的生物发酵产量在线预报方法
Xu et al. Security monitoring data fusion method based on ARIMA and LS-SVM
CN111931966A (zh) 基于决策树回归的供电可靠性预测方法
Zuo Automatic Analysis System for Enterprise Financial Information Based on Artificial Intelligence
Wang et al. Forecast of Production Quantity of General-Purpose Parts Based on Customized Production
Chen et al. Research on Interpolation Method for Missing Electricity Consumption Data.
CN115222113B (zh) 基于cnn-lstm的铁路区域货运量短期预测方法
CN113723835B (zh) 火电厂用水评估方法和终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination