CN116681173A - 一种基于rnn模型的数据密集型电力负载预测并行优化方法 - Google Patents

一种基于rnn模型的数据密集型电力负载预测并行优化方法 Download PDF

Info

Publication number
CN116681173A
CN116681173A CN202310661973.9A CN202310661973A CN116681173A CN 116681173 A CN116681173 A CN 116681173A CN 202310661973 A CN202310661973 A CN 202310661973A CN 116681173 A CN116681173 A CN 116681173A
Authority
CN
China
Prior art keywords
data
model
training
rnn model
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310661973.9A
Other languages
English (en)
Inventor
龙玉江
甘润东
李洵
卫薇
王杰峰
王策
钟掖
龙娜
卢仁猛
孙骏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guizhou Power Grid Co Ltd
Original Assignee
Guizhou Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guizhou Power Grid Co Ltd filed Critical Guizhou Power Grid Co Ltd
Priority to CN202310661973.9A priority Critical patent/CN116681173A/zh
Publication of CN116681173A publication Critical patent/CN116681173A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • G06F18/15Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于RNN模型的数据密集型电力负载预测并行优化方法,该方法包括以下步骤:步骤1、对原始数据进行空值处理、异常值进行检测和处理;步骤2、将步骤1处理之后的一个时间序列,对时间序列的每个时间步的输入包括过去若干个时间步的电力负载数据输入到RNN模型中进行训练。本发明使用RNN模型充分利用历史数据来进行预测,具有较高的预测准确性和稳定性。通过对历史负载数据的学习,RNN可以捕捉到数据的时序特征和长期依赖关系,从而更好地预测未来负载变化。

Description

一种基于RNN模型的数据密集型电力负载预测并行优化方法
技术领域
本发明涉及一种基于RNN模型的数据密集型电力负载预测并行优化方法,属于电力负载预测优化技术领域。
背景技术
电力负载预测指利用历史电力负载数据和相关信息,通过数学模型和算法来预测未来一段时间内的电力负载。电力负载是指消费者对电力***的实时用电需求。负载预测的目的是为了使电力***能够更好地规划和调度电力资源,以满足未来的电力需求。电力负载预测在电力行业中具有广泛的应用,包括电力资源调度、市场交易和电力供需平衡等方面。传统的电力负载预测方法主要基于时间序列分析、回归分析、人工神经网络等方法。
现有的人工神经网络中的深度学习模型是一种基于人工神经网络的机器学习方法通过多层非线性变换对数据进行抽象和表征学习,可以有效地处理大规模、高维度的数据。在电力负载预测方面,深度学习模型被广泛应用,例如使用循环神经网络(RNN)、长短时记忆网络(LSTM)、卷积神经网络(CNN)等模型进行负载预测。使用深度学习模型进行电力负载预测和并行优化的优点主要包括提高预测精度、加速计算速度、优化模型结构、提高能耗效率等方面。
随着电力***的迅速发展和数据量的快速增加,传统方法已经难以满足电力负载预测的需求:训练精度和训练速度。因此,电力科研工作者开始探索新的方法,如深度学习、并行计算等技术在电力负载预测中的应用,旨在提高预测精度和训练速度。这些新技术具有强大的数据处理和分析能力,并可以通过优化模型结构和并行计算来提高电力负载预测的效率和准确性。这些新技术的应用将为电力***的发展带来新的机遇和挑战,有望实现更加智能、高效、可靠和可持续的电力供应。
发明内容
本发明要解决的技术问题是:提供一种基于RNN模型的数据密集型电力负载预测并行优化方法,解决现有技术存在的问题。
本发明采取的技术方案为:一种基于RNN模型的数据密集型电力负载预测并行优化方法,该方法包括以下步骤:
步骤1、对原始数据进行空值处理、异常值进行检测和处理;
步骤2、将步骤1处理之后的一个时间序列,对时间序列的每个时间步的输入包括过去若干个时间步的电力负载数据输入到RNN模型中进行训练。
进一步地,上述步骤1中检测和处理的步骤具体如下:
步骤101:原始数据包含来自不同国家的真实电力负载、风力发电和太阳能发电的历史数据的Global Energy Forecasting Competition数据集;
步骤102:将步骤101的源生数据集中缺失值进行处理;
步骤103:将步骤102中空值处理后对异常值进行检测和处理,剔除异常数据;
步骤104:将原始数据按照时间分为训练集、验证集和测试集;
步骤105:根据问题需求,对数据进行转换,将温度从摄氏度转换为华氏度、将时间戳转换为datetime格式;对于时间序列数据,进行重采样和插值,以填补缺失值或规范数据采样频率;
步骤106:通过特征工程,对步骤105中重采样和插值处理后的数据进行特征提取,以用于模型训练;
步骤107:对步骤105中经过重采样和差值处理的数据,提取时间特征和统计特征来表征电力负载的变化规律。时间特征包括小时、星期、季节、假期等;统计特征包括历史负载数据的最大值、最小值、平均值、标准差等;
步骤108:对步骤107得到的数据进行归一化处理,使各个特征的取值范围统一为[0,1],避免某些特征对模型训练产生过大的影响,采用线性变换的方法实现归一化;
步骤109:数据并行化处理,由于数据规模过大,将数据分成多个小批次进行处理,提高模型训练的效率;
步骤110:将处理后的数据保存下来,便于后续的模型训练和预测使用。
进一步地,上述步骤102中缺失值处理方法为:用前一时刻的值进行填充处理。
进一步地,上述步骤103中异常数据剔除方法使用3σ法则。
进一步地,上述步骤104中将前80%的数据作为训练集,中间的10%作为验证集,最后的10%作为测试集。
进一步地,上述步骤108中归一化公式为:其中xmax为样本数据的最大值,xmin为样本数据的最小值。
进一步地,上述步骤2中RNN训练方法步骤如下:
步骤201:将预处理后的数据按照设定的时间窗口和滞后期进行滑动窗口处理,形成模型所需要的特征;采用滑动窗口方法将过去若干个时间点的数据作为特征输入到RNN模型中,以预测未来的负载;
步骤202:将输入到RNN模型中的特征矩阵按照70%训练集、15%验证集和15%测试集的比例划分;
步骤203:分别将训练集和测试集按照最大最小值进行归一化处理;
步骤204:将归一化后的训练集输入到RNN模型中进行训练;
步骤205:使用BPTT算法训练循环神经网络(RNN);BPTT算法是一种反向传播算法,它将RNN展开成前馈神经网络,并将每个时间步看作网络的一个层。对于每个时间步,使用反向传播算法计算当前时间步的损失函数对神经网络参数的梯度,并将每个时间步的梯度累加起来,最终得到整个序列的梯度。BPTT算法能够处理任意长度的序列,但需要在整个序列上进行反向传播,因此在处理长序列时会出现计算和存储成本过高的问题,同时需要特殊的处理来避免梯度消失或***的问题;
步骤206:将训练数据集划分成多个子集,每个子集由一个独立的计算单元处理,每个计算单元使用相同的RNN模型,并在每个时间步上更新模型参数,最后,将各计算单元处理的结果进行聚合,得到最终结果;
步骤207:要将RNN模型移植到GPU上,利用GPU的并行计算能力进行训练和推理,需按以下步骤:先安装GPU驱动和CUDA,选GPU支持的框架和库。再将RNN模型部署到GPU上,并指定GPU为计算设备。然后用模型对输入数据进行前向传播,获取推理结果。要注意GPU显存是否充足,可用GPU优化技术提高性能。最后可参考框架文档和优化指南获取更多信息。GPU加速可以显著提升计算速度,加快模型训练和预测的过程;
步骤208:将归一化好的测试集输入到训练好的RNN模型中进行测试。
进一步地,上述RNN训练方法步骤还包括步骤209:对训练好的模型进行性能分析,采用均方根误差(RMSE)和平均绝对误差(MAE)评估,通过消融实验、使用不同的参数对历史电力负载数据的结果进行对比。
进一步地,上述在模型训练阶段,采用反向传播算法进行模型训练。
本发明的有益效果:与现有技术相比,本发明的效果如下:
1)、本发明使用RNN模型充分利用历史数据来进行预测,具有较高的预测准确性和稳定性。通过对历史负载数据的学习,RNN可以捕捉到数据的时序特征和长期依赖关系,从而更好地预测未来负载变化。
2)、本发明通过反向传播算法和并行计算技术对RNN模型进行高效的训练和优化。反向传播算法能够根据预测误差来更新模型的权重和偏置,从而不断提高模型的预测准确性。而GPU并行计算技术能够快速地执行并行计算任务,大幅缩短模型训练时间,提高训练效率。
3)、本发明通过两种种指标对模型预测结果进行评估,均方根误差(RMSE)、平均绝对误差(MAE)等,同时,通过可以配合可视化技术,将预测结果进行展示和比较,帮助电力***决策者更好地理解预测结果和制定相应的应对措施。进一步提高模型的可靠性和实用性,为电力***的稳定运行和可持续发展提供有力支持。
附图说明
图1为本发明数据预处理的基本流程示意图;
图2为本发明模型预测的基本流程示意图。
具体实施方式
下面结合附图及具体的实施例对本发明进行进一步介绍。
实施例1:如图1-2所示,一种基于RNN模型的数据密集型电力负载预测并行优化方法,包括两部分:一是对原始数据进行空值处理、异常值进行检测和处理,二是将预处理好的数据集输入到RNN模型中进行训练预测和并行优化并进行评估。
1、将原始数据读入程序中后,其基本数据预处理的基本流程按照图1所示执行,以下为基本流程的主要步骤:
步骤101:将包含来自不同国家的真实电力负载、风力发电和太阳能发电的历史数据的Global Energy Forecasting Competition数据集读入程序中;
步骤102:将读入程序中的源生数据集中缺失值进行处理。用前一时刻的值进行填充处理;
步骤103:将空值处理后对异常值进行检测和处理,使用3σ法则剔除异常数据;
步骤104:将原始数据按照时间分为训练集、验证集和测试集。通常将前80%的数据作为训练集,接下来的10%作为验证集,剩余10%作为测试集;
步骤105:根据问题需求,对数据进行转换,将温度从摄氏度转换为华氏度、将时间戳转换为datetime格式等;对于时间序列数据,进行重采样和插值,以填补缺失值或规范数据采样频率;
步骤106:通过特征工程,对步骤105中重采样和插值处理后的数据进行特征提取,以用于模型训练;
步骤107:对步骤105中经过重采样和差值处理的数据,提取时间特征和统计特征来表征电力负载的变化规律。时间特征包括小时、星期、季节、假期等;统计特征包括历史负载数据的最大值、最小值、平均值、标准差等;;
步骤108:对步骤107得到的数据进行归一化处理,使各个特征的取值范围统一为[0,1],避免某些特征对模型训练产生过大的影响,采用线性变换的方法实现归一化,以确保各个特征的取值范围相同,防止某些特征对模型训练的影响过大,将原始数据线性化的方法转换到[0,1]的范围,归一化公式为:其中xmax为样本数据的最大值,xmin为样本数据的最小值;
步骤109:数据并行化处理,由于数据规模过大,将数据分成多个小批次进行处理,提高模型训练的效率;
步骤110:将处理后的数据保存下来,便于后续的模型训练和预测使用;
2、将数据清洗和预处理之后的一个时间序列,每个时间步的输入包括过去若干个时间步的电力负载数据输入到RNN模型中进行训练,以下为基本流程的主要步骤:
步骤201:将预处理后的数据按照一定的时间窗口和滞后期进行滑动窗口处理,形成模型所需要的特征。采用滑动窗口方法将过去若干个时间点的数据作为特征输入到RNN模型中,以预测未来的负载;
步骤202:将输入到RNN模型中的特征矩阵按照70%训练集、15%验证集和15%测试集的比例划分;
步骤203:分别将训练集和测试集按照最大最小值进行归一化处理;
步骤204:将归一化好的训练集输入到RNN模型中进行训练;
步骤205:在本发明中,使用BPTT算法训练循环神经网络(RNN)。BPTT算法是一种反向传播算法,它将RNN展开成前馈神经网络,并将每个时间步看作网络的一个层。对于每个时间步,使用反向传播算法计算当前时间步的损失函数对神经网络参数的梯度,并将每个时间步的梯度累加起来,最终得到整个序列的梯度。BPTT算法能够处理任意长度的序列,但需要在整个序列上进行反向传播,因此在处理长序列时会出现计算和存储成本过高的问题,同时需要特殊的处理来避免梯度消失或***的问题;
步骤206:将训练数据集划分成多个子集,每个子集由一个独立的计算单元处理,每个计算单元使用相同的RNN模型,并在每个时间步上更新模型参数。最后,将各计算单元处理的结果进行聚合,得到最终结果;
步骤207:要将RNN模型移植到GPU上,利用GPU的并行计算能力进行训练和推理,需按以下步骤:先安装GPU驱动和CUDA,选GPU支持的框架和库。再将RNN模型部署到GPU上,并指定GPU为计算设备。然后用模型对输入数据进行前向传播,获取推理结果。要注意GPU显存是否充足,可用GPU优化技术提高性能。最后可参考框架文档和优化指南获取更多信息。GPU加速可以显著提升计算速度,加快模型训练和预测的过程;
步骤208:将归一化好的测试集输入到训练好的RNN模型中进行测试;
步骤209:对训练好的模型进行性能分析:通过消融实验、使用不同的参数对历史电力负载数据的结果进行对比。
本发明采用的数据集:全球能源预测竞赛(Global Energy ForecastingCompetition,GEFC)数据集是由国际能源预测研究联盟(International EnergyForecasting Association,IEFA)主办的,旨在提高电力负载、风力发电和太阳能发电的预测准确性。该数据集包含来自不同国家的真实电力负载、风力发电和太阳能发电的历史数据,数据粒度可以是小时、天、周或月,时间跨度也相对较长。
该数据集的特点在于其多样性和实用性,可以用于不同类型的电力负载和可再生能源预测研究,同时也可以用于测试和比较不同预测方法的效果。
本发明采用到的优化训练方法:
1)数据清洗和预处理:对数据密集型电力负载进行预测和并行优化的过程中,数据清洗和预处理是至关重要的步骤。首先,需要对数据进行清洗,去除可能存在的异常值和不合理数据。对于Global Energy Forecasting Competition数据集,需要采用特征工程技术提取出影响电力负荷的因素,例如温度、天气、季节等。这些因素可以对电力负荷产生重要的影响,通过对其进行提取和分析,可以更好地预测未来的负荷情况。同时,由于数据中可能存在缺失值,需要针对缺失值进行填充处理,以确保数据的完整性和准确性。最后,也需要采用归一化技术对数据进行处理,使得模型能够更好地理解数据的分布和规律,从而提高预测的准确性。
2)模型训练和并行优化:在电力负载预测和并行优化中,采用循环神经网络(RNN)模型进行建模。循环神经网络是一种具有记忆能力的神经网络,能够在处理时间序列数据时有效地捕捉数据中的时序信息。因此,在电力负载预测中,循环神经网络能够很好地处理历史负荷数据,同时将其与未来负荷进行关联,从而实现负荷预测。
在模型训练阶段,采用反向传播算法进行模型训练,以提高模型的准确性和预测能力。反向传播算法通过计算损失函数对模型参数进行更新,从而使得模型的预测结果更加接近真实结果。在循环神经网络模型中,反向传播算法还需要考虑时间序列数据的特殊性,因此需要特别处理,采用BPTT(Backpropagation Through Time)算法来实现模型训练可以很好的的解决问题。
同时,为了加快模型训练速度和提高效率,可以利用并行计算技术对模型进行优化,将RNN模型分解成多个子模型,每个子模型负责处理一部分时间步,不同的子模型可以在不同的计算单元上运行,每个计算单元负责更新相应子模型的参数。最后,将各子模型处理的结果进行聚合,得到最终结果。使用GPU并行计算技术来加速模型训练。GPU拥有较高的并行计算能力和大规模数据处理能力,能够有效地提高模型训练速度和效率。
此外,通过调整模型结构和参数来优化模型性能,从而获得更好的预测结果和并行优化效果。在循环神经网络模型中,通过调整网络层数、隐藏层大小、激活函数、学习率等参数来优化模型性能,同时通过Dropout、Batch Normalization等技术来避免过拟合问题。
3)预测结果评估:对模型的预测结果进行评估,以判断模型的预测能力和准确度。使用两种评估指标:均方根误差(RMSE)、平均绝对误差(MAE)。均方根误差是预测值与实际值之间差值的平方和的均值的平方根,平均绝对误差是预测值与实际值之间差值的绝对值的均值。这些指标可以帮助研究人员更好地理解模型的预测能力和准确度。
除了使用评估指标之外,还利用可视化技术将预测结果进行展示和比较。将实际值和预测值在同一张图上进行绘制,以便更直观地比较它们之间的差异和趋势。此外,还采用时间序列分析的方法,对预测结果进行分析和可视化展示,以帮助电力***决策者更好地理解预测结果和制定相应的应对措施。总的来说,通过预测结果的评估和可视化,能够帮助电力***决策者更好地理解预测结果并作出相应决策。
本发明具有如下优点:
1.数据清洗和预处理:对电力负载数据进行清洗和处理,提高数据的质量和可用性。
2.模型选择和优化:选择适合电力负载预测的RNN模型,并通过调整模型结构和参数来进一步提高预测效果。
3.训练和并行计算:通过并行计算来加速训练和预测过程,同时优化模型结构和参数设置也可以进一步提高计算速度。
4.模型泛化能力:由于电力负载数据具有时变性和不确定性,需要通过合理的训练和验证方法来提高模型的泛化能力,避免出现过拟合或欠拟合等问题。
5.实时性和可靠性:电力负载预测需要具备较高的实时性和可靠性,因此需要使用快速且可靠的算法和***实现。
综上:本发明充分利用历史数据进行预测,能够捕捉到时序特征和长期依赖关系,从而提高预测准确性和稳定性。本发明使用反向传播算法和并行计算技术对模型进行高效训练和优化,加快模型训练速度,提高训练效率。本发明通过两种指标对模型预测结果进行评估,并利用可视化技术展示和比较预测结果,帮助决策者更好地理解预测结果和制定相应的应对措施,进一步提高模型的可靠性和实用性。本发明针对电力负载预测和并行优化的特点,进行模型结构和参数的调整,进一步提高模型性能。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内,因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (9)

1.一种基于RNN模型的数据密集型电力负载预测并行优化方法,其特征在于:该方法包括以下步骤:
步骤1、对原始数据进行空值处理、异常值进行检测和处理;
步骤2、将步骤1处理之后的一个时间序列,对时间序列的每个时间步的输入包括过去若干个时间步的电力负载数据输入到RNN模型中进行训练。
2.根据权利要求1所述的一种基于RNN模型的数据密集型电力负载预测并行优化方法,其特征在于:步骤1中检测和处理的步骤具体如下:
步骤101:原始数据包含来自不同国家的真实电力负载、风力发电和太阳能发电的历史数据的Global Energy Forecasting Competition数据集;
步骤102:将步骤101的源生数据集中缺失值进行处理;
步骤103:将步骤102中空值处理后对异常值进行检测和处理,剔除异常数据;
步骤104:将原始数据按照时间分为训练集、验证集和测试集;
步骤105:根据问题需求,对数据进行转换,将温度从摄氏度转换为华氏度、将时间戳转换为datetime格式;对于时间序列数据,进行重采样和插值;
步骤106:通过特征工程,对步骤105中重采样和插值处理后的数据进行特征提取,以用于模型训练;
步骤107:对步骤105中经过重采样和差值处理的数据,提取时间特征和统计特征来表征电力负载的变化规律,时间特征包括小时、星期、季节、假期等;统计特征包括历史负载数据的最大值、最小值、平均值、标准差等;
步骤108:对步骤107中提取到的特征数据进行归一化处理,将原始数据线性化的方法转换到[0,1]的范围;
步骤109:数据并行化处理;
步骤110:将处理后的数据保存下来。
3.根据权利要求2所述的一种基于RNN模型的数据密集型电力负载预测并行优化方法,其特征在于:步骤102中缺失值处理方法为:用前一时刻的值进行填充处理。
4.根据权利要求2所述的一种基于RNN模型的数据密集型电力负载预测并行优化方法,其特征在于:步骤103中异常数据剔除方法使用3σ法则。
5.根据权利要求2所述的一种基于RNN模型的数据密集型电力负载预测并行优化方法,其特征在于:步骤104中将前80%的数据作为训练集,中间的10%作为验证集,最后的10%作为测试集。
6.根据权利要求2所述的一种基于RNN模型的数据密集型电力负载预测并行优化方法,其特征在于:步骤108中归一化公式为:其中xmax为样本数据的最大值,xmin为样本数据的最小值。
7.根据权利要求2所述的一种基于RNN模型的数据密集型电力负载预测并行优化方法,其特征在于:步骤2中RNN训练方法步骤如下:
步骤201:将预处理后的数据按照设定的时间窗口和滞后期进行滑动窗口处理,形成模型所需要的特征;采用滑动窗口方法将过去若干个时间点的数据作为特征输入到RNN模型中,以预测未来的负载;
步骤202:将输入到RNN模型中的特征矩阵按照70%训练集、15%验证集和15%测试集的比例划分;
步骤203:分别将训练集和测试集按照最大最小值进行归一化处理;
步骤204:将归一化后的训练集输入到RNN模型中进行训练;
步骤205:使用BPTT算法训练循环神经网络(RNN);
步骤206:将训练数据集划分成多个子集,每个子集由一个独立的计算单元处理,每个计算单元使用相同的RNN模型,并在每个时间步上更新模型参数,最后,将各计算单元处理的结果进行聚合,得到最终结果;
步骤207:将RNN模型移植到GPU上,使用GPU的并行计算能力进行训练和推理;要用GPU推理RNN模型,需按以下步骤:先安装GPU驱动和CUDA,选GPU支持的框架和库,再将RNN模型放到GPU上,设GPU为计算设备,然后用模型对输入数据做前向传播,得推理结果,若GPU显存不够用,用GPU优化技术提升性能,最后查框架文档和优化指南了解更多;
步骤208:将归一化好的测试集输入到训练好的RNN模型中进行测试。
8.根据权利要求7所述的一种基于RNN模型的数据密集型电力负载预测并行优化方法,其特征在于:还包括步骤209:对训练好的模型进行性能分析:采用均方根误差(RMSE)和平均绝对误差(MAE)评估,通过消融实验、使用不同的参数对历史电力负载数据的结果进行对比。
9.根据权利要求7所述的一种基于RNN模型的数据密集型电力负载预测并行优化方法,其特征在于:在模型训练阶段,采用反向传播算法进行模型训练。
CN202310661973.9A 2023-06-06 2023-06-06 一种基于rnn模型的数据密集型电力负载预测并行优化方法 Pending CN116681173A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310661973.9A CN116681173A (zh) 2023-06-06 2023-06-06 一种基于rnn模型的数据密集型电力负载预测并行优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310661973.9A CN116681173A (zh) 2023-06-06 2023-06-06 一种基于rnn模型的数据密集型电力负载预测并行优化方法

Publications (1)

Publication Number Publication Date
CN116681173A true CN116681173A (zh) 2023-09-01

Family

ID=87778680

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310661973.9A Pending CN116681173A (zh) 2023-06-06 2023-06-06 一种基于rnn模型的数据密集型电力负载预测并行优化方法

Country Status (1)

Country Link
CN (1) CN116681173A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118035683A (zh) * 2024-02-21 2024-05-14 广州龙数科技有限公司 一种时间序列数据分析方法、***及设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118035683A (zh) * 2024-02-21 2024-05-14 广州龙数科技有限公司 一种时间序列数据分析方法、***及设备

Similar Documents

Publication Publication Date Title
CN113962364B (zh) 一种基于深度学习的多因素用电负荷预测方法
CN107578124B (zh) 基于多层改进gru神经网络的短期电力负荷预测方法
Lin et al. An improved moth-flame optimization algorithm for support vector machine prediction of photovoltaic power generation
CN109948845A (zh) 一种配电网负荷长短期记忆神经网络预测方法
CN113107626B (zh) 一种基于多变量lstm的联合循环发电机组负荷预测方法
CN110751318A (zh) 一种基于ipso-lstm的超短期电力负荷预测方法
Bendali et al. Deep learning using genetic algorithm optimization for short term solar irradiance forecasting
Cao et al. Multi-step wind power forecasting model using LSTM networks, similar time series and LightGBM
CN114218872B (zh) 基于dbn-lstm半监督联合模型的剩余使用寿命预测方法
CN108596242A (zh) 基于小波神经网络和支持向量机的电网气象负荷预测方法
Sodsong et al. Short-term solar PV forecasting using gated recurrent unit with a cascade model
CN112163689A (zh) 基于深度Attention-LSTM的短期负荷分位点概率预测方法
CN113158572A (zh) 一种短期负荷的预测方法及装置
CN115860177A (zh) 基于组合式机器学习模型光伏发电功率预测方法及其应用
CN114021848A (zh) 一种基于lstm深度学习的发电量需求预测方法
CN116681173A (zh) 一种基于rnn模型的数据密集型电力负载预测并行优化方法
CN111697560B (zh) 一种基于lstm预测电力***负荷的方法及***
Yuniarti et al. Short term electrical energy consumption forecasting using rnn-lstm
CN117132132A (zh) 基于气象数据的光伏发电功率预测方法
CN113762591B (zh) 一种基于gru和多核svm对抗学习的短期电量预测方法及***
CN115481788B (zh) 相变储能***负荷预测方法及***
CN113095534A (zh) 一种ARIMA与改进Elman神经网络组合的风电功率预测方法
CN115965150A (zh) 一种基于权重分配的电力负荷预测方法
CN115759343A (zh) 一种基于e-lstm的用户电量预测方法和装置
CN115238854A (zh) 一种基于tcn-lstm-am的短期负荷预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination