CN116345555A - 一种基于cnn-isca-lstm模型的短期光伏发电功率预测方法 - Google Patents

一种基于cnn-isca-lstm模型的短期光伏发电功率预测方法 Download PDF

Info

Publication number
CN116345555A
CN116345555A CN202310321716.0A CN202310321716A CN116345555A CN 116345555 A CN116345555 A CN 116345555A CN 202310321716 A CN202310321716 A CN 202310321716A CN 116345555 A CN116345555 A CN 116345555A
Authority
CN
China
Prior art keywords
data
cnn
lstm
power generation
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202310321716.0A
Other languages
English (en)
Inventor
王鑫
苗桂喜
孙浩然
元亮
席晟哲
王继勇
孟红杰
白方亮
连勇
王丽晔
孙大江
郑惠瀛
赵悠悠
王琪
苏子乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anyang Power Supply Co of State Grid Henan Electric Power Co Ltd
Original Assignee
Anyang Power Supply Co of State Grid Henan Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anyang Power Supply Co of State Grid Henan Electric Power Co Ltd filed Critical Anyang Power Supply Co of State Grid Henan Electric Power Co Ltd
Priority to CN202310321716.0A priority Critical patent/CN116345555A/zh
Publication of CN116345555A publication Critical patent/CN116345555A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/004Generation forecast, e.g. methods or systems for forecasting future energy generation
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/38Arrangements for parallely feeding a single network by two or more generators, converters or transformers
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/38Arrangements for parallely feeding a single network by two or more generators, converters or transformers
    • H02J3/381Dispersed generators
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02SGENERATION OF ELECTRIC POWER BY CONVERSION OF INFRARED RADIATION, VISIBLE LIGHT OR ULTRAVIOLET LIGHT, e.g. USING PHOTOVOLTAIC [PV] MODULES
    • H02S40/00Components or accessories in combination with PV modules, not provided for in groups H02S10/00 - H02S30/00
    • H02S40/30Electrical components
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/10Power transmission or distribution systems management focussing at grid-level, e.g. load flow analysis, node profile computation, meshed network optimisation, active network management or spinning reserve management
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/20Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2300/00Systems for supplying or distributing electric power characterised by decentralized, dispersed, or local generation
    • H02J2300/20The dispersed energy generation being of renewable origin
    • H02J2300/22The renewable source being solar energy
    • H02J2300/24The renewable source being solar energy of photovoltaic origin
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Strategic Management (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Human Resources & Organizations (AREA)
  • Software Systems (AREA)
  • Power Engineering (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Development Economics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于CNN‑ISCA‑LSTM模型的短期光伏发电功率预测方法:首先,获取光伏电站原始发电数据及气象数据,并进行数据预处理;其次,利用斯皮尔曼相关性法计算出各个气象特征与光伏发电数据之间的相关性,选取与发电功率特征相关性较高的特征作为模型训练的输入特征;在此基础上,改进SCA,并建立CNN‑ISCA‑LSTM短期光伏发电功率预测模型;最后,对预测结果进行反归一化并对模型预测效果进行评价,验证分析所提方法的有效性。利用改进的SCA对CNN‑LSTM模型的超参数进行优化,经过算例验证,所提模型可有效提升光伏发电功率预测的精度,且在非晴天工况下依然具有较高的预测稳定性。

Description

一种基于CNN-ISCA-LSTM模型的短期光伏发电功率预测方法
技术领域
本发明属于新能源发电功率预测技术领域,具体涉及一种基于CNN-ISCA-LSTM模型的短期光伏发电功率预测方法。
背景技术
石油、煤炭等化石燃料被大量使用并逐渐走向枯竭,目前世界各国既要应对能源缺乏,又要应对环境恶化。发展可再生新能源已经成为各国的首要选择,太阳能作为可再生新能源的一种,不受地域限制的辐照在地球表面,具有可再生能力强、清洁环保、资源丰富、开发利用方便等优点。光伏发电具有随机性和不连续性等特点,在并网时对电网的影响也越来越大。光伏发电功率预测能提高功率输出的预见性,不仅可以保证电网调度信息的可靠性,而且能够帮助电网调度合理规划,对推动光伏发电行业健康稳定发展具有重要的现实意义和指导意义。
现阶段对光伏发电功率预测的方法有很多,包括统计学方法、光伏性能模型、深度学习法以及混合模型等。由于深度学习模型可以实现端到端的映射,使用多种深度学习组合模型实现光伏出力的预测,不仅能够为模型提供多维度、高深度的数据信息,还可以进一步拓展模型本身的复杂度,提高模型的学习能力。同时,利用组合模型进行包括点预测、区间预测在内的多种预测形式,可细化利用深度学习方法对光伏输出功率预测的相关研究,为后续光伏输出功率问题的解决以及时间序列的预测处理工作提供一定的参考依据。
基于上述背景,基于深度学习建立一个高精度的预测模型进行短期光伏发电功率预测,对于帮助电力调度部门完善调度计划、提升光伏发电预测能力、提高光伏产业的经济收益,以及进行相关的理论研究等诸多方面都具备实用价值和指导意义。
发明内容
目前,在光伏发电功率预测中,预测模型超参数设置需要依靠大量经验和人为设置,不同参数的模型的预测效果差距较大,预测精度不够高,在多种工况下模型预测效果不够稳定,为了进一步提高模型预测效果,本发明提出一种基于改进的正弦余弦算法(Improved Sine Cosine Algorithm,ISCA)结合CNN-LSTM模型进行短期光伏发电功率预测的方法。首先,获取光伏电站原始发电数据以及气象数据,并进行数据预处理;其次,利用斯皮尔曼相关性法计算出各个气象特征与光伏发电数据之间的相关性,选取与发电功率特征相关性较高的特征作为模型训练的输入特征;在此基础上,改进SCA,并建立CNN-ISCA-LSTM短期光伏发电功率预测模型;最后,对预测结果进行反归一化并对模型预测效果进行评价,验证分析所提方法的有效性。
本发明采用的技术方案为:一种基于CNN-ISCA-LSTM模型的短期光伏发电功率预测方法,包括如下步骤:
S1:获取原始数据并对数据进行预处理;
S2:对原始特征进行相关性分析并剔除相关性系数较低的特征;
S3:建立CNN-LSTM混合预测模型,并确定待优化的超参数;
S4:改进SCA算法并构建CNN-ISCA-LSTM短期光伏发电功率预测模型。
S5:数据反归一化及模型预测效果评价。
具体的,所述步骤S1:获取原始数据并对数据进行预处理。原始数据集中可能存在因为数据采集设备或传感器异常导致的缺失值和异常值等不良数据,需要对数据进行预处理。在此基础上,对数据进行归一化处理,避免因量纲不同导致深度学习模型预测精度降低。该部分具体包括:
(1)采用随机森林算法对原始数据集进行缺失值填充。对于一个m行n列的数据集(n个特征,每个特征序列长度为m),其中特征i含缺失值,将缺失值所在行其他特征数据作为预测输入测试数据,缺失值作为待预测对象,其余n-1个特征不含缺失值所在行的数据作为训练集特征,i中未缺失数据作为训练集标签,随后对模型进行训练并对缺失值进行回归预测;
(2)使用箱线图对异常数据进行检测并采用随机森林算法填充。利用箱线图原理对原始数据进行异常值检测,随后将异常值视为缺失值,并采用随机森林算法对缺失值进行填充。箱线图判断为异常值的条件为:
Figure BDA0004151985240000031
式中,xa表示异常值;Q1、Q3分别表示箱线图的上四分位数和下四分位数;IQR表示四分位间距,即IQR=Q1-Q3
(3)数据归一化处理。原始数据集中各时序数据量纲不同、数值差别较大,若直接用于模型训练,会使模型学习非线性特征的能力变弱,需要对数据进行归一化处理至[0,1]区间。采用min-max法对数据进行归一化,计算公式为:
Figure BDA0004151985240000032
式中:xi(k)为特征i的第k个样本的原始值,xi,max、xi,min分别为特征i中最小值和最大值,xi′(k)为归一化值。
具体的,所述步骤S2:对原始特征进行相关性分析并剔除相关性系数较低的特征。光伏发电功率变化主要受气象因子的变化影响,例如太阳辐照度、气温、湿度、气压等。为在众多气象因子中筛选出影响光伏出力的主要特征,减少关联性小的因素对结果的负面影响,需要先对气象因子进行相关性分析。
斯皮尔曼相关系数(Spearman Correlation)法提供了对于变量取值范围不同情况下的处理方法,是一种有效的判断向量相似度的方式。选取皮尔逊相关系数对气象特征进行分析,以提取关键信息因子。
对于两个序列X和Y的斯皮尔曼相关性系数计算公式为:
Figure BDA0004151985240000041
式中:n为序列长度,xi和yi分别为序列X和Y的第i个变量,
Figure BDA0004151985240000042
和/>
Figure BDA0004151985240000043
分别为序列X和Y的平均值。S的取值范围为[-1,1],S越趋近于0,两个向量的相关性越低,越趋近于-1则成负相关,趋近于1成正相关。
具体的,所述步骤S3:建立CNN-LSTM混合预测模型,并确定待优化的超参数。
(1)CNN是近几年应用较为广泛的深度神经网络,其采用局部连接和权重共享的方式,对原始数据进行更高层次和更抽象的处理,能够自动有效地提取序列中的深层特征,降低特征提取和数据重构的复杂度,提高数据特征的质量,CNN利用卷积层、池化层和全连接层进行特征提取。卷积层用于提取输入数据中有用的特征信息,而池化层的作用是对卷积层中提取的特征进行挑选,并且可以减少相应的计算。
通过CNN进行特征提取时,通过增加卷积层的数量Nc可以使用多个卷积核处理输入数据序列,并生成相应尺寸的特征图,同时,信息提取的程度越深,特征表达的能力越精确,每个卷积层中卷积核的数量Nkernel和尺寸大小Skernel关系到提取信息的重要细节程度。经过卷积层提取特征后,通过池化层下采样,随后将生成的特征图经过全连接层输出,全连接层根据输入变量特征确定目标输出,全连接层的层数Nd、每个层的神经元个数NCNN,neural是全连接层最重要的超参数。除了上面超参数待优化外,还包括对批处理大小SCNN,batch、学习率Lrate的优化,从而可以提供更好的收敛性和更有效的梯度计算。最后,通过L2正则化和dropout防止网络过拟合。
(2)循环神经网络(Recurrent Neural Network,RNN)可以较好地处理时间序列问题,但无法解决长期依赖问题,即随着输入序列长度的增加,模型无法利用序列中较早期的数据信息。LSTM神经网络将RNN隐含层中的神经元替换为具有长期记忆效果的记忆单元,从而可以有效解决长期依赖问题。在LSTM模型中,其记忆单元包括遗忘门、输入门以及输出门3个部分,遗忘门丢弃不相关的信息,输入门决定存储在单元状态中的新信息,输出门控制隐含层节点的输出,这些门控单元使LSTM有更新和控制不同区块中信息流的能力。LSTM神经网络共有4个超参数待优化,分别是LSTM的层数Nl、最大迭代次数Ne,max、每一层的神经元个数NLSTM,neural、批处理大小SLSTM,batch
具体的,所述步骤S4:改进SCA并构建CNN-ISCA-LSTM短期光伏发电功率预测模型。SCA是一种基于正弦和余弦函数的智能进化算法,2015年Mirjalili提出了该算法,SCA在初始化阶段接受或自生成一组随机解,这些初始解组成种群。下一阶段,选定评分函数反复对种群中的个体解计算分数,接着采用正弦余弦迭代公式改进种群中的个体解,基于群体的优化方法随机地探寻优化问题的最优解,因此要找到最优解,需要经过多次迭代运行。所以通过生成多个初始解和增加迭代次数,提升算法能力。
SCA包括探索和开发阶段。SCA在探索和开发阶段均使用以下公式进行位置更新:
Figure BDA0004151985240000061
Figure BDA0004151985240000062
Figure BDA0004151985240000063
上式中,
Figure BDA0004151985240000064
表示迭代到第t次时解的位置;/>
Figure BDA0004151985240000065
表示迭代到第t次时第i维目标解的值;r1为正余弦振幅调节因子,用以决定下一位置的区域(或移动方向),为能够平衡的勘探和开发搜索空间,并最终收敛到全局最优值,用上述第二个公式计算得出,其中,a为一个正数(一般取2),k表示当前迭代次数,kmax表示最大迭代次数;r2为(0,2π)之间的随机数,决定了移向或远离目标的距离;r3为(0,2)之间的随机数,随机强调(r3>1)或减弱(r3<1)目标在距离上的影响。两个迭代更新公式结合在一起可以写为:
Figure BDA0004151985240000066
式中,r4为(0,1)之间的随机数,表示等概率地选择正弦和余弦函数。
SCA可以使求解问题自适应非凸,且在求解非线性约束优化问题时具有较好的鲁棒优化性能。其主要优点是参数少和高效的全局搜索机制。然而,还可以通过修改r1、r2、r3、r4的更新策略进一步提高SCA的性能,本发明采用以下三个改进阶段对四个参数进行更新:
(1)第一改进阶段采用反向学习策略来建立种群多样化。原理如下:假设已知数x为(a,b)之间的随机实数,其反向数x′的计算方法为:
x′=a+b-x
一般地,当xi={xi1,xi2,…,xij},其中xij为(aj,bj)之间的随机数,j=1,2,…,n。对于候选解xi,其反向量为x′={x′i1,x′i2,…,x′ij},其中
Figure BDA0004151985240000071
原始种群个体的位置为
Figure BDA0004151985240000072
为了增加种群个体的多样性,通过反向策略增加了反向种群个体的位置/>
Figure BDA0004151985240000073
(2)第二改进阶段利用Levy飞行策略最大限度地提高搜索效率,并使用以下公式避免算法过早收敛:
Figure BDA0004151985240000074
Figure BDA0004151985240000075
式中,α为步长缩放因子;β为固定常数1.5;p和q为两个随机变量,服从以下分布:
Figure BDA0004151985240000076
Figure BDA0004151985240000077
Figure BDA0004151985240000078
式中,Γ(·)为伽马函数。
(3)第三改进阶段利用混沌映射来修改SCA的关键参数以提高收敛速度。在本发明中,将锯齿图、正弦图、帐篷图和切比雪夫图四种混沌映射用于调整SCA的r1、r2、r3、r4参数。这些混沌映射的公式表达式如下:
Figure BDA0004151985240000081
在此基础上,构建CNN-ISCA-LSTM短期光伏发电功率预测模型。为了进一步提高预测精度,改善网络的性能,采用ISCA对CNN-LSTM的超参数进行寻优。CNN-LSTM模型的学习率、dropout率是具有连续值的超参数,批量大小、CNN或LSTM层数、最大迭代次数和神经元单元,是具有离散值的超参数,ISCA不断搜索解空间,需要耗费大量的时间,将连续值转换为离散值可以有效减少搜索时间,因此,通过以下公式来进行转化:
Figure BDA0004151985240000082
式中,xij表示连续值;yij表示离散值;lb表示搜索空间的下边界;ub表示搜索空间的下边界。
在ISCA寻优的过程中,生成具有n个个体的初始解集合,其中每个解均为多维数向量,表示待优化参数的个数。在初始化种群和混沌图之后,采用反向策略和Levy飞行策略不断更新解的当前位置,可以在算法勘探和开发阶段取得资源利用平衡,直到满足终止条件,所求得的最佳解即为CNN-LSTM超参数的最优值。为了评估每个更新策略的有效性,采用均方误差(MSE)作为适应度函数,计算公式为:
Figure BDA0004151985240000083
式中,yi表示实际值,y′表示预测值,n表示预测的样本数量。
具体的,所述步骤S5:数据反归一化及模型预测效果评价。对预测得到的光伏发电功率数据进行反归一化处理,使其具有物理意义,计算公式为:
xi(k)=xi′(k)(xi,max-xi,min)+xi,min
利用均方根误差(RMSE)、平均绝对误差(MAE)对模型预测效果进行评估,RMSE与MAE数值越小说明预测效果越好。具体计算表达式如下:
Figure BDA0004151985240000091
Figure BDA0004151985240000092
式中,yi表示实际值,y′表示预测值,n表示预测样本数量。
本发明的有益效果:在光伏发电功率预测工作中,预测模型超参数设置需要依靠大量经验和人为设置,不同参数的模型的预测效果差距较大,预测精度不够高,在多种工况下模型预测效果不够稳定,为进一步提高模型预测效果,本发明提出一种基于改进的正弦余弦算法结合CNN-LSTM模型进行短期光伏发电功率预测的方法,即利用ISCA对CNN-LSTM进行超参数优化,经过算例验证,所提模型可以有效提升光伏发电功率预测的精度,且在非晴天工况下依然具有较高的预测稳定性。
附图说明
图1为本发明的CNN神经网络的结构图;
图2为本发明的LSTM神经单元结构图;
图3为本发明的CNN-LSTM组合模型结构图;
图4为本发明的改进SCA算法流程;
图5为本发明的原始数据归一化箱线图;
图6为本发明的原始数据特征相关性系数热力图;
图7为本发明的晴天工况下各个模型的预测效果对比;
图8为本发明的非晴天工况下各个模型的预测效果对比。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围,以下结合实施例具体说明。
本发明包括如下步骤:
S1:获取原始数据并对数据进行预处理。原始数据集中可能存在因为数据采集设备或传感器异常导致的缺失值和异常值等不良数据,需要对数据进行预处理。在此基础上,对数据进行归一化处理,避免因量纲不同导致深度学习模型预测精度降低。该部分具体包括:
(1)采用随机森林算法对原始数据集进行缺失值填充。对于一个m行n列的数据集(n个特征,每个特征序列长度为m),其中特征i含缺失值,将缺失值所在行其他特征数据作为预测输入测试数据,缺失值作为待预测对象,其余n-1个特征不含缺失值所在行的数据作为训练集特征,i中未缺失数据作为训练集标签,随后对模型进行训练并对缺失值进行回归预测;
(2)使用箱线图对异常数据进行检测并采用随机森林算法填充。利用箱线图原理对原始数据进行异常值检测,随后将异常值视为缺失值,并采用随机森林算法对缺失值进行填充。箱线图判断为异常值的条件为:
Figure BDA0004151985240000111
式中,xa表示异常值;Q1、Q3分别表示箱线图的上四分位数和下四分位数;IQR表示四分位间距,即IQR=Q1-Q3
(3)数据归一化处理。原始数据集中各时序数据量纲不同、数值差别较大,若直接用于模型训练,会使模型学习非线性特征的能力变弱,需要对数据进行归一化处理至[0,1]区间。采用min-max法对数据进行归一化,计算公式为:
Figure BDA0004151985240000112
式中:xi(k)为特征i的第k个样本的原始值,xi,max、xi,min分别为特征i中最小值和最大值,xi′(k)为归一化值。
S2:对原始特征进行相关性分析并剔除相关性系数较低的特征。光伏发电功率变化主要受气象因子的变化影响,例如太阳辐照度、气温、湿度、气压等。为在众多气象因子中筛选出影响光伏出力的主要特征,减少关联性小的因素对结果的负面影响,需要先对气象因子进行相关性分析。
斯皮尔曼相关系数(Spearman Correlation)法提供了对于变量取值范围不同情况下的处理方法,是一种有效的判断向量相似度的方式。选取皮尔逊相关系数对气象特征进行分析,以提取关键信息因子。
对于两个序列X和Y的斯皮尔曼相关性系数计算公式为:
Figure BDA0004151985240000113
式中,式中:n为序列长度,xi和yi分别为序列X和Y的第i个变量,
Figure BDA0004151985240000114
和/>
Figure BDA0004151985240000115
分别为序列X和Y的平均值。
S的取值范围为[-1,1],S越趋近于0,两个向量的相关性越低,越趋近于-1则成负相关,趋近于1成正相关。
S3:建立CNN-LSTM混合预测模型,并确定待优化的超参数。
(1)CNN是近几年应用较为广泛的深度神经网络,其采用局部连接和权重共享的方式,对原始数据进行更高层次和更抽象的处理,能够自动有效地提取序列中的深层特征,降低特征提取和数据重构的复杂度,提高数据特征的质量,CNN利用卷积层、池化层和全连接层进行特征提取,附图1给出了CNN提取特征的简图。卷积层用于提取输入数据中有用的特征信息,而池化层的作用是对卷积层中提取的特征进行挑选,并且可以减少相应的计算。
通过CNN进行特征提取时,增加卷积层的数量Nc,可以使用多个卷积核处理输入数据,并生成相应尺寸的特征图,同时,信息提取的程度越深,特征表达的能力越精确,每个卷积层中卷积核的数量Nkernel和尺寸大小Skernel关系到提取信息的重要细节程度。经过卷积层提取特征后,通过池化层下采样,随后将生成的特征图经过全连接层输出,全连接层根据输入变量特征确定目标输出,全连接层的层数Nd、每个层的神经元个数NCNN,neural是全连接层最重要的超参数。除了上面超参数待优化外,还包括对批处理大小SCNN,batch、学习率Lrate的优化,从而可以提供更好的收敛性和更有效的梯度计算。最后,通过L2正则化和dropout防止网络过拟合。
(2)循环神经网络(Recurrent Neural Network,RNN)可以较好地处理时间序列问题,但无法解决长期依赖问题,即随着输入序列长度的增加,模型无法利用序列中较早期的数据信息。LSTM神经网络将RNN隐含层中的神经元替换为具有长期记忆效果的记忆单元,从而可以有效解决长期依赖问题。在LSTM模型中,其记忆单元包括遗忘门、输入门以及输出门3个部分,遗忘门丢弃不相关的信息,输入门决定存储在单元状态中的新信息,输出门控制隐含层节点的输出,这些门控单元使LSTM有更新和控制不同区块中信息流的能力。
附图2为LSTM单元结构,附图3给出了CNN-LSTM组合模型的结构图。LSTM的内部状态ct专门进行线性循环信息传递,同时非线性地输出信息给隐藏层的外部状态,xt表示当前时刻的输入数据;ct-1、ct分别表示上一时刻和当前时刻内部状态;ht-1、ht分别表示上一时刻与当前时刻隐藏层状态;☉表示矩阵元素相乘,
Figure BDA0004151985240000131
表示矩阵元素相加;s为Sigmoid激活函数,tanh为tanh激活函数;z为单元状态;zf为遗忘门门控状态,用于控制上一时刻内部状态ct-1需要遗忘的信息量;zi表示输入门控状态,控制当前时刻单元状态z有多少信息需要保存;zo表示输出门门控状态,控制当前时刻内部状态ct有多少信息需要输出给外部状态ht。根据图中信息流向,有以下公式成立:
z=tanh(W[xt ht-1]Τ)
zf=s(Wf[xt ht-1]Τ)
zi=s(Wi[xt ht-1]Τ)
zo=s(Wo[xt ht-1]Τ)
Figure BDA0004151985240000132
ht=zo⊙tanh(ct)
式中,W、Wf、Wi以及Wo分别表示单元状态更新、遗忘门、输入门和输出门的权重矩阵。
LSTM神经网络中共有4个超参数待优化,分别是LSTM的层数Nl、最大迭代次数Ne,max、每一层的神经元个数NLSTM,neural、批处理大小SLSTM,batch
S4:改进SCA并构建CNN-ISCA-LSTM短期光伏发电功率预测模型。SCA是一种基于正弦和余弦函数的智能进化算法,2015年Mirjalili提出了该算法,SCA在初始化阶段接受或自生成一组随机解,这些初始解组成种群。下一阶段,选定评分函数反复对种群中的个体解计算分数,接着采用正弦余弦迭代公式改进种群中的个体解,基于群体的优化方法随机地探寻优化问题的最优解,因此要找到最优解,需要经过多次迭代运行。所以通过生成多个初始解和增加迭代次数,提升算法能力。
SCA包括探索和开发阶段。SCA在探索和开发阶段均使用以下公式进行位置更新:
Figure BDA0004151985240000141
Figure BDA0004151985240000142
Figure BDA0004151985240000143
上式中,
Figure BDA0004151985240000144
表示迭代到第t次时解的位置;/>
Figure BDA0004151985240000145
表示迭代到第t次时第i维目标解的值;r1为正余弦振幅调节因子,用以决定下一位置的区域(或移动方向),为能够平衡的勘探和开发搜索空间,并最终收敛到全局最优值,用上述第二个公式计算得出,其中,a为一个正数(一般取2),k表示当前迭代次数,kmax表示最大迭代次数;r2为(0,2π)之间的随机数,决定了移向或远离目标的距离;r3为(0,2)之间的随机数,随机强调(r3>1)或减弱(r3<1)目标在距离上的影响。两个迭代更新公式结合在一起可以写为:
Figure BDA0004151985240000146
式中,r4为(0,1)之间的随机数,表示等概率地选择正弦和余弦函数。
SCA可以使求解问题自适应非凸,且在求解非线性约束优化问题时具有较好的鲁棒优化性能。其主要优点是参数少和高效的全局搜索机制。然而,还可以通过修改r1、r2、r3、r4的更新策略进一步提高SCA的性能,本发明采用以下三个改进阶段对四个参数进行更新:
(1)第一改进阶段采用反向学习策略来建立种群多样化。原理如下:假设已知数x为(a,b)之间的随机实数,其反向数x′的计算方法为:
x′=a+b-x
一般地,当xi={xi1,xi2,…,xij},其中xij为(aj,bj)之间的随机数,j=1,2,…,n。对于候选解xi,其反向量为x′={x′i1,x′i2,…,x′ij},其中
Figure BDA0004151985240000151
原始种群个体的位置为
Figure BDA0004151985240000152
为了增加种群个体的多样性,通过反向策略增加了反向种群个体的位置/>
Figure BDA0004151985240000153
(2)第二改进阶段利用Levy飞行策略最大限度地提高搜索效率,并使用以下公式避免算法过早收敛:
Figure BDA0004151985240000154
Figure BDA0004151985240000155
式中,α为步长缩放因子;β为固定常数1.5;p和q为两个随机变量,服从以下分布:
Figure BDA0004151985240000156
Figure BDA0004151985240000157
Figure BDA0004151985240000158
式中,Γ(·)为伽马函数。
(3)第三改进阶段利用混沌映射来修改SCA的关键参数以提高收敛速度。在本发明中,将锯齿图、正弦图、帐篷图和切比雪夫图四种混沌映射用于调整SCA的r1、r2、r3、r4参数。这些混沌映射的公式表达式如下:
Figure BDA0004151985240000161
附图4给出了算法流程,在此基础上,构建CNN-ISCA-LSTM短期光伏发电功率预测模型,。为了进一步提高预测精度,改善网络的性能,采用ISCA对CNN-LSTM的超参数进行寻优。CNN-LSTM模型的学习率、dropout率是具有连续值的超参数,批量大小、CNN或LSTM层数、最大迭代次数和神经元单元,是具有离散值的超参数,ISCA不断搜索解空间,需要耗费大量的时间,将连续值转换为离散值可以有效减少搜索时间,因此,通过以下公式来进行转化:
Figure BDA0004151985240000162
式中,xij表示连续值;yij表示离散值;lb表示搜索空间的下边界;ub表示搜索空间的下边界。
在ISCA寻优的过程中,生成具有n个个体的初始解集合,其中每个解均为多维数向量,表示待优化参数的个数。在初始化种群和混沌图之后,采用反向策略和Levy飞行策略不断更新解的当前位置,可以在算法勘探和开发阶段取得资源利用平衡,直到满足终止条件,所求得的最佳解即为CNN-LSTM超参数的最优值。为了评估每个更新策略的有效性,采用均方误差(MSE)作为适应度函数,计算公式为:
Figure BDA0004151985240000171
式中,yi表示实际值,y′表示预测值,n表示预测的样本数量。
S5:数据反归一化及模型预测效果评价。对预测得到的光伏发电功率数据进行反归一化处理,使其具有物理意义,计算公式为:
xi(k)=xi′(k)(xi,max-xi,min)+xi,min
利用均方根误差(RMSE)、平均绝对误差(MAE)对模型预测效果进行评估,RMSE与MAE数值越小说明预测效果越好。具体计算表达式如下:
Figure BDA0004151985240000172
Figure BDA0004151985240000173
式中,yi表示实际值,y′表示预测值,n表示预测样本数量。
以下对本发明的有效性进行验证:
本发明采用来源于澳大利亚太阳能中心网站上的公开数据,包括2020年1月1日-2021年1月1日1年的数据,时间分辨率为5min,共计105120条数据,按照3:1:1划分数据为训练集、验证集和测试集,即63072条数据做为训练集、21024条数据作为验证集、21024条数据作为测试集,该数据集包含的特征信息如表1所示:
表1原始数据集特征信息
Figure BDA0004151985240000174
Figure BDA0004151985240000181
(1)数据预处理
获取的样本数据不含缺失值以及异常值,因此对数据进行归一化操作,归一化后的箱线图如附图5所示。
(2)特征相关性分析与筛选
对特征进行斯皮尔曼相关性分析,画出相关性系数热力图如附图6所示。取与输出功率相关性大小绝对值大于0.5以上的特征作为模型训练的输入特征,从图中可以看出,筛选后的特征为:AC、WT、GHR、DHR、RGT、RDT总共6个输入特征。
(3)模型参数设置
对所提模型的初始参数进行设置,设置ISCA的初始种群大小为50,迭代次数为100,为了减小人为因素的影响,对优化超参数的取值范围设置如下:设置学习率区间为(0.001,0.1),批处理大小区间为(10,100),每个批处理大小训练的迭代次数为20,卷积核数量区间设置为(8,256),卷积核尺寸大小区间设置为(1,10),dropout率区间设置为(0.2,0.5),Epoch大小区间为(1,100),神经网络训练次数区间设置为(1,500)。
(4)模型有效性验证
经过ISCA算法优化后的CNN-LSTM模型超参数如表2所示:
表2CNN-LSTM网络模型参数
Figure BDA0004151985240000182
Figure BDA0004151985240000191
为了验证所提模型方法的有效性,将LSTM、CNN-LSTM、CNN-SCA-LSTM、CNN-ISCA-LSTM模型在晴天和非晴天两种工况下的预测效果进行对比,为客观评价模型的预测精度,避免偶然性误差影响,对各两种工况下的预测工作统一进行10次实验,取10次预测值的平均值作为最终预测结果,并与真实值进行误差计算分析,预测效果如附图7、8所示,预测误差结果如表3所示,未进行参数优化时,按照经验值设置超参数。在晴天工况下,所提模型相对于LSTM、CNN-LSTM、CNN-SCA-LSTM的RMSE和MAE值均较小,RMSE值分别小11.83%、10.29%、2.47%,MAE值分别小9.77%、8.86%、1.51%;在非晴天工况下,所提模型相对于LSTM、CNN-LSTM、CNN-SCA-LSTM的RMSE和MAE值均较小,RMSE值分别小13.27%、10.85%、2.55%,MAE值分别小11.91%、10.16%、2.61%。晴天工况下光伏发电功率波动较小,非晴天工况下,由于天气因素使得光伏发电出力随机性较强、波动性较大,此时各个模型相对于晴天工况下预测效果变差,标准LSTM模型的误差波动较大,其他两种模型的误差波动虽小但均超过1%,所提模型误差最高波动为1%,说明所提方法在晴天或非晴天工况下均可以有效对光伏发电功率进行较高精度地预测,该模型具有一定的稳定性。
表3评价指标值
Figure BDA0004151985240000192
经过上述分析,表明利用SCA对CNN-LSTM的超参数进行优化后,可以达到更好的预测效果,同时,利用改进方法可进一步提高预测精度,且该模型在晴天和非晴天工况下的功率预测具有一定的稳定性。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的得同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims (10)

1.一种基于CNN-ISCA-LSTM模型的短期光伏发电功率预测方法,包括如下步骤:
S1:获取原始数据并对数据进行预处理;
S2:对原始特征进行相关性分析并剔除相关性系数较低的特征;
S3:建立CNN-LSTM混合预测模型,并确定待优化的超参数;
S4:改进SCA算法并构建CNN-ISCA-LSTM短期光伏发电功率预测模型。
S5:数据反归一化及模型预测效果评价。
2.根据权利要求1所述的一种基于CNN-ISCA-LSTM模型的短期光伏发电功率预测方法,其特征在于,步骤S1中,获取原始数据并对数据进行预处理。
原始数据集中可能存在因为数据采集设备或传感器异常导致的缺失值和异常值等不良数据,需要对数据进行预处理。在此基础上,对数据进行归一化处理,避免因量纲不同导致深度学习模型预测精度降低。该部分具体包括:
(1)采用随机森林算法对原始数据集进行缺失值填充。对于一个m行n列的数据集(n个特征,每个特征序列长度为m),其中特征i含缺失值,将缺失值所在行其他特征数据作为预测输入测试数据,缺失值作为待预测对象,其余n-1个特征不含缺失值所在行的数据作为训练集特征,i中未缺失数据作为训练集标签,随后对模型进行训练并对缺失值进行回归预测;
(2)使用箱线图对异常数据进行检测并采用随机森林算法填充。利用箱线图原理对原始数据进行异常值检测,随后将异常值视为缺失值,并采用随机森林算法对缺失值进行填充。箱线图判断为异常值的条件为:
Figure FDA0004151985230000011
式中,xa表示异常值;Q1、Q3分别表示箱线图的上四分位数和下四分位数;IQR表示四分位间距,即IQR=Q1-Q3
(3)数据归一化处理。原始数据集中各时序数据量纲不同、数值差别较大,若直接用于模型训练,会使模型学习非线性特征的能力变弱,需要对数据进行归一化处理至[0,1]区间。采用min-max法对数据进行归一化,计算公式为:
Figure FDA0004151985230000021
式中:xi(k)为特征i的第k个样本的原始值,xi,max、xi,min分别为特征i中最小值和最大值,x′i(k)为归一化值。
3.根据权利要求1所述的一种基于CNN-ISCA-LSTM模型的短期光伏发电功率预测方法,其特征在于,所述步骤S2中,对原始特征进行相关性分析并剔除相关性系数较低的特征。光伏发电功率变化主要受气象因子的变化影响,例如太阳辐照度、气温、湿度、气压等。为在众多气象因子中筛选出影响光伏出力的主要特征,减少关联性小的因素对结果的负面影响,需要先对气象因子进行相关性分析。
斯皮尔曼相关系数(Spearman Correlation)法提供了对于变量取值范围不同情况下的处理方法,是一种有效的判断向量相似度的方式。选取皮尔逊相关系数对气象特征进行分析,以提取关键信息因子。
对于两个序列X和Y的斯皮尔曼相关性系数计算公式为:
Figure FDA0004151985230000022
式中,式中:n为序列长度,xi和yi分别为序列X和Y的第i个变量,
Figure FDA0004151985230000023
和/>
Figure FDA0004151985230000024
分别为序列X和Y的平均值。
S的取值范围为[-1,1],S越趋近于0,两个向量的相关性越低,越趋近于-1则成负相关,趋近于1成正相关。
4.根据权利要求1所述的一种基于CNN-ISCA-LSTM模型的短期光伏发电功率预测方法,其特征在于,所述步骤S3中,建立CNN-LSTM混合预测模型,并确定待优化的超参数。(1)CNN是近几年应用较为广泛的深度神经网络,其采用局部连接和权重共享的方式,对原始数据进行更高层次和更抽象的处理,能够自动有效地提取序列中的深层特征,降低特征提取和数据重构的复杂度,提高数据特征的质量,CNN利用卷积层、池化层和全连接层进行特征提取。卷积层用于提取输入数据中有用的特征信息,而池化层的作用是对卷积层中提取的特征进行挑选,并且可以减少相应的计算。
通过CNN进行特征提取时,通过增加卷积层的数量Nc可以使用多个卷积核处理输入数据序列,并生成相应尺寸的特征图,同时,信息提取的程度越深,特征表达的能力越精确,每个卷积层中卷积核的数量Nkernel和尺寸大小Skernel关系到提取信息的重要细节程度。经过卷积层提取特征后,通过池化层下采样,随后将生成的特征图经过全连接层输出,全连接层根据输入变量特征确定目标输出,全连接层的层数Nd、每个层的神经元个数NCNN,neural是全连接层最重要的超参数。除了上面超参数待优化外,还包括对批处理大小SCNN,batch、学习率Lrate的优化,从而可以提供更好的收敛性和更有效的梯度计算。最后,通过L2正则化和dropout防止网络过拟合。
(2)循环神经网络(Recurrent Neural Network,RNN)可以较好地处理时间序列问题,但无法解决长期依赖问题,即随着输入序列长度的增加,模型无法利用序列中较早期的数据信息。LSTM神经网络将RNN隐含层中的神经元替换为具有长期记忆效果的记忆单元,从而可以有效解决长期依赖问题。在LSTM模型中,其记忆单元包括遗忘门、输入门以及输出门3个部分,遗忘门丢弃不相关的信息,输入门决定存储在单元状态中的新信息,输出门控制隐含层节点的输出,这些门控单元使LSTM有更新和控制不同区块中信息流的能力。LSTM神经网络共有4个超参数待优化,分别是LSTM的层数Nl、最大迭代次数Ne,max、每一层的神经元个数NLSTM,neural、批处理大小SLSTM,batch
5.根据权利要求1所述的一种基于CNN-ISCA-LSTM模型的短期光伏发电功率预测方法,其特征在于,所述步骤S4中,改进SCA并构建CNN-ISCA-LSTM短期光伏发电功率预测模型。SCA是一种基于正弦和余弦函数的智能进化算法,2015年Mirjalili提出了该算法,SCA在初始化阶段接受或自生成一组随机解,这些初始解组成种群。下一阶段,选定评分函数反复对种群中的个体解计算分数,接着采用正弦余弦迭代公式改进种群中的个体解,基于群体的优化方法随机地探寻优化问题的最优解,因此要找到最优解,需要经过多次迭代运行。所以通过生成多个初始解和增加迭代次数,提升算法能力。
SCA包括探索和开发阶段。SCA在探索和开发阶段均使用以下公式进行位置更新:
Figure FDA0004151985230000041
Figure FDA0004151985230000042
Figure FDA0004151985230000043
上式中,
Figure FDA0004151985230000044
表示迭代到第t次时解的位置;/>
Figure FDA0004151985230000045
表示迭代到第t次时第i维目标解的值;r1为正余弦振幅调节因子,用以决定下一位置的区域(或移动方向),为能够平衡的勘探和开发搜索空间,并最终收敛到全局最优值,用上述第二个公式计算得出,其中,a为一个正数(一般取2),k表示当前迭代次数,kmax表示最大迭代次数;r2为(0,2π)之间的随机数,决定了移向或远离目标的距离;r3为(0,2)之间的随机数,随机强调(r3>1)或减弱(r3<1)目标在距离上的影响。两个迭代更新公式结合在一起可以写为:
Figure FDA0004151985230000051
式中,r4为(0,1)之间的随机数,表示等概率地选择正弦和余弦函数。
SCA可以使求解问题自适应非凸,且在求解非线性约束优化问题时具有较好的鲁棒优化性能。其主要优点是参数少和高效的全局搜索机制。然而,还可以通过修改r1、r2、r3、r4的更新策略进一步提高SCA的性能,本发明采用三个改进阶段对四个参数进行更新。
6.根据权利要求1和5所述的一种基于CNN-ISCA-LSTM模型的短期光伏发电功率预测方法,其特征在于,所述步骤S4中,进一步地,对SCA进行改进时,第一改进阶段采用反向学习策略来建立种群多样化。原理如下:假设已知数x为(a,b)之间的随机实数,其反向数x′的计算方法为:
x′=a+b-x
一般地,当xi={xi1,xi2,…,xij},其中xij为(aj,bj)之间的随机数,j=1,2,…,n。对于候选解xi,其反向量为x′={x′i1,x′i2,…,x′ij},其中
x′ij=aj+bj-xij
原始种群个体的位置为
Figure FDA0004151985230000052
为了增加种群个体的多样性,通过反向策略增加了反向种群个体的位置/>
Figure FDA0004151985230000053
7.根据权利要求1和5所述的一种基于CNN-ISCA-LSTM模型的短期光伏发电功率预测方法,其特征在于,所述步骤S4中,进一步地,对SCA进行改进时,第二改进阶段利用Levy飞行策略最大限度地提高搜索效率,并使用以下公式避免算法过早收敛:
Figure FDA0004151985230000061
Figure FDA0004151985230000062
式中,α为步长缩放因子;β为固定常数1.5;p和q为两个随机变量,服从以下分布:
Figure FDA0004151985230000063
Figure FDA0004151985230000064
Figure FDA0004151985230000065
式中,Γ(·)为伽马函数。
8.根据权利要求1和5所述的一种基于CNN-ISCA-LSTM模型的短期光伏发电功率预测方法,其特征在于,所述步骤S4中,进一步地,对SCA进行改进时,第三改进阶段利用混沌映射来修改SCA的关键参数以提高收敛速度。在本发明中,将锯齿图、正弦图、帐篷图和切比雪夫图四种混沌映射用于调整SCA的r1、r2、r3、r4参数。这些混沌映射的公式表达式如下:
Figure FDA0004151985230000066
9.根据权利要求1和5所述的一种基于CNN-ISCA-LSTM模型的短期光伏发电功率预测方法,其特征在于,所述步骤S4中,在此基础上,构建CNN-ISCA-LSTM短期光伏发电功率预测模型。为了进一步提高预测精度,改善网络的性能,采用ISCA对CNN-LSTM的超参数进行寻优。CNN-LSTM模型的学习率、dropout率是具有连续值的超参数,批量大小、CNN或LSTM层数、最大迭代次数和神经元单元,是具有离散值的超参数,ISCA不断搜索解空间,需要耗费大量的时间,将连续值转换为离散值可以有效减少搜索时间,因此,通过以下公式来进行转化:
Figure FDA0004151985230000071
式中,xij表示连续值;yij表示离散值;lb表示搜索空间的下边界;ub表示搜索空间的下边界。
在ISCA寻优的过程中,生成具有n个个体的初始解集合,其中每个解均为多维数向量,表示待优化参数的个数。在初始化种群和混沌图之后,采用反向策略和Levy飞行策略不断更新解的当前位置,可以在算法勘探和开发阶段取得资源利用平衡,直到满足终止条件,所求得的最佳解即为CNN-LSTM超参数的最优值。为了评估每个更新策略的有效性,采用均方误差(MSE)作为适应度函数,计算公式为:
Figure FDA0004151985230000072
式中,yi表示实际值,y′表示预测值,n表示预测的样本数量。
10.根据权利要求1所述的一种基于CNN-ISCA-LSTM模型的短期光伏发电功率预测方法,其特征在于,根据步骤S5,数据反归一化及模型预测效果评价。对预测得到的光伏发电功率数据进行反归一化处理,使其具有物理意义,计算公式为:
xi(k)=xi′(k)(xi,max-xi,min)+xi,min
利用均方根误差(RMSE)、平均绝对误差(MAE)对模型预测效果进行评估,RMSE与MAE数值越小说明预测效果越好。具体计算表达式如下:
Figure FDA0004151985230000081
Figure FDA0004151985230000082
式中,yi表示实际值,y′表示预测值,n表示预测样本数量。
CN202310321716.0A 2023-03-29 2023-03-29 一种基于cnn-isca-lstm模型的短期光伏发电功率预测方法 Withdrawn CN116345555A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310321716.0A CN116345555A (zh) 2023-03-29 2023-03-29 一种基于cnn-isca-lstm模型的短期光伏发电功率预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310321716.0A CN116345555A (zh) 2023-03-29 2023-03-29 一种基于cnn-isca-lstm模型的短期光伏发电功率预测方法

Publications (1)

Publication Number Publication Date
CN116345555A true CN116345555A (zh) 2023-06-27

Family

ID=86885423

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310321716.0A Withdrawn CN116345555A (zh) 2023-03-29 2023-03-29 一种基于cnn-isca-lstm模型的短期光伏发电功率预测方法

Country Status (1)

Country Link
CN (1) CN116345555A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117574180A (zh) * 2024-01-17 2024-02-20 华北电力大学 燃料生产排放***数据关联性控制管理***
CN117708716A (zh) * 2024-02-05 2024-03-15 敏博科技(武汉)有限公司 基于回归和时序融合的光伏发电功率/量预测方法及设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117574180A (zh) * 2024-01-17 2024-02-20 华北电力大学 燃料生产排放***数据关联性控制管理***
CN117574180B (zh) * 2024-01-17 2024-03-19 华北电力大学 燃料生产排放***数据关联性控制管理***
CN117708716A (zh) * 2024-02-05 2024-03-15 敏博科技(武汉)有限公司 基于回归和时序融合的光伏发电功率/量预测方法及设备
CN117708716B (zh) * 2024-02-05 2024-05-10 敏博科技(武汉)有限公司 基于回归和时序融合的光伏发电功率预测方法及设备

Similar Documents

Publication Publication Date Title
CN109492822B (zh) 空气污染物浓度时空域关联预测方法
CN109165774A (zh) 一种短期光伏功率预测方法
CN116345555A (zh) 一种基于cnn-isca-lstm模型的短期光伏发电功率预测方法
CN107609667B (zh) 基于Box_cox变换和UFCNN的供热负荷预测方法及***
CN109635245A (zh) 一种鲁棒宽度学习***
CN110942205A (zh) 一种基于himvo-svm的短期光伏发电功率预测方法
CN112232577B (zh) 用于多芯智能表的电力负荷概率预测***与方法
CN112100911B (zh) 一种基于深度bilstm的太阳辐射预测方法
CN114462718A (zh) 基于时间滑动窗口的cnn-gru风电功率预测方法
CN117117859B (zh) 基于神经网络的光伏发电功率预测方法及***
CN114219181A (zh) 基于迁移学习的风电功率概率预测方法
CN116894384B (zh) 一种多风机风速时空预测方法及***
CN112733997A (zh) 基于woa-lstm-mc的水文时间序列预测优化方法
CN116644970A (zh) 一种基于vmd分解和叠层深度学习的光伏功率预测方法
CN112381282A (zh) 基于宽度学习***的光伏发电功率预测方法
CN114897129A (zh) 一种基于日相似聚类与Kmeans-GRA-LSTM的光伏电站短期功率预测方法
CN114004152A (zh) 基于图卷积和循环神经网络的多风场风速时空预测方法
CN117540638A (zh) 一种光伏电站等值建模方法、介质及***
CN117132132A (zh) 基于气象数据的光伏发电功率预测方法
CN112418504A (zh) 一种基于混合变量选择优化深度信念网络风速预测方法
CN116845875A (zh) 一种基于woa-bp的短期光伏出力预测方法及装置
CN115481788B (zh) 相变储能***负荷预测方法及***
CN116681154A (zh) 一种基于emd-ao-delm的光伏功率计算方法
CN116611702A (zh) 一种面向楼宇综合能源管理的集成学习光伏发电预测方法
CN116090635A (zh) 一种气象驱动的新能源发电功率预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20230627