CN114897129A - 一种基于日相似聚类与Kmeans-GRA-LSTM的光伏电站短期功率预测方法 - Google Patents

一种基于日相似聚类与Kmeans-GRA-LSTM的光伏电站短期功率预测方法 Download PDF

Info

Publication number
CN114897129A
CN114897129A CN202210292305.9A CN202210292305A CN114897129A CN 114897129 A CN114897129 A CN 114897129A CN 202210292305 A CN202210292305 A CN 202210292305A CN 114897129 A CN114897129 A CN 114897129A
Authority
CN
China
Prior art keywords
data
power
multivariate
meteorological factor
lstm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210292305.9A
Other languages
English (en)
Inventor
黄从智
张昕慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China Electric Power University
Original Assignee
North China Electric Power University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China Electric Power University filed Critical North China Electric Power University
Priority to CN202210292305.9A priority Critical patent/CN114897129A/zh
Publication of CN114897129A publication Critical patent/CN114897129A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/251Fusion techniques of input or preprocessed data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/004Generation forecast, e.g. methods or systems for forecasting future energy generation
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/38Arrangements for parallely feeding a single network by two or more generators, converters or transformers
    • H02J3/381Dispersed generators
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Power Engineering (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种基于日相似聚类与Kmeans‑GRA‑LSTM的光伏电站短期功率预测方法,首先获取某光伏电站的功率数据和所在地的多元气象因子数据并对数据进行预处理。后提取功率特征值并使用K‑means聚类算法进行聚类。根据功率特征值聚类结果对应多元气象因子,将数据归一化处理并提取多元气象因子特征向量。选取预测日的多元气象因子特征向量,选取与预测日关联度较高的功率和多元气象因子数据作为相似日样本,选用算术优化算法对LSTM的参数进行优化,构建LSTM网络拓扑结构。根据构建完成的LSTM,预测某光伏电站的并网点功率。本发明为解决短期光伏功率预测提供了一种方案和思路。

Description

一种基于日相似聚类与Kmeans-GRA-LSTM的光伏电站短期功 率预测方法
技术领域
本发明涉及光伏发电与并网技术领域的短期光伏功率预测技术领域,具体来讲涉及一种基于日相似聚类与Kmeans-GRA-LSTM的光伏电站短期功率预测方法。
背景技术
世界能源以及环境形势的日益紧张带来了电力供需矛盾突出等问题,因而传统能源的开发利用受到更多的局限,而在新能源中,太阳能被认为是一种理想的可再生能源发电来源。光伏发电是一种重要的太阳能利用方式,但光伏电站的输出有着高度的随机性、波动性和间歇性等特点,大规模光伏发电的接入会对电力***的安全、稳定运行以及电能质量的保证带来严峻挑战。因此对光伏电站的输出功率进行预测,对于电力部门及时调整调度计划,提高电力***运行的可靠性和光伏电站的接入水平,减小***的旋转备用容量具有重要意义。
在光伏功率预测领域内,根据预测跨越的物理时间层面可按照超短期、短期和长期以及更长时间进行划分,针对本专利来讲,主要提出一种短期光伏功率预测方法即预测未来三天的光伏功率。短期光伏功率预测算法的研究,其主要是从预测所跨越的物理时间入手,以物理时间为基本度量标准,完成预测模型的基本构建,当前短期功率预测常使用神经网络算法、分类回归算法、时间序列算法以及概率预测算法和综合预测算法。
发明内容
本发明的目的是提供一种基于日相似聚类与Kmeans-GRA-LSTM的光伏电站短期功率预测方法,更为精确预测光伏发电功率,降低光伏并网对电网可能造成的损害。根据某光伏电站的并网点功率数据和某光伏电站所在地的多元气象因子数据,对获取的并网点功率数据和多元气象因子数据进行预处理,对获取的某光伏电站的并网点功率提取特征值,并使用K-means聚类算法进行聚类,根据并网点功率特征值聚类结果对应多元气象因子,将数据归一化处理并提取多元气象因子的特征向量,选取预测日的多元气象因子特征向量,使用灰色关联度法选取与预测日关联度最高的前10天的并网点功率数据和多元气象因子数据作为相似日样本,作为LSTM神经网络的训练集,选用算术优化算法对LSTM的参数进行优化,构建LSTM网络拓扑结构。根据构建完成的LSTM,预测某光伏电站的并网点功率,验证其方法的准确性。
本发明所采用的技术是,一种基于日相似聚类与Kmeans-GRA-LSTM的光伏电站短期功率预测方法,具体按照以下步骤实施:
获取某光伏电站的并网功率数据和某光伏电站所在地的多元气象因子数据。
其中多元气象因子数据中包括温度,湿度,大气压力,风速,风向和辐射度等气象因子。
对获取的并网点功率数据和多元气象因子数据进行预处理。
预处理的数据通常为缺失数据和异常数据。
对于异常数据和缺失数据均使用均值插补法进行补全,均值插补法如下:
Figure BDA0003561990810000021
其中x'i作为t时刻的期望平抑目标。其中,xi-1为需处理数据的前一个数据点,xi+1为需处理数据的后一个数据点,对需要处理数据的前后两个数据点作两两取均值进行差补。
对获取的某光伏电站的并网点功率数据提取特征值。
选取特征值分别为日功率平均值,日标准差,日功率变异系数,日功率偏态,日功率峰态和日总功率。具体公式如下:
日平均功率:
Figure BDA0003561990810000031
其中N表示数据点的数目,数据点个数与每天的辐射度时长有关。Pi表示每个时间点的并网点功率。
日标准差:
Figure BDA0003561990810000032
日功率变异系数:
Figure BDA0003561990810000033
日功率偏态:
Figure BDA0003561990810000034
日功率峰态:
Figure BDA0003561990810000035
日总功率:
Figure BDA0003561990810000036
提取出每日特征值后组成功率特征向量,进行归一化处理。归一化公式如下:
Figure BDA0003561990810000037
其中xmin,xmax分别表示样本的最小值和最大值,并且ymin=-1,ymax=1。
选用K-means聚类算法对归一化后的功率特征向量进行聚类。
K-means聚类算法具体流程:
从样本集中随机选取K个样本作为簇中心。
计算所有样本与这K个簇中心的距离,对于每一个样本,将其划分到与其距离最近的簇中心所在的簇中,对于新的簇计算各个簇的新的簇中心。
重复上述步骤,直至簇中心不在移动。
由于使用K-means对功率特征向量聚类,聚类中心数目不确定,因此引入聚类评估算***廓系数,轮廓系数公式如下:
Figure BDA0003561990810000041
其中,计算样本i到同簇其他样本的平均距离a(i),a(i)越小,说明样本i越应该被聚类到该簇,将a(i)称为样本i的簇内不相似度。计算样本i到某簇Cj的所有样本的平均距离b(ij),称为样本i与簇Cj的不相似度,其中bi=min{bi1,bi2,....,bik,}。
根据并网点功率特征向量聚类结果对应多元气象因子特征向量。
确定多元气象因子的特征向量包含风速、大气压、温度、湿度、风向、辐射度的最大值和最小值以及辐射时长。
并网点功率特征向量聚类结果与多元气象因子特征向量对应。
选取预测日的多元气象因子特征向量,使用灰色关联度法选取与预测日关联度最高的前10天的并网点功率数据和多元气象因子数据作为相似日样本,作为LSTM神经网络的训练集。
提取预测日的多元气象因子特征向量。
确定气象因子特征向量,分别提取温度,湿度,大气压力,风速,风向和辐射度的最大最小值以及辐射时长组成气象因子特征向量。
根据预测日的气象因子特征向量与各聚类中心的气象因子特征向量之间的欧氏度量,确定预测日气象因子特征向量所属的聚类簇。欧氏距离计算公式如下:
Figure BDA0003561990810000051
其中xo表示预测日的气象因子特征值,
Figure BDA0003561990810000052
每个簇的用气象因子特征值表示的簇中心。
采用灰色关联分析选取预测日气象因子特征向量与聚类簇中气象因子特征向量之间的几何相似度,来获得它们之间的关联度。
选取预测日气象因子特征向量作为参考序列,选取聚类簇中气象因子特征向量作为比较序列。
参考序列表示为:Y=Y(k)|k=1,2...,k
比较序列表示为:Xi=Y(k)|k=1,2...,n;i=1,2,...m
对参考序列和比较序列进行无量纲化处理:
Figure BDA0003561990810000053
i=1,2,...m
其中k对应时间段,i对应比较数列中的一行。
无量纲处理后计算关联度系数:
Figure BDA0003561990810000054
其中ρ表示分辨系数,通常取值范围为(0,1)之间,当p≤0.5463时分辨力最好,通常p=0.5。
计算关联度:
Figure BDA0003561990810000055
关联度从大到小排序,选取聚类簇中气象因子特征向量中相似度最高的前10天的并网点功率数据和多元气象因子数据作为相似日样本。
相似日中选用与预测日相关度最高的并网点功率数据和多元气象因子数据作为验证集,剩余的并网点功率数据和多元气象因子数据作为训练集,其中训练神经网络的输入数据为t-24时刻的并网点功率数据,t-24时刻的多元气象因子数据和t时刻的多元气象因子数据,训练神经网络的输出数据为t时刻的并网点功率数据。选取验证集的MSE作为算术优化算法的适应度函数,其中MSE如下:
Figure BDA0003561990810000061
LSTM神经网络可以将较长时间之前的信息输送给后面时间步长的细胞,有较大的记忆容量,有更强的泛化能力和自适应能力,可解决长时间依赖问题。LSTM神经网络结构如下:
Figure BDA0003561990810000062
其中Wf、Wi、Wc、Wo均为LSTM的权重矩阵,bf、bi、bc、bo均为LSTM的偏置,σ表示sigmoid激活函数。
将LSTM神经网络中神经网络隐藏层单元数目、迭代次数和学习率作为算术优化算法的寻优对象,初始化种群和相关参数r1,r2,r3参数。
算法通过数学优化器加速函数(MOA)选择搜索阶段,当r1>MOA时,算术优化算法进行全局探索,当r1<MOA时,算术优化算法进入局部开发阶段。
Figure BDA0003561990810000071
其中Min、Max分别表示种群所处位置的最大值和最小值,t、T分别表示当前迭代次数和最大迭代次数。
其中全局搜索通过乘法运算与除法运算实现,当r2>0.5时,执行除法搜索策略,当r2<0.5时,执行乘法搜索策略,其种群更新公式如下:
Figure BDA0003561990810000072
其中
Figure BDA0003561990810000073
其中,r2∈[0,1],u是调整搜索过程的控制参数,值为0.499,ξ是一个极小值,α是敏感参数,定义了迭代过程中的局部开发精度,取值为5。
局部搜索通过加法运算与减法运算实现,其种群更新公式如下:
Figure BDA0003561990810000074
其中,r3是0和1之间的随机数。
将寻优得到的LSTM神经网络中神经网络隐藏层单元数目、迭代次数和学习率,代入训练LSTM神经网络。
将预测日的多元气象因子数据输入构建完成的LSTM神经网络,输出预测日的并网点功率。
附图说明
图1为本发明一种基于日相似聚类与Kmeans-GRA-LSTM的光伏电站短期功率预测方法流程图。
图2为LSTM神经网络拓扑结构。
图3为算术优化算法的流程图。
具体实施方法
下面结合附图对本发明做出进一步的阐述,但不能以此来限制本申请的保护范围。
在本实例中,参照图1所示,本发明提出了一种基于日相似聚类与Kmeans-GRA-LSTM的光伏电站短期功率预测方法,包括步骤:
获取某光伏电站的并网功率数据和某光伏电站所在地的多元气象因子数据。
其中多元气象因子数据中包括温度,湿度,大气压力,风速,风向和辐射度等气象因子。
对获取的并网点功率数据和多元气象因子数据进行预处理。
预处理的数据通常为缺失数据和异常数据。
对于异常数据和缺失数据均使用均值插补法进行补全,均值插补法如下:
Figure BDA0003561990810000081
其中x'i作为t时刻的期望平抑目标。其中,xi-1为需处理数据的前一个数据点,xi+1为需处理数据的后一个数据点,对需要处理数据的前后两个数据点作两两取均值进行差补。
对获取的某光伏电站的并网点功率数据提取特征值。
选取特征值分别为日功率平均值,日标准差,日功率变异系数,日功率偏态,日功率峰态和日总功率。具体公式如下:
日平均功率:
Figure BDA0003561990810000091
其中N表示数据点的数目,数据点个数与每天的辐射度时长有关。Pi表示每个时间点的并网点功率。
日标准差:
Figure BDA0003561990810000092
日功率变异系数:
Figure BDA0003561990810000093
日功率偏态:
Figure BDA0003561990810000094
日功率峰态:
Figure BDA0003561990810000095
日总功率:
Figure BDA0003561990810000096
提取出每日特征值后组成功率特征向量。
功率特征向量=[日平均功率日标准差日功率变异系数日功率偏态日功率峰态日总功率]。
进行归一化处理,归一化公式如下:
Figure BDA0003561990810000097
其中xmin,xmax分别表示样本的最小值和最大值,并且ymin=-1,ymax=1。
选用K-means聚类算法对归一化后的功率特征向量进行聚类。
分别设置K的取值为2,3,4,5,6,依次进行K-means聚类并求解轮廓系数。
K-means聚类算法具体流程:
分别设置K的取值为2,3,4,5,6。
从样本集中随机选取K个样本作为簇中心。
计算所有样本与这K个簇中心的距离,对于每一个样本,将其划分到与其距离最近的簇中心所在的簇中,对于新的簇计算各个簇的新的簇中心。
重复上述步骤,直至簇中心不在移动。
由于使用K-means对功率特征向量聚类,聚类中心数目不确定,因此引入聚类评估算***廓系数,轮廓系数公式如下:
Figure BDA0003561990810000101
其中,计算样本i到同簇其他样本的平均距离a(i),a(i)越小,说明样本i越应该被聚类到该簇,将a(i)称为样本i的簇内不相似度。计算样本i到某簇Cj的所有样本的平均距离b(ij),称为样本i与簇Cj的不相似度,其中bi=min{bi1,bi2,....,bik,}。
根据求解的轮廓系数,选取最大轮廓系数所对应的K值作为K-means的簇中心数目。
根据并网点功率特征向量聚类结果对应多元气象因子特征向量,确定多元气象因子的特征向量包含风速、大气压、温度、湿度、风向、辐射度的最大值和最小值以及辐射时长。
多元气象因子的特征向量=[风速最大值风速最小值大气压最大值大气压最小值温度最大值温度最小值湿度最大值湿度最小值风向最大值风向最小值辐射度最大值辐射度最小值辐射时长]
并网点功率特征向量聚类结果与多元气象因子特征向量对应。
选取预测日的多元气象因子特征向量,使用灰色关联度法选取与预测日关联度最高的前10天的并网点功率数据和多元气象因子数据作为相似日样本,作为LSTM神经网络的训练集。
提取预测日的多元气象因子特征向量。
确定气象因子特征向量,分别提取温度,湿度,大气压力,风速,风向和辐射度的最大最小值以及辐射时长组成气象因子特征向量。
根据预测日的气象因子特征向量与各聚类中心的气象因子特征向量之间的欧氏度量,确定预测日气象因子特征向量所属的聚类簇。欧氏距离计算公式如下:
Figure BDA0003561990810000111
其中xo表示预测日的气象因子特征值,
Figure BDA0003561990810000112
每个簇的用气象因子特征值表示的簇中心。
采用灰色关联分析选取预测日气象因子特征向量与聚类簇中气象因子特征向量之间的几何相似度,来获得它们之间的关联度。
选取预测日气象因子特征向量作为参考序列,选取聚类簇中气象因子特征向量作为比较序列。
参考序列表示为:Y=Y(k)|k=1,2...,k
比较序列表示为:Xi=Y(k)|k=1,2...,n;i=1,2,...m
对参考序列和比较序列进行无量纲化处理:
Figure BDA0003561990810000113
i=1,2,...m
其中k对应时间段,i对应比较数列中的一行。
无量纲处理后计算关联度系数:
Figure BDA0003561990810000114
其中ρ表示分辨系数,通常取值范围为(0,1)之间,当p≤0.5463时分辨力最好,通常p=0.5。
计算关联度:
Figure BDA0003561990810000121
关联度从大到小排序,选取聚类簇中气象因子特征向量中相似度最高的前10天的并网点功率数据和多元气象因子数据作为相似日样本。
相似日中选用与预测日相关度最高的并网点功率数据和多元气象因子数据作为验证集,剩余的并网点功率数据和多元气象因子数据作为训练集,其中训练神经网络的输入数据为t-24时刻的并网点功率数据,t-24时刻的多元气象因子数据和t时刻的多元气象因子数据,训练神经网络的输出数据为t时刻的并网点功率数据。选取验证集的MSE作为算术优化算法的适应度函数,其中MSE如下:
Figure BDA0003561990810000122
LSTM神经网络可以将较长时间之前的信息输送给后面时间步长的细胞,有较大的记忆容量,有更强的泛化能力和自适应能力,可解决长时间依赖问题。LSTM神经网络结构如下:
ft=σ(Wf·[ht-1,xt]+bf)
it=σ(Wi·[ht-1,xt]+bi)
Figure BDA0003561990810000123
Figure BDA0003561990810000124
ot=σ(Wo·[ht-1,xt]+bo)
ht=ot*tanh(Ct)
其中Wf、Wi、Wc、Wo均为LSTM的权重矩阵,bf、bi、bc、bo均为LSTM的偏置,σ表示sigmoid激活函数。
将LSTM神经网络中神经网络隐藏层单元数目、迭代次数和学习率作为算术优化算法的寻优对象,初始化种群和相关参数r1,r2,r3参数。
算法通过数学优化器加速函数(MOA)选择搜索阶段,当r1>MOA时,算术优化算法进行全局探索,当r1<MOA时,算术优化算法进入局部开发阶段。
Figure BDA0003561990810000131
其中Min、Max分别表示种群所处位置的最大值和最小值,t、T分别表示当前迭代次数和最大迭代次数。
其中全局搜索通过乘法运算与除法运算实现,当r2>0.5时,执行除法搜索策略,当r2<0.5时,执行乘法搜索策略,其种群更新公式如下:
Figure BDA0003561990810000132
其中
Figure BDA0003561990810000133
其中,r2∈[0,1],u是调整搜索过程的控制参数,值为0.499,ξ是一个极小值,α是敏感参数,定义了迭代过程中的局部开发精度,取值为5。
局部搜索通过加法运算与减法运算实现,其种群更新公式如下:
Figure BDA0003561990810000134
其中,r3是0和1之间的随机数。
将寻优得到的LSTM神经网络中神经网络隐藏层单元数目、迭代次数和学习率,代入训练LSTM神经网络。
将预测日的多元气象因子数据输入构建完成的LSTM神经网络,输出预测日的并网点功率。
本发明申请人结合说明书附图对本发明的具体实施方式进行了描述,本行业的技术人员应当明白,上述具体实施和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (8)

1.一种基于日相似聚类与Kmeans-GRA-LSTM的光伏电站短期功率预测方法,利用经智能优化算法优化得到的LSTM网络建立光伏电站短期预测模型,其特征在于,按照以下步骤实施:
步骤1:获取某光伏电站的并网功率数据和某光伏电站所在地的多元气象因子数据。
步骤2:对获取的并网点功率数据和多元气象因子数据进行预处理。
步骤3:对获取的某光伏电站的并网点功率提取特征值,并使用K-means聚类算法进行聚类。
步骤4:根据并网点功率特征值聚类结果对应多元气象因子数据,将多元气象因子数据归一化处理并提取多元气象因子的特征向量。
步骤5:选取预测日的多元气象因子的特征向量,使用灰色关联度法选取与预测日关联度最高的前10天的并网点功率和多元气象因子数据作为相似日样本,作为LSTM神经网络的训练集。
步骤6:选用算术优化算法对LSTM的参数进行优化,构建LSTM网络拓扑结构。
步骤7:使用完成的LSTM神经网络预测某光伏电站的短期并网点功率。
2.根据权利要求1所述中的一种基于日相似聚类与Kmeans-GRA-LSTM的光伏电站短期功率预测方法,其特征在于,所述步骤1中具体为,获取一年内某光伏电站的并网点功率数据和某光伏电站所在地的多元气象因子数据,其中多元气象因子数据中包括温度,湿度,大气压力,风速,风向和辐射度等气象因子。
3.根据权利要求1所述中的一种基于日相似聚类与Kmeans-GRA-LSTM的光伏电站短期功率预测方法,其特征在于,所述步骤1中具体为,对获取的并网点功率数据和多元气象因子数据进行预处理。具体过程如下:
步骤3.1、预处理的数据通常为缺失数据和异常数据。
步骤3.2、筛选数据先根据相关准则作出具体判断准则。
步骤3.3、对于异常数据和缺失数据均使用均值插补法进行补全。
步骤3.4、均值插补法如下:
Figure FDA0003561990800000021
其中,xi-1为需处理数据的前一个数据点,xi+1为需处理数据的后一个数据点,对需要处理数据的前后两个数据点作两两取均值进行差补。
4.根据权利要求1所述中的一种基于日相似聚类与Kmeans-GRA-LSTM的光伏电站短期功率预测方法,其特征在于,所述步骤3中具体为,对获取的某光伏电站的并网点功率数据提取特征值,并使用K-means聚类算法进行聚类。具体步骤如下:
步骤4.1、对获取的某光伏电站的并网点功率数据提取特征值。
步骤4.2、选取特征值分别为日功率平均值,日标准差,日功率变异系数,日功率偏态,日功率峰值和日总功率。
步骤4.3、提取出每日特征值后组成功率特征向量,进行归一化处理。归一化公式如下:
Figure FDA0003561990800000022
其中xmin,xmax分别表示样本的最小值和最大值,并且ymin=-1,ymax=1。
步骤4.4、选用K-means聚类算法对归一化后的功率特征向量进行聚类。
5.根据权利要求1所述中的一种基于日相似聚类与Kmeans-GRA-LSTM的光伏电站短期功率预测方法,其特征在于,所述步骤4中具体为,根据并网点功率特征向量聚类结果对应多元气象因子特征向量,对多元气象因子数据归一化处理并提取多元气象因子的特征向量。具体过程如下:
步骤5.1、确定多元气象因子的特征向量包含风速、大气压、温度、湿度、风向、辐射度的最大值和最小值以及辐射时长。
步骤5.2、并网点功率特征向量聚类结果与多元气象因子特征向量对应。
6.根据权利要求1所述中的一种基于日相似聚类与Kmeans-GRA-LSTM的光伏电站短期功率预测方法,其特征在于,所述步骤5中具体为,选取预测日的多元气象因子特征向量,使用灰色关联度法选取与预测日关联度最高的前10天的并网点功率数据和多元气象因子数据作为相似日样本,作为LSTM神经网络的训练集。具体步骤如下:
步骤6.1、提取预测日的多元气象因子特征向量。
步骤6.2、确定气象因子特征向量,分别提取温度,湿度,大气压力,风速,风向和辐射度的最大最小值以及辐射时长组成气象因子特征向量。
步骤6.3、根据预测日的气象因子特征向量与各聚类中心的气象因子特征向量之间的欧氏度量,确定预测日气象因子特征向量所属的聚类簇。
步骤6.4、采用灰色关联分析选取预测日气象因子特征向量与聚类簇中气象因子特征向量之间的几何相似度,来获得它们之间的关联度。
步骤6.5、计算相关系数的公式如下:
Figure FDA0003561990800000031
其中y(k)和xi(k)分别表示参考序列和比较序列,其中ρ表示分辨率,ρ为0.5。
步骤6.6、计算关联度,关联度定义如下:
Figure FDA0003561990800000041
步骤6.7、选取聚类簇中气象因子特征向量中相似度最高的前10天的并网点功率数据和多元气象因子数据作为相似日样本。
7.根据权利要求1所述中的一种基于日相似聚类与Kmeans-GRA-LSTM的光伏电站短期功率预测方法,其特征在于,所述步骤6中具体为,选用算术优化算法对LSTM的参数进行优化,构建LSTM网络拓扑结构。具体步骤如下:
步骤7.1、LSTM神经网络可以将较长时间之前的信息输送给后面时间步长的细胞,有较大的记忆容量,有更强的泛化能力和自适应能力,可解决长时间依赖问题。LSTM神经网络结构如下:
ft=σ(Wf·[ht-1,xt]+bf)
it=σ(Wi·[ht-1,xt]+bi)
Figure FDA0003561990800000042
Figure FDA0003561990800000043
ot=σ(Wo·[ht-1,xt]+bo)
ht=ot*tanh(Ct)
步骤7.3、相似日中选用与预测日相关度最高的并网点功率数据和多元气象因子数据作为验证集,剩余的并网点功率数据和多元气象因子数据作为训练集,其中训练神经网络的输入数据为t-24时刻的并网点功率数据,t-24时刻的多元气象因子数据和t时刻的多元气象因子数据,训练神经网络的输出数据为t时刻的并网点功率数据。选取验证集的MSE作为算术优化算法的适应度函数,其中MSE如下:
Figure FDA0003561990800000051
y表示验证集的并网点功率,
Figure FDA0003561990800000052
表示预测的验证集并网点功率。
步骤7.2、将LSTM神经网络中神经网络隐藏层单元数目、迭代次数和学习率作为算术优化算法的寻优对象,初始化种群和相关参数r1,r2,r3参数。
步骤7.3、算法通过数学优化器加速函数(MOA)选择搜索阶段,当r1>MOA时,算术优化算法进行全局探索,当r1<MOA时,算术优化算法进入局部开发阶段。
Figure FDA0003561990800000053
步骤7.4、通过乘法运算与除法运算实现全局搜索,当r2>0.5时,执行除法搜索策略,当r2<0.5时,执行乘法搜索策略,其种群更新公式如下:
Figure FDA0003561990800000054
其中MOP如下所示:
Figure FDA0003561990800000055
利用加法运算与减法运算实现局部搜索,其种群位置更新公式如下:
Figure FDA0003561990800000056
步骤7.5、将寻优得到的LSTM神经网络中神经网络隐藏层单元数目、迭代次数和学习率,代入训练LSTM神经网络。
步骤7.6、完成基于预测日的LSTM神经网络构建。
8.根据权利要求1所述中的一种基于日相似聚类与Kmeans-GRA-LSTM的光伏电站短期功率预测方法,其特征在于,所述步骤7中具体为,根据构建完成的LSTM神经网络,预测某光伏电站的短期并网点功率。具体过程如下:
步骤8.1、引入构建完成的LSTM神经网络。
步骤8.2、将预测日的多元气象因子数据输入构建完成的LSTM神经网络,输出预测日的并网点功率。
CN202210292305.9A 2022-03-24 2022-03-24 一种基于日相似聚类与Kmeans-GRA-LSTM的光伏电站短期功率预测方法 Pending CN114897129A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210292305.9A CN114897129A (zh) 2022-03-24 2022-03-24 一种基于日相似聚类与Kmeans-GRA-LSTM的光伏电站短期功率预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210292305.9A CN114897129A (zh) 2022-03-24 2022-03-24 一种基于日相似聚类与Kmeans-GRA-LSTM的光伏电站短期功率预测方法

Publications (1)

Publication Number Publication Date
CN114897129A true CN114897129A (zh) 2022-08-12

Family

ID=82716122

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210292305.9A Pending CN114897129A (zh) 2022-03-24 2022-03-24 一种基于日相似聚类与Kmeans-GRA-LSTM的光伏电站短期功率预测方法

Country Status (1)

Country Link
CN (1) CN114897129A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116307287A (zh) * 2023-05-19 2023-06-23 国网信息通信产业集团有限公司 一种光伏发电有效时段的预测方法、***及预测终端
CN116933114A (zh) * 2023-06-12 2023-10-24 浙江大学 一种基于cnn-lstm的直流微电网检测方法及装置
CN117117859A (zh) * 2023-10-20 2023-11-24 华能新能源股份有限公司山西分公司 基于神经网络的光伏发电功率预测方法及***
CN117250869A (zh) * 2023-11-15 2023-12-19 成都态坦测试科技有限公司 温控设备的控制方法、装置、可读存储介质及电子设备
CN117878943A (zh) * 2023-12-25 2024-04-12 江苏明茂新能源科技有限公司 一种光伏微电网实时充电调度方法及***

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116307287A (zh) * 2023-05-19 2023-06-23 国网信息通信产业集团有限公司 一种光伏发电有效时段的预测方法、***及预测终端
CN116307287B (zh) * 2023-05-19 2023-08-01 国网信息通信产业集团有限公司 一种光伏发电有效时段的预测方法、***及预测终端
CN116933114A (zh) * 2023-06-12 2023-10-24 浙江大学 一种基于cnn-lstm的直流微电网检测方法及装置
CN117117859A (zh) * 2023-10-20 2023-11-24 华能新能源股份有限公司山西分公司 基于神经网络的光伏发电功率预测方法及***
CN117117859B (zh) * 2023-10-20 2024-01-30 华能新能源股份有限公司山西分公司 基于神经网络的光伏发电功率预测方法及***
CN117250869A (zh) * 2023-11-15 2023-12-19 成都态坦测试科技有限公司 温控设备的控制方法、装置、可读存储介质及电子设备
CN117878943A (zh) * 2023-12-25 2024-04-12 江苏明茂新能源科技有限公司 一种光伏微电网实时充电调度方法及***

Similar Documents

Publication Publication Date Title
CN114897129A (zh) 一种基于日相似聚类与Kmeans-GRA-LSTM的光伏电站短期功率预测方法
CN107766990B (zh) 一种光伏电站发电功率的预测方法
JP5888640B2 (ja) 太陽光発電予測装置、太陽光発電予測方法及び太陽光発電予測プログラム
CN117117859B (zh) 基于神经网络的光伏发电功率预测方法及***
CN116128150B (zh) 一种基于两级优化的光伏智能出力预测方法
CN114462718A (zh) 基于时间滑动窗口的cnn-gru风电功率预测方法
CN114792156A (zh) 基于曲线特征指标聚类的光伏输出功率预测方法和***
CN115907195A (zh) 一种光伏发电功率预测方法、***、电子设备及介质
CN116187540B (zh) 一种基于时空偏差修正的风电场站超短期功率预测方法
CN114757427A (zh) 自回归修正的lstm智能风电场超短期功率预测方法
CN111428766B (zh) 一种高维海量量测数据的用电模式分类方法
CN116629416A (zh) 光伏电站功率预测方法及装置
CN111222689A (zh) 基于多尺度时间特征的lstm负荷预测方法、介质及电子装置
CN114330100A (zh) 一种短期光伏功率概率区间预测方法
CN116345555A (zh) 一种基于cnn-isca-lstm模型的短期光伏发电功率预测方法
CN115759389A (zh) 基于天气类型的相似日组合策略的日前光伏功率预测方法
CN117318036A (zh) 一种基于改进鲸鱼优化算法的超短期光伏功率预测方法
CN117786441A (zh) 一种基于改进K-means聚类算法的多场景光伏用户用电行为分析方法
CN116227677A (zh) 一种考虑光伏功率爬坡特征的功率预测校正方法
CN115392387B (zh) 一种低压分布式光伏发电出力预测方法
CN115481788B (zh) 相变储能***负荷预测方法及***
CN115496153A (zh) 多头自注意力的深度卷积嵌入聚类风光荷联合场景方法
CN114234392B (zh) 一种基于改进pso-lstm的空调负荷精细预测方法
CN115456286A (zh) 一种短期光伏功率预测方法
Yang et al. Research on distributed photovoltaic power prediction based on spatiotemporal information ensemble method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination