CN114861990A - 风电功率预测模型建模方法、装置和设备 - Google Patents

风电功率预测模型建模方法、装置和设备 Download PDF

Info

Publication number
CN114861990A
CN114861990A CN202210402116.2A CN202210402116A CN114861990A CN 114861990 A CN114861990 A CN 114861990A CN 202210402116 A CN202210402116 A CN 202210402116A CN 114861990 A CN114861990 A CN 114861990A
Authority
CN
China
Prior art keywords
wind power
sample data
power prediction
prediction model
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210402116.2A
Other languages
English (en)
Inventor
严玉廷
李巍
苏适
潘姝慧
陈君
白浩
杨洋
雷金勇
冯勇
袁智勇
袁兴宇
郭琦
杨家全
喻磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electric Power Research Institute of Yunnan Power Grid Co Ltd
Original Assignee
Electric Power Research Institute of Yunnan Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electric Power Research Institute of Yunnan Power Grid Co Ltd filed Critical Electric Power Research Institute of Yunnan Power Grid Co Ltd
Priority to CN202210402116.2A priority Critical patent/CN114861990A/zh
Publication of CN114861990A publication Critical patent/CN114861990A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/004Generation forecast, e.g. methods or systems for forecasting future energy generation
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/38Arrangements for parallely feeding a single network by two or more generators, converters or transformers
    • H02J3/381Dispersed generators
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/20Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2300/00Systems for supplying or distributing electric power characterised by decentralized, dispersed, or local generation
    • H02J2300/20The dispersed energy generation being of renewable origin
    • H02J2300/28The renewable source being wind energy
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Human Resources & Organizations (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Power Engineering (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种风电功率预测模型建模方法、装置和设备,方法包括:获取样本数据,对样本数据进行预处理,将预处理后的样本数据划分为训练集和测试集。根据训练集进行动态时间建模,得到多种不同的LSTM‑CNN网络结构。将训练集输入各LSTM‑CNN网络结构进行训练,得到多个备选风电功率预测模型。根据测试集对各备选风电功率预测模型进行测试,在多个备选风电功率预测模型中确定优选风电功率预测模型。本申请中结合CNN和LSTM进行动态时间建模,引入CNN来压缩LSTM隐藏状态以减少模型的输出,克服模型训练过程中的过拟合、梯度***和消失问题,从而提高风电功率预测模型的预测精度。

Description

风电功率预测模型建模方法、装置和设备
技术领域
本申请涉及风电功率预测技术领域,尤其涉及一种风电功率预测模型建模方法、装置和设备。
背景技术
风电是一种清洁能源,其取之不尽用之不竭。随着世界能源环境的改革以及环境保护的迫切需要,风电在可再生能源中的地位愈发凸显。风力发电的高速发展,大大缓解我国能源不足的现状。但是,风力发电中存在随机性和不稳定性,随着一体化风电的高速发展,其存在的问题对电网的影响也愈发突出,严重威胁电力***安全、稳定、经济、可靠的运行。因此,准确的风电功率预测,可以显著提高电力***安全性、稳定性、经济性、可靠性,并提高风电的消纳能力。
目前,风电功率预测的研究方法主要有统计方法、物理方法和人工智能方法。人工智能方法是指结合了神经网络、支持向量机等各种智能算法的现代风电预测方法。相比于传统的统计方法和物理方法而言,通过人工智能算法可以优化模型参数,进而构建预测更精确的预测模型,在短期风电预测中有着广泛应用。但是由于区域气象数据量庞大,现有技术中使用的传统单一模型结构难以反映气象特征,在进行建模时也可能造成模型过拟合,进而导致预测结果不准确、误差大等问题。
发明内容
为至少在一定程度上克服相关技术中的风电功率预测模型预测结果不准确、误差大的问题,本申请提供一种风电功率预测模型建模方法、装置和设备。
本申请的方案如下:
根据本申请实施例的第一方面,提供一种风电功率预测模型建模方法,包括:
获取样本数据;所述样本数据至少包括:待预测风电厂的风电功率时间序列和所在区域数值天气数据;
对所述样本数据进行预处理;
将预处理后的样本数据划分为训练集和测试集;
根据所述训练集进行动态时间建模,得到多种不同的长短期记忆(Long Short-Term Memory,LSTM)-卷积神经网络(Convolutional Neural Network,CNN)网络结构;
将所述训练集输入各所述LSTM-CNN网络结构进行训练,得到多个备选风电功率预测模型;
根据所述测试集对各所述备选风电功率预测模型进行测试,在多个所述备选风电功率预测模型中确定优选风电功率预测模型,所述优选风电功率预测模型用于根据输入的天气数据输出风电功率预测数据。
优选的,在本申请一种可实现的方式中,所述对所述样本数据进行预处理,包括:
对所述样本数据进行异常值检测,剔除所述样本数据中的异常数据,得到含有缺失值的样本数据;
对所述含有缺失值的样本数据进行缺失值填补;
将缺失值填补后的样本数据进行归一化处理。
优选的,在本申请一种可实现的方式中,所述对所述样本数据进行异常值检测,剔除所述样本数据中的异常数据,包括:
基于局部异常因子算法对所述样本数据进行异常值检测,剔除所述样本数据中的异常数据;
所述局部异常因子算法包括:
在所述样本数据中选取待检测特征,在所述待检测特征下选取当前检测点;
计算所述当前检测点的邻域点所处位置的平均密度与所述当前检测点所处位置密度的比值;
在所述比值高于预设阈值时,判断所述当前检测点为异常点;
遍历所述样本数据中全部特征下的全部检测点,将所述所述样本数据中的全部异常点作为所述异常数据进行剔除。
优选的,在本申请一种可实现的方式中,所述对所述含有缺失值的样本数据进行缺失值填补,包括:
基于生成对抗网络的缺失值填补方法对所述含有缺失值的样本数据进行缺失值填补;
所述生成对抗网络的缺失值填补方法包括:
初始化所述生成对抗网络中生成器和判别器的参数;
在所述样本数据中进行采样得到真实样本;
在先验分布噪声中进行采样得到与所述真实样本数量对应的噪声样本;
基于所述生成器生成与所述真实样本数量对应的生成样本;
根据所述真实样本、所述噪声样本和所述生成样本,基于迭代更新算法训练所述判别器和所述生成器;所述迭代更新算法的训练方向为:使所述辨别器对所述真实样本和所述生成样本的辨别概率相同;
通过训练完成后的生成器对所述含有缺失值的样本数据进行缺失值填补。
优选的,在本申请一种可实现的方式中,所述基于迭代更新算法训练所述判别器和所述生成器,包括:每当所述判别器循环更新预设次数时,基于预设的学习率对所述生成器的参数进行更新。
优选的,在本申请一种可实现的方式中,所述将缺失值填补后的样本数据进行归一化处理,包括:
基于一阶差分法,将缺失值填补后的样本数据进行信号平稳化处理;
将平稳化处理后的样本数据中的各个变量的数值归至[-1,1];所述变量至少包括以下几项中的一项:风速、风向、气温、气压和风电功率;
归一化处理的计算公式为:
Figure BDA0003600630810000041
其中,x′为归一化后的变量,xmin和xmax分别为所述变量的极小值和极大值。
优选的,在本申请一种可实现的方式中,所述LSTM-CNN网络结构至少包括:LSTM层、卷积层、池化层、全连接层和丢弃层;
其中,所述卷积层用于对上一层的输出进行卷积操作,得到用于训练的特征;所述池化层用于对上一层的输出进行采样操作;所述全连接层用于完成从特征到功率的映射。
优选的,在本申请一种可实现的方式中,各所述LSTM-CNN网络结构的区别至少包括以下几种中的至少一种:层不同、层数不同和层排列顺序不同。
优选的,在本申请一种可实现的方式中,所述在多个所述备选风电功率预测模型中确定优选风电功率预测模型,包括:
计算各所述备选风电功率预测模型的均方根误差;
将均方根误差最小的备选风电功率预测模型确定为优选风电功率预测模型;
所述备选风电功率预测模型的均方根误差的计算公式为:
Figure BDA0003600630810000051
其中,n为进行测试的数据个数;Yi
Figure BDA0003600630810000052
分别为进行测试的数据的实际值和预测值;i为进行测试的点的序列编号。
根据本申请实施例的第二方面,提供一种风电功率预测模型建模装置,包括:
处理器和存储器;
所述处理器与存储器通过通信总线相连接:
其中,所述处理器,用于调用并执行所述存储器中存储的程序;
所述存储器,用于存储程序,所述程序至少用于执行如以上任一项所述的一种风电功率预测模型建模方法。
根据本申请实施例的第三方面,提供一种风电功率预测模型建模设备,包括:
获取模块,用于获取样本数据;所述样本数据至少包括:待预测风电厂的风电功率时间序列和所在区域数值天气数据;
预处理模块,用于对所述样本数据进行预处理;
划分模块,用于将预处理后的样本数据划分为训练集和测试集;
建模模块,根据所述训练集进行动态时间建模,得到多种不同的LSTM-CNN网络结构;
训练模块,用于将所述训练集输入各所述LSTM-CNN网络结构进行训练,得到多个备选风电功率预测模型;
测试模块,用于根据所述测试集对各所述备选风电功率预测模型进行测试,在多个所述备选风电功率预测模型中确定优选风电功率预测模型,所述优选风电功率预测模型用于根据输入的天气数据输出风电功率预测数据。
本申请提供的技术方案可以包括以下有益效果:本申请中的风电功率预测模型建模方法,首先获取样本数据,对样本数据进行预处理,将预处理后的样本数据划分为训练集和测试集。进而根据训练集进行动态时间建模,得到多种不同的LSTM-CNN网络结构。将训练集输入各LSTM-CNN网络结构进行训练,得到多个备选风电功率预测模型。最后根据测试集对各备选风电功率预测模型进行测试,在多个备选风电功率预测模型中确定优选风电功率预测模型,优选风电功率预测模型用于根据输入的天气数据输出风电功率预测数据。由于本申请中的样本数据至少包括待预测风电厂的风电功率时间序列和所在区域数值天气数据,样本数据为多变量时间序列,所以本申请中结合CNN和LSTM进行动态时间建模,引入CNN来压缩LSTM隐藏状态以减少模型的输出,克服模型训练过程中的过拟合、梯度***和消失问题,从而提高风电功率预测模型的预测精度。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是本申请一个实施例提供的一种风电功率预测模型建模方法的流程示意图;
图2是本申请一个实施例提供的一种风电功率预测模型建模方法中对样本数据进行预处理的流程示意图;
图3是本申请一个实施例提供的一种p的第k距离示意图;
图4是本申请一个实施例提供的p到o1和o2的可达距离示意图;
图5是本申请一个实施例提供的一种LSTM-CNN网络结构示意图;
图6是本申请一个实施例提供的一种风电功率预测模型建模装置的结构示意图;
图7是本申请一个实施例提供的一种风电功率预测模型建模设备的结构示意图。
附图标记:处理器-21;存储器-22;获取模块-31;预处理模块-32;划分模块-33;建模模块-34;训练模块-35;测试模块-36。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
一种风电功率预测模型建模方法,参照图1,包括:
S11:获取样本数据;样本数据至少包括:待预测风电厂的风电功率时间序列和所在区域数值天气数据;
本实施例中的样本数据为待预测风电厂的风电功率时间序列和所在区域数值天气数据。其中,风电功率时间序列可以为按采样时间采样的风电功率,采样时间间隔可以为15分钟。待预测风电厂所在区域的数值天气数据可以包括风速、风向、气温、气压、湿度等与风电功率数值相关的天气数据。
S12:对样本数据进行预处理;
本实施例中,对样本数据进行预处理,参照图2,具体包括:
S121:对样本数据进行异常值检测,剔除样本数据中的异常数据,得到含有缺失值的样本数据;包括:
基于局部异常因子算法对样本数据进行异常值检测,剔除样本数据中的异常数据;
局部异常因子算法包括:
在样本数据中选取待检测特征,在待检测特征下选取当前检测点;
计算当前检测点的邻域点所处位置的平均密度与当前检测点所处位置密度的比值;
在比值高于预设阈值时,判断当前检测点为异常点;
遍历样本数据中全部特征下的全部检测点,将样本数据中的全部异常点作为异常数据进行剔除。
本实施例中,在当前检测点的邻域点所处位置的平均密度与当前检测点所处位置密度的比值接近1,说明当前检测点和其邻域点密度相近,当前检测点和其邻域点可能同属一簇;如果比值小于1,则表示当前检测点的密度高于其邻域点密度,当前检测点为密集点;如果比值大于1,说明当前检测点的密度低于其邻域点密度,比值越大当前检测点越可能是异常点,本实施例中预设一个阈值,该阈值大于1,在比值高于该预设阈值时,判断当前检测点为异常点。
局部异常因子算法的具体实现过程举例说明如下:
1)计算对象p的第k距离k-distance(k为正整数),对象p的第k距离,即距离对象p第k远的点的距离,不包括点p,对象p的第k距离如图3所示。
2)计算测对象p的第k距离邻域,已知对象p的第k距离,与对象p之间距离小于等于k-distance的对象集合称为对象p的第k距离邻域,由于可能同时存在多个第k距离的数据,因此该集合至少包括k个对象,即p的第k邻域点的个数。
3)计算对象p相对于对象o的可达距离,公式如下:
reachidstance(p,o)=max{k-distance(o),‖p-o‖}
如果对象p远离对象o,则两者之间的可达距离就是它们之间的实际距离,但是如果它们足够近,对象p和对象o之间的可达距离用对象o的第k距离代替。
o到p的第k可达距离定义为:
reachidstance(p,o)=max{k-distance(o),d(p,o)}
如图4所示,o1到p的可达距离为d(p,o1),o2到p的可达距离为d(o2)。
reachidstance(p,o1)=d(p,o1)
reachidstance(p,o2)=d(o2)
4)计算p的局部可达密度:
Figure BDA0003600630810000091
p的局部可达密度lrdk(p)为p的全部邻域点Nk的平均可达密度的倒数。
5)计算p的局部离群因子:
Figure BDA0003600630810000092
p的局部离群因子LOFk(p)为p的全部邻域点Nk的局部可达密度与点p的局部可达密度之比的平均数,用于表示p是离群点的程度。
LOFk(p)接近1,说明p和其邻域点可达密度相近,p和其邻域点可能同属一簇;LOFk(p)小于1,则表示p的可达密度高于其邻域点密度,p为密集点;如果LOFk(p)大于1,说明p的密度低于其邻域点密度,LOFk(p)越大p越可能是异常点,在LOFk(p)高于预设阈值时,判断p为异常点。
本步骤中判断样本数据中是否存在异常数据,若存在异常数据,则将其剔除,此时,将得到含有缺失值的样本数据。
S122:对含有缺失值的样本数据进行缺失值填补;
具体包括:
基于生成对抗网络的缺失值填补方法对含有缺失值的样本数据进行缺失值填补;
生成对抗网络的缺失值填补方法包括:
初始化生成对抗网络中生成器和判别器的参数;
在样本数据中进行采样得到真实样本;
在先验分布噪声中进行采样得到与真实样本数量对应的噪声样本;
基于生成器生成与真实样本数量对应的生成样本;
根据真实样本、噪声样本和生成样本,基于迭代更新算法训练判别器和生成器;迭代更新算法的训练方向为:使辨别器对真实样本和生成样本的辨别概率相同;
通过训练完成后的生成器对含有缺失值的样本数据进行缺失值填补。
其中,在基于迭代更新算法训练判别器和生成器时,每当判别器循环更新预设次数时,基于预设的学习率对生成器的参数进行更新。
本实施例中基于生成对抗网络的缺失值填补方法对含有缺失值的样本数据进行缺失值填补,生成对抗网络由一个生成器和一个辨别器构成,其中生成器用于寻找输入数据的真实分布,辨别器用来训练获取填补缺失值。
本实施例中通过迭代更新算法训练判别器和生成器,多次更新迭代之后,最终理想情况是使得判别器无法辨别出真实样本和生成样本,即使辨别器对真实样本和生成样本的辨别概率相同,均为0.5。
S123:将缺失值填补后的样本数据进行归一化处理。
具体包括:
基于一阶差分法,将缺失值填补后的样本数据进行信号平稳化处理;
将平稳化处理后的样本数据中的各个变量的数值归至[-1,1];变量至少包括以下几项中的一项:风速、风向、气温、气压和风电功率;
归一化处理的计算公式为:
Figure BDA0003600630810000101
其中,x′为归一化后的变量,xmin和xmax分别为变量的极小值和极大值。
由于不同变量间的量纲存在差异,所以不同变量对应的数据在数值上会有很大差别。因此,为更加全面公平地考量各个因素变量的影响,需将各个变量和风电功率时间序列归一化。由于天气数据的非周期性趋势,本实施例中通过一阶差分法使缺失值填补后的样本数据中的信号从非平稳变换至平稳状态。然后根据风速、风向、气温、气压和风电功率等变量的极限值进行归一化处理,将各变量数值归至[-1,1]。
S13:将预处理后的样本数据划分为训练集和测试集;
本实施例中,可以将预处理后的样本数据按照比例划分为训练集和测试集,比如将预处理后的样本数据的前80%划分为训练集,后20%划分为测试集。当然,在其他实施例中也可以按其他比例进行划分,本实施例中对划分比例不做限定。
S14:根据训练集进行动态时间建模,得到多种不同的LSTM-CNN网络结构;
本实施例中,采用结合CNN和LSTM的方式动态时间建模,并且构建多种不同的LSTM-CNN网络结构,用以后续在多种不同的LSTM-CNN网络结构中确定最优的网络结构。
S15:将训练集输入各LSTM-CNN网络结构进行训练,得到多个备选风电功率预测模型;
S16:根据测试集对各备选风电功率预测模型进行测试,在多个备选风电功率预测模型中确定优选风电功率预测模型,优选风电功率预测模型用于根据输入的天气数据输出风电功率预测数据。
本实施例中,根据训练集对各LSTM-CNN网络结构进行训练,得到多个备选风电功率预测模型,再根据测试集对各备选风电功率预测模型进行测试,最终选择预测结果更优的网络结构,作为优选风电功率预测模型。
本实施例中的风电功率预测模型建模方法,首先获取样本数据,对样本数据进行预处理,将预处理后的样本数据划分为训练集和测试集。进而根据训练集进行动态时间建模,得到多种不同的LSTM-CNN网络结构。将训练集输入各LSTM-CNN网络结构进行训练,得到多个备选风电功率预测模型。最后根据测试集对各备选风电功率预测模型进行测试,在多个备选风电功率预测模型中确定优选风电功率预测模型,优选风电功率预测模型用于根据输入的天气数据输出风电功率预测数据。由于本实施例中的样本数据至少包括待预测风电厂的风电功率时间序列和所在区域数值天气数据,样本数据为多变量时间序列,所以本实施例中结合CNN和LSTM进行动态时间建模,引入CNN来压缩LSTM隐藏状态以减少模型的输出,克服模型训练过程中的过拟合、梯度***和消失问题,从而提高风电功率预测模型的预测精度。
一些实施例中的风电功率预测模型建模方法,参照图5,LSTM-CNN网络结构至少包括:LSTM层、卷积层、池化层、全连接层和丢弃层;
其中,卷积层用于对上一层的输出进行卷积操作,得到用于训练的特征;池化层用于对上一层的输出进行采样操作;全连接层用于完成从特征到功率的映射。
图5为本实施例中一种LSTM-CNN网络结构示意图。
可选的,参照图5,本实施例中的卷积层为conv1d卷积层。conv1d卷积层为单通道,适合处理文本序列。
一些实施例中的风电功率预测模型建模方法,各LSTM-CNN网络结构的区别至少包括以下几种中的至少一种:层不同、层数不同和层排列顺序不同。
本实施中,为了增加LSTM-CNN网络结构的多样性,各LSTM-CNN网络结构的区别至少包括以下几种中的至少一种:层不同、层数不同和层排列顺序不同。两个LSTM-CNN网络结构之间可以层相同,层数相同,但层排列顺序不同;或者层不同,层数相同,层排列顺序相同;或者层不同,层数不同,层排列顺序也不同等等,此处不做赘述。
一些实施例中的风电功率预测模型建模方法,在多个备选风电功率预测模型中确定优选风电功率预测模型,包括:
计算各备选风电功率预测模型的均方根误差;
将均方根误差最小的备选风电功率预测模型确定为优选风电功率预测模型。
备选风电功率预测模型的均方根误差的计算公式为:
Figure BDA0003600630810000131
其中,n为进行测试的数据个数;Yi
Figure BDA0003600630810000132
分别为进行测试的数据的实际值和预测值;i为进行测试的点的序列编号。
本实施例中,根据测试集对各备选风电功率预测模型进行测试,通过计算各备选风电功率预测模型的均方根误差,将均方根误差最小的备选风电功率预测模型确定为优选风电功率预测模型。
一种风电功率预测模型建模装置,参照图6,包括:
处理器21和存储器22;
处理器21与存储器22通过通信总线相连接:
其中,处理器21,用于调用并执行存储器中存储的程序;
存储器22,用于存储程序,程序至少用于执行如以上任一实施例中的一种风电功率预测模型建模方法。
本实施例中,存储器22存储的程序执行的风电功率预测模型建模方法包括:首先获取样本数据,对样本数据进行预处理,将预处理后的样本数据划分为训练集和测试集。进而根据训练集进行动态时间建模,得到多种不同的LSTM-CNN网络结构。将训练集输入各LSTM-CNN网络结构进行训练,得到多个备选风电功率预测模型。最后根据测试集对各备选风电功率预测模型进行测试,在多个备选风电功率预测模型中确定优选风电功率预测模型,优选风电功率预测模型用于根据输入的天气数据输出风电功率预测数据。由于本实施例中的样本数据至少包括待预测风电厂的风电功率时间序列和所在区域数值天气数据,样本数据为多变量时间序列,所以本实施例中结合CNN和LSTM进行动态时间建模,引入CNN来压缩LSTM隐藏状态以减少模型的输出,克服模型训练过程中的过拟合、梯度***和消失问题,从而提高风电功率预测模型的预测精度。
一种风电功率预测模型建模设备,参照图7,包括:
获取模块31,用于获取样本数据;样本数据至少包括:待预测风电厂的风电功率时间序列和所在区域数值天气数据;
预处理模块32,用于对样本数据进行预处理;
划分模块33,用于将预处理后的样本数据划分为训练集和测试集;
建模模块34,用于根据训练集进行动态时间建模,得到多种不同的LSTM-CNN网络结构;
训练模块35,用于将训练集输入各LSTM-CNN网络结构进行训练,得到多个备选风电功率预测模型;
测试模块36,用于根据测试集对各备选风电功率预测模型进行测试,在多个备选风电功率预测模型中确定优选风电功率预测模型,优选风电功率预测模型用于根据输入的天气数据输出风电功率预测数据。
本实施例中,获取模块31获取样本数据,预处理模块32对样本数据进行预处理,划分模块33将预处理后的样本数据划分为训练集和测试集。建模模块34根据训练集进行动态时间建模,得到多种不同的LSTM-CNN网络结构。训练模块35将训练集输入各LSTM-CNN网络结构进行训练,得到多个备选风电功率预测模型。测试模块36根据测试集对各备选风电功率预测模型进行测试,在多个备选风电功率预测模型中确定优选风电功率预测模型,优选风电功率预测模型用于根据输入的天气数据输出风电功率预测数据。由于本实施例中的样本数据至少包括待预测风电厂的风电功率时间序列和所在区域数值天气数据,样本数据为多变量时间序列,所以本实施例中结合CNN和LSTM进行动态时间建模,引入CNN来压缩LSTM隐藏状态以减少模型的输出,克服模型训练过程中的过拟合、梯度***和消失问题,从而提高风电功率预测模型的预测精度。
一些实施例中的风电功率预测模型建模设备,预处理模块32具体用于对样本数据进行异常值检测,剔除样本数据中的异常数据,得到含有缺失值的样本数据;
对含有缺失值的样本数据进行缺失值填补;
将缺失值填补后的样本数据进行归一化处理。
预处理模块32对样本数据进行异常值检测,剔除样本数据中的异常数据,包括:
基于局部异常因子算法对样本数据进行异常值检测,剔除样本数据中的异常数据;
局部异常因子算法包括:
在样本数据中选取待检测特征,在待检测特征下选取当前检测点;
计算当前检测点的邻域点所处位置的平均密度与当前检测点所处位置密度的比值;
在比值高于预设阈值时,判断当前检测点为异常点;
遍历样本数据中全部特征下的全部检测点,将样本数据中的全部异常点作为异常数据进行剔除。
预处理模块32对含有缺失值的样本数据进行缺失值填补,包括:
基于生成对抗网络的缺失值填补方法对含有缺失值的样本数据进行缺失值填补;
生成对抗网络的缺失值填补方法包括:
初始化生成对抗网络中生成器和判别器的参数;
在样本数据中进行采样得到真实样本;
在先验分布噪声中进行采样得到与真实样本数量对应的噪声样本;
基于生成器生成与真实样本数量对应的生成样本;
根据真实样本、噪声样本和生成样本,基于迭代更新算法训练判别器和生成器;迭代更新算法的训练方向为:使辨别器对真实样本和生成样本的辨别概率相同;
通过训练完成后的生成器对含有缺失值的样本数据进行缺失值填补。
预处理模块32基于迭代更新算法训练判别器和生成器,包括:每当判别器循环更新预设次数时,基于预设的学习率对生成器的参数进行更新。
预处理模块32将缺失值填补后的样本数据进行归一化处理,包括:
基于一阶差分法,将缺失值填补后的样本数据进行信号平稳化处理;
将平稳化处理后的样本数据中的各个变量的数值归至[-1,1];变量至少包括以下几项中的一项:风速、风向、气温、气压和风电功率;
归一化处理的计算公式为:
Figure BDA0003600630810000161
其中,x′为归一化后的变量,xmin和xmax分别为变量的极小值和极大值。
一些实施例中的风电功率预测模型建模设备,建模模块34构建的LSTM-CNN网络结构至少包括:LSTM层、卷积层、池化层、全连接层和丢弃层;
其中,卷积层用于对上一层的输出进行卷积操作,得到用于训练的特征;池化层用于对上一层的输出进行采样操作;全连接层用于完成从特征到功率的映射。
一些实施例中的风电功率预测模型建模设备,建模模块34构建的各LSTM-CNN网络结构的区别至少包括以下几种中的至少一种:层不同、层数不同和层排列顺序不同。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本申请的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (11)

1.一种风电功率预测模型建模方法,其特征在于,包括:
获取样本数据;所述样本数据至少包括:待预测风电厂的风电功率时间序列和所在区域数值天气数据;
对所述样本数据进行预处理;
将预处理后的样本数据划分为训练集和测试集;
根据所述训练集进行动态时间建模,得到多种不同的LSTM-CNN网络结构;
将所述训练集输入各所述LSTM-CNN网络结构进行训练,得到多个备选风电功率预测模型;
根据所述测试集对各所述备选风电功率预测模型进行测试,在多个所述备选风电功率预测模型中确定优选风电功率预测模型,所述优选风电功率预测模型用于根据输入的天气数据输出风电功率预测数据。
2.根据权利要求1所述的方法,其特征在于,所述对所述样本数据进行预处理,包括:
对所述样本数据进行异常值检测,剔除所述样本数据中的异常数据,得到含有缺失值的样本数据;
对所述含有缺失值的样本数据进行缺失值填补;
将缺失值填补后的样本数据进行归一化处理。
3.根据权利要求2所述的方法,其特征在于,所述对所述样本数据进行异常值检测,剔除所述样本数据中的异常数据,包括:
基于局部异常因子算法对所述样本数据进行异常值检测,剔除所述样本数据中的异常数据;
所述局部异常因子算法包括:
在所述样本数据中选取待检测特征,在所述待检测特征下选取当前检测点;
计算所述当前检测点的邻域点所处位置的平均密度与所述当前检测点所处位置密度的比值;
在所述比值高于预设阈值时,判断所述当前检测点为异常点;
遍历所述样本数据中全部特征下的全部检测点,将所述所述样本数据中的全部异常点作为所述异常数据进行剔除。
4.根据权利要求2所述的方法,其特征在于,所述对所述含有缺失值的样本数据进行缺失值填补,包括:
基于生成对抗网络的缺失值填补方法对所述含有缺失值的样本数据进行缺失值填补;
所述生成对抗网络的缺失值填补方法包括:
初始化所述生成对抗网络中生成器和判别器的参数;
在所述样本数据中进行采样得到真实样本;
在先验分布噪声中进行采样得到与所述真实样本数量对应的噪声样本;
基于所述生成器生成与所述真实样本数量对应的生成样本;
根据所述真实样本、所述噪声样本和所述生成样本,基于迭代更新算法训练所述判别器和所述生成器;所述迭代更新算法的训练方向为:使所述辨别器对所述真实样本和所述生成样本的辨别概率相同;
通过训练完成后的生成器对所述含有缺失值的样本数据进行缺失值填补。
5.根据权利要求4所述的方法,其特征在于,所述基于迭代更新算法训练所述判别器和所述生成器,包括:每当所述判别器循环更新预设次数时,基于预设的学习率对所述生成器的参数进行更新。
6.根据权利要求2所述的方法,其特征在于,所述将缺失值填补后的样本数据进行归一化处理,包括:
基于一阶差分法,将缺失值填补后的样本数据进行信号平稳化处理;
将平稳化处理后的样本数据中的各个变量的数值归至[-1,1];所述变量至少包括以下几项中的一项:风速、风向、气温、气压和风电功率;
归一化处理的计算公式为:
Figure FDA0003600630800000031
其中,x′为归一化后的变量,xmin和xmax分别为所述变量的极小值和极大值。
7.根据权利要求1所述的方法,其特征在于,所述LSTM-CNN网络结构至少包括:LSTM层、卷积层、池化层、全连接层和丢弃层;
其中,所述卷积层用于对上一层的输出进行卷积操作,得到用于训练的特征;所述池化层用于对上一层的输出进行采样操作;所述全连接层用于完成从特征到功率的映射。
8.根据权利要求1所述的方法,其特征在于,各所述LSTM-CNN网络结构的区别至少包括以下几种中的至少一种:层不同、层数不同和层排列顺序不同。
9.根据权利要求1所述的方法,其特征在于,所述在多个所述备选风电功率预测模型中确定优选风电功率预测模型,包括:
计算各所述备选风电功率预测模型的均方根误差;
将均方根误差最小的备选风电功率预测模型确定为优选风电功率预测模型;
所述备选风电功率预测模型的均方根误差的计算公式为:
Figure FDA0003600630800000032
其中,n为进行测试的数据个数;Yi
Figure FDA0003600630800000033
分别为进行测试的数据的实际值和预测值;i为进行测试的点的序列编号。
10.一种风电功率预测模型建模装置,其特征在于,包括:
处理器和存储器;
所述处理器与存储器通过通信总线相连接:
其中,所述处理器,用于调用并执行所述存储器中存储的程序;
所述存储器,用于存储程序,所述程序至少用于执行权利要求1-9任一项所述的一种风电功率预测模型建模方法。
11.一种风电功率预测模型建模设备,其特征在于,包括:
获取模块,用于获取样本数据;所述样本数据至少包括:待预测风电厂的风电功率时间序列和所在区域数值天气数据;
预处理模块,用于对所述样本数据进行预处理;
划分模块,用于将预处理后的样本数据划分为训练集和测试集;
建模模块,用于根据所述训练集进行动态时间建模,得到多种不同的LSTM-CNN网络结构;
训练模块,用于将所述训练集输入各所述LSTM-CNN网络结构进行训练,得到多个备选风电功率预测模型;
测试模块,用于根据所述测试集对各所述备选风电功率预测模型进行测试,在多个所述备选风电功率预测模型中确定优选风电功率预测模型,所述优选风电功率预测模型用于根据输入的天气数据输出风电功率预测数据。
CN202210402116.2A 2022-04-18 2022-04-18 风电功率预测模型建模方法、装置和设备 Pending CN114861990A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210402116.2A CN114861990A (zh) 2022-04-18 2022-04-18 风电功率预测模型建模方法、装置和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210402116.2A CN114861990A (zh) 2022-04-18 2022-04-18 风电功率预测模型建模方法、装置和设备

Publications (1)

Publication Number Publication Date
CN114861990A true CN114861990A (zh) 2022-08-05

Family

ID=82631703

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210402116.2A Pending CN114861990A (zh) 2022-04-18 2022-04-18 风电功率预测模型建模方法、装置和设备

Country Status (1)

Country Link
CN (1) CN114861990A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115618710A (zh) * 2022-09-08 2023-01-17 济南大学 一种基于gan的风电功率概率性预测方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110443725A (zh) * 2019-08-14 2019-11-12 国网甘肃省电力公司信息通信公司 基于cnn+lstm的风电功率预测模型
CN112348292A (zh) * 2021-01-07 2021-02-09 中国电力科学研究院有限公司 一种基于深度学习网络的短期风电功率预测方法和***
CN113642225A (zh) * 2021-05-24 2021-11-12 国网新疆电力有限公司经济技术研究院 一种基于attention机制的CNN-LSTM短期风电功率预测方法
CN113822418A (zh) * 2021-09-24 2021-12-21 中节能风力发电股份有限公司 一种风电场功率预测方法、***、设备和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110443725A (zh) * 2019-08-14 2019-11-12 国网甘肃省电力公司信息通信公司 基于cnn+lstm的风电功率预测模型
CN112348292A (zh) * 2021-01-07 2021-02-09 中国电力科学研究院有限公司 一种基于深度学习网络的短期风电功率预测方法和***
CN113642225A (zh) * 2021-05-24 2021-11-12 国网新疆电力有限公司经济技术研究院 一种基于attention机制的CNN-LSTM短期风电功率预测方法
CN113822418A (zh) * 2021-09-24 2021-12-21 中节能风力发电股份有限公司 一种风电场功率预测方法、***、设备和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
林友芳: "《交通大数据》", 30 September 2021, 北京交通大学出版社, pages: 108 - 115 *
梅子行: "《智能风控原理、算法与工程实践》", 31 January 2020, 机械工业出版社, pages: 133 - 136 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115618710A (zh) * 2022-09-08 2023-01-17 济南大学 一种基于gan的风电功率概率性预测方法及***

Similar Documents

Publication Publication Date Title
CN110703057B (zh) 基于数据增强和神经网络的电力设备局部放电诊断方法
CN111860982A (zh) 一种基于vmd-fcm-gru的风电场短期风电功率预测方法
CN109886464B (zh) 基于优化奇异值分解生成特征集的低信息损失短期风速预测方法
CN111680820A (zh) 分布式光伏电站故障诊断方法和装置
CN114066236B (zh) 风光有功出力场景生成方法、装置、电子设备及存储介质
CN105930900B (zh) 一种混合风力发电的预测方法及***
CN113888351A (zh) 光伏***的功率预测方法、装置及电子设备
CN111275108A (zh) 基于生成对抗网络对局部放电数据进行样本扩展的方法
CN112327104B (zh) 一种含分布式电源配电网的故障检测与定位方法
CN114548199A (zh) 一种基于深度迁移网络的多传感器数据融合方法
CN116401532B (zh) 一种电力***受扰后频率失稳识别方法及***
CN113935237A (zh) 一种基于胶囊网络的输电线路故障类型判别方法及***
CN114861990A (zh) 风电功率预测模型建模方法、装置和设备
CN112070103B (zh) 通过微波链路网格化自适应可变尺度反演大气能见度的方法
CN112906935A (zh) 一种风电场超短期功率预测方法
CN105024645A (zh) 一种基于矩阵进化的光伏阵列故障定位方法
CN112633315A (zh) 一种电力***扰动分类方法
CN114528883A (zh) 一种风电变流器igbt故障识别方法
CN108574290B (zh) 受迫振荡的振荡源定位方法、装置、终端及可读存储介质
CN110489852A (zh) 提高风电***数据质量的方法及装置
CN107577896B (zh) 基于混合Copula理论的风电场多机聚合等值方法
CN117578438A (zh) 一种用于预测新能源发电量的生成对抗网络方法及***
CN117272184A (zh) 一种基于issa-rf算法的光伏发电***故障分类方法
CN116400168A (zh) 一种基于深度特征聚类的电网故障诊断方法及***
CN115936926A (zh) 一种基于smote-gbdt的不平衡窃电数据分类方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination