CN108734359A - 一种风电功率预测数据预处理方法 - Google Patents

一种风电功率预测数据预处理方法 Download PDF

Info

Publication number
CN108734359A
CN108734359A CN201810584951.6A CN201810584951A CN108734359A CN 108734359 A CN108734359 A CN 108734359A CN 201810584951 A CN201810584951 A CN 201810584951A CN 108734359 A CN108734359 A CN 108734359A
Authority
CN
China
Prior art keywords
data
point
sample
uncertain
wind power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810584951.6A
Other languages
English (en)
Other versions
CN108734359B (zh
Inventor
程亚丽
王鸿
江秀臣
王致杰
盛戈皞
韩紫薇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Dianji University
Original Assignee
Shanghai Dianji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Dianji University filed Critical Shanghai Dianji University
Priority to CN201810584951.6A priority Critical patent/CN108734359B/zh
Publication of CN108734359A publication Critical patent/CN108734359A/zh
Application granted granted Critical
Publication of CN108734359B publication Critical patent/CN108734359B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • H02J3/386
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/20Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E10/00Energy generation through renewable energy sources
    • Y02E10/70Wind energy
    • Y02E10/76Power conversion electric or electronic aspects

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Computation (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Operations Research (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种风电功率预测数据预处理方法,风电功率数据通过SCADA***采集,该预处理方法是在三类支持向量机对SCADA***采集到的数据分类之后,将数据集中的不确定性区域筛选出来,对筛选出来的不确定数据区域测量不确定度,最后对离散数据进行拟合。

Description

一种风电功率预测数据预处理方法
技术领域
本发明属于风电技术领域,特别涉及一种风电功率预测数据预处理方法。
背景技术
随着我国“十三五”规划纲要的提出,可再生能源利用技术得到迅速发展,风力发电是发展水平相对成熟的可再生能源发电技术之一,并已在各国大规模得到开发推广。风电功率预测以及风电功率爬坡预测技术的研究也较为成熟,但对风电场SCADA***采集到的数据进行预处理的方法还有待研究。SCADA***在进行数据采集过程中,可能会发生信号中断、设备损坏或者程序中断等传输故障,都会使得收集到错误的数据或者引起数据缺失。如果不预先采取有效的方法处理这些***数据库中的干扰数据,而是直接或者处理方法不佳进行风电功率预测或风电功率爬坡预测都会降低预测的精确度。
专利文献201410398277.4公开了一种用于风电功率预测的风电数据预处理方法以及风电功率预测方法和***,其中,风电数据预处理方法包括:对风电数据进行聚类形成簇,得到簇外孤立点,并从每个簇内提取出中心点;以及,基于与簇内点的功率值的差异,从所述簇外孤立点中筛选出一个或多个孤立点。风电功率预测方法包括:对于采集到的风电数据,根据上述风电数据预处理方法选出部分数据;以及根据选出的数据预测风电功率信息。
专利文献201310714939.X公开了一种基于隶属云理论的不确定性推理方法,主要解决上下文存在不确定性信息时的推理问题。首先用数字特征表述给定的定型概念,将其理解为没有确定度信息的云滴,然后构造云规则控制器,将没有确定度的云滴作为控制器的输入,通过控制器,输出具有确定度的云滴向量,最后将所有的输出云滴进行精确化,得到输出结果。
发明内容
本发明提供一种风电功率预测数据预处理方法,目的在于解决现有风电场SCADA***对于风电功率预测数据不准确的问题。
本发明实施例之一,一种风电功率预测数据预处理方法,风电功率数据通过SCADA***采集,该预处理方法是在三类支持向量机对SCADA***采集到的数据分类之后,将数据集中的不确定性区域筛选出来,对筛选出来的不确定数据区域测量不确定度,最后对离散数据进行拟合。
本发明实施例之一,一种风电功率预测数据预处理***,所述预处理***包括:
三类支持向量机分类模型模块;
基于测量不确定度的离散数据拟合模型模块;
猴群算法拟合优化模块,其中,
三类支持向量机分类模型模块的处理过程是,
设训练样本数据集合:下标i=1,2,…,表示每一类样本集合中样本的序号,k=-1,0,1分别表示错误数据点、不确定数据点和正确数据点,
l-1,l0,l1分别表示错误、不确定和正确数据点的个数,假设不确定数据点位于正确数据点和错误数据点的中间,把SCADA***采集到的风速数据分为三类:第一类称为正确数据点;第二类称为错误数据点;第三类称为不确定数据点,
寻找两个平行的最优超平面H和H’,将三类样本数据点正确划分,并同时要求两个最近样本集间的距离最小;
基于测量不确定度的离散数据拟合模型模块的处理过程是,
即假设某样本数据服从正态分布,按规定,测量的最大允许误差为3σ,输入样本数据,利用最小二乘法找到最佳逼近曲线,若D为某点到拟合曲线L的距离,如果D>3σ,则称该点为异常点,予以舍弃;
猴群算法拟合优化模块的处理过程是:在剔除异常点后,再次利用最小二乘法拟合曲线,并采用猴群算法优化,使得拟合曲线尽量近似样本数据曲线,有利于对样本缺失数据进行替换。
本发明实施例针对SCADA***采集到的数据都是具有不确定性(即存在误差),使用最小二乘、支持向量机等单一方法很容易受到误差点(由于受到各种测试条件和工作环境的影响,离散数据存在不确定性)的干扰,即离散数据中存在冗余信息。
本发明采用不确定性理论对SCADA***采集到的数据进行检测和剔除风速异常点,并采用最小二乘法拟合找到风速最佳逼近曲线,为了提高拟合度,采用猴群优化算法对拟合曲线修正,以提高风电场功率预测和风电场功率爬坡预测精度。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1是本发明实施例中三类支持向量机。
图2是本发明实施例中三类支持向量机分类模型流程图。
图3是本发明实施例中基于测量不确定度的离散数据拟合模型流程图。
图4是本发明实施例中猴群算法流程图。
图5是本发明实施例中风电场SCADA***采集数据预处理实现整体框图。
具体实施方式
根据一个或者多个实施例,如图5所示,对风电场SCADA***采集到的数据进行预处理,风电功率预测数据预处理方法是在三类支持向量机对SCADA***采集到的风速数据分类之后,将数据集中的不确定性区域筛选出来,对筛选出来的不确定数据区域测量不确定度,删除异常数据,最后对新的数据采用基于猴群算法的最小二乘法曲线拟合,能够有效提高风电功率预测精度,是一种有效的风速数据预处理方法。
根据一个或者多个实施例,如图2所示,三类支持向量机分类模型的基本步骤如下:
把SCADA***采集到的风速数据作为模型的输入数据,构建基于三类支持向量机学习的训练样本;设定相关参数,输入学习样本数据;根据样本容量大小,进行分解,使其成为便于进行训练的子样本;使用三类支持向量机分类器对分解后的子样本数据进行训练;若训练结束,输出训练结果;否则增加数据样本容量,继续训练。
根据一个或者多个实施例,如图3所示,基于测量不确定度的离
散数据拟合模型基本步骤如下:
基于测量不确定度的离散数据拟合模型基本步骤如下:图二中,输出的错误数据点剔除,正确数据点保留,对于不确定数据区用测量不确定度理论检测异常点并剔除。
根据最小二乘法的定义,应使各残差平方和最小,即应满足:
式中,为残差,n为不确定区数据点个数。把不确定区的风速数据作为构建基于测量不确定度的学习样本;分析试验数据,利用最小二乘法找到最佳逼近曲线;研究最佳逼近曲线图,进行测量不确定度评定,本发明使用A类评定不确定度;依据评定结果,按测量不确定理论的3σ原则进行识别、剔除异常点数据;若训练结束,则输出结果数据;若训练不结束,则继续添加新的样本数据,不断提高模型的预测能力。
根据一个或者多个实施例,如图4所示,猴群优化算法的基本步骤如下:舍弃异常点之后,使用LS-SVM方法再次进行数据拟合,拟合过程中采用猴群算法进行优化,使拟合曲线逐步逼近新的样本数据曲线。
根据一个或者多个实施例,如图5所示,一种风电功率预测数据预处理***,对风电场SCADA***采集到的数据进行预处理实现整体框图。该预处理***是在三类支持向量机对SCADA***采集到的风速数据分类之后,将数据集中的不确定性区域筛选出来,对筛选出来的不确定数据区域测量不确定度,删除异常数据,最后对新的数据采用基于猴群算法的最小二乘法曲线拟合,能够有效提高风电功率预测精度,是一种有效的风速数据预处理***。
值得说明的是,虽然前述内容已经参考若干具体实施方式描述了本发明创造的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims (3)

1.一种风电功率预测数据预处理方法,风电功率数据通过SCADA***采集,其特征在于,该预处理方法是在三类支持向量机对SCADA***采集到的数据分类之后,将数据集中的不确定性区域筛选出来,对筛选出来的不确定数据区域测量不确定度,最后对离散数据进行拟合。
2.根据权利要求1所述的风电功率预测数据预处理方法,其特征在于,所述预处理方法包括:
建立三类支持向量机分类模型;
建立基于测量不确定度的离散数据拟合模型;
采用猴群算法拟合优化,其中,
三类支持向量机分类模型建立过程是,
设训练样本数据集合:下标i=1,2,…,表示每一类样本集合中样本的序号,k=-1,0,1分别表示错误数据点、不确定数据点和正确数据点,
l-1,l0,l1分别表示错误、不确定和正确数据点的个数,假设不确定数据点位于正确数据点和错误数据点的中间,把SCADA***采集到的风速数据分为三类:第一类称为正确数据点;第二类称为错误数据点;第三类称为不确定数据点,
寻找两个平行的最优超平面H和H’,将三类样本数据点正确划分,并同时要求两个最近样本集间的距离最小;
建立基于测量不确定度的离散数据拟合模型的过程是,
即假设某样本数据服从正态分布,按规定,测量的最大允许误差为3σ,输入样本数据,利用最小二乘法找到最佳逼近曲线,若D为某点到拟合曲线L的距离,如果D>3σ,则称该点为异常点,予以舍弃;
猴群算法拟合优化过程是:在剔除异常点后,再次利用最小二乘法拟合曲线,并采用猴群算法优化,使得拟合曲线尽量近似样本数据曲线,有利于对样本缺失数据进行替换。
3.一种风电功率预测数据预处理***,其特征在于,所述预处理***包括:
三类支持向量机分类模型模块;
基于测量不确定度的离散数据拟合模型模块;
猴群算法拟合优化模块,其中,
三类支持向量机分类模型模块的处理过程是,
设训练样本数据集合:下标i=1,2,…,表示每一类样本集合中样本的序号,k=-1,0,1分别表示错误数据点、不确定数据点和正确数据点,
l-1,l0,l1分别表示错误、不确定和正确数据点的个数,假设不确定数据点位于正确数据点和错误数据点的中间,把SCADA***采集到的风速数据分为三类:第一类称为正确数据点;第二类称为错误数据点;第三类称为不确定数据点,
寻找两个平行的最优超平面H和H’,将三类样本数据点正确划分,并同时要求两个最近样本集间的距离最小;
基于测量不确定度的离散数据拟合模型模块的处理过程是,
即假设某样本数据服从正态分布,按规定,测量的最大允许误差为3σ,输入样本数据,利用最小二乘法找到最佳逼近曲线,若D为某点到拟合曲线L的距离,如果D>3σ,则称该点为异常点,予以舍弃;
猴群算法拟合优化模块的处理过程是:在剔除异常点后,再次利用最小二乘法拟合曲线,并采用猴群算法优化,使得拟合曲线尽量近似样本数据曲线,有利于对样本缺失数据进行替换。
CN201810584951.6A 2018-06-08 2018-06-08 一种风电功率预测数据预处理方法 Active CN108734359B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810584951.6A CN108734359B (zh) 2018-06-08 2018-06-08 一种风电功率预测数据预处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810584951.6A CN108734359B (zh) 2018-06-08 2018-06-08 一种风电功率预测数据预处理方法

Publications (2)

Publication Number Publication Date
CN108734359A true CN108734359A (zh) 2018-11-02
CN108734359B CN108734359B (zh) 2021-10-01

Family

ID=63932525

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810584951.6A Active CN108734359B (zh) 2018-06-08 2018-06-08 一种风电功率预测数据预处理方法

Country Status (1)

Country Link
CN (1) CN108734359B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109740301A (zh) * 2019-03-14 2019-05-10 华北电力大学 一种基于bp神经网络的燃气机组碳排放量的核算方法
CN110566405A (zh) * 2019-08-29 2019-12-13 北京金风科创风电设备有限公司 风力发电机组的功率优化方法及装置
CN111191815A (zh) * 2019-11-25 2020-05-22 清华大学 一种用于风电集群的超短期出力预测方法及***
CN112801356A (zh) * 2021-01-21 2021-05-14 上海电机学院 一种基于ma-lssvm的电力负荷预测方法
CN117967498A (zh) * 2024-03-15 2024-05-03 三峡新能源海上风电运维江苏有限公司 风机变桨距的控制方法、装置、设备、介质及程序产品

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101449264A (zh) * 2006-07-12 2009-06-03 柯法克斯公司 用于转导数据分类的方法和***以及使用机器学习方法的数据分类方法
CN102184453A (zh) * 2011-05-16 2011-09-14 上海电气集团股份有限公司 基于模糊神经网络和支持向量机的风电功率组合预测方法
CN102545211A (zh) * 2011-12-21 2012-07-04 西安交通大学 一种通用的用于风电功率预测的数据预处理装置及方法
CN102866396A (zh) * 2011-07-05 2013-01-09 长春理工大学 基于不确定度的坐标系数据融合统一技术
US20150302313A1 (en) * 2014-04-22 2015-10-22 State Grid Corporation Of China Method of predicating ultra-short-term wind power based on self-learning composite data source

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101449264A (zh) * 2006-07-12 2009-06-03 柯法克斯公司 用于转导数据分类的方法和***以及使用机器学习方法的数据分类方法
CN102184453A (zh) * 2011-05-16 2011-09-14 上海电气集团股份有限公司 基于模糊神经网络和支持向量机的风电功率组合预测方法
CN102866396A (zh) * 2011-07-05 2013-01-09 长春理工大学 基于不确定度的坐标系数据融合统一技术
CN102545211A (zh) * 2011-12-21 2012-07-04 西安交通大学 一种通用的用于风电功率预测的数据预处理装置及方法
US20150302313A1 (en) * 2014-04-22 2015-10-22 State Grid Corporation Of China Method of predicating ultra-short-term wind power based on self-learning composite data source

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109740301A (zh) * 2019-03-14 2019-05-10 华北电力大学 一种基于bp神经网络的燃气机组碳排放量的核算方法
CN110566405A (zh) * 2019-08-29 2019-12-13 北京金风科创风电设备有限公司 风力发电机组的功率优化方法及装置
CN111191815A (zh) * 2019-11-25 2020-05-22 清华大学 一种用于风电集群的超短期出力预测方法及***
CN111191815B (zh) * 2019-11-25 2022-08-16 清华大学 一种用于风电集群的超短期出力预测方法及***
CN112801356A (zh) * 2021-01-21 2021-05-14 上海电机学院 一种基于ma-lssvm的电力负荷预测方法
CN117967498A (zh) * 2024-03-15 2024-05-03 三峡新能源海上风电运维江苏有限公司 风机变桨距的控制方法、装置、设备、介质及程序产品

Also Published As

Publication number Publication date
CN108734359B (zh) 2021-10-01

Similar Documents

Publication Publication Date Title
CN108734359A (zh) 一种风电功率预测数据预处理方法
CN109376801B (zh) 基于集成深度神经网络的风力发电机叶片结冰诊断方法
CN110533331B (zh) 一种基于输电线路数据挖掘的故障预警方法和***
CN107944622A (zh) 基于连续时段聚类的风电功率预测方法
CN101516099B (zh) 一种传感器网络异常检测方法
CN109871976A (zh) 一种基于聚类及神经网络的含分布式电源配电网电能质量预测方法
CN106295899B (zh) 基于遗传算法与支持向量分位数回归的风电功率概率密度预测方法
CN109670676A (zh) 基于支持向量数据描述的配网台区风险预警方法及***
CN109636171A (zh) 一种区域植被恢复的综合诊断与风险评价方法
CN104182803B (zh) 风电数据预处理方法及风电功率预测方法和***
CN110738232A (zh) 一种基于数据挖掘技术的电网电压越限成因诊断方法
CN116050666B (zh) 一种辐照特征聚类的光伏发电功率预测方法
CN115099296A (zh) 基于深度学习算法的海浪高度预测方法
CN111695666A (zh) 一种基于深度学习的风电功率超短期条件概率预测方法
CN115829105A (zh) 基于历史数据特征搜索的光伏功率预测方法
CN105930900A (zh) 一种混合风力发电的预测方法及***
CN114357670A (zh) 一种基于bls和自编码器的配电网用电数据异常预警方法
CN113610285A (zh) 一种分散式风电的功率预测方法
CN117910668A (zh) 一种考虑多不确定性因素的电力***演化路径规划方法
LU503778B1 (en) The method for wind speed downscaling of wind farms based on super-resolution reconstruction technology
CN112508278A (zh) 一种基于证据回归多模型的多联供***负荷预测方法
Ma et al. Anomaly Detection of Mountain Photovoltaic Power Plant Based on Spectral Clustering
CN113554203B (zh) 基于高维网格化和LightGBM的风电预测方法及装置
CN112682269A (zh) 一种基于oc-rkelm的风电机组状态监测方法
CN114372616B (zh) 基于组合识别和空间相关性的新能源出力异常校正方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant