CN113065278A - 一种基于频繁模式挖掘的富风期风电小发事件统计特性模型的预测方法 - Google Patents
一种基于频繁模式挖掘的富风期风电小发事件统计特性模型的预测方法 Download PDFInfo
- Publication number
- CN113065278A CN113065278A CN202110276871.6A CN202110276871A CN113065278A CN 113065278 A CN113065278 A CN 113065278A CN 202110276871 A CN202110276871 A CN 202110276871A CN 113065278 A CN113065278 A CN 113065278A
- Authority
- CN
- China
- Prior art keywords
- wind power
- occurrence
- mode
- period
- rich period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000005065 mining Methods 0.000 title claims abstract description 22
- 238000012706 support-vector machine Methods 0.000 claims abstract description 14
- 238000010219 correlation analysis Methods 0.000 claims abstract description 11
- 238000003064 k means clustering Methods 0.000 claims abstract description 9
- 238000012549 training Methods 0.000 claims abstract description 8
- 238000012545 processing Methods 0.000 claims description 11
- 230000009467 reduction Effects 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 7
- 238000007621 cluster analysis Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 230000003203 everyday effect Effects 0.000 claims description 4
- 241000282994 Cervidae Species 0.000 claims description 3
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 238000013178 mathematical model Methods 0.000 abstract description 2
- 230000008859 change Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 230000009194 climbing Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/38—Arrangements for parallely feeding a single network by two or more generators, converters or transformers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/08—Probabilistic or stochastic CAD
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2113/00—Details relating to the application field
- G06F2113/06—Wind turbines or wind farms
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2203/00—Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
- H02J2203/20—Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2300/00—Systems for supplying or distributing electric power characterised by decentralized, dispersed, or local generation
- H02J2300/20—The dispersed energy generation being of renewable origin
- H02J2300/28—The renewable source being wind energy
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E10/00—Energy generation through renewable energy sources
- Y02E10/70—Wind energy
- Y02E10/76—Power conversion electric or electronic aspects
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Quality & Reliability (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Power Engineering (AREA)
- Medical Informatics (AREA)
- Operations Research (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Probability & Statistics with Applications (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于频繁模式挖掘的富风期风电小发事件统计特性模型的预测方法,首先提取各风电场发生富风期风电小发事件时对应的持续时间段、间隔时间段;然后基于K‑means聚类算法分别对持续时间段、间隔时间段模式进行聚类分析得到不同的基本模式,同时得到各基本模式对应的气象特征,训练支持向量机分类器,从而使用基本模式对风电功率序列进行事件序列重编码;最后,通过APRIORI关联分析算法对事件序列进行挖掘得到富风期风电小发事件与事件之间的关联关系,进而建立富风期风电小发事件的自相关统计特性模型,通过模型进行预测。该方法深入挖掘出富风期风电小发事件之间的自相关特性,有效地解决了难以用数学模型建模的问题。
Description
技术领域
本发明属于电网风电波动特性建模技术领域,尤其涉及一种基于频繁模式挖掘的富风期风电小发事件统计特性模型的预测方法。
背景技术
能源是人类赖以生存的物质基础,是国家经济社会发展的命脉,在全球气候变化和能源安全的大背景下,可再生能源得到了大规模的发展。我国的可再生能源发展尤为迅速,其中风电并网装机和消纳总量高速增长,根据国家能源局公布的数据,截止2020年6月底,全国风电累计装机2.17亿千瓦。我国重视可再生能源发展的同时,由于我国的资源禀赋特点、电力***条件和市场机制问题,消纳大规模可再生能源也面临着更大挑战。风、光等可再生能源出力都具有随机性和波动性,并且当前我国电力***调节灵活性欠缺、电网调度运行方式较为僵化等现实导致***难以完全适应新形势要求,大型机组难以发挥节能高效的优势。随着可再生能源大规模开发,我国局部地区消纳矛盾逐渐凸显,部分地区出现了较为严重的弃风、弃光和弃水问题。
如今,大规模风电功率预测与波动特性建模还存在着众多问题,针对于常见的风电出力场景分析,绝大多数仅能讨论典型场景下风电的出力特性,而忽略了极端情况下可能出现的各种“意外”情况,例如富风期风电出力反而可能处于低位。富风期是指每年的1-5月和10-12月,气候变化程度较大,按往年的统计数据有较多的大风时期,风电功率水平也相对较高。然而由于特殊的气象成因,在某一区域或局部范围内,出现及其反常的无风和小风现象,导致此时的风电功率水平远低于前一时期和本时期应有的水平,即富风期风电小发事件。该场景与极端爬坡场景有所区别,极端爬坡场景是指风电功率的变化过程剧烈,一般是指短时期内的现象,而富风期时的风电小发事件是指长时间尺度的风电功率缺失。富风期风电小发事件是一种不可直接预测的风电功率长时间缺额现象,其存在使***的原有调度计划受到较大影响。一方面,功率的缺额改变了各机组的实际出力水平;另一方面,突发的功率变化对电力***的机组检修、安全运行均提出了巨大的挑战。在这种情况下,针对富风期出现风电小发事件这一极端场景展开深入分析,建立富风期风电小发事件的情景分析模型,从而定量刻画风电的出力特性,更加深层次地挖掘风电出力规律,有助于提高模型的完备性,加强电网安全运行的可靠性,帮助电网调度更加有效的利用风电资源,为后续高效利用可再生能源提供基础理论支撑。
发明内容
本发明的目的是提供一种考虑气象条件对风电出力的影响,利用实际风电功率数据完成富风期风电小发事件的统计特征研究,在对风电功率序列进行事件序列重编码后基于APRIORI关联分析算法建立富风期风电小发事件自相关统计特性模型的方法。
为实现上述目的,本发明采用的技术方案是:
一种基于频繁模式挖掘的富风期风电小发事件统计特性模型的预测方法,包括以下具体步骤:
步骤1、基于数据驱动方式,利用实际风电功率数据和时间标志信息,筛选出富风期风电小发事件出现的时间和频率,提取各风电场发生富风期风电小发事件时对应的持续时间段、间隔时间段,进行特征分析;
步骤2、引入气象数据,选取气象指标,基于K-means聚类算法分别对持续时间段、间隔时间段模式进行聚类分析得到不同的基本模式,同时得到各基本模式对应的气象特征,并利用支持向量机算法对各基本模式下的气象数据进行学习训练,得到支持向量机分类器;
步骤3、根据步骤2聚类分析得到的各基本模式,使用基本模式对风电功率序列进行事件序列重编码,实现对风电功率序列的降维处理;
步骤4、根据步骤3处理所得降维后的事件序列,通过APRIORI关联分析算法对事件序列进行挖掘得到富风期风电小发事件与事件之间的关联关系,进而建立富风期风电小发事件的自相关统计特性模型,完成对富风期风电小发事件的预测,具体包括:
步骤4.1、根据步骤3.2处理所得降维后的事件序列,通过APRIORI关联分析算法对事件序列进行挖掘分析得到富风期风电小发事件与事件之间的关联关系。基于APRIORI的原理对模式事件序列进行频繁项集搜索,记SC(mode)为支持度计数,即某一模式出现的频数。由于相隔较远的富风期风电小发事件相关性小,故只需考虑到频繁三项集即可,即依次包含两次富风期风电小发事件和相应的间隔的频繁项集。因此,从频繁二项集到频繁三项集就能够包含富风期风电小发事件的自相关信息,从频繁二项集上考虑模式A和模式B的自相关特性,在模式A发生之后,模式B发生的概率如下式所示:
该式从而建立起模式A和模式B的自相关特性,所有模式的自相关特性均可以由频繁项集计算得到;
步骤4.2、设定频繁项阈值为2个支持度计数,基于APRIORI算法对降维后的事件序列进行分析,搜索到频繁二项集、频繁三项集,并且得到其中频繁二项集、频繁三相集相应的支持度计数和,从而计算得到不同模式之间的自相关特性;
步骤4.3、基于上述步骤统计得到各模式间的自相关特性,进而建立富风期风电小发事件的自相关统计特性模型,所有的频繁二项集和频繁三项集都可以表征富风期风电小发事件的自相关特性,不同模式之间的关联关系的集合构成自相关统计特性模型。
步骤5、采集鹿原、协合、照阳河风电场站的2018年的实际风电功率数据和气象数据,根据步骤4.2处理所得到每个基本模式之间的关联关系,得到的频繁二项集和频繁三项集用于表征富风期风电小发事件的自相关特性,基于这种特性进行算例分析,可用于对未来的富风期风电小发事件进行预测,预测方法具体包括:
步骤5.1、根据步骤2中的聚类分析得到富风期风电小发事件持续时间段、间隔时间段各基本模式,将持续时间段模式编号为1~3,间隔时间段模式编号为4~6,同时根据步骤2得到各基本模式对应的模式内事件数、平均风速值、平均风向值、平均气温值、平均气压值、平均持续时间值/平均间隔时间值。
步骤5.2、假定先发生模式1和4的富风期风电小发事件持续时间段和间隔时间段后,紧接着会发生一起持续时间段,模式必定为1、2、3中的一类,由于根据步骤4.2已经计算出每个模式之间的自相关特性和具体概率情况,这样利用接下来会发生模式1、2、3的概率和对应的气象特征数据值,计算得到会发生模式1、2、3的概率乘以各模式对应的气象数据特征值的总和,即是接下来会发生的模式对应的各气象数据特征值,具体包括风速、风向、气温、气压,再利用这组数据基于svm模型的predict功能进行识别,即可得到其属于的具体模式,最后进行迭代可以预测出之后会发生的各模式。
在上述的基于频繁模式挖掘的富风期风电小发事件统计特性建模方法,步骤1的实现包括以下步骤:
步骤1.1、基于数据驱动方式,选取风电场站一年的实际风电功率数据,数据采集是每天内每隔15分钟采点一次,一天共96条数据;
步骤1.2、对实际风电功率数据进行预处理,采用删除法将存在缺失以及数值明显超出其物理意义范围的数据删除,实现缺失值与异常值处理;
步骤1.3、基于预处理后得到的实际风电功率数据,以低于一年中最大风电功率的5%为标准筛选出富风期风电小发事件出现的时间和频率,提取各风电场发生富风期风电小发事件时对应的持续时间段、间隔时间段;
步骤1.4、根据得到的特征数据分别从时间、空间尺度上刻画富风期风电小发事件持续时间、间隔时间概率分布图,刻画富风期风电小发事件起始时间概率分布图。
在上述的基于频繁模式挖掘的富风期风电小发事件统计特性建模方法,步骤2的实现包括以下步骤:
步骤2.1、引入气象数据,选取风速、风向、气温和气压作为气象指标;
步骤2.2、基于K-means聚类算法分别对持续时间段、间隔时间段模式进行聚类分析得到不同的基本模式,同时得到各基本模式对应的气象特征。利用k-means算法分别对持续时间段、间隔时间段模式中的历史气象数据分别进行聚类分析,形成各基本模式的具体步骤如下:
步骤2.2.1、从t个历史气象数据样本点中随机性的选取其中的k个气象数据样本点作为初始聚类中心,然后依次计算其余各样本点到这些初始聚类中心的距离,并将样本点赋给距离最近的类簇,从而形成初始的k个类簇;
步骤2.2.2、分别计算k个类簇内样本点数据的均值,即得到中心样本,以这k个中心样本作为新的聚类中心,重新计算各个气象数据样本点与新的聚类中心的距离,并再次根据最小距离原则将各个样本点分配给距离最近的类簇;
步骤2.2.3、重新计算k个类簇的均值,循环步骤2.2.2与步骤2.2.3,直到聚类中心不再发生变化为止;
步骤2.3、利用支持向量机算法对各基本模式下的气象数据进行学习训练,得到支持向量机分类器。针对气象模式类别大于2的支持向量机算法进行分析,采用逐一鉴别方法,构造k个SVM子分类器,在构造第j个SVM子分类器时,将属于第j类别的样本数据标记为正类,不属于j类别的样本数据标记为负类;训练时,对历史气象数据样本分别计算各个子分类器的判别函数值,并选取判别函数值最大所对应的类别为气象数据样本的类别,从而实现多分类。
在上述的基于频繁模式挖掘的富风期风电小发事件统计特性建模方法,步骤3的实现包括以下步骤:
步骤3.1、分析富风期风电小发事件的特征,可以发现富风期风电小发事件功率出力极低,其发生的持续时间长短是重要特征,除此之外发生两起富风期风电小发事件之间的间隔时间也是重要关注对象,因此利用富风期风电小发事件的持续时间、间隔时间参数来表达富风期风电小发事件信息,根据步骤2.2利用k-means算法,分别对每起持续时间段、间隔时间段模式中对应的历史气象数据求取均值,这样每一个模式都有对应的气象特征数据集,再对这些气象特征数据集进行聚类分析,可以得到不同的气象模式,根据不同的气象模式就可以对持续时间段、间隔时间段模式进行分类,则可以得到各基本子模式;
步骤3.2、为便于事件编码,将富风期风电小发事件持续时间段对应的模式A聚类后分别得到不同的模式并依次编号,将发生两次富风期风电小发事件间隔时间段对应的模式B聚类后分别得到不同的模式并依次编号,利用得到的各基本模式对风电功率序列进行事件序列重编码,将一个多维的功率序列降维为一个2维的事件序列。
本发明的有益效果:考虑了多个气象因素,如风速、风向、气温、气压对于富风期风电小发事件的影响,使得针对富风期风电小发事件这一极端场景分析建模结果更加准确;基于K-means聚类算法分别对富风期风电小发事件持续时间段、间隔时间段模式进行聚类分析得到不同的基本模式,从而使用各基本模式对风电功率序列进行事件序列重编码,将时间序列转换为事件序列,更好挖掘富风期风电小发事件与事件之间的关联关系;所采用的APRIORI关联分析算法可以深入挖掘出富风期风电小发事件之间的自相关特性,有效地解决了难以用数学模型建模的问题。
在实际应用时通过历史风电功率数据和气象数据,筛选出富风期风电小发事件发生的时间和频率,再利用聚类算法,对富风期风电小发事件的持续时间、间隔时间段模式进行聚类分析得到各基本模式,利用各基本模式对功率序列进行事件重编码,基于APRIORI算法对富风期风电小发事件进行自相关特性挖掘,从而更加深层次地挖掘风电出力规律,有助于提高模型的完备性,加强电网安全运行的可靠性,帮助电网调度更加有效的利用风电资源。
附图说明
图1是APRIORI算法的原理图;
图2是本发明一个实施例的方法流程示意图;
图3(a)是京津唐地区发生富风期风电小发事件时对应的持续时间概率分布图;
图3(b)是京津唐地区发生富风期风电小发事件时对应的间隔时间概率分布图;
图3(c)是京津唐地区发生富风期风电小发事件时对应的起始时间概率分布图。
具体实施方式
下面结合附图对本发明的实施方式进行详细描述。
本实施例为了解决现有技术中所存在的技术问题,提供了一种基于频繁模式挖掘的富风期风电小发事件统计特性建模方法,通过对富风期风电小发事件的风功率统计特征进行建模,得到其自相关特性模型,进而对这一极端场景展开深入分析,有助于提高模型的完备性,加强电网安全运行的可靠性,帮助电网调度更加有效的利用风电资源。
本实施例不是单独仅从风电功率角度来分析富风期风电小发事件统计特性,而是考虑了气象条件(风速、风向、气温、气压)对风电功率波动特性的影响。首先利用实际风电功率数据完成富风期风电小发事件的统计特征研究,得到富风期风电小发事件的持续时间段和间隔时间段模式,再通过引入历史气象数据,利用聚类算法对持续时间段和间隔时间段模式分析得到不同的基本模式,接着对风电功率序列进行事件序列重编码,进而基于APRIORI关联分析算法建立富风期风电小发事件自相关统计特性模型。
本实施例一种基于频繁模式挖掘的富风期风电小发事件统计特性建模方法,包括基于数据驱动方式,利用实际风电功率数据和时间标志信息,筛选出富风期风电小发事件出现的时间和频率,提取各风电场发生富风期风电小发事件时对应的持续时间段、间隔时间段;在此基础上,引入气象数据,基于K-means聚类算法分别对持续时间段、间隔时间段模式进行聚类分析得到不同的基本模式,同时得到各基本模式对应的气象特征,训练支持向量机分类器;使用基本模式对风电功率序列进行事件序列重编码;在得到降维后的事件序列之后,通过APRIORI关联分析算法对事件序列进行挖掘得到富风期风电小发事件与事件之间的关联关系,进而建立富风期风电小发事件的自相关统计特性模型,完成对富风期风电小发事件的预测。
本实施例是通过以下技术方案来实现的,如图2所示,本发明包括以下步骤:
S1.基于数据驱动方式,利用实际风电功率数据和时间标志信息,筛选出富风期风电小发事件出现的时间和频率,提取各风电场发生富风期风电小发事件时对应的持续时间段、间隔时间段,进行统计特征分析。
在S1中,对实际风电功率数据进行预处理,采用删除法将存在缺失以及数值明显超出其物理意义范围的数据删除,实现缺失值与异常值处理,由于当样本数量足够大时,缺失值与异常值只占总样本中的少数,因而采用删除法,将存在缺失以及数值明显超出其物理意义范围的数据删除;基于预处理后得到的实际风电功率数据,以低于一年中最大风电功率的5%为标准筛选出富风期风电小发事件出现的时间和频率,提取各风电场发生富风期风电小发事件时对应的持续时间段、间隔时间段;根据统计得到的特征数据分别从时间、空间尺度上刻画富风期风电小发事件持续时间、间隔时间概率分布图,刻画富风期风电小发事件起始时间概率分布图,实现对富风期风电小发事件的统计分析。对于样本数据进行统计分析,得到京津唐地区发生富风期风电小发事件时对应的持续时间、间隔时间和起始时间概率分布图如图3(a)、图3(b)、图3(c)所示。
S2.引入气象数据,选取气象指标,基于K-means聚类算法分别对持续时间段、间隔时间段模式进行聚类分析得到不同的基本模式,同时得到各基本模式对应的气象特征,并利用支持向量机算法对各基本模式下的气象数据进行学习训练,得到支持向量机分类器。考虑到风速、风向对风电功率的出力具有直接相关性,同时风机所处区域的气压以及温度的高低,都会在一定程度上引起空气的对流,因而最终选取风速、风向、气温、气压作为在考虑富风期风电小发事件情况下各模式聚类分析的气象数据指标。对于样本数据,以鹿原、照阳河和协合三个风电场同时发生富风期风电小发事件为例,分别对持续时间段、间隔时间段模式经过K-means聚类后,得到的各基本模式及其气象特征如表1、表2所示。
表1
模式 | 模式内事件数 | 平均风速 | 平均风向 | 平均气温 | 平均气压 | 平均持续时间(小时) |
1 | 31 | 2.97 | 125.60 | 11.62 | 599.50 | 9.55 |
2 | 17 | 3.40 | 238.62 | -9.81 | 586.85 | 11.34 |
3 | 20 | 3.66 | 211.04 | 19.49 | 649.62 | 9.38 |
表2
模式 | 模式内事件数 | 平均风速 | 平均风向 | 平均气温 | 平均气压 | 平均持续时间(小时) |
4 | 32 | 7.06 | 243.94 | 4.56 | 595.79 | 109.45 |
5 | 28 | 4.65 | 162.76 | 18.53 | 633.46 | 39.05 |
6 | 7 | 8.22 | 256.28 | -4.65 | 597.34 | 486.18 |
利用k-means算法分别对持续时间段、间隔时间段模式中的历史气象数据分别进行聚类分析,形成各基本模式的具体步骤如下:
S2.1.从t个历史气象数据样本点中随机性的选取其中的k个气象数据样本点作为初始聚类中心,然后依次计算其余各样本点到这些初始聚类中心的距离,并将样本点赋给距离最近的类簇,从而形成初始的k个类簇;
S2.2.分别计算k个类簇内样本点数据的均值,即得到中心样本,以这k个中心样本作为新的聚类中心,重新计算各个气象数据样本点与新的聚类中心的距离,并再次根据最小距离原则将各个样本点分配给距离最近的类簇;
S2.3.重新计算k个类簇的均值(中心样本),循环S2.2与S2.3,直到聚类中心不再发生变化为止。
S3.根据S2中的聚类分析得到的各基本模式,使用基本模式对风电功率序列进行事件序列重编码,实现对风电功率序列的降维处理。
在S3中,分析富风期风电小发事件的统计特征,可知富风期风电小发事件的持续时间、间隔时间参数能表达时序序列中的富风期风电小发事件信息,根据S2中统计聚类分析得到的各基本模式;为便于事件编码,将富风期风电小发事件持续时间段对应的模式A聚类分别得到不同的模式并依次编号,将发生两次富风期风电小发事件间隔时间段对应的模式B聚类分别得到不同的模式并依次编号,利用得到的各基本模式对风电功率序列进行事件序列重编码,将一个多维的功率序列降维为一个2维的事件序列。
S4.根据S3中处理所得降维后的事件序列,通过APRIORI关联分析算法对事件序列进行挖掘得到富风期风电小发事件与事件之间的关联关系,进而建立富风期风电小发事件的自相关统计特性模型,完成对富风期风电小发事件的预测。
在S4中,基于APRIORI的原理对模式事件序列进行频繁项集搜索,记SC(mode)为支持度计数,即某一模式出现的频数。由于相隔较远的富风期风电小发事件相关性较小,故只需考虑到频繁三项集即可,即依次包含两次富风期风电小发事件和相应的间隔的频繁项集。因此,从频繁二项集到频繁三项集就可以包含富风期风电小发事件的自相关信息,其中所有模式的自相关特性均可以由频繁项集计算得到;设定频繁项阈值为2个支持度计数,基于APRIORI算法对降维后的事件序列进行分析,可以搜索到频繁二项集、频繁三项集,并且得到其中频繁二项集、频繁三相集相应的支持度计数和,从而计算得到不同模式之间的自相关特性;基于上述步骤统计得到各模式间的自相关特性,进而建立富风期风电小发事件的自相关统计特性模型,在此基础上完成对富风期风电小发事件的预测。
S5.采集鹿原、协合、照阳河风电场站的2018年的实际风电功率数据和气象数据,根据步骤4.2处理所得到每个基本模式之间的关联关系,得到的频繁二项集和频繁三项集用于表征富风期风电小发事件的自相关特性,基于这种特性进行算例分析,可用于对未来的富风期风电小发事件进行预测,具体是:
S5.1、根据步骤2中的聚类分析得到富风期风电小发事件持续时间段、间隔时间段各基本模式,将持续时间段模式编号为1~3,间隔时间段模式编号为4~6,同时根据步骤2得到各基本模式对应的模式内事件数、平均风速值、平均风向值、平均气温值、平均气压值、平均持续时间值/平均间隔时间值。
S5.2、假定先发生模式1和4的富风期风电小发事件持续时间段和间隔时间段后,紧接着会发生一起持续时间段,模式必定为1、2、3中的一类,由于根据步骤4已经计算出每个模式之间的自相关特性和具体概率情况,这样利用接下来会发生模式1、2、3的概率和对应的气象特征数据值,计算得到会发生模式1、2、3的概率乘以各模式对应的气象数据特征值的总和,即是接下来会发生的模式对应的各气象数据特征值,具体包括风速、风向、气温、气压,再利用这组数据基于svm模型的predict功能进行识别,即可得到其属于的具体模式,最后进行迭代可以预测出之后会发生的各模式。
具体到本实施例,基于聚类后的各基本模式,从频繁二项集上考虑,对事件序列进行APRIORI关联性分析,搜索频繁二项集及其支持度计数,共搜索到13个频繁二项,频繁二项集总的支持度计数和为133。假定先发生模式1,紧接着发生模式4、5和6的概率分别依次为53.33%、46.67%、0。这样就建立了模式1和模式4、5、6的自相关特性统计特性模型。同理,从频繁三项集上考虑,对事件序列进行APRIORI关联性分析,搜索频繁三项集及其支持度计数,当前面发生模式1和4的富风期风电小发事件持续时间段和间隔时间段后,紧接着会发生一起持续时间段模式1、2、3的概率分别依次为61%、0、39%。基于上述得到的自相关统计特性,假定先发生模式2和4,根据得到的频繁项集自相关特性规律和预测方法,预测得到接下来会发生的模式依次为2、4、1、4、1、5。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
虽然以上结合附图描述了本发明的具体实施方式,但是本领域普通技术人员应当理解,这些仅是举例说明,可以对这些实施方式做出多种变形或修改,而不背离本发明的原理和实质。本发明的范围仅由所附权利要求书限定。
Claims (4)
1.一种基于频繁模式挖掘的富风期风电小发事件统计特性模型的预测方法,其特征在于,包括以下具体步骤:
步骤1、基于数据驱动方式,利用实际风电功率数据和时间标志信息,筛选出富风期风电小发事件出现的时间和频率,提取各风电场发生富风期风电小发事件时对应的持续时间段、间隔时间段,进行特征分析;
步骤2、引入气象数据,选取气象指标,基于K-means聚类算法分别对持续时间段、间隔时间段模式进行聚类分析得到不同的基本模式,同时得到各基本模式对应的气象特征,并利用支持向量机算法对各基本模式下的气象数据进行学习训练,得到支持向量机分类器;
步骤3、根据步骤2聚类分析得到的各基本模式,使用基本模式对风电功率序列进行事件序列重编码,实现对风电功率序列的降维处理;
步骤4、根据步骤3处理所得降维后的事件序列,通过APRIORI关联分析算法对事件序列进行挖掘得到富风期风电小发事件与事件之间的关联关系,进而建立富风期风电小发事件的自相关统计特性模型,完成对富风期风电小发事件的预测,具体包括:
步骤4.1、根据步骤3.2处理所得降维后的事件序列,通过APRIORI关联分析算法对事件序列进行挖掘分析得到富风期风电小发事件与事件之间的关联关系;基于APRIORI的原理对模式事件序列进行频繁项集搜索,记SC(mode)为支持度计数,即某一模式出现的频数;由于相隔较远的富风期风电小发事件相关性小,故只需考虑到频繁三项集即可,即依次包含两次富风期风电小发事件和相应的间隔的频繁项集;因此,从频繁二项集到频繁三项集就能够包含富风期风电小发事件的自相关信息,从频繁二项集上考虑模式A和模式B的自相关特性,在模式A发生之后,模式B发生的概率如下式所示:
该式从而建立起模式A和模式B的自相关特性,所有模式的自相关特性均可以由频繁项集计算得到;
步骤4.2、设定频繁项阈值为2个支持度计数,基于APRIORI算法对降维后的事件序列进行分析,搜索到频繁二项集、频繁三项集,并且得到其中频繁二项集、频繁三相集相应的支持度计数和,从而计算得到不同模式之间的自相关特性;
步骤4.3、基于上述步骤统计得到各模式间的自相关特性,进而建立富风期风电小发事件的自相关统计特性模型,所有的频繁二项集和频繁三项集都可以表征富风期风电小发事件的自相关特性,不同模式之间的关联关系的集合构成自相关统计特性模型;
步骤5、采集鹿原、协合、照阳河风电场站的2018年的实际风电功率数据和气象数据,根据步骤4.2处理所得到每个基本模式之间的关联关系,得到的频繁二项集和频繁三项集用于表征富风期风电小发事件的自相关特性,基于这种特性进行算例分析,可用于对未来的富风期风电小发事件进行预测,预测方法具体包括:
步骤5.1、根据步骤2中的聚类分析得到富风期风电小发事件持续时间段、间隔时间段各基本模式,将持续时间段模式编号为1~3,间隔时间段模式编号为4~6,同时根据步骤2得到各基本模式对应的模式内事件数、平均风速值、平均风向值、平均气温值、平均气压值、平均持续时间值/平均间隔时间值;
步骤5.2、假定先发生模式1和4的富风期风电小发事件持续时间段和间隔时间段后,紧接着会发生一起持续时间段,模式必定为1、2、3中的一类,由于根据步骤4.2已经计算出每个模式之间的自相关特性和具体概率情况,这样利用接下来会发生模式1、2、3的概率和对应的气象特征数据值,计算得到会发生模式1、2、3的概率乘以各模式对应的气象数据特征值的总和,即是接下来会发生的模式对应的各气象数据特征值,具体包括风速、风向、气温、气压,再利用这组数据基于svm模型的predict功能进行识别,即可得到其属于的具体模式,最后进行迭代可以预测出之后会发生的各模式。
2.如权利要求1所述的基于频繁模式挖掘的富风期风电小发事件统计特性建模方法,其特征在于,步骤1的实现包括以下步骤:
步骤1.1、基于数据驱动方式,选取风电场站一年的实际风电功率数据,数据采集是每天内每隔15分钟采点一次,一天共96条数据;
步骤1.2、对实际风电功率数据进行预处理,采用删除法将存在缺失以及数值明显超出其物理意义范围的数据删除,实现缺失值与异常值处理;
步骤1.3、基于预处理后得到的实际风电功率数据,以低于一年中最大风电功率的5%为标准筛选出富风期风电小发事件出现的时间和频率,提取各风电场发生富风期风电小发事件时对应的持续时间段、间隔时间段;
步骤1.4、根据得到的特征数据分别从时间、空间尺度上刻画富风期风电小发事件持续时间、间隔时间概率分布图,刻画富风期风电小发事件起始时间概率分布图。
3.如权利要求2所述的基于频繁模式挖掘的富风期风电小发事件统计特性建模方法,其特征在于,步骤2的实现包括以下步骤:
步骤2.1、引入气象数据,选取风速、风向、气温和气压作为气象指标;
步骤2.2、基于K-means聚类算法分别对持续时间段、间隔时间段模式进行聚类分析得到不同的基本模式,同时得到各基本模式对应的气象特征;利用k-means算法分别对持续时间段、间隔时间段模式中的历史气象数据分别进行聚类分析,形成各基本模式的具体步骤如下:
步骤2.2.1、从t个历史气象数据样本点中随机性的选取其中的k个气象数据样本点作为初始聚类中心,然后依次计算其余各样本点到这些初始聚类中心的距离,并将样本点赋给距离最近的类簇,从而形成初始的k个类簇;
步骤2.2.2、分别计算k个类簇内样本点数据的均值,即得到中心样本,以这k个中心样本作为新的聚类中心,重新计算各个气象数据样本点与新的聚类中心的距离,并再次根据最小距离原则将各个样本点分配给距离最近的类簇;
步骤2.2.3、重新计算k个类簇的均值,循环步骤2.2.2与步骤2.2.3,直到聚类中心不再发生变化为止;
步骤2.3、利用支持向量机算法对各基本模式下的气象数据进行学习训练,得到支持向量机分类器;针对气象模式类别大于2的支持向量机算法进行分析,采用逐一鉴别方法,构造k个SVM子分类器,在构造第j个SVM子分类器时,将属于第j类别的样本数据标记为正类,不属于j类别的样本数据标记为负类;训练时,对历史气象数据样本分别计算各个子分类器的判别函数值,并选取判别函数值最大所对应的类别为气象数据样本的类别,从而实现多分类。
4.如权利要求2所述的基于频繁模式挖掘的富风期风电小发事件统计特性建模方法,其特征在于,步骤3的实现包括以下步骤:
步骤3.1、分析富风期风电小发事件的特征,可以发现富风期风电小发事件功率出力极低,其发生的持续时间长短是重要特征,除此之外发生两起富风期风电小发事件之间的间隔时间也是重要关注对象,因此利用富风期风电小发事件的持续时间、间隔时间参数来表达富风期风电小发事件信息,根据步骤2.2利用k-means算法,分别对每起持续时间段、间隔时间段模式中对应的历史气象数据求取均值,这样每一个模式都有对应的气象特征数据集,再对这些气象特征数据集进行聚类分析,可以得到不同的气象模式,根据不同的气象模式就可以对持续时间段、间隔时间段模式进行分类,则可以得到各基本子模式;
步骤3.2、为便于事件编码,将富风期风电小发事件持续时间段对应的模式A聚类后分别得到不同的模式并依次编号,将发生两次富风期风电小发事件间隔时间段对应的模式B聚类后分别得到不同的模式并依次编号,利用得到的各基本模式对风电功率序列进行事件序列重编码,将一个多维的功率序列降维为一个2维的事件序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110276871.6A CN113065278B (zh) | 2021-03-15 | 2021-03-15 | 一种基于频繁模式挖掘的富风期风电小发事件统计特性模型的预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110276871.6A CN113065278B (zh) | 2021-03-15 | 2021-03-15 | 一种基于频繁模式挖掘的富风期风电小发事件统计特性模型的预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113065278A true CN113065278A (zh) | 2021-07-02 |
CN113065278B CN113065278B (zh) | 2023-01-31 |
Family
ID=76560860
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110276871.6A Active CN113065278B (zh) | 2021-03-15 | 2021-03-15 | 一种基于频繁模式挖掘的富风期风电小发事件统计特性模型的预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113065278B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113496262A (zh) * | 2021-09-08 | 2021-10-12 | 山东大学 | 数据驱动的有源配电网异常状态感知方法及*** |
CN115204322A (zh) * | 2022-09-16 | 2022-10-18 | 成都新希望金融信息有限公司 | 行为链路异常识别方法和装置 |
CN116384598A (zh) * | 2023-06-06 | 2023-07-04 | 中国电力科学研究院有限公司 | 一种基于时序事件编码的风电过程预测方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106447086A (zh) * | 2016-09-07 | 2017-02-22 | 中国农业大学 | 一种基于风电场数据预处理的风电功率组合预测方法 |
CN107909212A (zh) * | 2017-11-20 | 2018-04-13 | 武汉大学 | 基于中尺度风电功率发展过程序列化的爬坡事件预测方法 |
CN111008504A (zh) * | 2019-12-18 | 2020-04-14 | 武汉大学 | 一种基于气象模式识别的风电功率预测误差建模方法 |
-
2021
- 2021-03-15 CN CN202110276871.6A patent/CN113065278B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106447086A (zh) * | 2016-09-07 | 2017-02-22 | 中国农业大学 | 一种基于风电场数据预处理的风电功率组合预测方法 |
CN107909212A (zh) * | 2017-11-20 | 2018-04-13 | 武汉大学 | 基于中尺度风电功率发展过程序列化的爬坡事件预测方法 |
CN111008504A (zh) * | 2019-12-18 | 2020-04-14 | 武汉大学 | 一种基于气象模式识别的风电功率预测误差建模方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113496262A (zh) * | 2021-09-08 | 2021-10-12 | 山东大学 | 数据驱动的有源配电网异常状态感知方法及*** |
CN113496262B (zh) * | 2021-09-08 | 2022-02-08 | 山东大学 | 数据驱动的有源配电网异常状态感知方法及*** |
CN115204322A (zh) * | 2022-09-16 | 2022-10-18 | 成都新希望金融信息有限公司 | 行为链路异常识别方法和装置 |
CN116384598A (zh) * | 2023-06-06 | 2023-07-04 | 中国电力科学研究院有限公司 | 一种基于时序事件编码的风电过程预测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113065278B (zh) | 2023-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113065278B (zh) | 一种基于频繁模式挖掘的富风期风电小发事件统计特性模型的预测方法 | |
US11043808B2 (en) | Method for identifying pattern of load cycle | |
CN107766990B (zh) | 一种光伏电站发电功率的预测方法 | |
US20230136352A1 (en) | Method and system for predicting a day-ahead wind power of wind farms | |
CN112381181B (zh) | 一种建筑能耗异常的动态检测方法 | |
CN107748940B (zh) | 一种节电潜力量化预测方法 | |
CN112990558B (zh) | 一种基于深度迁移学习的气象温度、光照的预测方法 | |
CN111859283B (zh) | 一种考虑多能源荷时序性、相关性的场景生成方法 | |
CN115829105A (zh) | 基于历史数据特征搜索的光伏功率预测方法 | |
CN110781068B (zh) | 一种基于同构分解方法的数据中心跨层能耗预测方法 | |
CN106022578A (zh) | 基于数据高维化和K-means聚类的居民用电峰谷平时段划分方法 | |
CN116050666A (zh) | 一种辐照特征聚类的光伏发电功率预测方法 | |
CN113127464B (zh) | 农业大数据环境特征处理方法、装置及电子设备 | |
Zhang et al. | A density-center-based automatic clustering algorithm for IoT data analysis | |
CN111382763A (zh) | 一种光伏集群划分方法及*** | |
CN109359671B (zh) | 一种水电站水库调度规则的分类智能提取方法 | |
CN117033923A (zh) | 一种基于可解释性机器学习的犯罪数量预测方法及*** | |
CN114676931B (zh) | 一种基于数据中台技术的电量预测*** | |
CN111768066B (zh) | 基于融合特征的园区电热负荷耦合关系分析方法及装置 | |
CN110659681B (zh) | 基于模式识别的时序数据预测***及方法 | |
Tian et al. | Research on clustering based meteorological data mining methods | |
CN118115008B (zh) | 基于风、光、水集成控制的智慧能源管理方法及平台 | |
CN117977589B (zh) | 一种融合电网智能化终端管理***及方法 | |
CN116845869A (zh) | 一种风光出力典型场景集的聚类方法、装置和设备 | |
CN113792778B (zh) | 一种风电场分区及其出力相关系数计算方法和*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |