CN114781244A - 一种风电场内分群与参数优化方法 - Google Patents
一种风电场内分群与参数优化方法 Download PDFInfo
- Publication number
- CN114781244A CN114781244A CN202210306444.2A CN202210306444A CN114781244A CN 114781244 A CN114781244 A CN 114781244A CN 202210306444 A CN202210306444 A CN 202210306444A CN 114781244 A CN114781244 A CN 114781244A
- Authority
- CN
- China
- Prior art keywords
- clustering
- model
- equivalent
- algorithm
- power plant
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000005457 optimization Methods 0.000 title claims abstract description 22
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 45
- 238000002156 mixing Methods 0.000 claims abstract description 24
- 230000009467 reduction Effects 0.000 claims abstract description 22
- 238000004088 simulation Methods 0.000 claims abstract description 16
- BVEXVMARIREFTJ-TXMWGMRISA-N methyl (2r)-3-[(2s,6r,8s,11r)-2-[(e,2r)-4-[(2s,2'r,4r,4as,6r,8ar)-4-hydroxy-2-[(1s,3s)-1-hydroxy-3-[(2s,3r,6s)-3-methyl-1,7-dioxaspiro[5.5]undecan-2-yl]butyl]-3-methylidenespiro[4a,7,8,8a-tetrahydro-4h-pyrano[3,2-b]pyran-6,5'-oxolane]-2'-yl]but-3-en-2-yl] Chemical compound O1[C@H](C[C@@](C)(O)C(=O)OC)CC[C@@H](O)[C@@]21C=C(C)C[C@@H]([C@H](C)\C=C\[C@@H]1O[C@@]3(O[C@H]4[C@H](O)C(=C)[C@@H]([C@@H](O)C[C@H](C)[C@@H]5[C@@H](CC[C@@]6(OCCCC6)O5)C)O[C@@H]4CC3)CC1)O2 BVEXVMARIREFTJ-TXMWGMRISA-N 0.000 claims abstract description 10
- 238000004364 calculation method Methods 0.000 claims abstract description 8
- 230000006870 function Effects 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 7
- 230000011218 segmentation Effects 0.000 claims description 6
- 150000001875 compounds Chemical class 0.000 claims description 2
- 230000008602 contraction Effects 0.000 claims description 2
- 230000000694 effects Effects 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims description 2
- 238000005192 partition Methods 0.000 claims 1
- 229910052799 carbon Inorganic materials 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 23
- 230000004044 response Effects 0.000 description 15
- 238000003064 k means clustering Methods 0.000 description 9
- 239000007787 solid Substances 0.000 description 6
- 230000004927 fusion Effects 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 4
- 230000001052 transient effect Effects 0.000 description 4
- 238000007637 random forest analysis Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000036039 immunity Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/06—Multi-objective optimisation, e.g. Pareto optimisation using simulated annealing [SA], ant colony algorithms or genetic algorithms [GA]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2113/00—Details relating to the application field
- G06F2113/06—Wind turbines or wind farms
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
随着“双碳”目标的提出,风电场规模逐渐增大,其动态特性对新型电力***稳定性的影响较大。为了提升风电场仿真模型的等值精度和多工况广泛适用性,本发明提出一种风电场内分群与参数优化方法。首先,采用XGBoost‑Blending对分群指标进行降维选取;然后,提出基于DBSCAN‑DTW的聚类方法用于机群划分;最后,选取风机主导参数,将等值参数计算问题转化为多目标非线性优化模型,并采用基于改进参考点的多目标均衡优化算法MEOA进行求解。基于matlab/simulink搭建仿真模型,验证了使用本发明方法进行分群后等值模型的精确度和多工况广泛适用性。
Description
技术领域
本专利涉及建立风电场的动态仿真模型问题,提出一种风电场内分群与参数优化方法。
背景技术
随着“双碳”目标的提出,风电场规模逐渐增大,其动态特性对新型电力***稳定性的影响极大,需要构建准确反映风电场动态特性的仿真模型。本发明提出了一种风电场内分群与参数优化方法。K-means聚类易受噪声数据影响,而且在风电场中风机所受风速不同会导致动态响应时间不同,DBSCAN算法基于密度的聚类可以消除噪声影响,DTW算法以归整路径间的欧式距离作为风机间的相似度指标,两种算法相结合有利于解决这一问题。
发明内容
本发明公开了一种风电场内分群与参数优化方法。
该方法包括步骤1:采用XGBoost-Blending对分群指标进行降维选取;
步骤2:基于DBSCAN-DTW的聚类方法用于机群划分;
步骤3:将等值参数计算问题转化为多目标非线性优化模型,并采用多目标均衡优化算法MEOA进行求解;
步骤4:基于matlab/simulink搭建仿真模型,验证了使用本文方法进行分群后等值模型的精确度和多工况广泛适用性。
可选的,所述步骤1:采用XGBoost-Blending对分群指标进行降维选取,具体包括:
XGBoost的指标选取结果可解释,能够清晰地看出不同特征对结果的影响。XGBoost是一种基于分类和回归树(Classification And Regression Tree,CART)模型的集成算法。目标函数表示为:
其中,L是训练误差,即关于预测值和真实值的损失函数,表示该模型对于训练集的匹配程度;yi为真实值;Ω(ft)为采用L2范数定义的正则项,表示模型的复杂度,模型越复杂,正则项值越大;c为常数项。
其损失函数为:
为了避免过拟合和维度灾难,需要对特征进行降维选取。风力发电机特征提取的步骤如下:
1)输入风力发电机样本x,损失函数L。
2)利用贪婪算法构建树,学习新的函数,拟合上一次预测的残差。
3)对L进行迭代训练,使得误差越小越好。
4)采用L2范数定义正则项,计算复杂度,将树分成结构s和权重m两部分。
5)节点迭代后,得到节点分割前的损失与节点分割后的损失之差(即节点***的增益)的最优值,可用来计算特征的平均增益,来表征此特征的重要程度,然后选择较重要的特征,实现降维:
6)重复上述步骤,直到生成足够多的树,使得预测值最接近真实值,算法结束。
Blending模型融合可克服数据穿越,Blending模型与XGBoost元模型相融合既强化学习效果,又不至于造成整体模型的过度冗余,因此本发明采用 Blending融合XGBoost进行分群指标降维。对于每个特征在进行***时,都记录下来G值,并最终用特征的全部G值和除以特征被用于***节点的次数,得到特征的贡献程度的量化分数。按照贡献度从低到高的顺序逐一删除特征并重新聚类,遍历后得到轮廓值最高的聚类情况对应的指标选取方案。
可选的,所述步骤2:提出基于DBSCAN-DTW的聚类方法用于机群划分,具体包括:
在DBSCAN内部采用DTW来计算时间序列数据的相似度,通过对序列的延展和收缩,使得不同序列上的点与点对齐,从而计算出两条不同长度序列上点与点之间的累计最小距离,如式(4)所示。
设序列规整路径为R,k表示路径的长度,则规整路径为R=(r1,r2,…rk),规整路径距离函数为定义的规整路径需满足一定的约束条件:1) 边界性:两条序列P和Q的起点和终点必须相对应,即R1=(1,1),Rk=(m,n)。 2)单调性:序列P和Q上的点必须是单调的,使得两个序列不会相交。3)连续性:序列上的点只能和相邻的点匹配,不可以跨越式匹配,即0≤i-i′≤1。
通过DTW得到的是多维时间序列之间的相似度,需要将其代入到DBSCAN 聚类算法中进行聚类分群。DBSCAN算法中聚类半径Epsilon和一个类别中样本数量的最小值MinPts两个参数设定后,可以任意选取样本中的一个点作为核心点,找到所有满足密度可达这一条件的样本作为一个类别,保证类别中所有的点都在Epsilon邻域内,设样本集合为E,任取点m,如式(5)所示。
Epsilon(m,M)={m∈E|d(m,M)≤Epsilon} (5)
可选的,所述步骤3:将等值参数计算问题转化为多目标非线性优化模型,并采用多目标均衡优化算法MEOA进行求解,具体包括:
采用容量加权法计算等值机组发电机、变压器和轴系的参数;以等值前后每一机群中风力机总输入风能相等为原则计算等值风速;根据等功率损耗法将干线式拓扑结构转换为放射式拓扑结构,再计算集电***等值参数。
选取有功、无功功率和电压的等值精度构造目标函数:
其中:
采用基于改进参考点的多目标均衡优化算法MEOA进行求解该多目标非线性优化模型.
可选的,所述步骤4:基于matlab/simulink搭建仿真模型,验证了使用本文方法进行分群后等值模型的精确度和多工况广泛适用性,具体包括:
使用matlab/simulink搭建含16台DFIG的风电场模型,通过在某时段设置风电场出口三相短路故障获取特征时序数据,算法通过python实现,采用Linux 服务器进行模型的训练。
该技术与现有技术相比,具有如下有益效果:
针对风电场仿真模型等值精度低的问题,本发明提出一种采用Blending融合XGBoost进行分群指标降维、采用DTW优化DBSCAN划分机群、进行分群结果融合的方法,通过风机运行数据划分风电场内机群,通过实验得出以下结论。
(1)DTW考虑到风电场内同一型号的DFIG在不同风速下动态响应时间不同,而且有效解决了实际风电场数据部分缺失的问题。
(2)DBSCAN基于密度避免了相似的DFIG离群,其抗噪能力也得到了显著加强。
(3)Blending融合XGBoost选取分群指标,消除变量间的强相关性,提高了分群的速度和准确度。
(4)将等值参数计算问题转化为多目标非线性优化模型,并采用MEOA 进行求解,提高了等值精度并具有多工况广泛适用性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明方法实施总流程图;
图2为本发明CART基本结构图;
图3为本发明Blending融合步骤示意图;
图4为本发明风电场仿真图;
图5为本发明风机1、风机2有功功率暂态响应仿真图;
图6为本发明风机1、风机2的相似度时序图;
图7为本发明加入噪声前的k-means聚类结果图;
图8为本发明加入噪声后的k-means聚类结果图;
图9为本发明聚类原理图;
图10为本发明DBSCAN聚类流程图;
图11为本发明加入噪声前的DBSCAN聚类结果图;
图12为本发明加入噪声后的DBSCAN聚类结果图;
图13为本发明python算法流程图;
图14为本发明不同风速扰动场景图;
图15为本发明风电场示意图;
图16为本发明四机等值风电场示意图;
图17为并网点处电压响应曲线图;
图18为并网点处有功功率响应曲线图;
图19为并网点处无功功率响应曲线图;
图20为本发明五机等值风电场示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
随着“双碳”目标的提出,风电场规模逐渐增大,其动态特性对新型电力***稳定性的影响极大,需要构建准确反映风电场动态特性的仿真模型。本发明提出了一种风电场内分群与参数优化方法。K-means聚类易受噪声数据影响,而且在风电场中风机所受风速不同会导致动态响应时间不同,DBSCAN算法基于密度的聚类可以消除噪声影响,DTW算法以归整路径间的欧式距离作为风机间的相似度指标,两种算法相结合有利于解决这一问题。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明方法实施总流程图,如图1所示,一种基于视在阻抗的多并网逆变器***谐波谐振频率灰箱辨识方法,包含以下步骤:
步骤1:采用XGBoost-Blending对分群指标进行降维选取;
步骤2:基于DBSCAN-DTW的聚类方法用于机群划分;
步骤3:计算多机等值参数,转化为多目标非线性优化模型,采用基于改进参考点的多目标均衡优化算法MEOA进行求解;
步骤4:基于matlab/simulink搭建仿真模型,验证了使用本文方法进行分群后等值模型的精确度和多工况广泛适用性。
图2为本发明CART基本结构图。XGBoost是一种基于分类和回归树(Classification And Regression Tree,CART)模型的集成算法,构建CART的过程如下:1)寻找***点:从根节点(样本集合)出发,遍历特征,对每个样本的每个特征值,计算以此为阈值将样本集分为两部分时模型的增益。2)***与停止:记录增益最大时对应的特征及其增益值,并据此值将树分为左右节点,直到所有***点的增益都小于0。3)结果与得分:最后一层的每个叶节点都对应一个样本子集合(即最后的分类结果),并可根据上一步计算各特征的增益。
图3为本发明Blending融合步骤示意图。图中“→”表示划分,表示输入,表示输入。DP、DT和DA分别表示原始预测数据集、子训练集测试集,MO1、MO2、…、MOV表示V个XGBoost元模型,DA_P、DP_P表示输出元模型上的指标贡献度结果,DA_OUT表示DA_P与原DA数据对应实际结果组成新的数据集,MODA表示基于数据集DA_OUT的元模型,MODA_P表示元模型MODA指标贡献度输出,MOP表示基于MODA_P与DP_P组成数据集的元模型,最终指标贡度表示元模型MOP指标贡献度输出。
图4为本发明风电场仿真图。风电场由30台额定功率为1.5MW的DFIG 构成。DFIG机端电压575V,由一机一变的单元接线方式就地升压至25kV,场内每6台变压器经过架空线路连接,输送至25kV/220kV变电站并输送到外部电网,风机初始风速数据如附录中表1所示。
表1阵风扰动实验扰动分量参数
图5为本发明风机1、风机2有功功率暂态响应仿真图。风机1、风机2在 12s当发生三相短路故障时,风电机组的有功功率随之跌落。经历短时暂态(几十毫秒)后,很快达到了故障期间的稳态值。12.1s故障清除后,风机的有功功率经历一定时间的向下和向上过冲后,有功功率经历短时暂态(几十毫秒)后按照一定的斜率恢复至正常工作状态。12.5s时风机2(红色实线)已经达到稳态,而风机1(蓝色实线)仍然在恢复过程。
图6为本发明加入噪声前的k-means聚类结果图。聚类数据集为X=[1,1.1, 1.2,1.2,1.45,1.38,1.68,1.72,1.75,3,3.3,3.15,3.2,4,3.9,4.1,4.15],Y=[1,1.1,0.9,1.25,1.35,1.55,1.5,1.65,1.68,3,3.1,3.05,2.9,4,4.1,3.9,3.95],噪音点为(2,2.5)。一种颜色表示分成一类,簇1、簇2、簇3和簇4分别用蓝色、红色、绿色、黄色图形表示。
图7为本发明加入噪声后的k-means聚类结果图。当加入了噪声点以后,分群的结果出现了变化,算法却将噪声点归入簇2,而将框中本应属于簇2的两个点错误地归入了簇1中。
图8为本发明聚类原理图。DBSCAN算法将所有样本分成三个类别:核心点(黑色实心圆点表示)、边界点(实心圆点颜色与各簇颜色相对应);噪声点 (灰色实心圆点表示)。
图9为本发明DBSCAN聚类流程图。当两个参数设定后,可以任意选取样本中的一个点作为核心点,找到所有满足密度可达这一条件的样本作为一个类别,保证类别中所有的点都在Epsilon邻域内。
图10为本发明加入噪声前的DBSCAN聚类结果图。一种颜色表示分成一类,簇1、簇2、簇3和簇4分别用蓝色、紫色、绿色、黄色实心圆点表示。
图11为本发明加入噪声后的DBSCAN聚类结果图。簇1、簇2、簇3和簇 4分别用蓝色、深绿色、绿色、黄色图形实心圆点表示,噪声用紫色实心圆点表示。加入噪声后不影响分群结果,算法会自动识别出噪声点。
图12为本发明python算法流程图。将获取到的风机数据采用DTW计算出风机之间的最优归整路径,按照归整后的欧式距离计算相似程度,作为DBSCAN 的聚类依据,通过不断调整参数获得最优分群。此时的计算维度极高,可能存在特征间的强相关问题和冗余性,因此使用Blending融合XGBoost进行分群指标的选取,实现特征降维,重新进行DBSCAN-DTW聚类,输出分群结果。
图13为本发明不同风速扰动场景图。在不同风速场景下对模型进行检验,包括阵风(蓝色实线表示)、渐变风(红色实线表示)和综合风(黄色实线表示)。
图14为本发明风电场示意图。本文利用matlab/simulink仿真平台,搭建由 16台额定功率为1.5MW的DFIG构成的风电场。DFIG机端电压690V,由一机一变的单元接线方式就地升压至35kV,经过架空线路输送至35kV/220kV变电站并输送到外部电网。
图15为本发明四机等值风电场示意图。通过XGBoost选取分群指标、 DBSCAN-DTW聚类机群,以容量加权法计算DFIG等值参数,以损耗不变原则得到风电场内部集电网络等值参数得到的等值示意图。
图16为并网点处电压响应曲线图。原模型和XGBoost降维的 DBSCAN-DTW聚类算法的电压响应曲线图分别用蓝色实线和绿色实线表示,使用K-means聚类算法(红色实线)、DBSCAN-DTW聚类算法(黄色实线)、随机森林降维的DBSCAN-DTW聚类算法(紫色实线)同时进行了本实验作为对照。
图17为并网点处有功功率响应曲线图。原模型和XGBoost降维的 DBSCAN-DTW聚类算法的有功功率响应曲线分别用蓝色实线和绿色实线表示,使用K-means聚类算法(红色实线)、DBSCAN-DTW聚类算法(黄色实线)、随机森林降维的DBSCAN-DTW聚类算法(紫色实线)同时进行了本实验作为对照。
图18为并网点处无功功率响应曲线图。原模型和XGBoost降维的 DBSCAN-DTW聚类算法的无功功率响应曲线分别用蓝色实线和绿色实线表示,使用K-means聚类算法(红色实线)、DBSCAN-DTW聚类算法(黄色实线)、随机森林降维的DBSCAN-DTW聚类算法(紫色实线)同时进行了本实验作为对照。
图19为本发明五机等值风电场示意图。阵风第1组扰动下、综合风扰动下通过聚类算法分群后的风电场等值模型。
图20为本发明融合分群结果示意图。通过修改参数采集大量风速场景下的数据,将不同工况下分群结果进行聚类融合,得出分群结果。
针对风电场仿真模型等值精度低的问题,本发明提出一种采用Blending融合XGBoost进行分群指标降维、采用DTW优化DBSCAN划分机群、进行分群结果融合的方法,通过风机运行数据划分风电场内机群,通过实验得出以下结论。
(1)DTW考虑到风电场内同一型号的DFIG在不同风速下动态响应时间不同,而且有效解决了实际风电场数据部分缺失的问题。
(2)DBSCAN基于密度避免了相似的DFIG离群,其抗噪能力也得到了显著加强。
(3)Blending融合XGBoost选取分群指标,消除变量间的强相关性,提高了分群的速度和准确度。
(4)将等值参数计算问题转化为多目标非线性优化模型,并采用MEOA 进行求解,提高了等值精度并具有多工况广泛适用性。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
本发明中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (5)
1.一种风电场内分群与参数优化方法,其特征在于,包含以下步骤:
步骤1:采用XGBoost-Blending对分群指标进行降维选取;
步骤2:基于DBSCAN-DTW的聚类方法用于机群划分;
步骤3:将等值参数计算问题转化为多目标非线性优化模型,并采用多目标均衡优化算法MEOA进行求解;
步骤4:基于matlab/simulink搭建仿真模型,验证了使用本文方法进行分群后等值模型的精确度和多工况广泛适用性。
2.根据权利要求1所述的采用Blending融合XGBoost进行分群指标降维,其特征在于,所述步骤1:采用XGBoost-Blending对分群指标进行降维选取,具体包括:
XGBoost的指标选取结果可解释,能够清晰地看出不同特征对结果的影响。XGBoost是一种基于分类和回归树(Classification And Regression Tree,CART)模型的集成算法。目标函数表示为:
其中,L是训练误差,即关于预测值和真实值的损失函数,表示该模型对于训练集的匹配程度;yi为真实值;Ω(ft)为采用L2范数定义的正则项,表示模型的复杂度,模型越复杂,正则项值越大;c为常数项。
其损失函数为:
为了避免过拟合和维度灾难,需要对特征进行降维选取。风力发电机特征提取的步骤如下:
1)输入风力发电机样本x,损失函数L。
2)利用贪婪算法构建树,学习新的函数,拟合上一次预测的残差。
3)对L进行迭代训练,使得误差越小越好。
4)采用L2范数定义正则项,计算复杂度,将树分成结构s和权重m两部分。
5)节点迭代后,得到节点分割前的损失与节点分割后的损失之差(即节点***的增益)的最优值,可用来计算特征的平均增益,来表征此特征的重要程度,然后选择较重要的特征,实现降维:
6)重复上述步骤,直到生成足够多的树,使得预测值最接近真实值,算法结束。
Blending模型融合可克服数据穿越,Blending模型与XGBoost元模型相融合既强化学习效果,又不至于造成整体模型的过度冗余,因此本发明采用Blending融合XGBoost进行分群指标降维。对于每个特征在进行***时,都记录下来G值,并最终用特征的全部G值和除以特征被用于***节点的次数,得到特征的贡献程度的量化分数。按照贡献度从低到高的顺序逐一删除特征并重新聚类,遍历后得到轮廓值最高的聚类情况对应的指标选取方案。
3.根据权利要求1所述的采用DTW优化DBSCAN划分机群,其特征在于,所述步骤2:提出基于DBSCAN-DTW的聚类方法用于机群划分,具体包括:
在DBSCAN内部采用DTW来计算时间序列数据的相似度,通过对序列的延展和收缩,使得不同序列上的点与点对齐,从而计算出两条不同长度序列上点与点之间的累计最小距离,如式(4)所示。
设序列规整路径为R,k表示路径的长度,则规整路径为R=(r1,r2,…rk),规整路径距离函数为定义的规整路径需满足一定的约束条件:1)边界性:两条序列P和Q的起点和终点必须相对应,即R1=(1,1),Rk=(m,n)。2)单调性:序列P和Q上的点必须是单调的,使得两个序列不会相交。3)连续性:序列上的点只能和相邻的点匹配,不可以跨越式匹配,即0≤i-i′≤1。
通过DTW得到的是多维时间序列之间的相似度,需要将其代入到DBSCAN聚类算法中进行聚类分群。DBSCAN算法中聚类半径Epsilon和一个类别中样本数量的最小值MinPts两个参数设定后,可以任意选取样本中的一个点作为核心点,找到所有满足密度可达这一条件的样本作为一个类别,保证类别中所有的点都在Epsilon邻域内,设样本集合为E,任取点m,如式(5)所示。
Epsilon(m,M)={m∈E|d(m,M)≤Epsilon} (5)
5.根据权利要求1所述的验证方法,其特征在于,所述步骤4:基于matlab/simulink搭建仿真模型,验证了使用本文方法进行分群后等值模型的精确度和多工况广泛适用性,具体包括:
使用matlab/simulink搭建含16台DFIG的风电场模型,通过在某时段设置风电场出口三相短路故障获取特征时序数据,算法通过python实现,采用Linux服务器进行模型的训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210306444.2A CN114781244A (zh) | 2022-03-25 | 2022-03-25 | 一种风电场内分群与参数优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210306444.2A CN114781244A (zh) | 2022-03-25 | 2022-03-25 | 一种风电场内分群与参数优化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114781244A true CN114781244A (zh) | 2022-07-22 |
Family
ID=82424610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210306444.2A Withdrawn CN114781244A (zh) | 2022-03-25 | 2022-03-25 | 一种风电场内分群与参数优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114781244A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115310533A (zh) * | 2022-08-05 | 2022-11-08 | 中远海运科技股份有限公司 | 一种基于ais的海上风电场识别方法及*** |
-
2022
- 2022-03-25 CN CN202210306444.2A patent/CN114781244A/zh not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115310533A (zh) * | 2022-08-05 | 2022-11-08 | 中远海运科技股份有限公司 | 一种基于ais的海上风电场识别方法及*** |
CN115310533B (zh) * | 2022-08-05 | 2024-01-19 | 中远海运科技股份有限公司 | 一种基于ais的海上风电场识别方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109142946A (zh) | 基于蚁群算法优化随机森林的变压器故障检测方法 | |
CN111157899B (zh) | 一种基于模型融合思想对电池soc的估计方法 | |
CN110969290B (zh) | 一种基于深度学习的径流概率预测方法及*** | |
CN111478314B (zh) | 一种电力***暂态稳定评估方法 | |
CN110909977A (zh) | 基于adasyn-dhsd-et的电网故障诊断方法 | |
CN112581315A (zh) | 一种基于极端梯度动态密度聚类的风电场内分群方法 | |
CN110009141B (zh) | 基于sdae特征提取和svm分类模型的爬坡事件预测方法及*** | |
CN109672221B (zh) | 一种用于次同步振荡分析的直驱风电场动态等值方法 | |
CN110837915B (zh) | 一种基于混合集成深度学习的电力***低压负荷点预测及概率预测方法 | |
CN116245033B (zh) | 人工智能驱动的电力***分析方法及智能软件平台 | |
CN111725802B (zh) | 基于深度神经网络的交直流混联电网暂态稳定判断方法 | |
CN116842337A (zh) | 基于LightGBM优选特征与COA-CNN模型的变压器故障诊断方法 | |
CN112651576A (zh) | 长期风电功率预测方法及装置 | |
CN115329899A (zh) | 一种聚类等效模型构建方法、***、设备和存储介质 | |
CN115618249A (zh) | 一种基于LargeVis降维与DBSCAN聚类的低压配电台区相位识别方法 | |
CN114781244A (zh) | 一种风电场内分群与参数优化方法 | |
CN111401792A (zh) | 一种基于极限梯度提升决策树的动态安全评估方法 | |
CN108694475B (zh) | 基于混合模型的短时间尺度光伏电池发电量预测方法 | |
CN113536508A (zh) | 一种制造网络节点分类方法及*** | |
CN117148034A (zh) | 基于经验小波变换及图注意力网络的配电网故障选线方法 | |
CN117150898A (zh) | 基于参数优化集成学习的输电断面极限传输容量评估方法 | |
CN115021269B (zh) | 基于数据驱动的两阶段最优潮流求解方法 | |
CN116488151A (zh) | 一种基于条件生成对抗网络的短期风电功率预测方法 | |
Wang et al. | Cluster division in wind farm through ensemble modelling | |
CN113466630B (zh) | 一种基于rsspn模型的配电网故障原因分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20220722 |
|
WW01 | Invention patent application withdrawn after publication |