CN110008982A - 一种基于光伏发电出力聚类的气象监测点选择方法 - Google Patents
一种基于光伏发电出力聚类的气象监测点选择方法 Download PDFInfo
- Publication number
- CN110008982A CN110008982A CN201910029741.5A CN201910029741A CN110008982A CN 110008982 A CN110008982 A CN 110008982A CN 201910029741 A CN201910029741 A CN 201910029741A CN 110008982 A CN110008982 A CN 110008982A
- Authority
- CN
- China
- Prior art keywords
- photovoltaic
- weather
- power
- data
- power output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 39
- 238000010248 power generation Methods 0.000 title claims abstract description 26
- 238000010187 selection method Methods 0.000 title claims abstract description 16
- 238000005457 optimization Methods 0.000 claims abstract description 15
- 238000004458 analytical method Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 4
- 238000012552 review Methods 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- 238000000418 atomic force spectrum Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 3
- 238000007621 cluster analysis Methods 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims description 3
- 230000007261 regionalization Effects 0.000 claims description 3
- 241000196324 Embryophyta Species 0.000 claims 5
- 241000208340 Araliaceae Species 0.000 claims 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims 1
- 235000003140 Panax quinquefolius Nutrition 0.000 claims 1
- 235000008434 ginseng Nutrition 0.000 claims 1
- 238000000034 method Methods 0.000 abstract description 20
- 230000008569 process Effects 0.000 description 7
- 238000009434 installation Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005286 illumination Methods 0.000 description 3
- 230000005611 electricity Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000013277 forecasting method Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000005201 scrubbing Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Artificial Intelligence (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Water Supply & Treatment (AREA)
- Probability & Statistics with Applications (AREA)
- Public Health (AREA)
- Life Sciences & Earth Sciences (AREA)
- Primary Health Care (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Supply And Distribution Of Alternating Current (AREA)
- Photovoltaic Devices (AREA)
Abstract
本发明公开了一种基于光伏发电出力聚类的气象监测点选择方法,涉及电力领域。目前,为了提高预测光伏出力的准确,需设置多个气象监测点,成本高,目前预测光伏出力不能兼顾成本及预测的准确性。本技术方案利用聚类分析方法对每类天气类型下的用户光伏按照地域进行分块,分析不同区域的出力一致性,优化用户光伏的分群位置,统计区域内各个光伏电站与区域光伏出力的相关性系数,选择相关性大于设定值的电站作为该区域的代表电站,选择最为优越的代表电站所在地作为气象监测点。本技术方案可以利用最少的气象数据来预测群里每个用户光伏的功率,从而既优化了气象站位置选择以确保光伏预测精度,又减少了引入气象数据的成本,提高了经济性。
Description
技术领域
本发明涉及电力领域,尤其涉及一种基于光伏发电出力聚类的气象监测点选择方法。
背景技术
随着国家新能源政策发布,以及国家电网承担吸纳绿色能源措施的落实,分布式光伏总发电量快速增长,分布式光伏的总装机量达到一定规模。由于分布式光伏自发自用、余量上网的运行方式,其出力的随机性和波动性对配电网来说影响很大,因此分布式光伏的出力预测对电网来说具有重要意义。目前大部分功率预测方法都是针对光伏单站的光伏功率预测,而广域分布式光伏的功率预测研究很少,区域光伏电站群的功率预测实现有两种技术路线:一是对区域里所有光伏电站的功率预测结果进行简单的累加;二是基于代表光伏电站的功率预测结果,采用统计升尺度法实现区域性的光伏发电功率预测。对于包含很多个光伏电站的光伏群来说,由于单个电站的历史出力数据收集困难、局部气象因素无法获取等因素,简单累加法具有明显的局限性。
为了提高预测光伏出力的准确,需设置多个气象监测点,成本高,目前预测光伏出力不能兼顾成本及预测的准确性。
发明内容
本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供一种基于光伏发电出力聚类的气象监测点选择方法,以达到合理选择气象监测点,以兼顾成本及预测的准确性的目的。为此,本发明采取以下技术方案。
一种基于光伏发电出力聚类的气象监测点选择方法,包括以下步骤:
1)以每一小时数据为一个样本,对数据进行标幺化处理后,截取 5:00-20:00点15个小时的历史出力数据,按区间对光伏历史出力数据进行天气类型匹配识别,每个单个电站用15个时刻的天气类型指数来表示的出力历史数据,天气类型分为:晴天、晴间多云,多云、阴间多云,阴天,阵雨、雷阵雨、小雨,大雨、大到暴雨;
2)依次对每个整点的数据进行聚类分析,产生五种天气类型下的分布式光伏地理位置分布图,再次通过K-means聚类,对每一类天气类型下的光伏出力数据的地理位置分区;
3)每一种天气类型下,光伏出力的大小从属于一个区间,即光伏出力彼此具有相似性;按查表法定位每一个光伏电站的地理位置分块,若五种天气类型下光伏电站都从属于一个地理位置区块,只需从同一地理区块中中选择合适的电站作为初步参考电站,即无论什么天气类型下,光伏电站的出力都跟随参考电站,称为和谐电站;若不同的天气类型下,光伏电站从属于不同的地理区块,即从属于不同的参考电站,称为不和谐电站,则需另外选作参考电站;
4)在分类K值设定范围内计算不和谐电站与总电站数量的占比率,根据占比率,确定聚类分析的最优K值;
5)重新对全部分布式光伏地理位置按K值进行聚类分析,得出结果即为具有空间相关性的广域分布式光伏划群的区域化展示,获得光伏发电用户群划分结果;
6)统计区域内各个光伏电站与区域光伏出力的相关性系数,选择相关性大于设定值的电站作为该区域的代表电站;
7)对同一区域中的代表电站进行预测复核,衡量不同代表电站的优越性;
8)选择最为优越的代表电站所在地作为气象监测点。
本技术方案为气象站点最少部署或提出多光伏用户基于“空间-时间关联”的功率预测提供依据;首先将气象对光伏出力的影响分为大气候和小气候两类:大气候主要是日照或五类天气类型影响,通过光伏实际出力占额定出力的比例来划分,从而将历史数据时段划分为五类天气类型样本群;小气候认为是光伏安装高程、温度、湿度以及周围地理环境等广义小气候影响,对历史五类天气类型样本群,进行空间相关的聚类分析,得到用户光伏区域划分;综合分块中不合群的用户光伏点数量和子区域气象一致性来决定最优地域分块方案为用户光伏分群策略。本技术方案利用聚类分析方法对每类天气类型下的用户光伏按照地域进行分块,分析不同区域的出力一致性,优化用户光伏的分群位置,有利于选出最具有代表性的参考电站作为气象监测点的建设位置或购买气象数据的气象站参考位置,以利用最少的气象数据来预测群里每个用户光伏的功率,从而既优化了气象站位置选择以确保光伏预测精度,又减少了引入气象数据的成本,提高了经济性;另外,即便不采取增加气象站,将大规模分布式电站的气象一致性分群,可以通过气象一致性的分布式电站组建分群的时间空间光伏预测。
本技术方案综合考虑广域分布式光伏电站出力的空间相关性,在对其进行群化的基础上,利用相关系数检测与覆盖电站的出力相关性,综合考虑其地理位置、额定发电量、预测误差等因素,选择最具代表性的光伏电站作为气象监测点。
本技术方案适用于广域分布式光伏电站,考虑经济因素无法在每个电站建立气象监测点来获取气象数据,而精确的气象数据对光伏预测尤为重要,本技术方案选择合适的气象监测点对广域分布式光伏整体出力预测具有重要意义,兼顾了预测的准确性及经济性。
作为优选技术手段:在步骤1)中,天气类型的匹配时,根据实际日发电量与日额定发电量参考值的占比值k按区间对天气分类,分布区间和对应五类天气类型,当1≤k<0.8时,认为天气类型为晴天、晴间多云;当0.8≤k<0.6时,认为天气类型为多云、阴间多云;当0.6≤k<0.4时,认为天气类型为阴天;当0.4≤k<0.2时,认为天气类型为阵雨、雷阵雨、小雨;当0.2≤k<0时,认为天气类型为大雨、大到暴雨。
作为优选技术手段:在步骤1)中,天气类型识别包括步骤:
101)获取光伏历史数据;
102)获取单站最大功率;
103)日出力曲线标玄化;
104)日出力曲线四季化;
105)天气类型聚类识别;
106)按地域聚类分析,获得对应区间的天气状态。
本技术方案实现按季区分,能更准确的进行分区。
作为优选技术手段:离散采样时,日实际发电量是日间隔15分钟的采样值,则有:
其中i为光伏用户序号,j为光伏日采集点数,P(i,j)为第i个光伏用户j时刻的离散采样值,Pmax为日额定发电量的参考值,此处由于缺少额定发电量数据,由日发电量离散采样值的历史最大值估算;当每间隔15 分钟采集一次数据,一天有4×24=96点,即j=1,2,…,96。
作为优选技术手段:聚类分析结果依赖于初始聚类中心和聚类个数而波动,具有一定的不稳定性;选择合适的初始聚类中心位置对分析聚类结果至关重要;假设待聚类的数据集为X={xi|xi∈RP,i=1,2,…,n},K个初始位置中心为C1,C2,…,CK,用W1,W2,…,WK表示K个类所包含的样本集合,所有的样本集合为W;
定义1样本xi,xj之间的欧式距离:
定义2样本xi到所有样本距离的平均值:
定义3数据集样本的平均距离
定义4数据点xi的密度density(xi)
density(x)={p∈C|d(x,p)≤cmean*θ}
θ为密度半径系数;
首先根据定义3-4计算数据集中每一个样本数据的密度,寻找密度最大的样本作为第一个类的初始中心C1,删除处于密度半径中的样本,即
W=W-W1
重复上述原则,重新在W中寻找密度最大的样本将其作为第C个类别的初始中心,并令
以此类推直至找出K个初始聚类中心C1,C2,…,CK。
作为优选技术手段:使用向量间的欧式距离作为分类的依据,计算公式如下:
其中,dij为第i个标准向量和第j个标准向量间的欧式距离,n为每个标准向量的维度;
作为优选技术手段:获取的历史数据包括气象数据和历史出力数据,并将历史数据按季节划分,分为春季、夏季、秋季、冬季,每一季的数据在以天气聚类后,再以地区化聚类。
作为优选技术手段:在步骤7)中,通过计算平均绝对误差(MAE)和均方根误差(RMSE)指标来衡量不同代表电站的优越性;优化目标定义如下:
定义1:均方根误差和,计算如下:
定义2:平均绝对误差和,计算如下式:
其中C为区域类别,N为每个区域中的电站数量,m为功率的时间序列长度;
平均绝对误差和均方根误差越小则电站的优越性高。
作为优选技术手段:区域内各个光伏电站与区域光伏出力的相关性系数,计算公式如下:
式中:xi、yi分别代表不同的时间序列,为时间序列的均值, n为时间序列长度。
有益效果:
本技术方案综合考虑广域分布式光伏电站出力的空间相关性,在对其进行群化的基础上,利用相关系数检测与覆盖电站的出力相关性,综合考虑其地理位置、额定发电量、预测误差等因素,选择最具代表性的光伏电站作为气象监测点。
本技术方案适用于广域分布式光伏电站,考虑经济因素无法在每个电站建立气象监测点来获取气象数据,而精确的气象数据对光伏预测尤为重要,本技术方案选择合适的气象监测点对广域分布式光伏整体出力预测具有重要意义,兼顾了预测的准确性及经济性。
本技术方案利用聚类分析方法对每类天气类型下的用户光伏按照地域进行分块,分析不同区域的出力一致性,优化用户光伏的分群位置,有利于选出最具有代表性的参考电站作为气象监测点的建设位置或购买气象数据的气象站参考位置,以利用最少的气象数据来预测群里每个用户光伏的功率,从而既优化了气象站位置选择以确保光伏预测精度,又减少了引入气象数据的成本,提高了经济性;另外,即便不采取增加气象站,将大规模分布式电站的气象一致性分群,可以通过气象一致性的分布式电站组建分群的时间空间光伏预测。有效提高预测的准确。
附图说明
图1是本发明的流程图。
图2是本发明的子区域划分流程图。
图3是本发明的气象代表站选取流程图。
图4是本发明的光伏群化过程图。
具体实施方式
以下结合说明书附图对本发明的技术方案做进一步的详细说明。
如图1所示,一种基于光伏发电出力聚类的气象监测点选择方法,包括以下步骤:
1)以每一小时数据为一个样本,对数据进行标幺化处理后,截取 5:00-20:00点15个小时的历史出力数据,按区间对光伏历史出力数据进行天气类型匹配识别,每个单个电站用15个时刻的天气类型指数来表示的出力历史数据,天气类型分为:晴天、晴间多云,多云、阴间多云,阴天,阵雨、雷阵雨、小雨,大雨、大到暴雨;
2)依次对每个整点的数据进行聚类分析,产生五种天气类型下的分布式光伏地理位置分布图,再次通过K-means聚类,对每一类天气类型下的光伏出力数据的地理位置分区;
3)每一种天气类型下,光伏出力的大小从属于一个区间,即光伏出力彼此具有相似性;按查表法定位每一个光伏电站的地理位置分块,若五种天气类型下光伏电站都从属于一个地理位置区块,只需从同一地理区块中中选择合适的电站作为初步参考电站,即无论什么天气类型下,光伏电站的出力都跟随参考电站,称为和谐电站;若不同的天气类型下,光伏电站从属于不同的地理区块,即从属于不同的参考电站,称为不和谐电站,则需另外选作参考电站;
4)在分类K值设定范围内计算不和谐电站与总电站数量的占比率,根据占比率,确定聚类分析的最优K值;
5)重新对全部分布式光伏地理位置按K值进行聚类分析,得出结果即为具有空间相关性的广域分布式光伏划群的区域化展示,获得光伏发电用户群划分结果;
6)统计区域内各个光伏电站与区域光伏出力的相关性系数,选择相关性大于设定值的电站作为该区域的代表电站;
7)对同一区域中的代表电站进行预测复核,衡量不同代表电站的优越性;
8)选择最为优越的代表电站所在地作为气象监测点。
本技术方案综合考虑广域分布式光伏电站出力的空间相关性,在对其进行群化的基础上,利用相关系数检测与覆盖电站的出力相关性,综合考虑其地理位置、额定发电量、预测误差等因素,选择最具代表性的光伏电站作为气象监测点。
本技术方案适用于广域分布式光伏电站,考虑经济因素无法在每个电站建立气象监测点来获取气象数据,而精确的气象数据对光伏预测尤为重要,本技术方案选择合适的气象监测点对广域分布式光伏整体出力预测具有重要意义,兼顾了预测的准确性及经济性。
本技术方案为气象站点最少部署或提出多光伏用户基于“空间-时间关联”的功率预测提供依据;首先将气象对光伏出力的影响分为大气候和小气候两类:大气候主要是日照或五类天气类型影响,通过光伏实际出力占额定出力的比例来划分,从而将历史数据时段划分为五类天气类型样本群;小气候认为是光伏安装高程、温度、湿度以及周围地理环境等广义小气候影响,对历史五类天气类型样本群,进行空间相关的聚类分析,得到用户光伏区域划分;综合分块中不合群的用户光伏点数量和子区域气象一致性来决定最优地域分块方案为用户光伏分群策略。本技术方案利用聚类分析方法对每类天气类型下的用户光伏按照地域进行分块,分析不同区域的出力一致性,优化用户光伏的分群位置,有利于选出最具有代表性的参考电站作为气象监测点的建设位置或购买气象数据的气象站参考位置,以利用最少的气象数据来预测群里每个用户光伏的功率,从而既优化了气象站位置选择以确保光伏预测精度,又减少了引入气象数据的成本,提高了经济性;另外,即便不采取增加气象站,将大规模分布式电站的气象一致性分群,可以通过气象一致性的分布式电站组建分群的时间空间光伏预测。
本方法主要包括K-means聚类方法,根据数据自身的距离或相似度将它们划分成若干组,划分的原则是组内样本最小化而组间距离最大化。该算法的具体步骤如下:
a)数据清理,对原始数据进行质量分析,包括数据缺失值分析、数据异常值处理等。
b)数据预处理,对数据进行归一化和标准化,用于消除量纲之间的差异。
c)聚类特征提取,从数据中提取最有效的聚类特征,转换为特征向量。
d)聚类,针对特征向量,选择最佳的聚类个数和距离函数,执行聚类或分组。
e)聚类评价,指对聚类的效果选择合适的评价函数进行评价。
如图2、3、4所示,本技术方案主要包括子区域划分和气象代表站选取两部分。
如图2所示,子区域划分流程包括步骤:
101)获取光伏历史数据;
102)求取单站最大功率;
103)日出力曲线标玄化,按每户的最大出力作1;
104)日出力曲线四季化;
105)日出力曲线形态化聚类(第一层聚类,拟天气聚类,一般为6 类,对应大晴、晴、多云、阴、雨、大波动);
106)日出力曲线形态化聚类(第二层聚类,拟地区化聚类,一般为 5-6类,对应该区的东、西、南、北、中等);
107)光伏站的天气聚类区域化结果分析;
108)光伏站的区域化结果输出。
如图3所示,气象代表站选取包括步骤:
201)获取光伏站的区域化结果;
202)光伏站的区域化地理区划分析;
203)单光伏站与气象代表站的关联表确定;
204)获取这些代表站的历史数据;
205)对代表站进行预测复核;
206)效果评估,选择最优的气象代表站。
以下就下列问题作进一步解释说明:
一、光伏出力过程与气象的关联原理:
1)大气候影响
由于光伏出力影响因素众多,其预测精度与天气状态密切相关。光伏发电量影响因子中太阳辐照度与光伏出力的相关性最大,甚至是线性相关的,为主要影响因素,称为大气候影响。
2)地理特性小气候的影响
大气候相同条件下,温度、湿度、光伏所在的地形等小气候因素对光伏出力也起不可忽略作用对于相同大气候下,属于某一地域的光伏的出力过程特性相近,由于地理特性小气候的影响,而不同地域的光伏过程特性出现偏差,成为小气候影响。
二、天气状态的确定:
由于光伏电站缺少历史气象数据,用光伏出力的历史数据提取天气类型的特征向量是聚类的关键。由于光照强度直接影响光伏出力,而晴天时由于云量较少,光照强度处于最大值,一定程度上可以反映光伏出力实际日发电量和日额定发电量参考值的占比值最大,随着光照强度的减弱,光伏出力实际日发电量与日额定发电量参考值的占比值逐步减少。因此提出日实际发电量与日额定发电量的比值为天气类型指数K,离散采样时,日实际发电量是日间隔15分钟的采样值,则有:
其中i为光伏用户序号,j为光伏日采集点数,P(i,j)为第i个光伏用户j时刻的离散采样值,Pmax为日额定发电量的参考值,此处由于缺少额定发电量数据,由日发电量离散采样值的历史最大值估算。假设每间隔15 分钟采集一次数据,一天有4×24=96点,即j=1,2,…,96。
根据实际日发电量与日额定发电量参考值的占比值按区间对天气分类,分布区间和对应五类天气类型如表1:
表1天气类型指数与天气类型对照
三、初始中心位置选择:
聚类分析结果依赖于初始聚类中心和聚类个数而波动,具有一定的不稳定性。选择合适的初始聚类中心位置对分析聚类结果至关重要。假设待聚类的数据集为X={xi|xi∈RP,i=1,2,…,n},K个初始位置中心为C1,C2,…,CK,用W1,W2,…,WK表示K个类所包含的样本集合,所有的样本集合为W。
定义1样本xi,xj之间的欧式距离:
定义2样本xi到所有样本距离的平均值:
定义3数据集样本的平均距离
定义4数据点xi的密度density(xi)
density(x)={p∈C|d(x,p)≤cmean*θ}θ为密度半径系数
首先根据定义3-4计算数据集中每一个样本数据的密度,寻找密度最大的样本作为第一个类的初始中心C1,删除处于密度半径中的样本,即
W=W-W1
重复上述原则,重新在W中寻找密度最大的样本将其作为第C个类别的初始中心,并令
以此类推直至找出K个初始聚类中心C1,C2,…,CK。
四、聚类依据
所谓聚类依据是指数据分类的条件。本文使用向量间的欧式距离作为分类的依据,计算公式如下:
其中,dij为第i个标准向量和第j个标准向量间的欧式距离,n为每个标准向量的维度。
五、区域划分过程
提某市分布式光伏用户的2017年6-8月92天的历史出力数据,截取早上9点至晚上5点间隔1小时的8个小时的历史数据作为数据源。子区域的划分过程如图4所示:基于聚类分析的子区域划分。
以早上11:00为例,首先对天气类型指数按区间对光伏历史出力数据进行天气类型匹配识别;然后通过K-means聚类,对每一类天气类型下的光伏出力数据的地理位置划分子区域;聚类类数范围设定为K=[3,10]。展示地理位置聚类分块数量为6块,每一种天气类型下聚类后光伏用户的地理位置分布;为方便区分对每一个子区域编号1-6。
每一种天气类型下,光伏出力的大小从属于一个地理区域,即该区域的光伏出力彼此具有相似性。分别定位每一个用户光伏的地理位置区域,若五种天气类型下用户光伏都从属于一个确定的地理位置区域,只需从同一地理区域中选择合适的电站作为初步参考电站,即无论什么天气类型下,该用户光伏的出力都跟随这相同的参考电站,我们称为和谐电站。若不同的天气类型下,用户光伏从属于不同的地理区域,即从属于不同的参考电站,我们称为不和谐电站;对于不和谐电站,则不同天气类型,难以跟随同一的参考电站。计算每一个区域覆盖的光伏从站并计算不和谐电站在全部电站中的数量占比,如表2。
表2 11:00时段的和谐电站与不和谐电站占比
随着地理位置分块类数增加,不和谐电站占比不一定随聚类类数变大而变大(或变小);根据本县域案例的分析,已表明了其波动性,如K=8 的不和谐电站数量,就比K=7的要小。
随着地理位置分块类数增加,区域面积减小,天气类型指数的方差逐渐减小,区域内气象趋于统一,因此考虑微地形、微气象的影响,划分的子区域面积不宜过大。故综合考虑不和谐电站占比和气象一致性,该15分钟的数据样本中,聚类数为8的用户光伏分群为最优划分,其他时刻的数据样本选择代表站的方法与上述相同,可得出不同时刻的数据样本下,优化得到的最优划分类数有K=7、K=8、K=9。
用户光伏群的最优分类
基于用户光伏历史数据的不同分类数量K的计算结果见表3;可以看出,在最优分类K=7时,两种误差都是最小值,说明在这种区域分布优选出的代表电站历史出力数据与区域的波动情况最为接近。
表3两种误差比较结果
六、气象监测点优化选取
1、Pearson相关系数
在最优分类个数基础上划分区域后,分别在区域中选择相关性较高的电站作为代表电站,通常为1个,而电站的装机容量、地理位置和预测精度都将影响区域预测的精度,本文首先考虑代表电站与区域电站的出力相关性因素,尽量选择与区域光伏电站出力波动性最接近的电站,因此结合光伏电站和区域电站的历史出力数据,统计区域内各个光伏电站与区域光伏出力的相关性系数,计算公式如下:
式中:xi、yi分别代表不同的时间序列,为时间序列的均值, n为时间序列长度。
2、气象监测点评价模型
光伏群的最终最优分类K值随着每一小时数据样本的分布不同而改变,即所选代表电站随不同时刻的数据样本改变而更新,但气象监测点应为固定的几个代表电站,因此需要对代表电站进一步的优化,此处引入平均绝对误差(MAE)和均方根误差(RMSE)指标来衡量不同代表电站的优越性。优化目标定义如下:
定义1:均方根误差和,计算如下:
定义2:平均绝对误差和,计算如下式:
其中C为区域类别,N为每个区域中的电站数量,m为功率的时间序列长度。
以上图1-4所示的一种基于光伏发电出力聚类的气象监测点选择方法是本发明的具体实施例,已经体现出本发明实质性特点和进步,可根据实际的使用需要,在本发明的启示下,对其进行等同修改,均在本方案的保护范围之列。
Claims (9)
1.一种基于光伏发电出力聚类的气象监测点选择方法,其特征在于包括以下步骤:
1)以每一小时数据为一个样本,对数据进行标幺化处理后,截取5:00-20:00点15个小时的历史出力数据,按区间对光伏历史出力数据进行天气类型匹配识别,每个单个电站用15个时刻的天气类型指数来表示的出力历史数据,天气类型分为:晴天、晴间多云,多云、阴间多云,阴天,阵雨、雷阵雨、小雨,大雨、大到暴雨;
2)依次对每个整点的数据进行聚类分析,产生五种天气类型下的分布式光伏地理位置分布图,再次通过K-means聚类,对每一类天气类型下的光伏出力数据的地理位置分区;
3)每一种天气类型下,光伏出力的大小从属于一个区间,即光伏出力彼此具有相似性;按查表法定位每一个光伏电站的地理位置分块,若五种天气类型下光伏电站都从属于一个地理位置区块,只需从同一地理区块中中选择合适的电站作为初步参考电站,即无论什么天气类型下,光伏电站的出力都跟随参考电站,称为和谐电站;若不同的天气类型下,光伏电站从属于不同的地理区块,即从属于不同的参考电站,称为不和谐电站,则需另外选作参考电站;
4)在分类K值设定范围内计算不和谐电站与总电站数量的占比率,根据占比率,确定聚类分析的最优K值;
5)重新对全部分布式光伏地理位置按K值进行聚类分析,得出结果即为具有空间相关性的广域分布式光伏划群的区域化展示,获得光伏发电用户群划分结果;
6)统计区域内各个光伏电站与区域光伏出力的相关性系数,选择相关性大于设定值的电站作为该区域的代表电站;
7)对同一区域中的代表电站进行预测复核,衡量不同代表电站的优越性;
8)选择最为优越的代表电站所在地作为气象监测点。
2.根据权利要求1所述的一种基于光伏发电出力聚类的气象监测点选择方法,其特征在于:在步骤1)中,天气类型的匹配时,根据实际日发电量与日额定发电量参考值的占比值k按区间对天气分类,分布区间和对应五类天气类型,当1≤k<0.8时,认为天气类型为晴天、晴间多云;当0.8≤k<0.6时,认为天气类型为多云、阴间多云;当0.6≤k<0.4时,认为天气类型为阴天;当0.4≤k<0.2时,认为天气类型为阵雨、雷阵雨、小雨;当0.2≤k<0时,认为天气类型为大雨、大到暴雨。
3.根据权利要求2所述的一种基于光伏发电出力聚类的气象监测点选择方法,其特征在于:在步骤1)中,天气类型识别包括步骤:
101)获取光伏历史数据;
102)获取单站最大功率;
103)日出力曲线标幺化;
104)日出力曲线四季化;
105)天气类型聚类识别;
106)按地域聚类分析,获得对应区间的天气状态。
4.根据权利要求1所述的一种基于光伏发电出力聚类的气象监测点选择方法,其特征在于:离散采样时,日实际发电量是日间隔15分钟的采样值,则有:
其中i为光伏用户序号,j为光伏日采集点数,P(i,j)为第i个光伏用户j时刻的离散采样值,Pmax为日额定发电量的参考值,此处由于缺少额定发电量数据,由日发电量离散采样值的历史最大值估算;当每间隔15分钟采集一次数据,一天有4×24=96点,即j=1,2,…,96。
5.根据权利要求4所述的一种基于光伏发电出力聚类的气象监测点选择方法,其特征在于:聚类分析结果依赖于初始聚类中心和聚类个数而波动,具有一定的不稳定性;选择合适的初始聚类中心位置对分析聚类结果至关重要;假设待聚类的数据集为X={xi|xi∈RP,i=1,2,…,n},K个初始位置中心为C1,C2,…,CK,用W1,W2,…,WK表示K个类所包含的样本集合,所有的样本集合为W;
定义1样本xi,xj之间的欧式距离:
定义2样本xi到所有样本距离的平均值:
定义3数据集样本的平均距离
定义4数据点xi的密度density(xi)
density(x)={p∈C|d(x,p)≤cmean*θ}
θ为密度半径系数;
首先根据定义3-4计算数据集中每一个样本数据的密度,寻找密度最大的样本作为第一个类的初始中心C1,删除处于密度半径中的样本,即
W=W-W1
重复上述原则,重新在W中寻找密度最大的样本将其作为第C个类别的初始中心,并令
以此类推直至找出K个初始聚类中心C1,C2,…,CK。
6.根据权利要求5所述的一种基于光伏发电出力聚类的气象监测点选择方法,其特征在于:使用向量间的欧式距离作为分类的依据,计算公式如下:
其中,dij为第i个标准向量和第j个标准向量间的欧式距离,n为每个标准向量的维度。
7.根据权利要求1-6任一权利要求所述的一种基于光伏发电出力聚类的气象监测点选择方法,其特征在于:获取的历史数据包括气象数据和历史出力数据,并将历史数据按季节划分,分为春季、夏季、秋季、冬季,每一季的数据在以天气聚类后,再以地区化聚类。
8.根据权利要求1所述的一种基于光伏发电出力聚类的气象监测点选择方法,其特征在于:在步骤7)中,通过计算平均绝对误差(MAE)和均方根误差(RMSE)指标来衡量不同代表电站的优越性;优化目标定义如下:
定义1:均方根误差和,计算如下:
定义2:平均绝对误差和,计算如下式:
其中C为区域类别,N为每个区域中的电站数量,m为功率的时间序列长度;
平均绝对误差和均方根误差越小则电站的优越性高。
9.根据权利要求8所述的一种基于光伏发电出力聚类的气象监测点选择方法,其特征在于:区域内各个光伏电站与区域光伏出力的相关性系数,计算公式如下:
式中:xi、yi分别代表不同的时间序列,为时间序列的均值,n为时间序列长度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910029741.5A CN110008982B (zh) | 2019-01-11 | 2019-01-11 | 一种基于光伏发电出力聚类的气象监测点选择方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910029741.5A CN110008982B (zh) | 2019-01-11 | 2019-01-11 | 一种基于光伏发电出力聚类的气象监测点选择方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110008982A true CN110008982A (zh) | 2019-07-12 |
CN110008982B CN110008982B (zh) | 2023-11-03 |
Family
ID=67165390
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910029741.5A Active CN110008982B (zh) | 2019-01-11 | 2019-01-11 | 一种基于光伏发电出力聚类的气象监测点选择方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110008982B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110991083A (zh) * | 2019-12-19 | 2020-04-10 | 阳光电源(上海)有限公司 | 一种光伏电站模型确定方法、装置、设备及储存介质 |
CN111784030A (zh) * | 2020-06-12 | 2020-10-16 | 国网冀北电力有限公司电力科学研究院 | 一种基于空间相关性的分布式光伏功率预测方法及装置 |
CN112117818A (zh) * | 2020-08-10 | 2020-12-22 | 珠海格力电器股份有限公司 | 一种车载光伏***及其控制方法、装置和存储介质 |
CN112290885A (zh) * | 2020-09-30 | 2021-01-29 | 国网浙江安吉县供电有限公司 | 一种户用光伏***直流侧故障诊断方法 |
CN112328851A (zh) * | 2020-11-10 | 2021-02-05 | 国能日新科技股份有限公司 | 分布式电源监测方法、装置及电子设备 |
CN112446554A (zh) * | 2020-12-18 | 2021-03-05 | 阳光电源股份有限公司 | 功率预测模型建立方法、功率预测方法及装置 |
CN114611842A (zh) * | 2022-05-10 | 2022-06-10 | 国网山西省电力公司晋城供电公司 | 一种整县屋顶分布式光伏功率预测方法 |
CN115796564A (zh) * | 2023-02-13 | 2023-03-14 | 山东济矿鲁能煤电股份有限公司阳城煤矿 | 一种基于气象监管的煤矿工作管理*** |
CN116070884A (zh) * | 2023-03-30 | 2023-05-05 | 深圳奥雅设计股份有限公司 | 高密度城市社区和微气候监控与管理*** |
CN116682062A (zh) * | 2023-06-07 | 2023-09-01 | 国网山东省电力公司济南供电公司 | 一种基于电网高影响气象要素的灾害智能识别与监控方法、***和存储介质 |
CN116858277A (zh) * | 2023-07-13 | 2023-10-10 | 遂宁市玖云通科技有限公司 | 一种基于大数据分析的计算机数据处理*** |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106022538A (zh) * | 2016-05-31 | 2016-10-12 | 中国矿业大学 | 基于k均值聚类改进广义天气的光伏发电预测方法 |
CN106228278A (zh) * | 2016-08-19 | 2016-12-14 | 长园深瑞继保自动化有限公司 | 光伏功率预测*** |
US20170109395A1 (en) * | 2015-10-14 | 2017-04-20 | The Climate Corporation | Computer-generated accurate yield map data using expert filters and spatial outlier detection |
-
2019
- 2019-01-11 CN CN201910029741.5A patent/CN110008982B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170109395A1 (en) * | 2015-10-14 | 2017-04-20 | The Climate Corporation | Computer-generated accurate yield map data using expert filters and spatial outlier detection |
CN106022538A (zh) * | 2016-05-31 | 2016-10-12 | 中国矿业大学 | 基于k均值聚类改进广义天气的光伏发电预测方法 |
CN106228278A (zh) * | 2016-08-19 | 2016-12-14 | 长园深瑞继保自动化有限公司 | 光伏功率预测*** |
Non-Patent Citations (1)
Title |
---|
李伟;王冰;陈献慧;缪永来;: "基于气象因子权重相似日的短期光伏功率预测" * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110991083A (zh) * | 2019-12-19 | 2020-04-10 | 阳光电源(上海)有限公司 | 一种光伏电站模型确定方法、装置、设备及储存介质 |
CN110991083B (zh) * | 2019-12-19 | 2023-07-14 | 阳光电源(上海)有限公司 | 一种光伏电站模型确定方法、装置、设备及储存介质 |
CN111784030A (zh) * | 2020-06-12 | 2020-10-16 | 国网冀北电力有限公司电力科学研究院 | 一种基于空间相关性的分布式光伏功率预测方法及装置 |
CN111784030B (zh) * | 2020-06-12 | 2023-10-24 | 国网冀北电力有限公司电力科学研究院 | 一种基于空间相关性的分布式光伏功率预测方法及装置 |
CN112117818A (zh) * | 2020-08-10 | 2020-12-22 | 珠海格力电器股份有限公司 | 一种车载光伏***及其控制方法、装置和存储介质 |
CN112290885B (zh) * | 2020-09-30 | 2024-06-07 | 国网浙江安吉县供电有限公司 | 一种户用光伏***直流侧故障诊断方法 |
CN112290885A (zh) * | 2020-09-30 | 2021-01-29 | 国网浙江安吉县供电有限公司 | 一种户用光伏***直流侧故障诊断方法 |
CN112328851A (zh) * | 2020-11-10 | 2021-02-05 | 国能日新科技股份有限公司 | 分布式电源监测方法、装置及电子设备 |
CN112328851B (zh) * | 2020-11-10 | 2023-11-03 | 国能日新科技股份有限公司 | 分布式电源监测方法、装置及电子设备 |
CN112446554A (zh) * | 2020-12-18 | 2021-03-05 | 阳光电源股份有限公司 | 功率预测模型建立方法、功率预测方法及装置 |
CN112446554B (zh) * | 2020-12-18 | 2024-05-14 | 阳光电源股份有限公司 | 功率预测模型建立方法、功率预测方法及装置 |
CN114611842A (zh) * | 2022-05-10 | 2022-06-10 | 国网山西省电力公司晋城供电公司 | 一种整县屋顶分布式光伏功率预测方法 |
CN114611842B (zh) * | 2022-05-10 | 2022-07-29 | 国网山西省电力公司晋城供电公司 | 一种整县屋顶分布式光伏功率预测方法 |
CN115796564A (zh) * | 2023-02-13 | 2023-03-14 | 山东济矿鲁能煤电股份有限公司阳城煤矿 | 一种基于气象监管的煤矿工作管理*** |
CN115796564B (zh) * | 2023-02-13 | 2023-04-25 | 山东济矿鲁能煤电股份有限公司阳城煤矿 | 一种基于气象监管的煤矿工作管理*** |
CN116070884A (zh) * | 2023-03-30 | 2023-05-05 | 深圳奥雅设计股份有限公司 | 高密度城市社区和微气候监控与管理*** |
CN116682062A (zh) * | 2023-06-07 | 2023-09-01 | 国网山东省电力公司济南供电公司 | 一种基于电网高影响气象要素的灾害智能识别与监控方法、***和存储介质 |
CN116682062B (zh) * | 2023-06-07 | 2024-05-03 | 国网山东省电力公司济南供电公司 | 一种基于电网高影响气象要素的灾害智能识别与监控方法、***和存储介质 |
CN116858277A (zh) * | 2023-07-13 | 2023-10-10 | 遂宁市玖云通科技有限公司 | 一种基于大数据分析的计算机数据处理*** |
Also Published As
Publication number | Publication date |
---|---|
CN110008982B (zh) | 2023-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110008982A (zh) | 一种基于光伏发电出力聚类的气象监测点选择方法 | |
CN109919353A (zh) | 一种基于空间相关性的arima模型的分布式光伏预测方法 | |
Gassar et al. | Review of geographic information systems-based rooftop solar photovoltaic potential estimation approaches at urban scales | |
CN112070286B (zh) | 复杂地形流域的降水预报预警*** | |
CN106570581B (zh) | 能源互联网环境下基于属性关联的负荷预测***及其方法 | |
WO2019237440A1 (zh) | 一种分位数概率性短期电力负荷预测集成方法 | |
WO2018082523A1 (zh) | 一种负荷周期的模式识别方法 | |
Yao et al. | A support vector machine approach to estimate global solar radiation with the influence of fog and haze | |
CN110009385A (zh) | 一种基于多因素映射的光伏发电用户群划分方法 | |
CN106022528B (zh) | 一种基于密度峰值层次聚类的光伏电站短期功率预测方法 | |
CN106022538B (zh) | 基于k均值聚类改进广义天气的光伏发电预测方法 | |
CN114429053B (zh) | 流域尺度wefe***适配性模拟优化方法 | |
CN114021420A (zh) | 一种分布式光伏超短期发电功率预测方法及*** | |
CN109376951A (zh) | 一种光伏概率预测方法 | |
CN111428745A (zh) | 一种基于聚类分析的低压用户用电特征提取方法 | |
CN110119556A (zh) | 一种区域水源涵养功能的时空演变分析方法 | |
CN115907822A (zh) | 一种考虑区域及经济影响的负荷特征指标关联性挖掘方法 | |
CN114239962B (zh) | 一种基于开源信息的精细化空间负荷预测方法 | |
Michailidou et al. | A study of weather types at Athens and Thessaloniki and their relationship to circulation types for the cold-wet period, part I: two-step cluster analysis | |
CN114611842A (zh) | 一种整县屋顶分布式光伏功率预测方法 | |
CN110416996A (zh) | 一种基于云平台的分布式光伏集群功率预测*** | |
CN104751253B (zh) | 基于b-样条基底展开曲线聚类的配电网潮流预测方法 | |
Janse van Vuuren et al. | Clustering of wind resource data for the South African renewable energy development zones | |
Yang et al. | Optimizing building spatial morphology to alleviate human thermal stress | |
Lodetti et al. | MAE and RMSE analysis of K-means predictive algorithm for photovoltaic generation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |