CN107895202A - 基于多视角风速模式挖掘的短期风速预测方法 - Google Patents
基于多视角风速模式挖掘的短期风速预测方法 Download PDFInfo
- Publication number
- CN107895202A CN107895202A CN201711001445.1A CN201711001445A CN107895202A CN 107895202 A CN107895202 A CN 107895202A CN 201711001445 A CN201711001445 A CN 201711001445A CN 107895202 A CN107895202 A CN 107895202A
- Authority
- CN
- China
- Prior art keywords
- wind speed
- mrow
- mtd
- msub
- time series
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000000007 visual effect Effects 0.000 title claims abstract description 47
- 238000009412 basement excavation Methods 0.000 title claims abstract description 19
- 238000013277 forecasting method Methods 0.000 title claims abstract description 15
- 238000000034 method Methods 0.000 claims abstract description 42
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 22
- 230000008859 change Effects 0.000 claims abstract description 19
- 239000011159 matrix material Substances 0.000 claims abstract description 15
- 238000000605 extraction Methods 0.000 claims abstract description 11
- 238000010606 normalization Methods 0.000 claims abstract description 10
- 230000008569 process Effects 0.000 claims description 19
- 238000012549 training Methods 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 8
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 3
- 238000012706 support-vector machine Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000005611 electricity Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 2
- 241001123248 Arma Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000002803 fossil fuel Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Aerodynamic Tests, Hydrodynamic Tests, Wind Tunnels, And Water Tanks (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于多视角风速模式挖掘的短期风速预测方法方法,包括:采集风电场的风速历史数据,形成历史风速的时间序列;通过互信息法确定时间序列的延迟;根据获得的延迟将风速时间序列转换成为矩阵型数据,获得风速样本;根据风速样本从风速的统计信息、风速变化趋势和风速波动趋势三个视角提取描述风速变化规律的特征信息;对风速样本进行归一化处理,获得归一化后的风速变化的特征信息;基于归一化后的风速变化的特征信息,通过多视角聚类算法对风速样本进行聚类,从而建立具有k个簇集的短期风速预测的模型;计算待预测的风速样本与上述确定的k个簇集之间的欧式距离,利用其中欧式距离最小的簇集所对应的SVR风速预测模型完成风速预测。
Description
技术领域
本发明涉及一种基于多视角的风电场风速变化模式的短期风速预测方法,属于电力信息技术领域
背景技术
化石燃料过度消耗引起的能源危机和环境危机越来越严重,风力发电作为一种清洁能源得到了快速发展。然而风速和风功率的准确预测制约着大规模风力并网发电的稳定性,目前广泛采用的预测方法是数值预报(numerical weather prediction,NWP)和数据驱动建模(data-driven modeling)。数值预报基于气象公式能获得较稳定的气象预测,但其计算代价大,短期风速预测和超短期风速预测误差大。数据驱动建模则广泛应用于短期风速预测和超短期风速预测。主要算法有人工神经网络(artificial neural networks,ANNs)和支持向量机(support vector machines,SVMs),以及自回归移动均值模型(autoregressive moving average model,ARMA)和卡尔曼滤波法(Kalman filter)、递归神经网络等。
随着对风速规律认识的加深,研究发现风速具有较强的随机性,并且在不同的时段不同的季节,变化模式也不相同。针对风速这些特点,为了进一步提高风速预测的精度,目前主要从两方面来开展研究工作。一是采用混合模型的方式,2006年Sanchez较早的提出通过为不同的模型赋值一定的权重系数组合多个时间序列模型实现风能的短期预测,此后,很多风速预测的混合模型被相继提出。DL等人通过小波技术将风速划分为不同的分量。Fei等人提出EMD-MkRVR算法,通过模态分解的方式将数据分解为不同的分量。欧阳等人通过支持向量机对不同的样本采用不同的核函数提高风速预测精度。二则是采用聚类等方法提前对风速模式进行分解,再根据不同模式的特点来进行建模和预测。风速变化模式于2009年被首次提出。Kusiak和Li提出基于Kmeans算法分别在不同场景下对风速进行聚类,获得风速模式。Hu等人指出Kmeans算法善于发现圆形簇集并不利于风速变化模式的探索,提出通过GPCA(generalized principal component analysis)方法自动将风速划分为不同的簇集,得到风速模式。Lee和piao等人提出通过采用投影聚类(projected clustering)的方式得到风速模式。
然而现有的聚类方法主要采用的是风速的统计特性,如均值、方差等,或者直接将统计信息与风速的趋势信息简单串联为一个单独的特征信息,难以将风速变化中的趋势信息或统计信息作为一个独立整体的特征来进行模式聚类分析。
发明内容
针对现有技术,本发明提供一种基于多视角风速模式挖掘的短期风速预测方法。将波动曲线作为一个整体的特征和统计特征同时进行聚类分析,从而充分利用风速波动趋势信息和统计信息来进行风速模式的提取。将本发明方法应用到实际的风速预报数据中,可以有效的抽取出该数据中隐含的风速模式。本发明中,基于多视角的风速模式挖掘,可以将风速时间序列产生的内在机制的不同有效的区分开来,进而将风速样本划分成多个不同的簇集。在多视角聚类算法给出的结果上,对不同的簇集分别建立相应的风速预测模型,根据新样本所属的簇集选择相应的风速预测模型完成对风速的预测。
本发明所要解决的技术问题是:风速具有较强的随机性和不确定性,在不同的时段不同的季节有不同的变化模式,风速的变化模式不仅与风速的统计信息特征有关,还与风速变化趋势信息相关。传统的聚类技术和日相似性虽然在风速预测中考虑到了风速时间序列在不同的时段呈现出的变化规律不同,但是在聚类的过程中,仅考虑了一种特征对风速变化规律进行描述,或者单纯的将多种不同的特征进行简单的串联构成一个特征集。然而多种不同的特征应分别作为一个独立整体的特征进行处理,因为这些特征描述风速变化规律的视角不同。传统的经典聚类算法却无法在风速模式提取的过程中将不同的信息作为一个独立完整的特征。
为了解决上述技术问题,本发明提出的一种基于多视角风速模式挖掘的短期风速预测方法,包括以下步骤:
步骤一、采集风电场的风速历史数据,形成历史风速的时间序列S;
步骤二、通过互信息法确定时间序列S的延迟τ;
步骤三、根据步骤二获得的延迟τ将步骤一获得的风速时间序列S转换成为矩阵型数据,获得风速样本;
步骤四、根据步骤三获得的风速样本从风速的统计信息、风速变化趋势和风速波动趋势三个视角提取描述风速变化规律的特征信息;
步骤五、对风速样本进行归一化处理,获得归一化后的风速变化的特征信息;
步骤六、基于归一化后的风速变化的特征信息,通过多视角聚类算法对风速样本进行聚类,从而建立短期风速预测的模型;包括:先利用多视角聚类算法将训练集划分成k个不同的簇集,k的取值为2、3、4、5,当k的值为一个固定值时,分别建立k个SVR风速预测模型,统计k个SVR风速预测模型的平均训练误差,以与最小平均训练误差对应的k值作为k的最终取值;然后,依据k的最终取值利用多视角聚类算法将训练集划分成k个不同的簇集,分别建立k个SVR风速预测模型,并作为短期风速预测的模型;
步骤七、计算待预测的风速样本与上述k个簇集之间的欧式距离,利用其中欧式距离最小的簇集所对应的SVR风速预测模型完成风速预测。
本发明中,步骤一的具体过程为:采集安装在风电场的测风速设备所记录的风速大小的历史数据,按照时间点的先后顺序排列成序列,形成风速的时间序列数据。风速时间序列中相邻两点之间的时间间隔为10min;其中,风速时间序列如式(1)所示:
S={s(t),t=1,2,...,N} (1)
式(1)中,S表示风速的时间序列,s(t)表示风速时间序列S中各时间点的风速大小,t表示风速时间序列S中风速点按时间的先后关系排序后得到的序号,N为风速时间序列S中时间点的个数。
步骤二的具体过程为:设:变量X,Y均为离散变量,时间序列的延迟为τ,两个变量取值个数分别为m和n,变量X和Y通过以下方式由风速时间序列S获得:
(X,Y)=[s(t),s(t+τ)] (2)
则互信息计算方式如下:
I(X,Y)=H(X)+H(Y)-H(X,Y) (3)
其中,I(X,Y)表示互信息的大小,H(·)表示熵函数,P(·)表示概率密度函数,利用互信息法计算得到的信息值的极小值来确定时间序列的延迟τ。
步骤三的具体过程为:根据步骤二确定的时间序列的延迟τ将步骤一获得的风速时间序列S转换成为矩阵型数据data:
式(7)中,data代表风速时间序列转换成的矩阵型数据,该矩阵型数据data的每一行表示一个风速样本,每一列表示不同时刻的风速大小,其中,最右侧的一列表示待预测的风速大小,其他列均为风速样本的风速大小;v表示风速,t表示不同的时间点,m表示风速过去的m个状态,n表示由风速时间序列S获得的风速样本的个数。
步骤四的具体过程为:从获得的风速样本中提取描述风速变化的特征信息,包括风速的统计信息,风速的变化趋势信息,风速的波动趋势信息,所述风速的统计信息包括风速最大值、风速最小值、平均风速、风速波动程度和风速最大波动范围;
风速的变化趋势表示为:[v(t),v(t-1),v(t-2),…,v(t-(m-1))],其中,各项为对应时间点的风速;
风速的波动趋势表示为:[△v(t-1),△v(t-2),…,△v(t-(m-1))],其中,各项为相邻时间点风速大小的差分值;
风速最大值MAX[v(t),v(t-1),v(t-2),…,v(t-(m-1))],
风速最小值表示为:MIN[v(t),v(t-1),v(t-2),…,v(t-(m-1))],
平均风速表示为:MEAN[v(t),v(t-1),v(t-2),…,v(t-(m-1))],
风速波动程度表示为:
风速最大波动范围表示为[vmax-vmin];vmax=MAX[v(t),v(t-1),v(t-2),…,v(t-(m-1))],vmin=MIN[v(t),v(t-1),v(t-2),…,v(t-(m-1))]。
步骤五的具体过程为:确定风速变化的特征信息之后,需要对各特征信息进行归一化操作,归一化操作采用最大最小归一化:
式(8)中,ft表示归一化后的t时间点的特征向量,fmin表示该特征的最小值构成的向量,fmax表示该特征的最大值构成的向量。
步骤六中,计算SVR风速预测模型训练误差包括计算平均绝对值误差MAE和平均方差MSE,平均绝对值误差MAE和平均方差MSE的计算方式分别如下:
式(9)和式(10)中,yri为第i个样本的实际风速值,ypi为第i个样本的风速预测值,n是风速时间序列S获得的风速样本的个数。
与现有技术相比,本发明的有益效果是:
(1)本发明中,将风速变化规律的特征信息分类,而不是简单的特征串联,从多个不同的角度描述风速变化的规律模式,寻找风速时间序列内在机制的不同变化。本发明将风速样本划分成多个不同的簇集,分别在不同的簇集上建立风速预测模型。
(2)本发明中,采用多视角聚类算法完成风速变化模式的挖掘。传统的经典聚类算法无法在风速模式提取的过程中将不同的信息作为一个独立完整的特征,而是将多个不同的风速变化特征串联为一个特征集,串联后的特征隐藏了部分风速变化规律的信息,不能将特征信息单独分析,寻找到的风速变化模式不能很好的折射风速时间序列内在机制的不同。
(3)本发明基于多视角的聚类算法可以处理海量数据,因此在丰富的大量数据下可以更好的实现对风速模式的挖掘,而不是单纯的局限于短时间内的风速数据,因此提出的风速变化模式具有更好的全局性,不易陷入局部风速模式的挖掘;
附图说明
图1是本发明基于多视角风速模式挖掘的风速预测方法的流程图。
具体实施方式
下面结合附图和具体实施例对本发明技术方案作进一步详细描述,所描述的具体实施例仅对本发明进行解释说明,并不用以限制本发明。
本发明的原理是:提出了一种新的风速变化模式挖掘方法,对风速样本进行聚类采用多视角聚类算法,并且簇集的个数由最小的平均训练误差确定。风速具有较强的随机性,风速变化模式不仅仅由趋势信息特征折射,还可以通过统计特征信息折射,相比于传统的方法,本发明可以将不同类型的特征在聚类过程中单独作为一个独立完整的特征,使各特征之间不相互影响,进而提高信息的利用率,更好的获得风速变化模式,完成对风速的预测。
本发明的构思是:本发明方法通过多视角聚类算法将风速的统计特征,如风速均值、最大风速等作为一个独立完整的特征,从统计特征的角度描述风速变化规律;其次,将风速随时间变化的趋势信息作为一个独立完整的特征,即一个视角,从不同时间内风速变化趋势信息描述风速变化规律;最后,将通过差分计算获得的风速波动的趋势信息作为一个独立完整的特征,从风速在不同时间内的波动趋势描述风速的内在变化规律。基于此,本发明采用多视角聚类算法可以使得在聚类的过程将每一种特征作为一个独立整体的特征进行分析。
基于此,本发明提出的一种基于多视角风速模式挖掘的短期风速预测方法方法,包括以下步骤:
步骤一、采集风电场的风速历史数据,形成历史风速的时间序列S;
步骤二、通过互信息法确定时间序列S的延迟τ;
步骤三、根据步骤二获得的延迟τ将步骤一获得的风速时间序列S转换成为矩阵型数据,获得风速样本;
步骤四、根据步骤三获得的风速样本从风速的统计信息、风速变化趋势和风速波动趋势三个视角提取描述风速变化规律的特征信息;
步骤五、对风速样本进行归一化处理,获得归一化后的风速变化的特征信息;
步骤六、基于归一化后的风速变化的特征信息,通过多视角聚类算法对风速样本进行聚类,从而建立短期风速预测的模型;包括:先利用多视角聚类算法将训练集划分成k个不同的簇集,不同的簇集代表不同的风速模式,k的取值为2、3、4、5,当k的值为一个固定值时,分别建立k个SVR风速预测模型,统计k个SVR风速预测模型的平均训练误差,以与最小平均训练误差对应的k值作为k的最终取值;然后,依据k的最终取值利用多视角聚类算法将训练集划分成k个不同的簇集,分别建立k个SVR风速预测模型,并作为短期风速预测的模型;如图1所示。
步骤七、计算待预测的风速样本与上述k个簇集之间的欧式距离,利用其中欧式距离最小的簇集所对应的SVR风速预测模型完成风速预测。
本发明中:
步骤一的具体过程为:
采集安装在风电场的测风速设备所记录的风速大小的历史数据,按照时间点的先后顺序排列成序列,形成风速的时间序列数据。风速时间序列中相邻两点之间的时间间隔为10min左右,每个时间序列中数据采集间的时间间隔是固定的。以此该风速时间序列作为风速模式挖掘的原始时间序列。其中,风速时间序列可按照如下式(1)所示:
S={s(t),t=1,2,...,N} (1)
式(1)中,S表示风速的时间序列,s(t)表示风速时间序列S中各时间点的风速大小,t表示风速时间序列S中风速点按时间的先后关系排序后得到的序号,N为风速时间序列S中时间点的个数。
步骤二的具体过程为:
通过互信息法确定所得到的时间序列的延迟时间。互信息法是一种高效的计算序列之间相关关系的计算方法,设:变量X,Y均为离散变量,时间序列的延迟为τ,两个变量取值个数分别为m和n,变量X和Y通过以下方式由风速时间序列S获得:
(X,Y)=[s(t),s(t+τ)] (2)
则互信息计算方式如下:
I(X,Y)=H(X)+H(Y)-H(X,Y) (3)
其中,I(X,Y)表示互信息的大小,H(·)表示熵函数,P(·)表示概率密度函数,利用互信息法计算得到的信息值的极小值来确定时间序列的延迟τ。
步骤三的具体过程为:
根据步骤二确定的时间序列的延迟τ将步骤一获得的风速时间序列S转换成为矩阵型数据data,即矩阵的每一行表示一个样本,每一列表示一个样本的特征,获得风速变化样本;
式(7)中,data代表风速时间序列转换成的矩阵型数据,该矩阵型数据data的每一行表示一个风速样本,每一列表示不同时刻的风速大小,其中,最右侧的一列表示待预测的风速大小,其他列均为风速样本的风速大小;v表示风速,t表示不同的时间点,m表示风速过去的m个状态,n表示由风速时间序列S获得的风速样本的个数。
步骤四的具体过程为:
分别从获得的风速样本中提取描述风速变化的统计特征信息,其中包括风速的统计信息,风速的变化趋势信息,风速的波动趋势信息,所述风速的统计信息包括风速最大值、风速最小值、平均风速、风速波动程度和风速最大波动范围,形式如下表所示:
表中:t表示时间序列编号(即表示不同的时间点),m表示风速时间序列过去的状态。根据表1可以有效的提取到反应风速变化规律的特征信息,其中将所有的统计信息作为一个单独的视角,形成一个特征集。风速变化趋势作为一个视角,风速的波动趋势作为另外一个视角,从三个不同的角度刻画风速的变化规律。
步骤五的具体过程为:
确定风速变化的特征信息之后,需要对各特征信息进行归一化操作,归一化操作采用最大最小归一化:
式(8)中,ft表示归一化后的t时间点的特征向量,fmin表示该特征的最小值构成的向量,fmax表示该特征的最大值构成的向量。
步骤六中:
(一)计算SVR风速预测模型训练误差包括计算平均绝对值误差MAE((meanabsolute error,)和平均方差MSE(mean square error),平均绝对值误差MAE和平均方差MSE的计算方式分别如下:
式(9)和式(10)中,yri为第i个样本的实际风速值,ypi为第i个样本的风速预测值,n是风速时间序列S获得的风速样本的个数。
(二)多视角聚类过程中多视角数据的处理方式,其目标函数如下所示:
s.t.Z*≥0,U(υ)≥0,Z(υ)≥0,υ=1,2,...,nυ
其中表示基矩阵,表示第υ个视角数据中潜藏的特征矩阵,表示各个不同的视角其潜藏的特征矩阵的一致表示,k表示簇集的个数,αυ表示折中参数。当风速样本集中存在部分样本缺失时,可以通过赋予不同的权重来减弱缺失样本的副作用,其目标函数如下所示:
其中的W表示权重。为了进一步增强潜藏的特征矩阵的稀疏性,我们对矩阵增加洗属性约束,新的目标函数表示如下:
其中||·||1表示L1范数,βυ表示折中调节参数,在得到多个视角下的的潜藏特征矩阵之后,在此数据结果上进行传统的经典聚类算法,将数据集划分成多个不同的簇集,进而实现簇集的划分。
(三)采用支持向量回归建立风速预测模型,支持向量回归的预测函数的一般形式为:
其中为核函数,实现由低维空间到高维空间的映射,通常在核函数的选择中我们选择高斯核函数,b为偏置,s为支持向量的个数。其目标函数表示如下:
s.t.yi-ωxi-b≤ε+ξi
其中yi为输入xi对应的输出,C为惩罚系数,ε为不敏感度,ξi和是松弛变量,其中ξi,
利用本发明短期风速预测方法对待预测的新样本进行风速预测的基本过程是:根据待预测的新样本所属簇集的不同选择相应的风速预测模型完成风速的预测,当一个新的待预测风速样本出现时,根据步骤四对这个样本进行特征提取获得三个不同视角的特征,由步骤六确定了簇集的个数并进而确定各个簇集之后,从三个不同的视角计算各个簇集的中心,根据新样本从三个不同的视角距离各个簇集中心的欧式距离的和的欧式距离大小,选择最近的一个簇作为其所属的簇集。当确定了簇集之后,便可选择由该簇集上的风速样本训练出的风速样本对新样本进行风速预测。
尽管上面结合附图对本发明进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨的情况下,还可以做出很多变形,这些均属于本发明的保护之内。
Claims (7)
1.一种基于多视角风速模式挖掘的短期风速预测方法,其特征在于,包括以下步骤:
步骤一、采集风电场的风速历史数据,形成历史风速的时间序列S;
步骤二、通过互信息法确定时间序列S的延迟τ;
步骤三、根据步骤二获得的延迟τ将步骤一获得的风速时间序列S转换成为矩阵型数据,获得风速样本;
步骤四、根据步骤三获得的风速样本从风速的统计信息、风速变化趋势和风速波动趋势三个视角提取描述风速变化规律的特征信息;
步骤五、对风速样本进行归一化处理,获得归一化后的风速变化的特征信息;
步骤六、基于归一化后的风速变化的特征信息,通过多视角聚类算法对风速样本进行聚类,从而建立短期风速预测的模型;包括:先利用多视角聚类算法将训练集划分成k个不同的簇集,k的取值为2、3、4、5,当k的值为一个固定值时,分别建立k个SVR风速预测模型,统计k个SVR风速预测模型的平均训练误差,以与最小平均训练误差对应的k值作为k的最终取值;然后,依据k的最终取值利用多视角聚类算法将训练集划分成k个不同的簇集,分别建立k个SVR风速预测模型,并作为短期风速预测的模型;
步骤七、计算待预测的风速样本与上述k个簇集之间的欧式距离,利用其中欧式距离最小的簇集所对应的SVR风速预测模型完成风速预测。
2.根据权利要求1所述基于多视角风速模式挖掘的短期风速预测方法,其特征在于,步骤一的具体过程为:
采集安装在风电场的测风速设备所记录的风速大小的历史数据,按照时间点的先后顺序排列成序列,形成风速的时间序列数据。风速时间序列中相邻两点之间的时间间隔为10min;其中,风速时间序列如式(1)所示:
S={s(t),t=1,2,...,N} (1)
式(1)中,S表示风速的时间序列,s(t)表示风速时间序列S中各时间点的风速大小,t表示风速时间序列S中风速点按时间的先后关系排序后得到的序号,N为风速时间序列S中时间点的个数。
3.根据权利要求1所述基于多视角风速模式挖掘的短期风速预测方法,其特征在于,步骤二的具体过程为:
设:变量X,Y均为离散变量,时间序列的延迟为τ,两个变量取值个数分别为m和n,变量X和Y通过以下方式由风速时间序列S获得:
(X,Y)=[s(t),s(t+τ)] (2)
则互信息计算方式如下:
I(X,Y)=H(X)+H(Y)-H(X,Y) (3)
<mrow>
<mi>H</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>-</mo>
<munderover>
<mo>&Sigma;</mo>
<mi>i</mi>
<mi>m</mi>
</munderover>
<msub>
<mi>P</mi>
<mi>x</mi>
</msub>
<mo>&lsqb;</mo>
<mi>x</mi>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mi>log</mi>
<mo>{</mo>
<msub>
<mi>P</mi>
<mi>x</mi>
</msub>
<mo>&lsqb;</mo>
<mi>x</mi>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>}</mo>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>4</mn>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<mi>H</mi>
<mrow>
<mo>(</mo>
<mi>y</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>-</mo>
<munderover>
<mo>&Sigma;</mo>
<mi>j</mi>
<mi>n</mi>
</munderover>
<msub>
<mi>P</mi>
<mi>y</mi>
</msub>
<mo>&lsqb;</mo>
<mi>y</mi>
<mrow>
<mo>(</mo>
<mi>j</mi>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mi>l</mi>
<mi>o</mi>
<mi>g</mi>
<mo>{</mo>
<msub>
<mi>P</mi>
<mi>y</mi>
</msub>
<mo>&lsqb;</mo>
<mi>y</mi>
<mrow>
<mo>(</mo>
<mi>j</mi>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>}</mo>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>5</mn>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<mi>H</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>,</mo>
<mi>y</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>-</mo>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>,</mo>
<mi>y</mi>
</mrow>
</munder>
<msub>
<mi>P</mi>
<mrow>
<mi>x</mi>
<mo>,</mo>
<mi>y</mi>
</mrow>
</msub>
<mo>&lsqb;</mo>
<mi>x</mi>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>)</mo>
</mrow>
<mo>,</mo>
<mi>y</mi>
<mrow>
<mo>(</mo>
<mi>j</mi>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mi>l</mi>
<mi>o</mi>
<mi>g</mi>
<mo>{</mo>
<msub>
<mi>P</mi>
<mrow>
<mi>x</mi>
<mi>y</mi>
</mrow>
</msub>
<mo>&lsqb;</mo>
<mi>x</mi>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>)</mo>
</mrow>
<mo>,</mo>
<mi>y</mi>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>}</mo>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>6</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,I(X,Y)表示互信息的大小,H(·)表示熵函数,P(·)表示概率密度函数,利用互信息法计算得到的信息值的极小值来确定时间序列的延迟τ。
4.根据权利要求1所述基于多视角风速模式挖掘的短期风速预测方法,其特征在于,步骤三的具体过程为:
根据步骤二确定的时间序列的延迟τ将步骤一获得的风速时间序列S转换成为矩阵型数据data:
<mrow>
<mi>d</mi>
<mi>a</mi>
<mi>t</mi>
<mi>a</mi>
<mo>=</mo>
<mfenced open = "[" close = "]">
<mtable>
<mtr>
<mtd>
<msub>
<mi>v</mi>
<mrow>
<mi>t</mi>
<mo>-</mo>
<mi>n</mi>
<mo>-</mo>
<mi>m</mi>
</mrow>
</msub>
</mtd>
<mtd>
<mo>.</mo>
</mtd>
<mtd>
<mo>.</mo>
</mtd>
<mtd>
<msub>
<mi>v</mi>
<mrow>
<mi>t</mi>
<mo>-</mo>
<mi>n</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
</msub>
</mtd>
<mtd>
<msub>
<mi>v</mi>
<mrow>
<mi>t</mi>
<mo>-</mo>
<mi>n</mi>
</mrow>
</msub>
</mtd>
</mtr>
<mtr>
<mtd>
<mo>.</mo>
</mtd>
<mtd>
<mo>.</mo>
</mtd>
<mtd>
<mo>.</mo>
</mtd>
<mtd>
<mo>.</mo>
</mtd>
<mtd>
<mo>.</mo>
</mtd>
</mtr>
<mtr>
<mtd>
<mo>.</mo>
</mtd>
<mtd>
<mo>.</mo>
</mtd>
<mtd>
<mo>.</mo>
</mtd>
<mtd>
<mo>.</mo>
</mtd>
<mtd>
<mo>.</mo>
</mtd>
</mtr>
<mtr>
<mtd>
<mo>.</mo>
</mtd>
<mtd>
<mo>.</mo>
</mtd>
<mtd>
<mo>.</mo>
</mtd>
<mtd>
<mo>.</mo>
</mtd>
<mtd>
<mo>.</mo>
</mtd>
</mtr>
<mtr>
<mtd>
<msub>
<mi>v</mi>
<mrow>
<mi>t</mi>
<mo>-</mo>
<mi>m</mi>
</mrow>
</msub>
</mtd>
<mtd>
<mo>.</mo>
</mtd>
<mtd>
<mo>.</mo>
</mtd>
<mtd>
<msub>
<mi>v</mi>
<mrow>
<mi>t</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
</msub>
</mtd>
<mtd>
<msub>
<mi>v</mi>
<mi>t</mi>
</msub>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>7</mn>
<mo>)</mo>
</mrow>
</mrow>
式(7)中,data代表风速时间序列转换成的矩阵型数据,该矩阵型数据data的每一行表示一个风速样本,每一列表示不同时刻的风速大小,其中,最右侧的一列表示待预测的风速大小,其他列均为风速样本的风速大小;v表示风速,t表示不同的时间点,m表示风速过去的m个状态,n表示由风速时间序列S获得的风速样本的个数。
5.根据权利要求1所述基于多视角风速模式挖掘的短期风速预测方法,其特征在于,步骤四的具体过程为:
从获得的风速样本中提取描述风速变化的特征信息,包括风速的统计信息,风速的变化趋势信息,风速的波动趋势信息,所述风速的统计信息包括风速最大值、风速最小值、平均风速、风速波动程度和风速最大波动范围;
风速的变化趋势表示为:[v(t),v(t-1),v(t-2),…,v(t-(m-1))],其中,各项为对应时间点的风速;
风速的波动趋势表示为:[△v(t-1),△v(t-2),…,△v(t-(m-1))],其中,各项为相邻时间点风速大小的差分值;
风速最大值MAX[v(t),v(t-1),v(t-2),…,v(t-(m-1))],
风速最小值表示为:MIN[v(t),v(t-1),v(t-2),…,v(t-(m-1))],
平均风速表示为:MEAN[v(t),v(t-1),v(t-2),…,v(t-(m-1))],
风速波动程度表示为:
风速最大波动范围表示为[vmax-vmin];vmax=MAX[v(t),v(t-1),v(t-2),…,v(t-(m-1))],vmin=MIN[v(t),v(t-1),v(t-2),…,v(t-(m-1))]。
6.根据权利要求1所述基于多视角风速模式挖掘的短期风速预测方法,其特征在于,步骤五的具体过程为:
确定风速变化的特征信息之后,需要对各特征信息进行归一化操作,归一化操作采用最大最小归一化:
<mrow>
<msub>
<mi>f</mi>
<mi>t</mi>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<msub>
<mi>f</mi>
<mi>t</mi>
</msub>
<mo>-</mo>
<msub>
<mi>f</mi>
<mi>min</mi>
</msub>
</mrow>
<mrow>
<msub>
<mi>f</mi>
<mi>max</mi>
</msub>
<mo>-</mo>
<msub>
<mi>f</mi>
<mi>min</mi>
</msub>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>8</mn>
<mo>)</mo>
</mrow>
</mrow>
式(8)中,ft表示归一化后的t时间点的特征向量,fmin表示该特征的最小值构成的向量,fmax表示该特征的最大值构成的向量。
7.根据权利要求1所述基于多视角风速模式挖掘的短期风速预测方法,其特征在于,步骤六中,计算SVR风速预测模型训练误差包括计算平均绝对值误差MAE和平均方差MSE,平均绝对值误差MAE和平均方差MSE的计算方式分别如下:
<mrow>
<mi>M</mi>
<mi>A</mi>
<mi>E</mi>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<mi>n</mi>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<mo>|</mo>
<mrow>
<msub>
<mi>y</mi>
<mrow>
<mi>r</mi>
<mi>i</mi>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>y</mi>
<mrow>
<mi>p</mi>
<mi>i</mi>
</mrow>
</msub>
</mrow>
<mo>|</mo>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>9</mn>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<mi>M</mi>
<mi>S</mi>
<mi>E</mi>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<mi>n</mi>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>y</mi>
<mrow>
<mi>r</mi>
<mi>i</mi>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>y</mi>
<mrow>
<mi>p</mi>
<mi>i</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>10</mn>
<mo>)</mo>
</mrow>
</mrow>
式(9)和式(10)中,yri为第i个样本的实际风速值,ypi为第i个样本的风速预测值,n是风速时间序列S获得的风速样本的个数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711001445.1A CN107895202B (zh) | 2017-10-24 | 2017-10-24 | 基于多视角风速模式挖掘的短期风速预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711001445.1A CN107895202B (zh) | 2017-10-24 | 2017-10-24 | 基于多视角风速模式挖掘的短期风速预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107895202A true CN107895202A (zh) | 2018-04-10 |
CN107895202B CN107895202B (zh) | 2022-03-04 |
Family
ID=61803736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711001445.1A Expired - Fee Related CN107895202B (zh) | 2017-10-24 | 2017-10-24 | 基于多视角风速模式挖掘的短期风速预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107895202B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109615027A (zh) * | 2018-12-29 | 2019-04-12 | 中南大学 | 一种高速铁路沿线风速特征提取智能预测方法 |
CN109886825A (zh) * | 2018-12-25 | 2019-06-14 | 北京农业信息技术研究中心 | 一种农业物联网数据多视角投影聚类重构方法及*** |
CN111159900A (zh) * | 2019-12-30 | 2020-05-15 | 国核电力规划设计研究院有限公司 | 风机风速的预测方法及装置 |
CN112015784A (zh) * | 2020-09-07 | 2020-12-01 | 华北电力大学(保定) | 风况数据挖掘方法、装置、测风装置和数据挖掘设备 |
WO2022033258A1 (zh) * | 2020-08-14 | 2022-02-17 | 中国科学院分子细胞科学卓越创新中心 | 基于自动储层神经网络的多步预测未来风速的方法和*** |
CN117688464A (zh) * | 2024-02-04 | 2024-03-12 | 国网上海市电力公司 | 一种基于多源传感器数据的隐患分析方法及*** |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101793907A (zh) * | 2010-02-05 | 2010-08-04 | 浙江大学 | 一种风电场短期风速预测方法 |
CN103258142A (zh) * | 2013-06-04 | 2013-08-21 | 哈尔滨工业大学 | 基于天气模式的风电场短期风速预测方法 |
CN103324980A (zh) * | 2013-04-25 | 2013-09-25 | 华北电力大学(保定) | 一种风电场风速预测方法 |
CN105654207A (zh) * | 2016-01-07 | 2016-06-08 | 国网辽宁省电力有限公司锦州供电公司 | 基于风速、风向信息的风电功率预测方法 |
CN105719029A (zh) * | 2016-03-11 | 2016-06-29 | 中国农业大学 | 一种基于风速波动特征提取的风电功率组合预测方法 |
CN106529719A (zh) * | 2016-11-08 | 2017-03-22 | 中国地质大学(武汉) | 基于粒子群优化算法风速融合的风电功率预测的方法 |
-
2017
- 2017-10-24 CN CN201711001445.1A patent/CN107895202B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101793907A (zh) * | 2010-02-05 | 2010-08-04 | 浙江大学 | 一种风电场短期风速预测方法 |
CN103324980A (zh) * | 2013-04-25 | 2013-09-25 | 华北电力大学(保定) | 一种风电场风速预测方法 |
CN103258142A (zh) * | 2013-06-04 | 2013-08-21 | 哈尔滨工业大学 | 基于天气模式的风电场短期风速预测方法 |
CN105654207A (zh) * | 2016-01-07 | 2016-06-08 | 国网辽宁省电力有限公司锦州供电公司 | 基于风速、风向信息的风电功率预测方法 |
CN105719029A (zh) * | 2016-03-11 | 2016-06-29 | 中国农业大学 | 一种基于风速波动特征提取的风电功率组合预测方法 |
CN106529719A (zh) * | 2016-11-08 | 2017-03-22 | 中国地质大学(武汉) | 基于粒子群优化算法风速融合的风电功率预测的方法 |
Non-Patent Citations (2)
Title |
---|
刘兴杰等: "基于经验模式分解和时间序列分析的风电场风速预测", 《太阳能学报》 * |
张充 等: "基于风速变化周期的风电场功率分类组合预测模型", 《太阳能学报》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109886825A (zh) * | 2018-12-25 | 2019-06-14 | 北京农业信息技术研究中心 | 一种农业物联网数据多视角投影聚类重构方法及*** |
CN109886825B (zh) * | 2018-12-25 | 2021-06-29 | 北京农业信息技术研究中心 | 一种农业物联网数据多视角投影聚类重构方法及*** |
CN109615027A (zh) * | 2018-12-29 | 2019-04-12 | 中南大学 | 一种高速铁路沿线风速特征提取智能预测方法 |
CN111159900A (zh) * | 2019-12-30 | 2020-05-15 | 国核电力规划设计研究院有限公司 | 风机风速的预测方法及装置 |
CN111159900B (zh) * | 2019-12-30 | 2024-02-09 | 国核电力规划设计研究院有限公司 | 风机风速的预测方法及装置 |
WO2022033258A1 (zh) * | 2020-08-14 | 2022-02-17 | 中国科学院分子细胞科学卓越创新中心 | 基于自动储层神经网络的多步预测未来风速的方法和*** |
CN112015784A (zh) * | 2020-09-07 | 2020-12-01 | 华北电力大学(保定) | 风况数据挖掘方法、装置、测风装置和数据挖掘设备 |
CN112015784B (zh) * | 2020-09-07 | 2024-02-13 | 华北电力大学(保定) | 风况数据挖掘方法、装置、测风装置和数据挖掘设备 |
CN117688464A (zh) * | 2024-02-04 | 2024-03-12 | 国网上海市电力公司 | 一种基于多源传感器数据的隐患分析方法及*** |
CN117688464B (zh) * | 2024-02-04 | 2024-04-19 | 国网上海市电力公司 | 一种基于多源传感器数据的隐患分析方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN107895202B (zh) | 2022-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107895202A (zh) | 基于多视角风速模式挖掘的短期风速预测方法 | |
Zhao et al. | Correlation-constrained and sparsity-controlled vector autoregressive model for spatio-temporal wind power forecasting | |
CN109146162B (zh) | 一种基于集成循环神经网络的概率风速预测方法 | |
CN103268366B (zh) | 一种适用于分散式风电场的组合风电功率预测方法 | |
CN115293415A (zh) | 计及时间演变和空间相关的多风电场短期功率预测方法 | |
CN108985965A (zh) | 一种结合神经网络和参数估计的光伏功率区间预测方法 | |
CN107730044A (zh) | 一种可再生能源发电和负荷的混合预测方法 | |
CN106971240A (zh) | 一种变量选择与高斯过程回归的短期负荷预测方法 | |
CN111210082A (zh) | 一种基于优化的bp神经网络算法的降水量预测方法 | |
CN107194600A (zh) | 一种电力负荷季节特性分类方法 | |
CN105868853A (zh) | 一种短期风电功率组合概率预测方法 | |
CN108428015A (zh) | 一种基于历史气象数据和随机模拟的风电功率预测方法 | |
CN110263998B (zh) | 多源数值天气预报集合双层修正方法 | |
CN106295857A (zh) | 一种风电功率超短期预测方法 | |
CN110263971A (zh) | 基于支持向量机的超短期风电功率组合预测方法 | |
CN105303250A (zh) | 一种基于最优权系数的风电功率组合预测方法 | |
CN113255210A (zh) | 一种风电机组联邦故障诊断方法及*** | |
CN108335010A (zh) | 一种风电出力时间序列建模方法及*** | |
CN109902340A (zh) | 一种计及复杂气象耦合特性的多源-荷联合场景生成方法 | |
CN110197307A (zh) | 一种结合注意力机制的区域型海表面温度预测方法 | |
CN114169445A (zh) | 基于cae和gan混合网络的日前光伏功率预测方法、装置与*** | |
CN114792158A (zh) | 基于时空融合图神经网络的多风电场短期功率预测方法 | |
Wang et al. | Improved prediction method of PV output power based on optimised chaotic phase space reconstruction | |
CN105844334A (zh) | 一种基于径向基神经网络的温度插值算法 | |
CN108694475B (zh) | 基于混合模型的短时间尺度光伏电池发电量预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220304 |