CN109615027A - 一种高速铁路沿线风速特征提取智能预测方法 - Google Patents
一种高速铁路沿线风速特征提取智能预测方法 Download PDFInfo
- Publication number
- CN109615027A CN109615027A CN201811643482.7A CN201811643482A CN109615027A CN 109615027 A CN109615027 A CN 109615027A CN 201811643482 A CN201811643482 A CN 201811643482A CN 109615027 A CN109615027 A CN 109615027A
- Authority
- CN
- China
- Prior art keywords
- wind speed
- model
- forecasting
- value
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 10
- 239000013598 vector Substances 0.000 claims abstract description 103
- 238000012216 screening Methods 0.000 claims abstract description 56
- 238000000034 method Methods 0.000 claims abstract description 38
- 238000013480 data collection Methods 0.000 claims abstract description 20
- 238000013528 artificial neural network Methods 0.000 claims description 46
- 238000012549 training Methods 0.000 claims description 46
- 239000000203 mixture Substances 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 7
- 239000012141 concentrate Substances 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 238000003064 k means clustering Methods 0.000 claims description 5
- 241001269238 Data Species 0.000 claims description 3
- 235000009413 Ratibida columnifera Nutrition 0.000 claims description 3
- 241000510442 Ratibida peduncularis Species 0.000 claims description 3
- 230000003111 delayed effect Effects 0.000 claims description 3
- 238000003780 insertion Methods 0.000 claims description 3
- 230000037431 insertion Effects 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 230000001537 neural effect Effects 0.000 claims description 3
- 210000005036 nerve Anatomy 0.000 claims description 2
- 238000003825 pressing Methods 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 abstract description 4
- 239000000284 extract Substances 0.000 abstract description 3
- 238000010219 correlation analysis Methods 0.000 abstract description 2
- 238000010801 machine learning Methods 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 4
- 238000013277 forecasting method Methods 0.000 description 3
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Marketing (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种高速铁路沿线风速特征提取智能预测方法,该方法利用风速不同特征进行K‑means聚类,并选择最优聚类数K,将风速模型样本分为K类,然后针对K个聚类类别分别建立100个风速预测特征预选模型,利用数学分析和相关性分析方法筛选风速预测特征预选模型并建立K个风速预测特征模型组和K个风速预测归一模型,最后分析预测的风速向量与风速时间序列数据集之间的相关性并还原真实风速,该方法具有预测高精度、特征智能提取、适应性强、鲁棒性高的特点,适合应用于大风环境下的高速铁路沿线安全等领域。
Description
技术领域
本发明涉及一种高速铁路沿线风速特征提取智能预测方法。
背景技术
近年来,风速预测迅速成为国内外热门研究领域之一。风速预测方法在大风环境下的高速铁路沿线安全方面有着越来越大的作用和广泛应用。风速预测方法应用于大风环境下的铁路沿线安全,实时精确预测未来风速能为列车提供更多提前预警处理时间,形成安全行车方案,保证行车安全。
风速会受到季节、温度、海拔等因素的影响,其具有很强的随机性和复杂的非线性特点。目前风速预测方法主要有学习方法、物理方法和统计方法。机器学习方法在近年来得到快速发展,因此使用机器学习方法对复杂非线性的风速进行预测更为可取,常用模型有人工神经网络、卡尔曼滤波、时间序列分析等。
为解决风速预测中的非平稳非线性的问题,有效提取风速特征,对风速进行高精度的预测,急需提供一种高速铁路沿线风速特征提取智能预测方法,实现对风速的高精度、强适应性、高鲁棒性的预测。
发明内容
本发明提供了一种高速铁路沿线风速特征提取智能预测方法,其目的在于,通过聚类算法和机器学习算法分析高速铁路沿线大风环境下风速特性,并提取的风速特征,建立多种神经网络模型,对高速铁路沿线风速进行准确有效的预测。
一种高速铁路沿线风速特征提取智能预测方法,包括以下步骤:
步骤1:通过测风站获取原始风速时间序列数据集;
在高速铁路沿线指定位置设置测风站,通过测风站获取原始风速时间序列数据集;
所述原始风速时间序列数据集共由n个原始风速数据组成;其中Δt为风速采样时间间隔;n为采样次数,n至少大于500;
步骤2:建立风速模型样本A;
所述风速模型样本A包括风速模型训练样本Aa和风速模型筛选样本Ab;
建立风速模型样本A的具体过程如下:
步骤A1:对原始风速时间序列数据集进行卡尔曼滤波,得到滤波后的风速时间序列数据集和噪声时间序列数据集;
步骤A2:将风速时间序列数据集中任意连续4个时刻的风速作为一组风速向量,得到包含有n-3组风速向量的风速模型样本A;
不同的所述风速向量中可能出现同一时刻的风速值;
步骤A3:按采样时间顺序,从风速模型样本A中,选取前3/4的风速向量组成风速模型训练样本Aa,剩余的风速向量组成风速模型筛选样本Ab;
步骤3:使用K-means聚类方法,对风速模型样本A中的每一组风速向量进行聚类,选取最优聚类数K,得到K个聚类中心时间序列;
步骤4:依据已经聚为K个聚类类别的风速模型样本A,将风速模型训练样本Aa分为K个对应聚类类别的风速模型训练子样本{Aa,1,Aa,2,…,Aa,K},将风速模型筛选样本Ab分为K个对应风速模型筛选子样本{Ab,1,Ab,2,…,Ab,K};
步骤5:针对K个风速模型训练子样本,建立K种基于Elman神经网络的风速预测特征预选模型各100个;
所述基于Elman神经网络的风速预测特征预选模型输出值命名为风速特征预选值;
步骤6:筛选模型,分别将K种基于Elman神经网络的风速预测特征预选模型各100个筛选至各10个;
步骤7:每种聚类类别的10个风速预测特征预选模型组成风速预测特征模型组,得到K个风速预测特征模型组;
所述风速预测特征模型组包括10个风速预测特征预选模型,每个风速预测特征模型组输出数据组成长度为10的向量命名为风速特征向量;
步骤8:针对K个风速预测特征模型组,建立K个基于小波神经网络的风速预测归一模型;
所述风速预测归一模型输出值设定为风速归一值;
步骤9:实时预测风速;
实时采集当前时刻及近期的风速数据,数据采样时间间隔应保持与步骤1中使用的原始风速时间序列数据集的风速采样时间间隔Δt一致,进行实时预测风速的具体过程如下:
步骤B1:设置风速预测目标时间T,通过测风站获取与目标时间T最接近的至少200个时刻的原始风速值组成原始风速时间序列,进入步骤B2;
步骤B2:对原始风速时间序列进行卡尔曼滤波,得到滤波后的风速时间序列,进入步骤B3;
步骤B3:计算风速时间序列中与目标时间T最接近的4个时刻的风速值与步骤3得出的K个聚类中心时间序列的欧式距离,以距离最小原则选择对应聚类类别的风速预测特征模型组,将风速时间序列中与目标时间T最接近的3个时刻的风速值作为输入数据,输入到风速预测特征模型组中,输出得到长度为10的风速特征向量,进入步骤B4;
步骤B4:将风速特征向量作为输入数据,输入到对应聚类类别的风速预测归一模型,输出风速归一值,进入步骤B5;
步骤B5:判断步骤B4输出风速归一值所在时刻是否大于目标时间T,若是,进入步骤B7,否则,进入步骤B6;
步骤B6:将步骤B4输出的风速归一值***到风速时间序列首位,更新风速时间序列,返回步骤B3;
步骤B7:计算风速时间序列中与目标时间T最接近的100个时刻的风速值组成的向量与步骤2中得到的风速时间序列数据集任意连续的100个时刻的风速值组成的向量之间的皮尔逊相关系数,选择皮尔逊相关系数最高的风速时间序列数据集中一组100个时刻的风速值组成的向量,将步骤2中的噪声时间序列数据集对应时刻的滤波噪声附加在风速时间序列与目标时间T最接近的100个时刻中,即还原预测风速真实性,完成目标时刻的风速预测。
进一步地,所述使用K-means聚类方法,对风速模型样本A中的每一组风速向量进行聚类,选取最优聚类数K,得到K个聚类中心时间序列的具体过程如下:
步骤2.1:设置K-means聚类数K’,K’=1;
步骤2.2:采用欧式距离作为相似性度量函数,对风速模型样本A中的每一组风速向量进行聚类,获得K’个聚类类别和K’个聚类中心时间序列;
所述欧式距离的计算公式为其中,X=(x1,x2,x3,x4),Y=(y1,y2,y3,y4)分别为两个不同的风速向量,d(X,Y)为风速向量X,Y之间的欧式距离;
步骤2.3:计算K-means聚类的误差平方和SSE(K′);
其中,K′是聚类数,Ci是第i个聚类类别,p是Ci类中的一组风速向量,mi是Ci类的聚类中心;
步骤2.4:判断K’值是否等于20,若是,进入步骤2.5,否则,令K’=K’+1,然后返回步骤2.2;
步骤2.5:分别计算当K’=2至19时的每个α(K′)和β(K′)值,然后进入步骤2.6;
α(K′)=arctan(SSE(K′)-SSE(K′+1)),α∈(0°,90°),K′∈[2,19]
β(K′)=arctan(SSE(K′)-SSE(K′-1)),β∈(90°,180°),K′∈[2,19];
步骤2.6:分别计算当K’=2至19时的每个α(K′)+β(K′)值,选取使得α(K′)+β(K′)最大时的K’值作为最优聚类数K,得到K个聚类中心时间序列。
进一步地,所述针对K个风速模型训练子样本,建立K种基于Elman神经网络的风速预测特征预选模型各100个的过程为:依次将K个风速模型训练子样本中的每组风速向量前3个时刻的风速值作为输入数据,第4个时刻的风速值作为输出数据,训练Elman神经网络,针对每个风速模型训练子样本训练得到的Elman神经网络分别随机设置100种不同取值的Elman神经网络参数,得到K种基于Elman神经网络的风速预测特征预选模型各100个,共100*K个基于Elman神经网络的风速预测特征预选模型。
进一步地,所述100*K个基于Elman神经网络的风速预测特征预选模型在训练时均设置输入层节点个数为3,隐含层节点个数设置范围为[5,10],输出层节点个数为1,承接层节点个数为7,隐含层函数采用Sigmoid函数,网络的训练采用BP算法,最大迭代次数设置为800,训练学习率设置范围为[0.001,0.5],阈值为0.005。
进一步地,所述筛选模型,分别将K种基于Elman神经网络的风速预测特征预选模型各100个筛选至各10个的具体过程如下:
步骤5.1:依次将K个风速模型筛选子样本{Ab,1,Ab,2,…,Ab,K}中的每组风速向量前3个时刻的风速值作为输入数据,分别输入到对应聚类类别的100个风速预测特征预选模型中;
步骤5.2:初步筛选风速预测特征预选模型;
依次计算每个风速预测特征预选模型输出的风速特征预选值按时间次序组成的一维向量与风速模型筛选样本Ab中对应时刻的风速值组成的一维向量的均方误差,淘汰均方误差大于均方误差均值的风速预测特征预选模型;
步骤5.3:建立筛选向量;
分别利用K个聚类中心时间序列中与当前时刻最接近的3个时刻的风速值建立K个长度为3的筛选向量;
步骤5.4:更新筛选向量;
分别将K个筛选向量前3个时刻的风速数据作为输入数据,输入至对应聚类类别的风速预测特征预选模型中,将输出的第4个时刻的风速特征预选值***筛选向量第一位置,其余数据位置顺序依次延后,重复此步骤直到K个筛选向量长度均达到200;
步骤5.5:再次筛选风速预测特征预选模型;
分别计算每种聚类类别的风速预测特征预选模型得到的筛选向量两两之间的皮尔逊相关系数,得到K个皮尔逊相关系数矩阵,分别计算每个筛选向量与其他筛选向量之间的皮尔逊相关系数的累加值,逐步淘汰皮尔逊相关系数累加值最大对应的风速预测特征预选模型,直到每种聚类类别的风速预测特征预选模型均剩余10个。
进一步地,所述针对K个风速预测特征模型组,建立K个基于小波神经网络的风速预测归一模型的具体过程如下:
步骤6.1:依次将风速模型样本A中的每组风速向量前3个时刻的风速值作为输入数据,输入到对应聚类类别的风速预测特征模型组中,输出得到风速特征向量;
步骤6.2:依次将步骤6.1得到的风速特征向量作为输入数据,风速模型样本A中对应的第4个时刻的风速值作为输出数据,训练小波神经网络,得到针对K个风速预测特征模型组的K个基于小波神经网络的风速预测归一模型。
进一步地,所述基于小波神经网络的风速预测归一模型在训练时均设置输入层节点个数为10,隐含层小波元个数为20,输出层节点个数为1;隐层小波神经元采用MexicanHat小波函数,输出层节点采用Sigmoid函数,训练过程中的最大迭代次数设置为500,训练学习率为0.04,阈值为0.002。
有益效果
本发明提供了一种高速铁路沿线风速特征提取智能预测方法,该方法针对高速铁路沿线大风环境下的复杂、非线性、非平稳风速,通过聚类算法和机器学习算法,对风速数据进行聚类分析,选择聚类效果最好的聚类数K,将风速模型样本分为K类,并对每种聚类簇的风速模型样本建立100个风速预测特征预选模型,通过数学分析方法分别筛选效果好的10个模型组建成K个风速预测特征模型组提取风速特征,然后建立K个风速预测归一模型,将风速预测特征模型组的特征输出值进行归一,最后通过相关性分析,还原风速的真实性;
该方法利用聚类算法将风速数据进行聚类,并针对每种聚类簇单独构建多种不同神经网络模型,有效地提取风速特征;风速预测过程中针对风速不同特征类型进行聚类分析,建立风速预测特征模型组,最后对风速特征输出进行归一,可以有效避免风速的非平稳性变化,从而找出风速特征值,具有预测高精度、特征智能提取、适应性强、鲁棒性高的特点,适合应用于大风环境下的高速铁路沿线安全等领域。
附图说明
图1为本发明所述方法的流程示意图。
具体实施方式
下面将结合附图和实例对本发明做进一步的说明。
如图1所示,一种高速铁路沿线风速特征提取智能预测方法,包括以下步骤:
步骤1:通过测风站获取原始风速时间序列数据集;
在高速铁路沿线指定位置设置测风站,通过测风站获取原始风速时间序列数据集w(t)=[w(t=Δt),w(t=2*Δt),…,w(t=n*Δt)];
所述原始风速时间序列数据集共由n个原始风速数据组成;其中Δt为风速采样时间间隔;n为采样次数,n至少大于500;
步骤2:建立风速模型样本A;
所述风速模型样本A包括风速模型训练样本Aa和风速模型筛选样本Ab;
建立风速模型样本A的具体过程如下:
步骤A1:对原始风速时间序列数据集进行卡尔曼滤波,得到滤波后的风速时间序列数据集w′(t)=[w′(t=Δt),w′(t=2*Δt),…,w′(t=n*Δt)]和噪声时间序列数据集no(t)=[no(t=Δt),no(t=2*Δt),…,no(t=n*Δt)];
步骤A2:将风速时间序列数据集中任意连续4个时刻的风速作为一组风速向量,得到包含有n-3组风速向量的风速模型样本A;
不同的所述风速向量中可能出现同一时刻的风速值,所述风速模型样本A表示为:
其中,风速模型样本A中的每一行表示一组风速向量,共n-3组风速向量;
步骤A3:按采样时间顺序,从风速模型样本A中,选取前组风速向量组成风速模型训练样本Aa,剩余的风速向量组成风速模型筛选样本Ab;
步骤3:使用K-means聚类方法,对风速模型样本A中的每一组风速向量进行聚类,选取最优聚类数K,得到K个聚类中心时间序列,具体过程如下:
步骤2.1:设置K-means聚类数K’,K’=1;
步骤2.2:采用欧式距离作为相似性度量函数,对风速模型样本A中的每一组风速向量进行聚类,获得K’个聚类类别和K’个聚类中心时间序列;
所述欧式距离的计算公式为其中,X=(x1,x2,x3,x4),Y=(y1,y2,y3,y4)分别为两个不同的风速向量,d(X,Y)为风速向量X,Y之间的欧式距离;
步骤2.3:计算K-means聚类的误差平方和SSE(K′);
其中,K′是聚类数,Ci是第i个聚类类别,p是Ci类中的一组风速向量,mi是Ci类的聚类中心;
步骤2.4:判断K’值是否等于20,若是,进入步骤2.5,否则,令K’=K’+1,然后返回步骤2.2;
步骤2.5:分别计算当K’=2至19时的每个α(K′)和β(K′)值,然后进入步骤2.6;
α(K′)=arctan(SSE(K′)-SSE(K′+1)),α∈(0°,90°),K′∈[2,19]
β(K′)=arctan(SSE(K′)-SSE(K′-1)),β∈(90°,180°),K′∈[2,19];
步骤2.6:分别计算当K’=2至19时的每个α(K′)+β(K′)值,选取使得α(K′)+β(K′)最大时的K’值作为最优聚类数K,得到K个聚类中心时间序列;
步骤4:依据已经聚为K个聚类类别的风速模型样本A,将风速模型训练样本Aa分为K个对应聚类类别的风速模型训练子样本{Aa,1,Aa,2,…,Aa,K},将风速模型筛选样本Ab分为K个对应风速模型筛选子样本{Ab,1,Ab,2,…,Ab,K};
步骤5:针对K个风速模型训练子样本,建立K种基于Elman神经网络的风速预测特征预选模型各100个;
所述基于Elman神经网络的风速预测特征预选模型输出值命名为风速特征预选值;
所述针对K个风速模型训练子样本,建立K种基于Elman神经网络的风速预测特征预选模型各100个的过程为:依次将K个风速模型训练子样本中的每组风速向量前3个时刻的风速值作为输入数据,第4个时刻的风速值作为输出数据,训练Elman神经网络,针对每个风速模型训练子样本训练得到的Elman神经网络分别随机设置100种不同取值的Elman神经网络参数,得到K种基于Elman神经网络的风速预测特征预选模型各100个,共100*K个基于Elman神经网络的风速预测特征预选模型,表示为:
其中,M_Elman表示100*K个基于Elman神经网络的风速预测特征预选模型,每一行表示同一聚类类型的100个风速预测特征预选模型,共K行;
所述100*K个基于Elman神经网络的风速预测特征预选模型在训练时均设置输入层节点个数为3,隐含层节点个数设置范围为[5,10],输出层节点个数为1,承接层节点个数为7,隐含层函数采用Sigmoid函数,网络的训练采用BP算法,最大迭代次数设置为800,训练学习率设置范围为[0.001,0.5],阈值为0.005;
步骤6:筛选模型,分别将K种基于Elman神经网络的风速预测特征预选模型各100个筛选至各10个,具体过程如下:
步骤5.1:依次将K个风速模型筛选子样本{Ab,1,Ab,2,…,Ab,K}中的每组风速向量前3个时刻的风速值作为输入数据,分别输入到对应聚类类别的100个风速预测特征预选模型中;
步骤5.2:初步筛选风速预测特征预选模型;
依次计算每个风速预测特征预选模型输出的风速特征预选值按时间次序组成的一维向量与风速模型筛选样本Ab中对应时刻的风速值组成的一维向量的均方误差,淘汰均方误差大于均方误差均值的风速预测特征预选模型;
步骤5.3:建立筛选向量;
分别利用K个聚类中心时间序列中与当前时刻最接近的3个时刻的风速值建立K个长度为3的筛选向量;
步骤5.4:更新筛选向量;
分别将K个筛选向量前3个时刻的风速数据作为输入数据,输入至对应聚类类别的风速预测特征预选模型中,将输出的第4个时刻的风速特征预选值***筛选向量第一位置,其余数据位置顺序依次延后,重复此步骤直到K个筛选向量长度均达到200;
步骤5.5:再次筛选风速预测特征预选模型;
分别计算每种聚类类别的风速预测特征预选模型得到的筛选向量两两之间的皮尔逊相关系数,得到K个皮尔逊相关系数矩阵P1,P2,…,PK,第i个皮尔逊相关系数矩阵Pi表示为:
其中,Pi表示第i个聚类类别的风速预测特征预选模型得到的筛选向量两两之间的皮尔逊相关系数矩阵,表示第i个聚类类别的风速预测特征预选模型中的第100个模型和第2个模型得到的筛选向量之间的皮尔逊相关系数;
分别计算每个筛选向量与其他筛选向量之间的皮尔逊相关系数的累加值,即分别对K个皮尔逊相关系数矩阵P1,P2,…,PK中的每一行进行求和,例如,第i个皮尔逊相关系数矩阵Pi的第i个风速预测特征预选模型的皮尔逊相关系数的累加值为
逐步淘汰皮尔逊相关系数累加值最大对应的风速预测特征预选模型,直到每种聚类类别的风速预测特征预选模型均剩余10个,表示为:
其中,M_Elman表示经筛选后的10*K个基于Elman神经网络的风速预测特征预选模型,每一行表示同一聚类类型的10个风速预测特征预选模型,共K行;
步骤7:每种聚类类别的10个风速预测特征预选模型组成风速预测特征模型组,得到K个风速预测特征模型组;
所述风速预测特征模型组包括10个风速预测特征预选模型,每个风速预测特征模型组输出数据组成长度为10的向量命名为风速特征向量,第i个风速预测特征模型组表示为[m_elmani,1,m_elmani,1,…,m_elmani,10];
步骤8:针对K个风速预测特征模型组,建立K个基于小波神经网络的风速预测归一模型;
所述风速预测归一模型输出值设定为风速归一值;
所述针对K个风速预测特征模型组,建立K个基于小波神经网络的风速预测归一模型的具体过程如下:
步骤6.1:依次将风速模型样本A中的每组风速向量前3个时刻的风速值作为输入数据,输入到对应聚类类别的风速预测特征模型组中,输出得到风速特征向量;
步骤6.2:依次将步骤6.1得到的风速特征向量作为输入数据,风速模型样本A中对应的第4个时刻的风速值作为输出数据,训练小波神经网络,得到针对K个风速预测特征模型组的K个基于小波神经网络的风速预测归一模型;
所述基于小波神经网络的风速预测归一模型在训练时均设置输入层节点个数为10,隐含层小波元个数为20,输出层节点个数为1;隐层小波神经元采用Mexican Hat小波函数,输出层节点采用Sigmoid函数,训练过程中的最大迭代次数设置为500,训练学习率为0.04,阈值为0.002;
步骤9:实时预测风速;
实时采集当前时刻及近期的风速数据,数据采样时间间隔应保持与步骤1中使用的原始风速时间序列数据集的风速采样时间间隔Δt一致,进行实时预测风速的具体过程如下:
步骤B1:设置风速预测目标时间T,通过测风站获取与目标时间T最接近的至少200个时刻的原始风速值组成原始风速时间序列,进入步骤B2;
步骤B2:对原始风速时间序列进行卡尔曼滤波,得到滤波后的风速时间序列,进入步骤B3;
步骤B3:计算风速时间序列中与目标时间T最接近的4个时刻的风速值与步骤3得出的K个聚类中心时间序列的欧式距离,以距离最小原则选择对应聚类类别的风速预测特征模型组,将风速时间序列中与目标时间T最接近的3个时刻的风速值作为输入数据,输入到风速预测特征模型组中,输出得到长度为10的风速特征向量,进入步骤B4;
步骤B4:将风速特征向量作为输入数据,输入到对应聚类类别的风速预测归一模型,输出风速归一值,进入步骤B5;
步骤B5:判断步骤B4输出风速归一值所在时刻是否大于目标时间T,若是,进入步骤B7,否则,进入步骤B6;
步骤B6:将步骤B4输出的风速归一值***到风速时间序列首位,更新风速时间序列,返回步骤B3;
步骤B7:计算风速时间序列中与目标时间T最接近的100个时刻的风速值组成的向量与步骤2中得到的风速时间序列数据集w′(t)=[w′(t=Δt),w′(t=2*Δt),…,w′(t=n*Δt)]中的任意连续的100个时刻的风速值组成的向量之间的皮尔逊相关系数,选择皮尔逊相关系数最高的风速时间序列数据集中一组100个时刻的风速值组成的向量,将步骤2中的噪声时间序列数据集no(t)=[no(t=Δt),no(t=2*Δt),…,no(t=n*Δt)]中对应时刻的滤波噪声附加在风速时间序列与目标时间T最接近的100个时刻中,即还原预测风速真实性,完成目标时刻的风速预测。
以上所述仅是本发明技术的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本发明的保护范围。
Claims (7)
1.一种高速铁路沿线风速特征提取智能预测方法,其特征在于,包括以下步骤:
步骤1:通过测风站获取原始风速时间序列数据集;
在高速铁路沿线指定位置设置测风站,通过测风站获取原始风速时间序列数据集;
所述原始风速时间序列数据集共由n个原始风速数据组成;其中Δt为风速采样时间间隔;n为采样次数,n至少大于500;
步骤2:建立风速模型样本A;
所述风速模型样本A包括风速模型训练样本Aa和风速模型筛选样本Ab;
建立风速模型样本A的具体过程如下:
步骤A1:对原始风速时间序列数据集进行卡尔曼滤波,得到滤波后的风速时间序列数据集和噪声时间序列数据集;
步骤A2:将风速时间序列数据集中任意连续4个时刻的风速作为一组风速向量,得到包含有n-3组风速向量的风速模型样本A;
步骤A3:按采样时间顺序,从风速模型样本A中,选取前3/4的风速向量组成风速模型训练样本Aa,剩余的风速向量组成风速模型筛选样本Ab;
步骤3:使用K-means聚类方法,对风速模型样本A中的每一组风速向量进行聚类,选取最优聚类数K,得到K个聚类中心时间序列;
步骤4:依据已经聚为K个聚类类别的风速模型样本A,将风速模型训练样本Aa分为K个对应聚类类别的风速模型训练子样本{Aa,1,Aa,2,…,Aa,K},将风速模型筛选样本Ab分为K个对应风速模型筛选子样本{Ab,1,Ab,2,…,Ab,K};
步骤5:针对K个风速模型训练子样本,建立K种基于Elman神经网络的风速预测特征预选模型各100个;
所述基于Elman神经网络的风速预测特征预选模型输出值命名为风速特征预选值;
步骤6:筛选模型,分别将K种基于Elman神经网络的风速预测特征预选模型各100个筛选至各10个;
步骤7:每种聚类类别的10个风速预测特征预选模型组成风速预测特征模型组,得到K个风速预测特征模型组;
所述风速预测特征模型组包括10个风速预测特征预选模型,每个风速预测特征模型组输出数据组成长度为10的向量命名为风速特征向量;
步骤8:针对K个风速预测特征模型组,建立K个基于小波神经网络的风速预测归一模型;
所述风速预测归一模型输出值设定为风速归一值;
步骤9:实时预测风速;
实时采集当前时刻及近期的风速数据,数据采样时间间隔应保持与步骤1中使用的原始风速时间序列数据集的风速采样时间间隔Δt一致,进行实时预测风速的具体过程如下:
步骤B1:设置风速预测目标时间T,通过测风站获取与目标时间T最接近的至少200个时刻的原始风速值组成原始风速时间序列,进入步骤B2;
步骤B2:对原始风速时间序列进行卡尔曼滤波,得到滤波后的风速时间序列,进入步骤B3;
步骤B3:计算风速时间序列中与目标时间T最接近的4个时刻的风速值与步骤3得出的K个聚类中心时间序列的欧式距离,以距离最小原则选择对应聚类类别的风速预测特征模型组,将风速时间序列中与目标时间T最接近的3个时刻的风速值作为输入数据,输入到风速预测特征模型组中,输出得到长度为10的风速特征向量,进入步骤B4;
步骤B4:将风速特征向量作为输入数据,输入到对应聚类类别的风速预测归一模型,输出风速归一值,进入步骤B5;
步骤B5:判断步骤B4输出风速归一值所在时刻是否大于目标时间T,若是,进入步骤B7,否则,进入步骤B6;
步骤B6:将步骤B4输出的风速归一值***到风速时间序列首位,更新风速时间序列,返回步骤B3;
步骤B7:计算风速时间序列中与目标时间T最接近的100个时刻的风速值组成的向量与步骤2中得到的风速时间序列数据集任意连续的100个时刻的风速值组成的向量之间的皮尔逊相关系数,选择皮尔逊相关系数最高的风速时间序列数据集中一组100个时刻的风速值组成的向量,将步骤2中的噪声时间序列数据集对应时刻的滤波噪声附加在风速时间序列与目标时间T最接近的100个时刻中,即还原预测风速真实性,完成目标时刻的风速预测。
2.根据权利要求1所述的方法,其特征在于,所述使用K-means聚类方法,对风速模型样本A中的每一组风速向量进行聚类,选取最优聚类数K,得到K个聚类中心时间序列的具体过程如下:
步骤2.1:设置K-means聚类数K’,K’=1;
步骤2.2:采用欧式距离作为相似性度量函数,对风速模型样本A中的每一组风速向量进行聚类,获得K’个聚类类别和K’个聚类中心时间序列;
所述欧式距离的计算公式为其中,X=(x1,x2,x3,x4),Y=(y1,y2,y3,y4)分别为两个不同的风速向量,d(X,Y)为风速向量X,Y之间的欧式距离;
步骤2.3:计算K-means聚类的误差平方和SSE(K′);
其中,K′是聚类数,Ci是第i个聚类类别,p是Ci类中的一组风速向量,mi是Ci类的聚类中心;
步骤2.4:判断K’值是否等于20,若是,进入步骤2.5,否则,令K’=K’+1,然后返回步骤2.2;
步骤2.5:分别计算当K’=2至19时的每个α(K′)和β(K′)值,然后进入步骤2.6;
α(K′)=arctan(SSE(K′)-SSE(K′+1)),α∈(0°,90°),K′∈[2,19]
β(K′)=arctan(SSE(K′)-SSE(K′-1)),β∈(90°,180°),K′∈[2,19];
步骤2.6:分别计算当K’=2至19时的每个α(K′)+β(K′)值,选取使得α(K′)+β(K′)最大时的K’值作为最优聚类数K,得到K个聚类中心时间序列。
3.根据权利要求1所述的方法,其特征在于,所述针对K个风速模型训练子样本,建立K种基于Elman神经网络的风速预测特征预选模型各100个的过程为:依次将K个风速模型训练子样本中的每组风速向量前3个时刻的风速值作为输入数据,第4个时刻的风速值作为输出数据,训练Elman神经网络,针对每个风速模型训练子样本训练得到的Elman神经网络分别随机设置100种不同取值的Elman神经网络参数,得到K种基于Elman神经网络的风速预测特征预选模型各100个,共100*K个基于Elman神经网络的风速预测特征预选模型。
4.根据权利要求3所述的方法,其特征在于,所述100*K个基于Elman神经网络的风速预测特征预选模型在训练时均设置输入层节点个数为3,隐含层节点个数设置范围为[5,10],输出层节点个数为1,承接层节点个数为7,隐含层函数采用Sigmoid函数,网络的训练采用BP算法,最大迭代次数设置为800,训练学习率设置范围为[0.001,0.5],阈值为0.005。
5.根据权利要求1所述的方法,其特征在于,所述筛选模型,分别将K种基于Elman神经网络的风速预测特征预选模型各100个筛选至各10个的具体过程如下:
步骤5.1:依次将K个风速模型筛选子样本{Ab,1,Ab,2,…,Ab,K}中的每组风速向量前3个时刻的风速值作为输入数据,分别输入到对应聚类类别的100个风速预测特征预选模型中;
步骤5.2:初步筛选风速预测特征预选模型;
依次计算每个风速预测特征预选模型输出的风速特征预选值按时间次序组成的一维向量与风速模型筛选样本Ab中对应时刻的风速值组成的一维向量的均方误差,淘汰均方误差大于均方误差均值的风速预测特征预选模型;
步骤5.3:建立筛选向量;
分别利用K个聚类中心时间序列中与当前时刻最接近的3个时刻的风速值建立K个长度为3的筛选向量;
步骤5.4:更新筛选向量;
分别将K个筛选向量前3个时刻的风速数据作为输入数据,输入至对应聚类类别的风速预测特征预选模型中,将输出的第4个时刻的风速特征预选值***筛选向量第一位置,其余数据位置顺序依次延后,重复此步骤直到K个筛选向量长度均达到200;
步骤5.5:再次筛选风速预测特征预选模型;
分别计算每种聚类类别的风速预测特征预选模型得到的筛选向量两两之间的皮尔逊相关系数,得到K个皮尔逊相关系数矩阵,分别计算每个筛选向量与其他筛选向量之间的皮尔逊相关系数的累加值,逐步淘汰皮尔逊相关系数累加值最大对应的风速预测特征预选模型,直到每种聚类类别的风速预测特征预选模型均剩余10个。
6.根据权利要求1所述的方法,其特征在于,所述针对K个风速预测特征模型组,建立K个基于小波神经网络的风速预测归一模型的具体过程如下:
步骤6.1:依次将风速模型样本A中的每组风速向量前3个时刻的风速值作为输入数据,输入到对应聚类类别的风速预测特征模型组中,输出得到风速特征向量;
步骤6.2:依次将步骤6.1得到的风速特征向量作为输入数据,风速模型样本A中对应的第4个时刻的风速值作为输出数据,训练小波神经网络,得到针对K个风速预测特征模型组的K个基于小波神经网络的风速预测归一模型。
7.根据权利要求6所述的方法,其特征在于,所述基于小波神经网络的风速预测归一模型在训练时均设置输入层节点个数为10,隐含层小波元个数为20,输出层节点个数为1;隐层小波神经元采用Mexican Hat小波函数,输出层节点采用Sigmoid函数,训练过程中的最大迭代次数设置为500,训练学习率为0.04,阈值为0.002。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811643482.7A CN109615027B (zh) | 2018-12-29 | 2018-12-29 | 一种高速铁路沿线风速特征提取智能预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811643482.7A CN109615027B (zh) | 2018-12-29 | 2018-12-29 | 一种高速铁路沿线风速特征提取智能预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109615027A true CN109615027A (zh) | 2019-04-12 |
CN109615027B CN109615027B (zh) | 2020-12-08 |
Family
ID=66016400
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811643482.7A Active CN109615027B (zh) | 2018-12-29 | 2018-12-29 | 一种高速铁路沿线风速特征提取智能预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109615027B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110650058A (zh) * | 2019-10-08 | 2020-01-03 | 河南省云安大数据安全防护产业技术研究院有限公司 | 一种网络流量分析方法、装置、存储介质及设备 |
CN111291943A (zh) * | 2020-03-09 | 2020-06-16 | 西南交通大学 | 一种基于频繁序列的高铁大风预警方法 |
CN112381420A (zh) * | 2020-11-17 | 2021-02-19 | 平安普惠企业管理有限公司 | 基于沙漠风速的风险预警方法、装置、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070223841A1 (en) * | 2006-03-23 | 2007-09-27 | Weinzapfel Robert A | Methods of characterizing the probability of wind impact |
CN102063641A (zh) * | 2010-10-14 | 2011-05-18 | 北京大学 | 高速铁路沿线风速预测方法 |
CN107895202A (zh) * | 2017-10-24 | 2018-04-10 | 天津大学 | 基于多视角风速模式挖掘的短期风速预测方法 |
CN109063907A (zh) * | 2018-07-27 | 2018-12-21 | 中南大学 | 一种高速铁路沿线极大风速智能遍历大步长预测方法 |
-
2018
- 2018-12-29 CN CN201811643482.7A patent/CN109615027B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070223841A1 (en) * | 2006-03-23 | 2007-09-27 | Weinzapfel Robert A | Methods of characterizing the probability of wind impact |
CN102063641A (zh) * | 2010-10-14 | 2011-05-18 | 北京大学 | 高速铁路沿线风速预测方法 |
CN107895202A (zh) * | 2017-10-24 | 2018-04-10 | 天津大学 | 基于多视角风速模式挖掘的短期风速预测方法 |
CN109063907A (zh) * | 2018-07-27 | 2018-12-21 | 中南大学 | 一种高速铁路沿线极大风速智能遍历大步长预测方法 |
Non-Patent Citations (3)
Title |
---|
HUI LIU 等: "Wind speed forecasting method based on deep learning strategy using empirical wavelet transform, long short term memory neural network and Elman neural network", 《ENERGY CONVERSION AND MANAGEMENT》 * |
刘辉 等: "基于小波分析法与滚动式时间序列法的风电场风速短期预测优化算法", 《中南大学学报(自然科学版)》 * |
潘迪夫 等: "基于时间序列分析和卡尔曼滤波算法的风电场风速预测优化模型", 《电网技术》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110650058A (zh) * | 2019-10-08 | 2020-01-03 | 河南省云安大数据安全防护产业技术研究院有限公司 | 一种网络流量分析方法、装置、存储介质及设备 |
CN110650058B (zh) * | 2019-10-08 | 2022-03-04 | 河南省云安大数据安全防护产业技术研究院有限公司 | 一种网络流量分析方法、装置、存储介质及设备 |
CN111291943A (zh) * | 2020-03-09 | 2020-06-16 | 西南交通大学 | 一种基于频繁序列的高铁大风预警方法 |
CN111291943B (zh) * | 2020-03-09 | 2022-03-08 | 西南交通大学 | 一种基于频繁序列的高铁大风预警方法 |
CN112381420A (zh) * | 2020-11-17 | 2021-02-19 | 平安普惠企业管理有限公司 | 基于沙漠风速的风险预警方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109615027B (zh) | 2020-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109615027A (zh) | 一种高速铁路沿线风速特征提取智能预测方法 | |
CN104077613B (zh) | 一种基于级联多级卷积神经网络的人群密度估计方法 | |
CN107016405B (zh) | 一种基于分级预测卷积神经网络的害虫图像分类方法 | |
CN105894045B (zh) | 一种基于空间金字塔池化的深度网络模型的车型识别方法 | |
CN106446942A (zh) | 基于增量学习的农作物病害识别方法 | |
CN110298266A (zh) | 基于多尺度感受野特征融合的深度神经网络目标检测方法 | |
CN105374033B (zh) | 基于脊波反卷积网络和稀疏分类的sar图像分割方法 | |
CN109977918A (zh) | 一种基于无监督域适应的目标检测定位优化方法 | |
CN105913087A (zh) | 基于最优池化卷积神经网络的物体识别方法 | |
CN107506740A (zh) | 一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法 | |
CN105938564A (zh) | 基于主成分分析和神经网络的水稻病害识别方法及*** | |
CN106709453A (zh) | 一种基于深度学习的体育视频关键姿态提取方法 | |
CN108510521A (zh) | 一种多特征融合的尺度自适应目标跟踪方法 | |
CN107871136A (zh) | 基于稀疏性随机池化的卷积神经网络的图像识别方法 | |
CN109684922A (zh) | 一种基于卷积神经网络的多模型对成品菜的识别方法 | |
CN107480649A (zh) | 一种基于全卷积神经网络的指纹汗孔提取方法 | |
CN110287882A (zh) | 一种基于深度学习的大菊品种图像识别方法 | |
CN109215034A (zh) | 一种基于空间金字塔掩盖池化的弱监督图像语义分割方法 | |
CN103593652B (zh) | 一种基于黄瓜叶片症状图像处理的黄瓜病害识别方法 | |
CN109218134B (zh) | 一种基于神经风格迁移的测试用例生成*** | |
CN106997475A (zh) | 一种基于并行卷积神经网络的害虫图像识别方法 | |
CN109635811A (zh) | 空间植物的图像分析方法 | |
CN110417694A (zh) | 一种通信信号调制方式识别方法 | |
CN109902564A (zh) | 一种基于结构相似性稀疏自编码网络的异常事件检测方法 | |
CN110348490A (zh) | 一种基于支持向量机算法的土壤质量预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |