CN109035762B

CN109035762B - 一种基于时空宽度学习的交通速度预测方法

Info

Publication number: CN109035762B
Application number: CN201810691891.8A
Authority: CN
Inventors: 赵春晖; 崔紫强
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2018-06-28
Filing date: 2018-06-28
Publication date: 2020-12-18
Anticipated expiration: 2038-06-28
Also published as: CN109035762A

Abstract

本发明公开了一种基于时空宽度学习的交通速度预测方法。该方法充分考虑了交通速度的时间特性和空间特性，同时考虑了天气和节假日的影响，并引入宽度学习的思想建立预测模型。时间特性方面，本方法提取了速度信号的时序慢特征作为特征节点。空间特性方面，本方法提出了一种滑动窗口相关系数法搜寻对预测路段速度有影响的相关路段，并将这些路段的速度数据作为扩展自变量引入模型。本方法在引入宽度学习思想建立预测模型的同时引入L1和L2正则化对特征进行稀疏选择，防止模型的过拟合。本方法考虑了时空特性，具有很强的可解释性，相比传统的预测方法，提高了预测精度，而且一定程度缩短了建模时间，为交通速度预测方法的研究指明了新的方向。

Description

一种基于时空宽度学习的交通速度预测方法

技术领域

本发明属于交通时序数据分析和预测研究领域，特别是涉及一种基于时空相关性和宽度学习的交通速度预测方法。

背景技术

21世纪以来，人口数量急剧增长，城市化进程飞速发展，路网总量和机动车数量不断增长，交通拥堵状况越来越严重。准确合理地预估交通车速，实时评价交通状况，可以有效地疏导交通，显著改善交通拥堵状况，并且可以辅助管理者合理地实施交通管制，对保护人民生命财产，维护公共安全以及提升城市形象有着及其重要的意义。

交通速度是一种时间序列数据，具有临近性和周期性的特点。前人对此已经做了相应的研究和探讨，目前，对交通速度预测的方法主要有传统的时间序列模型，如ARIMA。近几年，随着人工智能和数据挖掘等技术的发展，一些机器学习方法，如支持向量回归、神经网络模型等也被广泛地运用在交通预测中。其中，传统的时间序列模型，由于其是基于线性的，难以模拟道路的真实状况，且没有考虑数据的周期性。而神经网络等机器学习模型不但需要较长的训练时间，而且容易造成模型过拟合等问题，难以实现对实际交通速度实时预测。此外，现存的方法大多是对某一条道路单独建模，而忽略其他相关路段的影响。但实际上，由于城市交通网的存在，不同道路之间的车流量、车速等存在一定关系，即不同道路间会相互影响。基于单一道路的模型并不能很好地运用在实际的城市道路预测中，基于此，本发明考虑了相关路段的相互影响。此外，由于交通速度数据是一种时序性数据，本发明采用慢特征分析的方法有效提取交通速度数据中变化缓慢的特征。又由于天气和节假日等随机因素会对交通速度造成一定程度的影响，本发明引入了天气和节假日等随机因素。综上，本发明所提出的基于时空宽度学习的交通速度预测方法，既考虑了相关路段的影响，又有效提取了时序数据的慢特征，且融入了天气和节假日因素的影响。模型的训练上，采用了与宽度学习结构相似的模型，其训练时间短，拟合效果好。同时引入了L1和L2正则化来防止模型的过拟合。到目前为止，尚未见到与本发明相关的研究报道。

发明内容

本发明的目的在于针对现有交通速度预测方法的不足，提供一种基于时空宽度学习的交通速度预测方法。

本发明的目的是通过以下技术方案来实现的：一种基于时空宽度学习的交通速度预测方法，该方法包括以下步骤：

步骤1:建模数据预处理：对各路段的速度数据和对应时刻的天气类型、节假日类型进行预处理。

对于速度数据，将获取的车辆速度数据按照不同路段分类，按时间先后顺序排序。对需要分析的每一个路段，选取第k时刻之后的1小时作为时间间隔，k表示该时间间隔的起点，用该时间间隔内该路段上速度的平均值来代替第k时刻的速度。k＝0,1,2,…,23，即每个时间间隔的起点为整点，从而每个路段每天被分割成24个时刻(0点到23点)，每一个时刻对应一个固定的速度值。则路段i在m天内获得的速度向量可以表示为v_i ^T(1×24m)，其中，i为路段代号，i＝1,2,…,L，L为路段总数。

对于天气，按照降水量大小将其分类，分别用不同标签表示；将日期类型分为三类：工作日、周末、节假日，分别用不同标签表示；获取上述速度变量对应时刻的天气和日期类型，路段i在m天内的天气数据表示为w_i ^T(1×24m)，日期类别数据表示为d_i ^T(1×24m)。

步骤2:搜寻对预测路段的速度有影响的路段，并定义为待预测路段的相关路段：

(2.1)设c为待预测路段代号。删掉v_c ^T的第一个样本和v_i ^T(i＝1,2,…,L,i≠c) 的最后一个样本后重新对齐，构成L个新的速度向量V_i ^T(1×24m)。

(2.2)对于L个新的速度向量V_i ^T(1×24m)，(i＝1,2,…,L)，用一个长度为K 个样本的一维滑动窗口滑过v_i ^T(1×24m)，每次向后滑动12个样本，那么一共可以滑动z次，其中z＝(24m-K)/12。将路段i在第j个滑动窗口中的数据所组成的列向量记为

则所有路段在第j个滑动窗口中的列向量组成一个矩阵

窗口移动z次共得到z个矩阵，对于第j个矩阵，按照下式计算

与其他L-1个列向量

的相关系数

其中，vn_ck ^j为路段c在第j个滑动窗口中的数据所组成的列向量

中的第k个元素；

为vn_ck ^j的均值，

为vn_ik ^j的均值，

那么，路段c与任意路段i的速度滑动相关程度系数定义为R_ci，由下式得到：

(2.3)然后依据R_ci确定相关路段：将R_ci按照降序排列，从中选取前F个最大值所对应的路段代号i，则相关路段确定完毕。表示在除路段c以外的路段中选取了F个与路段c相关的路段，其路段代号记为r₁,r₂,...,r_F，这些相关路段的速度将作为变量用于预测模型的建立。

步骤3:确定模型的输入变量

对于路段代号为c的待预测路段，在第M～m天内，采用如下四部分的样本对第t时刻的交通速度v_c(t)进行预测：

第一部分为：路段c在t-24M,t-24(M-1),...,t-24时刻的速度；

第二部分为：路段c在t-N,t-(N-1),...t-1时刻的速度；

第三部分为：步骤二所述的F个与路段c相关的路段在(t-1)时刻的速度 v_r1,v_r2,...,v_rF；

第四部分为：路段c在t时刻的天气和时间类型w_c(t),d_c(t)。

路段c在t-24M,t-24(M-1),...,t-24时刻的速度、路段c在t-N,t-(N-1),...t-1时刻的速度、步骤二所述的F个与路段c相关的路段在(t-1)时刻的速度 v_r1,v_r2,...,v_rF、路段c在t时刻的天气和时间类型w_c(t),d_c(t)依次构成长度为 M+N+F+2的预测变量。

24(m-M)个预测变量和响应变量组成维度为24(m-M)×(M+N+F+2)的预测变量矩阵X'和维度为24(m-M)×1的响应变量矩阵Y。

步骤4:提取速度变量的慢特征

(4.1)取步骤3中所述预测变量矩阵X'的前M+N+F列，作为速度变量矩阵X'₁，对于X'₁的第i列X_1i'，进行如下式所示的减均值的中心化处理：

X_1i＝X_1i'-var(X_1i') (12)

其中，i＝1,2,…,M+N+F，var(X_1i')表示X₁的第i列的均值。

中心化处理后的X_1i组成新的变量矩阵X₁。

(4.2)构造X₁的协方差矩阵，并进行SVD分解，如下式所示：

X₁X₁ ^T＝UΛU^T (13)

按下式进行白化处理：

B＝Λ^-1/2U^TX₁＝QX₁ (14)

其中，B为白化后的矩阵，Q＝Λ^-1/2U^T是白化矩阵。

(4.3)对B的第二行开始的每一行减去前一行所得到的差分矩阵

再进行 SVD分解，

求解得到正交矩阵P，Ω表示对角矩阵。

则静态慢特征S₁＝PB＝WX₁，其中，W＝PQ。

(4.4)对S₁进行行向量差分，从第2行开始，每行减去上一行得到新的矩阵，即得到动态慢特征S₂。

(4.5)去掉S₁的第一行，与S₂按行方向进行拼接，得到特征维度为2(M+N+F) 的速度慢特征矩阵S。

步骤5:建立基于时空宽度学习的交通速度预测模型；

步骤6:在线预测；

(6.1)对测试样本，首先执行步骤1到步骤3，得到测试样本的待预测变量矩阵X_t(p×(M+N+F+2))和响应变量矩阵Y_t(p×1)，p为测试样本个数。

(6.2)取X_t的前M+N+F列为速度变量矩阵

首先对

的每一列进行与训练集相同的中心化处理。然后按下式提取静态慢特征：

其中W为步骤(4.3)中获取的W。对

求行向量差分，第1行减去训练集的最后一行，从第2行开始，每行减去前一行。这样得到一个新的矩阵，即是动态慢特征

将

与

进行行方向的拼接，得到p×(2M+2N+2F)维的速度慢特征矩阵S_t。

(6.3)将速度慢特征矩阵S_t与对应的天气因素w_t和节假日因素d_t代入步骤5 所建立的预测模型，得到预测结果

进一步地，所述步骤5包括以下子步骤：

(5.1)构建网络的特征节点。将静态慢特征S₁和动态慢特征S₂作为由原始数据映射得到的特征节点，S₁作为第一组映射特征，记为Z₁；S₂作为第二组映射特征，记为Z₂；对应时刻的天气因素和节假日因素[w_c,d_c]记为Z₃。给定记号 Z＝[Z₁,Z₂,Z₃]表示两组映射特征和其他特征。

(5.2)构造增强节点:

其中，ξ_j是第j组增强节点的激活函数，

是第j组增强节点的随机权重系数矩阵，

为第j组增强节点的偏置项。前g组增强节点被记为H^g＝[H₁,H₂...,H_g]。

(5.3)将网络的所有特征节点和增强节点连接到输出端，如下式所示：

(5.4)采用ElasticNet的思想，同时引入L1和L2正则化。求解权重W^m：

λ₁λ₂为正则化系数。

进一步地，删掉v_c ^T的第一个样本和v_i ^T(i＝1,2,…,L,i≠c)的最后一个样本后重新对齐，对齐的目的是为了分析其他路段i上一时刻的速度对待预测路段c当前时刻的速度的影响。

与现有技术相比，本发明的有益效果是：本方法从实际交通数据的时间特性和空间特性着手，克服了传统回归分析方法没有考虑到的问题，充分挖掘了交通速度的时空相关性。首先，在时间相关性方面，该方法不仅在构造变量时考虑了交通数据的临近性和周期性，而且利用慢特征分析提取速度的时序慢特征作为特征节点；其次，在空间相关性方面，对于每一个待预测路段，都考虑与其相关的路段对其的影响。本发明在考虑时空相关性的同时，考虑了外界因素(天气和节假日)对交通速度的影响。此外，本发明利用了宽度学习的思想用于模型的建立，在保证精度的同时，加快了线下训练和在线预测的速度，且引入了L1、L2正则化，有效避免了模型的过拟合。为交通速度预测提供了一种有效易行的方法，为实际道路状况预测的研究指明了新的方向。本发明所提出的交通速度预测方法充分考虑了时空相关性。时间相关性方面，利用慢特征分析提取速度数据的时序慢特征，空间方面，对每一个预测路段，都考虑与其相关的路段对其的影响。且发明在保证了精度的同时，线下训练和在线预测的时间都非常快，保证了效率，是一种有效易行的方法。

附图说明

图1是本发明基于时空宽度学习的交通速度预测方法建模流程图。

图2是使用本发明寻找相关路段的方法所找到的与路段306相关性最强的前5个路段与路段306的相关程度。

图3是采用本发明基于时空宽度学习的交通速度方法对路段306的预测速度与真实速度的比较图。

图4为支持向量回归方法对路段306的预测速度与真实速度的比较图。

图5为神经网络方法对路段306的预测速度与真实速度的比较图。

具体实施方式

下面结合附图和具体实例，对本发明作进一步详细说明。

本实例所采用数据为杭州市8000辆出租车2013年10月1日～2014年1月 31日的为期四个月，共计123天的GPS信号数据，GPS数据中包括速度值和采样时间以及位置信息。

如图1所示，本发明是基于时空宽度学习的交通速度预测方法，该方法包括以下步骤：

步骤1:建模数据预处理。

对各路段的速度数据和对应时刻的天气类型、节假日类型进行预处理。

对于速度数据，将获取的车辆速度数据按照不同路段分类，按时间先后顺序排序。对需要分析的每一个路段，选取第k时刻之后的1小时作为时间间隔，k表示该时间间隔的起点，用该时间间隔内该路段上速度的平均值来代替第k时刻的速度。k＝0,1,2,…,23，即每个时间间隔的起点为整点，从而每个路段每天被分割成24个时刻(0点到23点)，每一个时刻对应一个固定的速度值。则路段i在m天内获得的速度向量可以表示为v_i ^T(1×24m)，其中，i为路段代号，i＝1,2,…,L，L为路段总数。本实例中，我们对杭州市出租车2013年10月1 日～2014年1月31日的为期四个月，共计123天的GPS信号进行了预处理，并从中随机选出了246个路段的数据进行接下来的分析，m＝123，L＝246。

考虑到天气和节假日影响，还需要对天气和节假日类型数据进行预处理。由于外界因素的定性表述无法引入模型中，所以本发明对天气、节假日等外界因素进行定量划分。对于天气，按照降水量大小将其分类，分别用不同标签表示；将日期类型分为三类：工作日、周末、节假日，分别用不同标签表示；获取上述速度变量对应时刻的天气和日期类型，路段i在m天内的天气数据表示为w_i ^T(1×24m)，日期类别数据表示为d_i ^T(1×24m)。本实例中，对于天气，按照降水量大小将其分为三类，第一类是干燥无降水的天气，比如晴天、多云等；第二类是中度湿润，比如小雨、中雨、小雪、大雾等；第三类是高度湿润，比如大雨、大雪等，分别用数值1、2、3表示。对于节假日的影响，将日期类型分为三类：工作日、周末、节假日，分别用数值1、2、3来表示。路段i在m天内的天气数据表示为w_i ^T(1×24m)，日期类别数据表示为d_i ^T(1×24 m)。本实例中，共获取为期四个月123天每天24小时的天气，以及123天每天的节假日类型，天气和节假日类型数据均对应于速度向量。如表1所示为某一路段预处理后的部分数据的格式示例。

表1

路段代号	当前速度	时间	天气	节假日
					186	35	2013/10/1 8:00	1	3
186	35	2013/10/1 9:00	1	3
					186	32.1429	2013/10/1 10:00	1	3
186	32	2013/10/1 11:00	1	3
					186	33.3571	2013/10/1 12:00	1	3
186	34	2013/10/1 13:00	1	3
					186	30.4	2013/10/1 14:00	1	3

步骤2:搜寻对预测路段的速度有影响的路段，并定义为待预测路段的相关路段

(2.1)设c为待预测路段代号。本实例以c＝306为例，路段306代表莫干山路(从天目山路到金家渡中路)路段。删掉v_c ^T的第一个样本和v_i ^T (i＝1,2,…,L,i≠c)的最后一个样本后重新对齐，构成L个新的速度向量 V_i ^T(1×24m)，这样对齐的目的是为了分析其他路段i上一时刻的速度对待预测路段c当前时刻的速度的影响。

则所有路段在第j个滑动窗口中的列向量组成一个矩阵

窗口移动z次共得到z个矩阵，对于第j个矩阵，按照下式计算

与其他L-1个列向量

的相关系数

中的第k个元素；

为vn_ck ^j的均值，

为vn_ik ^j的均值，

本实例中，按上式计算路段306与其他245个路段的相关系数

那么，路段306与任意路段i的速度滑动相关程度系数定义为R_ci，由下式得到：

(2.3)然后依据R_ci确定相关路段：将R_ci按照降序排列，从中选取前F个最大值所对应的路段代号i，则相关路段确定完毕。表示在除路段c以外的路段中选取了F个与路段c相关的路段，其路段代号记为r₁,r₂,...,r_F，这些相关路段的速度将作为变量用于预测模型的建立。本实例中，将R_306,i按照降序排列，图2为降序排列后的前5个路段的相关程度，本实例中F选为2，从中选取前2个最大值所对应的路段代号i。可以看出，路段305的相关程度最高，为3.1070，路段 308的相关程度第二高，为2.5193。则相关路段确定完毕，即在除路段306以外的路段中选取了2个与路段306相关的路段，其路段代号分别为 r₁＝305,r₁＝308，相关路段的速度将作为变量用于预测模型的建立。

步骤3:确定模型的输入变量

第一部分为：路段c在t-24M,t-24(M-1),...,t-24时刻的速度；

第二部分为：路段c在t-N,t-(N-1),...t-1时刻的速度；

第四部分为：路段c在t时刻的天气和时间类型w_c(t),d_c(t)。

路段c在t-24M,t-24(M-1),...,t-24时刻的速度、路段c在t-N,t-(N-1),...t-1时刻的速度、步骤二所述的F个与路段c相关的路段在(t-1)时刻的速度 v_r1,v_r2,...,v_rF、路段c在t时刻的天气和时间类型w_c(t),d_c(t)依次构成长度为 M+N+F+2的预测变量。24(m-M)个预测变量和响应变量组成维度为 24(m-M)×(M+N+F+2)的预测变量矩阵X'和维度为24(m-M)×1的响应变量矩阵 Y。本实例中，考虑到交通速度会存在以星期(7天)为周期的周期性，将M选为7。关于N的选择，本实例选取N＝6用来体现交通速度数据的时间临近性。预测路段为306，则由24(123-7)＝2784个预测变量和响应变量可得到预测变量矩阵X(2784×17)和响应变量矩阵Y(2784×1)。取前2401个样本作为训练集，第 2402～2784个样本作为测试集。

步骤4:提取速度变量的慢特征

(4.1)取步骤3中所述预测变量矩阵X'的前M+N+F列，作为速度变量矩阵X'₁，本实例中，M+N+F＝7+6+2＝15，共15列。对于X'₁的第i列X_1i'，进行如下式所示的减均值的中心化处理：

X_1i＝X_1i'-var(X_1i') (21)

其中，i＝1,2,…,M+N+F，var(X_1i')表示X₁的第i列的均值。

中心化处理后的X_1i组成新的变量矩阵X₁。

(4.2)构造X₁的协方差矩阵，并进行SVD分解，如下式所示：

X₁X₁ ^T＝UΛU^T (22)

按下式进行白化处理：

Z＝Λ^-1/2U^TX₁＝QX₁ (23)

其中，Z为白化后的矩阵，Q＝Λ^-1/2U^T是白化矩阵。

表示对Z的第二行开始的每一行减去前一行所得到的差分矩阵。

(4.3)对B的第二行开始的每一行减去前一行所得到的差分矩阵

再进行 SVD分解，

求解得到正交矩阵P，Ω表示对角矩阵。

则静态慢特征S₁＝PB＝WX₁，其中，W＝PQ。

(4.5)去掉S₁的第一行，与S₂按行方向进行拼接，得到特征维度为2(M+N+F) 的速度慢特征矩阵S。本实例得到2400×30维的速度慢特征矩阵S。

步骤5:建立基于时空宽度学习的交通速度预测模型

(5.2)构造增强节点:

其中，ξ_j是第j组增强节点的激活函数，

是第j组增强节点的随机权重系数矩阵，

为第j组增强节点的偏置项。前g组增强节点被记为H^g＝[H₁,H₂...,H_g]。本实例中，

的维度为2400×1，g取为100，即构造100个增强节点，增强节点的激活函数均为sigmoid函数。

(5.4)采用ElasticNet的思想，同时引入L1和L2正则化。本实例中，L1 正则化参数λ₁设为0.5，L2正则化参数λ₂设为0.25。求解权重W^m：

步骤6:在线预测

(6.1)对测试样本，首先执行步骤1到步骤3，得到测试样本的待预测变量矩阵X_t(p×(M+N+F+2))和响应变量矩阵Y_t(p×1)，p为测试样本个数。本实例中，对步骤3所划分出的包含383个样本的测试集，首先执行步骤1到步骤3，得到测试样本的预测变量矩阵X_t(383×17)和响应变量矩阵Y_t(383×1)。

(6.2)取X_t的前M+N+F＝15列为速度变量矩阵

首先对

其中W为步骤(4.3)中获取的W。对

将

与

进行行方向的拼接，得到p×(2M+2N+2F)维的速度慢特征矩阵S_t。本实例中得到383×30维的速度慢特征矩阵S_t。

计算测试集真实标签与预测结果

的均方误差RMSE，为0.889911。并绘制真实值与预测结果的曲线图，如图3所示。从图中可以看出，本发明方法可以很好的跟随真实速度的变化趋势，实现交通速度的较为准确的预测。为与常用的机器学习算法作对比，本实例将该方法与支持向量回归、神经网络模型作了对比，图4为支持向量回归方法的预测结果与真实值的对比曲线图，图5为神经网络方法的预测结果与真实值的对比曲线图。表2为三种方法在测试集上的RMSE以及模型训练时间对比。从表中可以看出，本方法不但缩短了模型训练的时间，而且减小了均方误差，提高了预测精度。

表2

模型	测试集RMSE	训练耗时
			本发明所述模型	0.8899	0.23s
支持向量回归	0.9427	0.76s
			神经网络	1.1748	3.21s

为了进一步证明模型的有效性，随机选取10个路段，分别用本发明所述方法和其他两个对比方法进行建模，建模过程同上。计算测试集的RMSE，结果如表3所示。

表3

	本发明所述模型	支持向量回归	神经网络
				路段306	0.8899	0.9427	1.1784
路段302	2.7762	3.0105	3.0450
				路段102	1.4694	1.7488	2.7623
路段1376	1.2387	1.2209	1.2866
				路段185	1.7301	1.7781	1.8634
路段267	3.6634	3.7440	3.9750
				路段503	3.1016	3.2283	3.0245
路段369	1.7893	2.2310	2.5732
				路段414	3.5668	4.1035	3.9801
路段617	2.6468	3.1986	3.2315
				10个路段RMSE均值	2.2872	2.5206	2.6920

从表中可以看出，与其他方法相比，本发明所述方法具有更低的预测误差，且结论具有普遍性。

Claims

1.一种基于时空宽度学习的交通速度预测方法，其特征在于，该方法包括以下步骤：

步骤1:建模数据预处理：对各路段的速度数据和对应时刻的天气类型、节假日类型进行预处理；

步骤2:搜寻对预测路段的速度有影响的路段，并定义为待预测路段的相关路段；具体包括如下子步骤：

(2.1)设c为待预测路段代号；删掉v_c ^T的第一个样本和v_i ^T(i＝1,2,…,L,i≠c)的最后一个样本后重新对齐，构成L个新的速度向量V_i ^T(1×24m)；其中，i为路段代号，i＝1,2,…,L，L为路段总数；V_i ^T(1×24m)表示路段i在m天内获得的速度向量；对齐的目的是为了分析其他路段i上一时刻的速度对待预测路段c当前时刻的速度的影响；

(2.2)对于L个新的速度向量V_i ^T(1×24m)，(i＝1,2,…,L)，用一个长度为K个样本的一维滑动窗口滑过v_i ^T(1×24m)，每次向后滑动12个样本，那么一共可以滑动z次，其中z＝(24m-K)/12；将路段i在第j个滑动窗口中的数据所组成的列向量记为

j＝1,2,…,z；则所有路段在第j个滑动窗口中的列向量组成一个矩阵

窗口移动z次共得到z个矩阵，对于第j个矩阵，按照下式计算

与其他L-1个列向量

的相关系数

中的第k个元素；

为vn_ck ^j的均值，

为vn_ik ^j的均值，

(2.3)然后依据R_ci确定相关路段：将R_ci按照降序排列，从中选取前F个最大值所对应的路段代号i，则相关路段确定完毕；表示在除路段c以外的路段中选取了F个与路段c相关的路段，其路段代号记为r₁,r₂,...,r_F，这些相关路段的速度将作为变量用于预测模型的建立；

步骤3:确定模型的输入变量；

步骤4:提取速度变量的慢特征；

步骤5:建立基于时空宽度学习的交通速度预测模型；

步骤6:在线预测。

2.根据权利要求1所述的方法，其特征在于，所述步骤1具体为：

对于速度数据，将获取的车辆速度数据按照不同路段分类，按时间先后顺序排序；对需要分析的每一个路段，选取第k时刻之后的1小时作为时间间隔，k表示该时间间隔的起点，用该时间间隔内该路段上速度的平均值来代替第k时刻的速度；k＝0,1,2,…,23，即每个时间间隔的起点为整点，从而每个路段每天被分割成24个时刻，即0点到23点，每一个时刻对应一个固定的速度值；则路段i在m天内获得的速度向量可以表示为v_i ^T(1×24m)，其中，i为路段代号，i＝1,2,…,L，L为路段总数；

3.根据权利要求1所述的方法，其特征在于，所述步骤3具体为：

第一部分为：路段c在t-24M,t-24(M-1),...,t-24时刻的速度；

第二部分为：路段c在t-N,t-(N-1),...t-1时刻的速度；

第三部分为：步骤2所述的F个与路段c相关的路段在(t-1)时刻的速度v_r1,v_r2,...,v_rF；

第四部分为：路段c在t时刻的天气和时间类型w_c(t),d_c(t)；

路段c在t-24M,t-24(M-1),...,t-24时刻的速度、路段c在t-N,t-(N-1),...t-1时刻的速度、步骤2所述的F个与路段c相关的路段在(t-1)时刻的速度v_r1,v_r2,...,v_rF、路段c在t时刻的天气和时间类型w_c(t),d_c(t)依次构成长度为M+N+F+2的预测变量；

4.根据权利要求3所述的方法，其特征在于，所述步骤4具体为：

(4.1)取步骤3中所述预测变量矩阵X'的前M+N+F列，作为速度变量矩阵X₁'，对于X₁'的第i列X_1i'，进行如下式所示的减均值的中心化处理：

X_1i＝X_1i'-var(X_1i') (3)

其中，i＝1,2,…,M+N+F，var(X_1i')表示X₁的第i列的均值；

中心化处理后的X_1i组成新的变量矩阵X₁；

(4.2)构造X₁的协方差矩阵，并进行SVD分解，如下式所示：

X₁X₁ ^T＝UΛU^T (4)

按下式进行白化处理：

B＝Λ^-1/2U^TX₁＝QX₁ (5)

其中，B为白化后的矩阵，Q＝Λ^-1/2U^T是白化矩阵；

(4.3)对B的第二行开始的每一行减去前一行所得到的差分矩阵