CN109035762B - 一种基于时空宽度学习的交通速度预测方法 - Google Patents
一种基于时空宽度学习的交通速度预测方法 Download PDFInfo
- Publication number
- CN109035762B CN109035762B CN201810691891.8A CN201810691891A CN109035762B CN 109035762 B CN109035762 B CN 109035762B CN 201810691891 A CN201810691891 A CN 201810691891A CN 109035762 B CN109035762 B CN 109035762B
- Authority
- CN
- China
- Prior art keywords
- speed
- time
- road section
- matrix
- road
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 239000011159 matrix material Substances 0.000 claims description 68
- 239000013598 vector Substances 0.000 claims description 35
- 238000012360 testing method Methods 0.000 claims description 16
- 238000012549 training Methods 0.000 claims description 15
- 230000004044 response Effects 0.000 claims description 12
- 238000013507 mapping Methods 0.000 claims description 9
- 230000003068 static effect Effects 0.000 claims description 9
- 230000002087 whitening effect Effects 0.000 claims description 8
- 238000007781 pre-processing Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 238000001556 precipitation Methods 0.000 claims description 4
- 238000000354 decomposition reaction Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims 1
- 238000011160 research Methods 0.000 abstract description 5
- 239000000284 extract Substances 0.000 abstract description 3
- 230000000875 corresponding effect Effects 0.000 description 12
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000009736 wetting Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
Landscapes
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种基于时空宽度学习的交通速度预测方法。该方法充分考虑了交通速度的时间特性和空间特性,同时考虑了天气和节假日的影响,并引入宽度学习的思想建立预测模型。时间特性方面,本方法提取了速度信号的时序慢特征作为特征节点。空间特性方面,本方法提出了一种滑动窗口相关系数法搜寻对预测路段速度有影响的相关路段,并将这些路段的速度数据作为扩展自变量引入模型。本方法在引入宽度学习思想建立预测模型的同时引入L1和L2正则化对特征进行稀疏选择,防止模型的过拟合。本方法考虑了时空特性,具有很强的可解释性,相比传统的预测方法,提高了预测精度,而且一定程度缩短了建模时间,为交通速度预测方法的研究指明了新的方向。
Description
技术领域
本发明属于交通时序数据分析和预测研究领域,特别是涉及一种基于时空 相关性和宽度学习的交通速度预测方法。
背景技术
21世纪以来,人口数量急剧增长,城市化进程飞速发展,路网总量和机动 车数量不断增长,交通拥堵状况越来越严重。准确合理地预估交通车速,实时 评价交通状况,可以有效地疏导交通,显著改善交通拥堵状况,并且可以辅助 管理者合理地实施交通管制,对保护人民生命财产,维护公共安全以及提升城 市形象有着及其重要的意义。
交通速度是一种时间序列数据,具有临近性和周期性的特点。前人对此已 经做了相应的研究和探讨,目前,对交通速度预测的方法主要有传统的时间序 列模型,如ARIMA。近几年,随着人工智能和数据挖掘等技术的发展,一些机 器学习方法,如支持向量回归、神经网络模型等也被广泛地运用在交通预测中。 其中,传统的时间序列模型,由于其是基于线性的,难以模拟道路的真实状况, 且没有考虑数据的周期性。而神经网络等机器学习模型不但需要较长的训练时 间,而且容易造成模型过拟合等问题,难以实现对实际交通速度实时预测。此 外,现存的方法大多是对某一条道路单独建模,而忽略其他相关路段的影响。但实际上,由于城市交通网的存在,不同道路之间的车流量、车速等存在一定 关系,即不同道路间会相互影响。基于单一道路的模型并不能很好地运用在实 际的城市道路预测中,基于此,本发明考虑了相关路段的相互影响。此外,由 于交通速度数据是一种时序性数据,本发明采用慢特征分析的方法有效提取交 通速度数据中变化缓慢的特征。又由于天气和节假日等随机因素会对交通速度 造成一定程度的影响,本发明引入了天气和节假日等随机因素。综上,本发明 所提出的基于时空宽度学习的交通速度预测方法,既考虑了相关路段的影响, 又有效提取了时序数据的慢特征,且融入了天气和节假日因素的影响。模型的 训练上,采用了与宽度学习结构相似的模型,其训练时间短,拟合效果好。同 时引入了L1和L2正则化来防止模型的过拟合。到目前为止,尚未见到与本发 明相关的研究报道。
发明内容
本发明的目的在于针对现有交通速度预测方法的不足,提供一种基于时空 宽度学习的交通速度预测方法。
本发明的目的是通过以下技术方案来实现的:一种基于时空宽度学习的交 通速度预测方法,该方法包括以下步骤:
步骤1:建模数据预处理:对各路段的速度数据和对应时刻的天气类型、节 假日类型进行预处理。
对于速度数据,将获取的车辆速度数据按照不同路段分类,按时间先后顺 序排序。对需要分析的每一个路段,选取第k时刻之后的1小时作为时间间 隔,k表示该时间间隔的起点,用该时间间隔内该路段上速度的平均值来代替 第k时刻的速度。k=0,1,2,…,23,即每个时间间隔的起点为整点,从而每个路段 每天被分割成24个时刻(0点到23点),每一个时刻对应一个固定的速度值。 则路段i在m天内获得的速度向量可以表示为vi T(1×24m),其中,i为路段代 号,i=1,2,…,L,L为路段总数。
对于天气,按照降水量大小将其分类,分别用不同标签表示;将日期类型 分为三类:工作日、周末、节假日,分别用不同标签表示;获取上述速度变量 对应时刻的天气和日期类型,路段i在m天内的天气数据表示为wi T(1×24m), 日期类别数据表示为di T(1×24m)。
步骤2:搜寻对预测路段的速度有影响的路段,并定义为待预测路段的相关 路段:
(2.1)设c为待预测路段代号。删掉vc T的第一个样本和vi T(i=1,2,…,L,i≠c) 的最后一个样本后重新对齐,构成L个新的速度向量Vi T(1×24m)。
(2.2)对于L个新的速度向量Vi T(1×24m),(i=1,2,…,L),用一个长度为K 个样本的一维滑动窗口滑过vi T(1×24m),每次向后滑动12个样本,那么一共可 以滑动z次,其中z=(24m-K)/12。将路段i在第j个滑动窗口中的数据所组成的 列向量记为则所有路段在第j个滑动窗口中的列向量组成一个 矩阵窗口移动z次共得到z个矩阵,对于第j个矩阵,按照 下式计算与其他L-1个列向量的相关系数
那么,路段c与任意路段i的速度滑动相关程度系数定义为Rci,由下式得到:
(2.3)然后依据Rci确定相关路段:将Rci按照降序排列,从中选取前F个最 大值所对应的路段代号i,则相关路段确定完毕。表示在除路段c以外的路段中 选取了F个与路段c相关的路段,其路段代号记为r1,r2,...,rF,这些相关路段的速 度将作为变量用于预测模型的建立。
步骤3:确定模型的输入变量
对于路段代号为c的待预测路段,在第M~m天内,采用如下四部分的样本 对第t时刻的交通速度vc(t)进行预测:
第一部分为:路段c在t-24M,t-24(M-1),...,t-24时刻的速度;
第二部分为:路段c在t-N,t-(N-1),...t-1时刻的速度;
第三部分为:步骤二所述的F个与路段c相关的路段在(t-1)时刻的速度 vr1,vr2,...,vrF;
第四部分为:路段c在t时刻的天气和时间类型wc(t),dc(t)。
路段c在t-24M,t-24(M-1),...,t-24时刻的速度、路段c在t-N,t-(N-1),...t-1时刻的速度、步骤二所述的F个与路段c相关的路段在(t-1)时刻的速度 vr1,vr2,...,vrF、路段c在t时刻的天气和时间类型wc(t),dc(t)依次构成长度为 M+N+F+2的预测变量。
24(m-M)个预测变量和响应变量组成维度为24(m-M)×(M+N+F+2)的预测 变量矩阵X'和维度为24(m-M)×1的响应变量矩阵Y。
步骤4:提取速度变量的慢特征
(4.1)取步骤3中所述预测变量矩阵X'的前M+N+F列,作为速度变量矩 阵X'1,对于X'1的第i列X1i',进行如下式所示的减均值的中心化处理:
X1i=X1i'-var(X1i') (12)
其中,i=1,2,…,M+N+F,var(X1i')表示X1的第i列的均值。
中心化处理后的X1i组成新的变量矩阵X1。
(4.2)构造X1的协方差矩阵,并进行SVD分解,如下式所示:
X1X1 T=UΛUT (13)
按下式进行白化处理:
B=Λ-1/2UTX1=QX1 (14)
其中,B为白化后的矩阵,Q=Λ-1/2UT是白化矩阵。
则静态慢特征S1=PB=WX1,其中,W=PQ。
(4.4)对S1进行行向量差分,从第2行开始,每行减去上一行得到新的矩 阵,即得到动态慢特征S2。
(4.5)去掉S1的第一行,与S2按行方向进行拼接,得到特征维度为2(M+N+F) 的速度慢特征矩阵S。
步骤5:建立基于时空宽度学习的交通速度预测模型;
步骤6:在线预测;
(6.1)对测试样本,首先执行步骤1到步骤3,得到测试样本的待预测变 量矩阵Xt(p×(M+N+F+2))和响应变量矩阵Yt(p×1),p为测试样本个数。
其中W为步骤(4.3)中获取的W。对求行向量差分,第1行减去训练 集的最后一行,从第2行开始,每行减去前一行。这样得到一个新的矩阵,即 是动态慢特征将与进行行方向的拼接,得到p×(2M+2N+2F)维的速度 慢特征矩阵St。
进一步地,所述步骤5包括以下子步骤:
(5.1)构建网络的特征节点。将静态慢特征S1和动态慢特征S2作为由原始 数据映射得到的特征节点,S1作为第一组映射特征,记为Z1;S2作为第二组映 射特征,记为Z2;对应时刻的天气因素和节假日因素[wc,dc]记为Z3。给定记号 Z=[Z1,Z2,Z3]表示两组映射特征和其他特征。
(5.2)构造增强节点:
(5.3)将网络的所有特征节点和增强节点连接到输出端,如下式所示:
(5.4)采用ElasticNet的思想,同时引入L1和L2正则化。求解权重Wm:
λ1λ2为正则化系数。
进一步地,删掉vc T的第一个样本和vi T(i=1,2,…,L,i≠c)的最后一个样本后 重新对齐,对齐的目的是为了分析其他路段i上一时刻的速度对待预测路段c当 前时刻的速度的影响。
与现有技术相比,本发明的有益效果是:本方法从实际交通数据的时间特 性和空间特性着手,克服了传统回归分析方法没有考虑到的问题,充分挖掘了 交通速度的时空相关性。首先,在时间相关性方面,该方法不仅在构造变量时 考虑了交通数据的临近性和周期性,而且利用慢特征分析提取速度的时序慢特 征作为特征节点;其次,在空间相关性方面,对于每一个待预测路段,都考虑 与其相关的路段对其的影响。本发明在考虑时空相关性的同时,考虑了外界因 素(天气和节假日)对交通速度的影响。此外,本发明利用了宽度学习的思想 用于模型的建立,在保证精度的同时,加快了线下训练和在线预测的速度,且引入了L1、L2正则化,有效避免了模型的过拟合。为交通速度预测提供了一种 有效易行的方法,为实际道路状况预测的研究指明了新的方向。本发明所提出 的交通速度预测方法充分考虑了时空相关性。时间相关性方面,利用慢特征分 析提取速度数据的时序慢特征,空间方面,对每一个预测路段,都考虑与其相 关的路段对其的影响。且发明在保证了精度的同时,线下训练和在线预测的时 间都非常快,保证了效率,是一种有效易行的方法。
附图说明
图1是本发明基于时空宽度学习的交通速度预测方法建模流程图。
图2是使用本发明寻找相关路段的方法所找到的与路段306相关性最强的 前5个路段与路段306的相关程度。
图3是采用本发明基于时空宽度学习的交通速度方法对路段306的预测速 度与真实速度的比较图。
图4为支持向量回归方法对路段306的预测速度与真实速度的比较图。
图5为神经网络方法对路段306的预测速度与真实速度的比较图。
具体实施方式
下面结合附图和具体实例,对本发明作进一步详细说明。
本实例所采用数据为杭州市8000辆出租车2013年10月1日~2014年1月 31日的为期四个月,共计123天的GPS信号数据,GPS数据中包括速度值和采 样时间以及位置信息。
如图1所示,本发明是基于时空宽度学习的交通速度预测方法,该方法包 括以下步骤:
步骤1:建模数据预处理。
对各路段的速度数据和对应时刻的天气类型、节假日类型进行预处理。
对于速度数据,将获取的车辆速度数据按照不同路段分类,按时间先后顺 序排序。对需要分析的每一个路段,选取第k时刻之后的1小时作为时间间 隔,k表示该时间间隔的起点,用该时间间隔内该路段上速度的平均值来代替 第k时刻的速度。k=0,1,2,…,23,即每个时间间隔的起点为整点,从而每个路段 每天被分割成24个时刻(0点到23点),每一个时刻对应一个固定的速度值。 则路段i在m天内获得的速度向量可以表示为vi T(1×24m),其中,i为路段代 号,i=1,2,…,L,L为路段总数。本实例中,我们对杭州市出租车2013年10月1 日~2014年1月31日的为期四个月,共计123天的GPS信号进行了预处理,并 从中随机选出了246个路段的数据进行接下来的分析,m=123,L=246。
考虑到天气和节假日影响,还需要对天气和节假日类型数据进行预处理。由于外界因素的定性表述无 法引入模型中,所以本发明对天气、节假日等外界因素进行定量划分。对于天气,按照降水量大小将其分 类,分别用不同标签表示;将日期类型分为三类:工作日、周末、节假日,分别用不同标签表示;获取上 述速度变量对应时刻的天气和日期类型,路段i在m天内的天气数据表示为wi T(1×24m),日期类别数据 表示为di T(1×24m)。本实例中,对于天气,按照降水量大小将其分为三类,第一类是干燥无降水的天气, 比如晴天、多云等;第二类是中度湿润,比如小雨、中雨、小雪、大雾等;第三类是高度湿润,比如大雨、大雪等,分别用数值1、2、3表示。对于节假日的影响,将日期类型分为三类:工作日、周末、节假日, 分别用数值1、2、3来表示。路段i在m天内的天气数据表示为wi T(1×24m),日期类别数据表示为di T(1×24 m)。本实例中,共获取为期四个月123天每天24小时的天气,以及123天每天的节假日类型,天气和节 假日类型数据均对应于速度向量。如表1所示为某一路段预处理后的部分数据的格式示例。
表1
路段代号 | 当前速度 | 时间 | 天气 | 节假日 |
186 | 35 | 2013/10/1 8:00 | 1 | 3 |
186 | 35 | 2013/10/1 9:00 | 1 | 3 |
186 | 32.1429 | 2013/10/1 10:00 | 1 | 3 |
186 | 32 | 2013/10/1 11:00 | 1 | 3 |
186 | 33.3571 | 2013/10/1 12:00 | 1 | 3 |
186 | 34 | 2013/10/1 13:00 | 1 | 3 |
186 | 30.4 | 2013/10/1 14:00 | 1 | 3 |
步骤2:搜寻对预测路段的速度有影响的路段,并定义为待预测路段的相关 路段
(2.1)设c为待预测路段代号。本实例以c=306为例,路段306代表莫干 山路(从天目山路到金家渡中路)路段。删掉vc T的第一个样本和vi T (i=1,2,…,L,i≠c)的最后一个样本后重新对齐,构成L个新的速度向量 Vi T(1×24m),这样对齐的目的是为了分析其他路段i上一时刻的速度对待预测路 段c当前时刻的速度的影响。
(2.2)对于L个新的速度向量Vi T(1×24m),(i=1,2,…,L),用一个长度为K 个样本的一维滑动窗口滑过vi T(1×24m),每次向后滑动12个样本,那么一共可 以滑动z次,其中z=(24m-K)/12。将路段i在第j个滑动窗口中的数据所组成的 列向量记为则所有路段在第j个滑动窗口中的列向量组成一个 矩阵窗口移动z次共得到z个矩阵,对于第j个矩阵,按照 下式计算与其他L-1个列向量的相关系数
那么,路段306与任意路段i的速度滑动相关程度系数定义为Rci,由下式 得到:
(2.3)然后依据Rci确定相关路段:将Rci按照降序排列,从中选取前F个最 大值所对应的路段代号i,则相关路段确定完毕。表示在除路段c以外的路段中 选取了F个与路段c相关的路段,其路段代号记为r1,r2,...,rF,这些相关路段的速 度将作为变量用于预测模型的建立。本实例中,将R306,i按照降序排列,图2为 降序排列后的前5个路段的相关程度,本实例中F选为2,从中选取前2个最大 值所对应的路段代号i。可以看出,路段305的相关程度最高,为3.1070,路段 308的相关程度第二高,为2.5193。则相关路段确定完毕,即在除路段306以 外的路段中选取了2个与路段306相关的路段,其路段代号分别为 r1=305,r1=308,相关路段的速度将作为变量用于预测模型的建立。
步骤3:确定模型的输入变量
对于路段代号为c的待预测路段,在第M~m天内,采用如下四部分的样本 对第t时刻的交通速度vc(t)进行预测:
第一部分为:路段c在t-24M,t-24(M-1),...,t-24时刻的速度;
第二部分为:路段c在t-N,t-(N-1),...t-1时刻的速度;
第三部分为:步骤二所述的F个与路段c相关的路段在(t-1)时刻的速度 vr1,vr2,...,vrF;
第四部分为:路段c在t时刻的天气和时间类型wc(t),dc(t)。
路段c在t-24M,t-24(M-1),...,t-24时刻的速度、路段c在t-N,t-(N-1),...t-1时刻的速度、步骤二所述的F个与路段c相关的路段在(t-1)时刻的速度 vr1,vr2,...,vrF、路段c在t时刻的天气和时间类型wc(t),dc(t)依次构成长度为 M+N+F+2的预测变量。24(m-M)个预测变量和响应变量组成维度为 24(m-M)×(M+N+F+2)的预测变量矩阵X'和维度为24(m-M)×1的响应变量矩阵 Y。本实例中,考虑到交通速度会存在以星期(7天)为周期的周期性,将M选 为7。关于N的选择,本实例选取N=6用来体现交通速度数据的时间临近性。 预测路段为306,则由24(123-7)=2784个预测变量和响应变量可得到预测变 量矩阵X(2784×17)和响应变量矩阵Y(2784×1)。取前2401个样本作为训练集,第 2402~2784个样本作为测试集。
步骤4:提取速度变量的慢特征
(4.1)取步骤3中所述预测变量矩阵X'的前M+N+F列,作为速度变量矩 阵X'1,本实例中,M+N+F=7+6+2=15,共15列。对于X'1的第i列X1i',进行如 下式所示的减均值的中心化处理:
X1i=X1i'-var(X1i') (21)
其中,i=1,2,…,M+N+F,var(X1i')表示X1的第i列的均值。
中心化处理后的X1i组成新的变量矩阵X1。
(4.2)构造X1的协方差矩阵,并进行SVD分解,如下式所示:
X1X1 T=UΛUT (22)
按下式进行白化处理:
Z=Λ-1/2UTX1=QX1 (23)
则静态慢特征S1=PB=WX1,其中,W=PQ。
(4.4)对S1进行行向量差分,从第2行开始,每行减去上一行得到新的矩 阵,即得到动态慢特征S2。
(4.5)去掉S1的第一行,与S2按行方向进行拼接,得到特征维度为2(M+N+F) 的速度慢特征矩阵S。本实例得到2400×30维的速度慢特征矩阵S。
步骤5:建立基于时空宽度学习的交通速度预测模型
(5.1)构建网络的特征节点。将静态慢特征S1和动态慢特征S2作为由原始 数据映射得到的特征节点,S1作为第一组映射特征,记为Z1;S2作为第二组映 射特征,记为Z2;对应时刻的天气因素和节假日因素[wc,dc]记为Z3。给定记号 Z=[Z1,Z2,Z3]表示两组映射特征和其他特征。
(5.2)构造增强节点:
其中,ξj是第j组增强节点的激活函数,是第j组增强节点的随机权重系数矩阵,为第j组增强节点的偏置项。前g组增强节点被记为Hg=[H1,H2...,Hg]。 本实例中,的维度为2400×1,g取为100,即构造100个增强节点,增强节点 的激活函数均为sigmoid函数。
(5.3)将网络的所有特征节点和增强节点连接到输出端,如下式所示:
(5.4)采用ElasticNet的思想,同时引入L1和L2正则化。本实例中,L1 正则化参数λ1设为0.5,L2正则化参数λ2设为0.25。求解权重Wm:
步骤6:在线预测
(6.1)对测试样本,首先执行步骤1到步骤3,得到测试样本的待预测变 量矩阵Xt(p×(M+N+F+2))和响应变量矩阵Yt(p×1),p为测试样本个数。本实例 中,对步骤3所划分出的包含383个样本的测试集,首先执行步骤1到步骤3, 得到测试样本的预测变量矩阵Xt(383×17)和响应变量矩阵Yt(383×1)。
其中W为步骤(4.3)中获取的W。对求行向量差分,第1行减去训练集的 最后一行,从第2行开始,每行减去前一行。这样得到一个新的矩阵,即是动 态慢特征将与进行行方向的拼接,得到p×(2M+2N+2F)维的速度慢特 征矩阵St。本实例中得到383×30维的速度慢特征矩阵St。
(6.3)将速度慢特征矩阵St与对应的天气因素wt和节假日因素dt代入步骤5 所建立的预测模型,得到预测结果计算测试集真实标签与预测结果的均方 误差RMSE,为0.889911。并绘制真实值与预测结果的曲线图,如图3所示。 从图中可以看出,本发明方法可以很好的跟随真实速度的变化趋势,实现交通 速度的较为准确的预测。为与常用的机器学习算法作对比,本实例将该方法与 支持向量回归、神经网络模型作了对比,图4为支持向量回归方法的预测结果 与真实值的对比曲线图,图5为神经网络方法的预测结果与真实值的对比曲线 图。表2为三种方法在测试集上的RMSE以及模型训练时间对比。从表中可以 看出,本方法不但缩短了模型训练的时间,而且减小了均方误差,提高了预测 精度。
表2
模型 | 测试集RMSE | 训练耗时 |
本发明所述模型 | 0.8899 | 0.23s |
支持向量回归 | 0.9427 | 0.76s |
神经网络 | 1.1748 | 3.21s |
为了进一步证明模型的有效性,随机选取10个路段,分别用本发明所述方 法和其他两个对比方法进行建模,建模过程同上。计算测试集的RMSE,结果 如表3所示。
表3
本发明所述模型 | 支持向量回归 | 神经网络 | |
路段306 | 0.8899 | 0.9427 | 1.1784 |
路段302 | 2.7762 | 3.0105 | 3.0450 |
路段102 | 1.4694 | 1.7488 | 2.7623 |
路段1376 | 1.2387 | 1.2209 | 1.2866 |
路段185 | 1.7301 | 1.7781 | 1.8634 |
路段267 | 3.6634 | 3.7440 | 3.9750 |
路段503 | 3.1016 | 3.2283 | 3.0245 |
路段369 | 1.7893 | 2.2310 | 2.5732 |
路段414 | 3.5668 | 4.1035 | 3.9801 |
路段617 | 2.6468 | 3.1986 | 3.2315 |
10个路段RMSE均值 | 2.2872 | 2.5206 | 2.6920 |
从表中可以看出,与其他方法相比,本发明所述方法具有更低的预测误差, 且结论具有普遍性。
Claims (6)
1.一种基于时空宽度学习的交通速度预测方法,其特征在于,该方法包括以下步骤:
步骤1:建模数据预处理:对各路段的速度数据和对应时刻的天气类型、节假日类型进行预处理;
步骤2:搜寻对预测路段的速度有影响的路段,并定义为待预测路段的相关路段;具体包括如下子步骤:
(2.1)设c为待预测路段代号;删掉vc T的第一个样本和vi T(i=1,2,…,L,i≠c)的最后一个样本后重新对齐,构成L个新的速度向量Vi T(1×24m);其中,i为路段代号,i=1,2,…,L,L为路段总数;Vi T(1×24m)表示路段i在m天内获得的速度向量;对齐的目的是为了分析其他路段i上一时刻的速度对待预测路段c当前时刻的速度的影响;
(2.2)对于L个新的速度向量Vi T(1×24m),(i=1,2,…,L),用一个长度为K个样本的一维滑动窗口滑过vi T(1×24m),每次向后滑动12个样本,那么一共可以滑动z次,其中z=(24m-K)/12;将路段i在第j个滑动窗口中的数据所组成的列向量记为j=1,2,…,z;则所有路段在第j个滑动窗口中的列向量组成一个矩阵窗口移动z次共得到z个矩阵,对于第j个矩阵,按照下式计算与其他L-1个列向量的相关系数
那么,路段c与任意路段i的速度滑动相关程度系数定义为Rci,由下式得到:
(2.3)然后依据Rci确定相关路段:将Rci按照降序排列,从中选取前F个最大值所对应的路段代号i,则相关路段确定完毕;表示在除路段c以外的路段中选取了F个与路段c相关的路段,其路段代号记为r1,r2,...,rF,这些相关路段的速度将作为变量用于预测模型的建立;
步骤3:确定模型的输入变量;
步骤4:提取速度变量的慢特征;
步骤5:建立基于时空宽度学习的交通速度预测模型;
步骤6:在线预测。
2.根据权利要求1所述的方法,其特征在于,所述步骤1具体为:
对于速度数据,将获取的车辆速度数据按照不同路段分类,按时间先后顺序排序;对需要分析的每一个路段,选取第k时刻之后的1小时作为时间间隔,k表示该时间间隔的起点,用该时间间隔内该路段上速度的平均值来代替第k时刻的速度;k=0,1,2,…,23,即每个时间间隔的起点为整点,从而每个路段每天被分割成24个时刻,即0点到23点,每一个时刻对应一个固定的速度值;则路段i在m天内获得的速度向量可以表示为vi T(1×24m),其中,i为路段代号,i=1,2,…,L,L为路段总数;
对于天气,按照降水量大小将其分类,分别用不同标签表示;将日期类型分为三类:工作日、周末、节假日,分别用不同标签表示;获取上述速度变量对应时刻的天气和日期类型,路段i在m天内的天气数据表示为wi T(1×24m),日期类别数据表示为di T(1×24m)。
3.根据权利要求1所述的方法,其特征在于,所述步骤3具体为:
对于路段代号为c的待预测路段,在第M~m天内,采用如下四部分的样本对第t时刻的交通速度vc(t)进行预测:
第一部分为:路段c在t-24M,t-24(M-1),...,t-24时刻的速度;
第二部分为:路段c在t-N,t-(N-1),...t-1时刻的速度;
第三部分为:步骤2所述的F个与路段c相关的路段在(t-1)时刻的速度vr1,vr2,...,vrF;
第四部分为:路段c在t时刻的天气和时间类型wc(t),dc(t);
路段c在t-24M,t-24(M-1),...,t-24时刻的速度、路段c在t-N,t-(N-1),...t-1时刻的速度、步骤2所述的F个与路段c相关的路段在(t-1)时刻的速度vr1,vr2,...,vrF、路段c在t时刻的天气和时间类型wc(t),dc(t)依次构成长度为M+N+F+2的预测变量;
24(m-M)个预测变量和响应变量组成维度为24(m-M)×(M+N+F+2)的预测变量矩阵X'和维度为24(m-M)×1的响应变量矩阵Y。
4.根据权利要求3所述的方法,其特征在于,所述步骤4具体为:
(4.1)取步骤3中所述预测变量矩阵X'的前M+N+F列,作为速度变量矩阵X1',对于X1'的第i列X1i',进行如下式所示的减均值的中心化处理:
X1i=X1i'-var(X1i') (3)
其中,i=1,2,…,M+N+F,var(X1i')表示X1的第i列的均值;
中心化处理后的X1i组成新的变量矩阵X1;
(4.2)构造X1的协方差矩阵,并进行SVD分解,如下式所示:
X1X1 T=UΛUT (4)
按下式进行白化处理:
B=Λ-1/2UTX1=QX1 (5)
其中,B为白化后的矩阵,Q=Λ-1/2UT是白化矩阵;
则静态慢特征S1=PB=WX1,其中,W=PQ;
(4.4)对S1进行行向量差分,从第2行开始,每行减去上一行得到新的矩阵,即得到动态慢特征S2;
(4.5)去掉S1的第一行,与S2按行方向进行拼接,得到特征维度为2(M+N+F)的速度慢特征矩阵S。
5.根据权利要求4所述的方法,其特征在于,所述步骤6具体为:
(6.1)对测试样本,首先执行步骤1到步骤3,得到测试样本的待预测变量矩阵Xt(p×(M+N+F+2))和响应变量矩阵Yt(p×1),p为测试样本个数;
其中W为步骤(4.3)中获取的W;对求行向量差分,第1行减去训练集的最后一行,从第2行开始,每行减去前一行;这样得到一个新的矩阵,即是动态慢特征将与进行行方向的拼接,得到p×(2M+2N+2F)维的速度慢特征矩阵St;
6.根据权利要求3所述的方法,其特征在于,所述步骤5具体为:
(5.1)构建网络的特征节点;将静态慢特征S1和动态慢特征S2作为由原始数据映射得到的特征节点,S1作为第一组映射特征,记为Z1;S2作为第二组映射特征,记为Z2;对应时刻的天气因素和节假日因素[wc,dc]记为Z3;给定记号Z=[Z1,Z2,Z3]表示两组映射特征和其他特征;
(5.2)构造增强节点:
(5.3)将网络的所有特征节点和增强节点连接到输出端,如下式所示:
(5.4)采用ElasticNet的思想,同时引入L1和L2正则化;求解权重Wm:
λ1λ2为正则化系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810691891.8A CN109035762B (zh) | 2018-06-28 | 2018-06-28 | 一种基于时空宽度学习的交通速度预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810691891.8A CN109035762B (zh) | 2018-06-28 | 2018-06-28 | 一种基于时空宽度学习的交通速度预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109035762A CN109035762A (zh) | 2018-12-18 |
CN109035762B true CN109035762B (zh) | 2020-12-18 |
Family
ID=65521911
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810691891.8A Active CN109035762B (zh) | 2018-06-28 | 2018-06-28 | 一种基于时空宽度学习的交通速度预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109035762B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109828552B (zh) * | 2019-02-22 | 2020-08-28 | 北京工业大学 | 一种基于宽度学习***的间歇过程故障监测与诊断方法 |
CN110009135B (zh) * | 2019-03-08 | 2021-04-27 | 浙江大学 | 一种基于宽度学习的风电功率预测方法 |
CN110299005B (zh) * | 2019-06-10 | 2020-11-17 | 浙江大学 | 一种基于深度集成学习的城市大规模路网交通速度预测方法 |
CN110570019A (zh) * | 2019-08-14 | 2019-12-13 | 中国地质大学(武汉) | 一种基于宽度学习的烧结过程综合焦比时序预测方法 |
CN111613054B (zh) * | 2020-05-07 | 2021-07-06 | 浙江大学 | 一种协同考虑时空相关性及贡献差异的多步交通速度预测方法 |
CN113098910B (zh) * | 2021-05-13 | 2022-05-10 | 福州大学 | 基于时空粒度和三宽度学习的网络入侵检测方法及*** |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150072471A (ko) * | 2013-12-19 | 2015-06-30 | 건국대학교 산학협력단 | 시공간 확률 모델을 이용한 교통 흐름 예측 시스템 |
CN104408913B (zh) * | 2014-11-03 | 2016-03-16 | 东南大学 | 一种考虑时空相关性的交通流三参数实时预测方法 |
CN104537260B (zh) * | 2015-01-14 | 2018-02-09 | 清华大学 | 基于缓慢特征回归的动态软测量方法和*** |
CN106971547B (zh) * | 2017-05-18 | 2019-06-04 | 福州大学 | 一种考虑时空相关性的短时交通流预测方法 |
CN107464419A (zh) * | 2017-08-28 | 2017-12-12 | 北京工业大学 | 一种考虑时空特性的短时交通流预测方法 |
-
2018
- 2018-06-28 CN CN201810691891.8A patent/CN109035762B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109035762A (zh) | 2018-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109035762B (zh) | 一种基于时空宽度学习的交通速度预测方法 | |
CN109285346B (zh) | 一种基于关键路段的城市路网交通状态预测方法 | |
CN111612243B (zh) | 交通速度预测方法、***及存储介质 | |
CN111613054B (zh) | 一种协同考虑时空相关性及贡献差异的多步交通速度预测方法 | |
CN110782663B (zh) | 一种结合时空特性的路网交通流量短时预测方法 | |
CN113096388B (zh) | 一种基于梯度提升决策树的短时交通流量预测方法 | |
CN113362598B (zh) | 一种高速公路服务区车流量预测方法 | |
CN110675632B (zh) | 针对多特征空间和数据稀疏的车辆短时轨迹预测控制方法 | |
CN111862592A (zh) | 一种基于rgcn的交通流预测方法 | |
CN112884014A (zh) | 一种基于路段拓扑结构分类的交通速度短时预测方法 | |
CN115565369A (zh) | 一种基于超图的时空超图卷积交通流量预测方法及*** | |
CN113033081A (zh) | 一种基于som-bpnn模型的径流模拟方法及*** | |
CN116913088A (zh) | 一种用于高速公路的智能流量预测方法 | |
CN115206092A (zh) | 一种基于注意力机制的BiLSTM和LightGBM模型的交通预测方法 | |
CN112215231A (zh) | 一种结合空间深度卷积和残差结构的大尺度点云语义分割方法 | |
CN111815075B (zh) | 一种重大公共卫生事件下交通出行需求的预测方法 | |
CN112115754B (zh) | 基于烟花差分进化混合算法-极限学习机的短时交通流预测模型 | |
CN113112792A (zh) | 一种基于语义信息的多模块交通密集度预测方法 | |
CN113065684A (zh) | 基于vae和深度学习组合模型的高速公路旅行时间预测方法 | |
CN112712695B (zh) | 一种交通流预测方法、装置及存储介质 | |
CN109741597A (zh) | 一种基于改进深度森林的公交车路段运行时间预测方法 | |
CN115909717A (zh) | 一种基于深度学习的高速公路短时交通流预测方法 | |
CN115063972A (zh) | 基于图卷积和门控循环单元的交通速度预测方法和*** | |
CN109871513B (zh) | 一种高速公路车辆通行行为相似度计算方法及*** | |
CN114139773A (zh) | 一种基于时空图卷积网络的公共交通流量预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |