CN108564790B - 一种基于交通流时空相似性的城市短时交通流预测方法 - Google Patents

一种基于交通流时空相似性的城市短时交通流预测方法 Download PDF

Info

Publication number
CN108564790B
CN108564790B CN201810603991.0A CN201810603991A CN108564790B CN 108564790 B CN108564790 B CN 108564790B CN 201810603991 A CN201810603991 A CN 201810603991A CN 108564790 B CN108564790 B CN 108564790B
Authority
CN
China
Prior art keywords
time
traffic
traffic flow
space
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810603991.0A
Other languages
English (en)
Other versions
CN108564790A (zh
Inventor
胡玉龙
罗伦
熊国清
李迪龙
王芳
巢伦
逯跃锋
卢晶晶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Transport Telecommunications And Information Center
Guojiao Space Information Technology Beijing Co ltd
Original Assignee
China Transport Telecommunications And Information Center
Guojiao Space Information Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Transport Telecommunications And Information Center, Guojiao Space Information Technology Beijing Co ltd filed Critical China Transport Telecommunications And Information Center
Priority to CN201810603991.0A priority Critical patent/CN108564790B/zh
Publication of CN108564790A publication Critical patent/CN108564790A/zh
Application granted granted Critical
Publication of CN108564790B publication Critical patent/CN108564790B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0129Traffic data processing for creating historical data or processing based on historical data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明涉及一种基于交通流时空相似性的城市短时交通流预测方法,该方法对传统的非参数回归方法进行了改造,包括如下步骤:S1、基于交通流时空相似性,定义交通流的时间状态向量、时空状态向量;S2、构造当前时段下交通流的“当前时空状态向量;S3、构造历史上不同日期同一时段下交通流的“历史时空状态向量”;S4、使用距离度量函数计算当前和各历史时空状态向量间的“时空相似距离”;S5、选择k个时空相似距离最小的历史状态向量所在的日期,查出这k个历史日期对应的预测时段的交通流;S6、基于这k个历史日期对应的预测时段的交通流,使用预测函数计算目标路段下一时段的交通流;S7、根据交通流的预测结果和实际结果,对目标路段的预测误差进行评价分析。目的在于提高城市短时交通流预测的准确度。

Description

一种基于交通流时空相似性的城市短时交通流预测方法
技术领域
本发明涉及智能交通浮动车轨迹大数据的应用技术领域,尤其涉及一种基于交通流时空相似性的城市短时交通流预测方法。
背景技术
交通流预测分为以交通规划为目的的长期交通流预测,以交通管理为目的的中期交通流预测,以及以实时交通控制和引导为目的短时交通流预测。为控制和诱导服务的短时交通流预测的时间跨度较之前两种大大的缩小,一般不超过15分钟。在较短的时间段内,交通流变化的周期性降低,随机性和非线性增强,各种干扰造成的影响也较大,因此短时交通流预测相对中长期预测难度更大。
自20世纪80年代初以来,短时交通预测理论为智能交通***的实现提供基础理论支持和数据支持,一直是智能交通***的研究和应用的一个重要组成部分,也是近年来兴起的智慧城市、城市计算和时空数据挖掘等研究的重要内容,对改进城市规划、缓解交通拥堵、节约能耗、提高城市交通管理水平和人们的出行效率有重要作用。
传统的短时交通预测方法主要有历史平均模型(HA)、BP神经网络模型、原始短时交通流预测Original KNN模型等,这些模型的预测结果及分析中,HA模型只考虑了交通状态的周期性,没有考虑其时变性,抗干扰能力差,不能反映交通流的动态性和非线性;BP-NN模型能识别复杂非线性***,不需要经验公式,但隐层节点数的确立没有统一的方法,只能凭经验试凑,存在局部极小,收敛速度慢,难以实现在线调节;Original KNN模型虽然也是基于数据驱动的非参数回归方法,但是其只考虑了时间维度上交通流的相似性,而只使用基于时间相似性的状态向量并不能很全面的描述道路交通流的特征。
随着短时交通预测方法研究的不断深入,其他学者提出了基于时空权重的KNN改进模型(STW-KNN),STW-KNN模型虽然也考虑了空间因素对交通状态的影响,但是只是简单的加入了上下游交通状态,并没有考虑周围路段与目标路段的流量关系,也没有度量周围路段的影响程度。
基于上述研究背景,为了能够克服传统短时交通预测中存在的上述缺陷或者不足,以及近些年部分学者提出的短时交通流预测方法中缺点,本发明引入城市交通流的时空相似性,改进传统的非参数回归模型,提出一种基于交通流时空相似性的K近邻非参数回归预测模型——STS-KNN模型(K-Nearest Neighbors model based on Spatial-TemporalSimilarity of Traffic based)。
发明内容
本发明的目的在于:克服现有技术中短时交通预测方法存在的上述不足,提供一种基于交通流时空相似性的城市短时交通流预测方法,目的在于提高城市短时交通流预测的准确度。
为了达到上述目的,本发明采用如下技术方案实现:
一种基于交通流时空相似性的城市短时交通流预测方法,该方法包括如下步骤:
S1、基于交通流时空相似性,定义交通流的时间状态向量TSV、时空状态向量STSV;
S2、构造当前时段下交通流的“当前时空状态向量;
S3、构造历史上不同日期同一时段下交通流的“历史时空状态向量”;
S4、使用距离度量函数计算当前和各历史时空状态向量间的“时空相似距离”STD;
S5、选择k个相似距离最小的历史状态向量所在的日期,查出这k个历史日期对应的预测时段的交通流;
S6、基于这k个历史日期对应的预测时段的交通流,使用预测函数计算目标路段下一时段的交通流;
S7、根据交通流的预测结果和实际结果,对目标路段的预测误差进行评价分析。
作为上述方案的进一步优化,步骤S1的计算具体如下:
S11、定义路段m交通流的时间状态向量
Figure BDA0001693839380000022
时间状态向量是指从时间维度上来描述目标路段交通状态(这里使用交通流描述交通状态)的特征,包括本路段过去若干时段的交通流,以及相邻路段间交通流的变化趋势,
Figure BDA0001693839380000023
定义如下:
Figure BDA0001693839380000021
其中,Vm(t)代表路段m在时段t的交通流;Vm(t-d)代表路段m在过去时段t-d的交通流;d代表滞后时段,也称为匹配窗口,可利用历史数据通过试验中确定,公式的前半部分用于描述过去时段的影响,后半部分描述交通变化趋势的影响;
S12、定义路段m交通流的时空状态向量
Figure BDA0001693839380000024
时空状态向量从时间和空间两个维度来描述道路的交通特征,即认为目标路段的交通状态还与周边区域的交通状态有关,
Figure BDA0001693839380000033
定义如下:
Figure BDA0001693839380000031
其中,
Figure BDA0001693839380000034
代表路段m在时段t的时间状态向量;m1,...,mn代表路段m的n个流量相似路段,
Figure BDA0001693839380000035
代表路段m的第n个“流量相似路段”的时间状态向量;n代表路段m的流量相似路段的数量,与具体的路网结构有关,可利用历史数据通过试验确定,通过公式可以看出,时空状态向量是由目标路段与其空间相邻的“流量相似路段”的“时间状态向量”组成;
S13、流量相似路段的判别方法:使用同一时段内穿过相邻两个路段的浮动车的数量来度量路段之间的流量相似性,如果穿过两个路段的浮动车数量多,说明这两个路段的交通流相似性越大。
作为上述方案的进一步优化,步骤S2的计算具体如下:
S21、根据公式(1)计算当前时段t下,目标路段m的当前时间状态向量
Figure BDA0001693839380000036
及其流量相似路段m1,...,mn的当前时间状态向量
Figure BDA0001693839380000037
S22、根据S21计算的各路段时间状态向量和公式(2),计算当前时段t下,目标路段m的当前时空状态向量
Figure BDA0001693839380000038
作为上述方案的进一步优化,步骤S3的计算具体如下:
S31、根据公式(1)计算不同历史日期的时段t下,目标路段m的各历史时间状态向量
Figure BDA0001693839380000039
及其流量相似路段m1,...,mn的各历史时间状态向量
Figure BDA00016938393800000310
S32、根据S31计算的各路段时间状态向量和公式(2),计算各历史日期的时段t下,目标路段m的各历史时空状态向量
Figure BDA00016938393800000311
作为上述方案的进一步优化,步骤S4的计算具体如下:
S41、首先计算当前和各历史时间状态向量间的距离:时间相似距离,通过下式计算:
Figure BDA0001693839380000032
其中0≤a≤1,dT(XCT(t),XHT(t))表示当前和历史时间状态向量间的距离,即“时间相似距离”;Vc(t-p)和(Vc(t-p-1)-Vc(t-p))是当前时间状态向量中的元素,分别表示当前t-p时段的交通流和交通流在相邻时段间的变化量;Vh(t-p)和(Vh(t-p-1)-Vh(t-p))是历史时间状态向量中的元素,分别表示历史不同日期同一时段的交通流和交通流的变化量;该公式不仅度量了当前交通状态和历史交通状态的差距,也度量了当前交通变化趋势和历史交通变化趋势的差距,这种差距反映了历史状态与当前状态的相似程度;这里用参数α表示交通流差距和交通流变化趋势差距所占的权重,可通过交通流历史数据分析确定最优值;
S42、基于公式(3)计算的目标路段和其相似路段的“时间相似距离”,使用距离度量函数
Figure BDA0001693839380000042
计算目标路段当前和各历史时空状态向量间的“时空相似距离”,通过下式计算:
Figure BDA0001693839380000043
其中,
Figure BDA0001693839380000044
代表目标路段自身的“时间相似距离”,
Figure BDA0001693839380000045
表示目标路段的第i个“流量相似路段”的“时间相似距离”;可以看出,“时空相似距离”是由目标路段的和其流量相似路段的加权“时间相似距离”组成;Wk是不同流量相似路段所占的权重,按照“流量相似度”降序排序,通过下式秩次加权的方法计算:
Figure BDA0001693839380000041
其中:rk为第k个候选近邻的顺序,K为近邻的数量;“流量相似度”越大,rk越小,Wk越大,即“流量相似度”越大的路段对目标路段的交通状态影响越大。
作为上述方案的进一步优化,步骤S5的计算具体如下:
S51、在上一步计算出当前和各历史时空状态向量间的“时空相似距离”后,对该距离排序,查出K个相似距离最小的历史时空状态向量,并得出对应的K个历史日期;
S52、在历史交通流数据库中,查出这K个历史日期下t+1时段的交通流V′k(t+1)。
作为上述方案的进一步优化,步骤S6的计算具体如下:
S61、获得历史上K个历史日期的t+1时段的交通流V′k(t+1);
S62、使用预测函数计算t+1时段(预测时段)路段m的交通流Vm(t+1),预测函数如下式所示;
Figure BDA0001693839380000051
其中:V′k(t+1)为历史数据库中搜索到的第k个近邻所对应的下一时段的平均交通流,近邻的度量标准使用的即“距离度量函数”;Wk为V′k(t+1)所占的权重;
S63、基于秩次加权的权函数Wk通过下式计算:
Figure BDA0001693839380000052
其中:rk为第k个候选近邻的顺序,K为近邻的数量。由于交通***的强时变性,同一路段在不同时期的交通状况差别很大,因此在预测目标路段未来交通状况时,搜索到的不同历史近邻的重要程度也不同,因此本发明使用加权的方式度量不同近邻对预测结果的影响程度。
作为上述方案的进一步优化,在所述步骤S7中,采用以下的评价标准对预测误差进行评价分析:
Figure BDA0001693839380000053
其中,MAPE是平均相对百分比误差,D代表预测的天数;L代表预测的时段数量;Fd,t和Od,t分别代表目标路段第D天第t个时段的预测值和真实值,使用MAPE对比不同模型的预测精度,更低的MAPE意味着更高的预测精度,并且模型的预测性能可由不同的MAPE范围评价,一般当MAPE≤20%,就认为预测是有效的。
一个完整的非参数回归预测框架应考虑3个关键要素:能够恰当描述当前和历史数据模式的状态向量;确定历史状态和当前状态相似度的距离度量函数;利用候选相似历史状态进行预测的预测函数,本发明针对城市路网交通“流量相似性”的特点,对现有的非参数回归方法进行改进,以此为基础设计了基于交通流时空相似性的状态向量和距离度量函数。采用本发明的基于交通流时空相似性的城市短时交通流预测方法具有如下有益效果:
1)定义并引入了“流量相似路段”和“流量相似度”,将其作为一个重要因素引入到本发明提出的预测模型中,该因素能够度量周围路段对目标路段交通状态的影响权重;
2)相对于其他固定的参数化的预测方法,该模型没有固定的参数,其参数d、k、n、α能够根据已获取的数据来确定,完全由预测目标的历史数据驱动,模型的应用适合城市不同区域的路网环境,这一特点保证了本预测方法的高适用性;
3)相对于已有的非参数回归预测方法,该模型利用城市道路交通流时间和空间上的相似性,改进非参数回归模型中的状态向量和距离度量函数两个关键要素,能够更好的描述道路的交通状态,提高了城市短时交通流预测的精准度。
附图说明
图1为本发明基于交通流时空相似性的城市短时交通流预测方法的流程示意图。
图2为1辆浮动车1天的轨迹点空间分布图;
图3为某路段144个时段(10min/时段)30天交通流量的时间分布图;
图4为4条空间相连路段在某天144个时段的交通流量统计图;
图5为STS-KNN模型中各个参数对预测性能造成的影响;
图6为历史数据规模对预测性能的影响;
图7为浮动车数量对预测性能的影响;
图8为某市中心城区1个月早晚高峰的平均交通流量空间分布图;
图9为不同路段环境下STS-KNN模型预测误差;
图10为不同模型的多步预测误差对比。
具体实施方式
下面结合附图1-10对本发明基于交通流时空相似性的城市短时交通流预测方法作以详细说明。
一种基于交通流时空相似性的城市短时交通流预测方法,该方法包括如下步骤:
S1、基于交通流时空相似性,定义交通流的时间状态向量TSV、时空状态向量STSV;
S2、构造当前时段下交通流的“当前时空状态向量;
S3、构造历史上不同日期同一时段下交通流的“历史时空状态向量”;
S4、使用距离度量函数计算当前和各历史时空状态向量间的“时空相似距离”STD;
S5、选择k个相似距离最小的历史状态向量所在的日期,查出这k个历史日期对应的预测时段的交通流;
S6、基于这k个历史日期对应的预测时段的交通流,使用预测函数计算目标路段下一时段的交通流;
S7、根据交通流的预测结果和实际结果,对目标路段的预测误差进行评价分析。
步骤S1的计算具体如下:
S11、定义路段m交通流的时间状态向量
Figure BDA0001693839380000073
时间状态向量是指从时间维度上来描述目标路段交通状态(这里使用交通流描述交通状态)的特征,包括本路段过去若干时段的交通流,以及相邻路段间交通流的变化趋势,
Figure BDA0001693839380000074
定义如下:
Figure BDA0001693839380000071
其中,Vm(t)代表路段m在时段t的交通流;Vm(t-d)代表路段m在过去时段t-d的交通流;d代表滞后时段,也称为匹配窗口,可利用历史数据通过试验中确定,公式的前半部分用于描述过去时段的影响,后半部分描述交通变化趋势的影响;
S12、定义路段m交通流的时空状态向量
Figure BDA0001693839380000075
时空状态向量从时间和空间两个维度来描述道路的交通特征,即认为目标路段的交通状态还与周边区域的交通状态有关,
Figure BDA0001693839380000076
定义如下:
Figure BDA0001693839380000072
其中,
Figure BDA0001693839380000077
代表路段m在时段t的时间状态向量;m1,...,mn代表路段m的n个流量相似路段,
Figure BDA0001693839380000078
代表路段m的第n个“流量相似路段”的时间状态向量;n代表路段m的流量相似路段的数量,与具体的路网结构有关,可利用历史数据通过试验确定,通过公式可以看出,时空状态向量是由目标路段与其空间相邻的“流量相似路段”的“时间状态向量”组成;
S13、流量相似路段的判别方法:使用同一时段内穿过相邻两个路段的浮动车的数量来度量路段之间的流量相似性,如果穿过两个路段的浮动车数量多,说明这两个路段的交通流相似性越大。
步骤S2的计算具体如下:
S21、根据公式(1)计算当前时段t下,目标路段m的当前时间状态向量
Figure BDA0001693839380000079
及其流量相似路段m1,...,mn的当前时间状态向量
Figure BDA00016938393800000710
S22、根据S21计算的各路段时间状态向量和公式(2),计算当前时段t下,目标路段m的当前时空状态向量
Figure BDA00016938393800000711
作为上述方案的进一步优化,步骤S3的计算具体如下:
S31、根据公式(1)计算不同历史日期的时段t下,目标路段m的各历史时间状态向量
Figure BDA0001693839380000084
及其流量相似路段m1,...,mn的各历史时间状态向量
Figure BDA0001693839380000085
S32、根据S31计算的各路段时间状态向量和公式(2),计算各历史日期的时段t下,目标路段m的各历史时空状态向量
Figure BDA0001693839380000086
步骤S4的计算具体如下:
S41、首先计算当前和各历史时间状态向量间的距离:时间相似距离,通过下式计算:
Figure BDA0001693839380000081
其中0≤α≤1,dT(XCT(t),XHT(t)表示当前和历史时间状态向量间的距离,即“时间相似距离”;Vc(t-p)和(Vc(t-p-1)-Vc(t-p))是当前时间状态向量中的元素,分别表示当前t-p时段的交通流和交通流在相邻时段间的变化量;Vh(t-p)和(Vh(t-p-1)-Vh(t-p))是历史时间状态向量中的元素,分别表示历史不同日期同一时段的交通流和交通流的变化量;该公式不仅度量了当前交通状态和历史交通状态的差距,也度量了当前交通变化趋势和历史交通变化趋势的差距,这种差距反映了历史状态与当前状态的相似程度;这里用参数α表示交通流差距和交通流变化趋势差距所占的权重,可通过交通流历史数据分析确定最优值;
S42、基于公式(3)计算的目标路段和其相似路段的“时间相似距离”,使用距离度量函数
Figure BDA0001693839380000087
计算目标路段当前和各历史时空状态向量间的“时空相似距离”,通过下式计算:
Figure BDA0001693839380000082
其中,
Figure BDA0001693839380000088
代表目标路段自身的“时间相似距离”,
Figure BDA0001693839380000089
表示目标路段的第i个“流量相似路段”的“时间相似距离”;可以看出,“时空相似距离”是由目标路段的和其流量相似路段的加权“时间相似距离”组成;Wk是不同流量相似路段所占的权重,按照“流量相似度”降序排序,通过下式秩次加权的方法计算:
Figure BDA0001693839380000083
其中:rk为第k个候选近邻的顺序,K为近邻的数量;“流量相似度”越大,rk越小,Wk越大,即“流量相似度”越大的路段对目标路段的交通状态影响越大。
步骤S5的计算具体如下:
S51、在上一步计算出当前和各历史时空状态向量间的“时空相似距离”后,对该距离排序,查出K个相似距离最小的历史时空状态向量,并得出对应的K个历史日期;
S52、在历史交通流数据库中,查出这K个历史日期下t+1时段的交通流V′k(t+1)。
步骤S6的计算具体如下:
S61、获得历史上K个历史日期的t+1时段的交通流V′k(t+1);
S62、使用预测函数计算t+1时段(预测时段)路段m的交通流Vm(t+1),预测函数如下式所示;
Figure BDA0001693839380000091
其中:V′k(t+1)为历史数据库中搜索到的第k个近邻所对应的下一时段的平均交通流,近邻的度量标准使用的即“距离度量函数”;Wk为V′k(t+1)所占的权重;
S63、基于秩次加权的权函数Wk通过下式计算:
Figure BDA0001693839380000092
其中:rk为第k个候选近邻的顺序,K为近邻的数量。由于交通***的强时变性,同一路段在不同时期的交通状况差别很大,因此在预测目标路段未来交通状况时,搜索到的不同历史近邻的重要程度也不同,因此本发明使用加权的方式度量不同近邻对预测结果的影响程度。
在所述步骤S7中,采用以下的评价标准对预测误差进行评价分析:
Figure BDA0001693839380000093
其中,MAPE是平均相对百分比误差,D代表预测的天数;L代表预测的时段数量;Fd,t和Od,t分别代表目标路段第D天第t个时段的预测值和真实值,使用MAPE对比不同模型的预测精度,更低的MAPE意味着更高的预测精度,并且模型的预测性能可由不同的MAPE范围评价,一般当MAPE≤20%,就认为预测是有效的。
本发明所利用的数据为某市12000辆出租车1个月产生的所有GPS记录,共含有超过9.72亿条GPS记录,每辆车GPS记录采集间隔为8秒到1分钟左右,数据总量占用计算机存储空间52.4GB。图2显示了本发明研究的城区范围以及一辆出租车在1天内产生的1050条GPS位置记录。具体操作步骤为:
步骤一:数据预处理阶段。原始浮动车的GPS记录可能存在部分异常数据,例如异常离群点、属性信息丢失等,预处理阶段首先清理掉这些异常数据,然后利用提取的属性数据统计各个时段浮动车通过各个路段的浮动车流量和平均速度,最终,根据统计的结果建立历史交通流数据库。
步骤二:预测阶段。从时间和空间的维度来看,不同时空位置的城市交通流具有一定的相似性,这种相似性是使用非参数回归预测方法的基础。例如图3交通流的时间分布体现了某一路段的交通流具有很强的历史周期性,图4交通流量数据统计图体现了在不同时段下,某一个路段的交通流与其周围空间邻近路段的交通流具有较强的相似性,基于交通流历史数据库和交通流的时空相似性,使用本发明提出的STS-KNN预测模型对选定区域和选定时段未来5分钟的交通流量进行预测。
步骤三:结果反馈阶段。首先确定STS-KNN预测模型中的各项参数,并验证本发明提出的基于交通流时空相似性的状态向量在提高预测准确度上的有效性;然后考察历史数据规模和浮动车数量对STS-KNN预测模型的影响;最后验证模型在不同路网环境下的适用性,并和现有的短时交通预测方法进行对比分析。
进一步的,所述步骤二的具体操作如下:
S1、基于交通流时空相似性构建状态向量。找到与目标路段流量相似的相邻路段,通过以下公式计算目标路段和相似路段的当前时空状态向量和历史时空状态向量:
Figure BDA0001693839380000101
式中,
Figure BDA0001693839380000103
代表路段m在时段t的时空状态向量;
Figure BDA0001693839380000104
代表路段m在时段t的时间状态向量;1,…,n代表路段m的n个流量相似路段,
Figure BDA0001693839380000105
代表路段m的第n个“流量相似路段”的时间状态向量;n代表路段m的流量相似路段的数量。
时间状态向量通过下式计算:
Figure BDA0001693839380000102
其中,Vm(t)代表路段m在时段t的交通流;Vm(t-d)代表路段m在过去时段t-d的交通流;d代表滞后时段,也称为匹配窗口,可利用历史数据通过试验中确定。
S2、以交通流数据的时间和空间相似性为基础,使用时空相似距离计算当前状态向量和历史状态向量的距离,匹配出和当前时空状态向量相似的历史时空状态向量,时空相似距离的计算公式如下;
Figure BDA0001693839380000111
其中,
Figure BDA0001693839380000115
代表目标路段自身的“时间相似距离”,
Figure BDA0001693839380000116
表示目标路段的第i个“流量相似路段”的“时间相似距离”,时间相似距离通过下式计算:
Figure BDA0001693839380000112
其中0≤a≤1,Vc(t-p)和(Vc(t-p-1)-Vc(t-p))是当前时间状态向量中的元素,分别表示当前t-p时段的交通流和交通流在相邻时段间的变化量;Vh(t-p)和(Vh(t-p-1)-Vh(t-p))是历史时间状态向量中的元素,分别表示历史不同日期同一时段的交通流和交通流的变化量。
Wk是不同流量相似路段所占的权重,通过下式计算:
Figure BDA0001693839380000113
其中:rk为第k个候选近邻的顺序,K为近邻的数量。“流量相似度”越大,rk越小,Wk越大,即“流量相似度”越大的路段对目标路段的交通状态影响越大。
S3、综合各项参数,使用基于秩次加权的预测函数进行预测,得出目标路段未来一段时间的交通流状况,基于秩次加权的预测函数定义如下:
Figure BDA0001693839380000114
其中:V′k(t+1)为历史数据库中搜索到的第k个近邻所对应的下一时段的平均交通流,近邻的度量标准使用的即是本发明提出的距离度量函数;Wk为V′k(t+1)所占的权重,使用秩次加权的方法计算:
Figure BDA0001693839380000121
其中:rk为第k个候选近邻的顺序,K为近邻的数量。
进一步的,所述步骤三的具体操作如下:
S1、测试各项参数对STS-KNN模型的预测影响。本发明提出STS-KNN预测模型影响因素有4点:时间状态向量中匹配窗口的大小d;时间相似距离中交通流的变化和变化趋势的权重α;时空状态向量中流量相似路段数量n;预测函数中的近邻数量k。本节实验各项参数的范围为d=0,1,…5,α=0,0.1…1,n=1,2,3,4,5,6,k=1,2,…29,生成能够使预测误差MAPE最小的最佳参数组合(d,a,n,k),并对比基于时间相似性的TC-KNN模型和基于时空相似性的STS-KNN模型的预测效果。选取了对交通流速度进行预测时,若干天两种模型的最低MAPE以及对应的参数如下表所示:
表1 TC-KNN模型和STS-KNN模型的短时交通速度预测MAPE(%)对比
Figure BDA0001693839380000122
为了看出每个因素变化对预测结果的具体影响,在其他参数属于平均MAPE最小的条件下(d=1,a=0.5,n=4,k=17),考察每个因素对预测结果的影响,结果如图5所示。
从表1和图5可以看出,本文提出的基于交通流时空相似性的STS-KNN模型,相比原始基于时间向量的KNN模型确实提高了预测性能,并且影响STS-KNN模型的4个关键参数对预测误差的影响具有规律性,在特定路段时能够取到使预测误差最小的组合。针对本实验路段,可取(d=1,a=0.5,n=4,k=17),此时预测MAPE为12.25%。在预测城市中其他路段时可以采用同样的方法,并在预测过程中不断利用预测的结果反馈得到最佳的参数组合。
S2、测试不同规模的历史数据对STS-KNN模型的预测影响,分别取前5天、前10天、前15天、前20天和前25天的历史数据来预测11月26日-30日之间目标路段7:00-22:00的180个时段的平均交通速度。图6显示了使用不同规模的历史数据预测的5日平均MAPE,可以看出随着数据规模大的增大,预测准确度确实在提高,但是当规模大于15天后,预测误差趋于稳定(和20天相差不到0.05%)。
S3、测试不同浮动车数量对STS-KNN预测模型造成的影响。图7显示了分别使用7000、8000、9000、10000、11000、12000辆出租车的历史交通数据来预测目标路段的180个时段的平均交通速度,可以看出,对于该案例1个月的出租车路网覆盖率情况,当采集到的市区出租车浮动车数量达到9000辆时,预测MAPE降低到12.37%,然后趋于稳定,再增大浮动车数量对预测误差影响并不明显,说明当前的出租车浮动车数量已经达到了能够得到较准确路网交通信息的规模。
S4、为了验证本发明提出的基于数据驱动的STS-KNN预测模型在不同交通环境下的适用性,选择不同路网结构和不同时段的交通流数据和交通速度数据进行测试。选择4个不同路段进行交通流和交通速度预测,在地理上的分布如图8所示。图9显示了这4条不同路段在各自预测时段下的交通流速度和交通流量的误差。可以看出,在不同的路网环境下,本发明提出的STS-KNN短时交通预测模型对交通流速度和交通流量都可以有“比较准确”的预测结果(平均MAPE≤20%)。
S5、进行多步预测实验,将STS-KNN短时交通预测模型与其他的模型进行对比。多步预测(Multistep Forecasting)指的是对未来较长一段时间的交通状态进行预测。现有的基于数据驱动的短时交通多步预测大都是基于上一个时段的预测结果,例如BP-NN和STW-KNN,本发明也采用这种方法,使用上文介绍的其他4种预测方法进行交通速度的多步预测对比。
实验结果如图10,图中显示了实验预测的12步(Forecasting Step),每步5分钟对应的MAPE。可以看出,除了HA方法,其他4种方法的预测MAPE都会随着预测步骤的增加而增大。这是因为除了HA模型,在其他这些模型中当前状态都是一个重要的输入参数,使用前一个预测结果进行下一步预测时会发生“误差传递”现象。本发明提出的STS-KNN模型原理上还是基于非参数回归的方法,所以也不能避免这种情况,这也是现有的这类智能模型或基于数据驱动的模型的共同缺点——预测误差会随着预测步数的增多而增大。但STS-KNN模型在每一步都要比其他模型预测效果好,因为本发明提出的模型考虑了目标路段周围的路网结构,并作为一个重要因素添加到模型中,而这种路网结构一般情况下不会随着时间的变化而改变。
综上,本发明提出的一种基于交通流时空相似性的K近邻非参数回归短时交通预测模型——STS-KNN模型,该模型包含3个关键要素:基于交通流时空相似性的状态向量——时空状态向量,度量时空状态向量之间距离的距离度量函数,以及基于秩次加权的预测函数。该模型改进了非参数回归模型中用于搜索邻域的状态向量和距离度量函数,能够更准确的描述交通流的时空特征,可用于提高城市短时交通流预测的准确度。
上述的对实施例的描述是为便于该技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对这些实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于这里的实施例,本领域技术人员根据本发明的揭示,不脱离本发明范畴所做出的改进和修改都应该在本发明的保护范围之内。

Claims (1)

1.一种基于交通流时空相似性的城市短时交通流预测方法,在预测目标路段下一时段交通流时,其特征在于,该方法包括如下步骤:
S1、基于交通流时空相似性,定义交通流的时间状态向量TSV、时空状态向量STSV;步骤S1的计算具体如下:
S11、定义路段m交通流的时间状态向量
Figure FDA0002750765130000011
时间状态向量是指从时间维度上来描述目标路段交通状态的特征,包括本路段过去若干时段的交通流,以及相邻路段间交通流的变化趋势,
Figure FDA0002750765130000012
定义如下:
Figure FDA0002750765130000013
其中,Vm(t)代表路段m在时段t的交通流;Vm(t-d)代表路段m在过去时段t-d的交通流;d代表滞后时段,也称为匹配窗口,利用历史数据通过试验确定,公式的前半部分用于描述过去时段的影响,后半部分描述交通变化趋势的影响;
S12、定义路段m交通流的时空状态向量
Figure FDA0002750765130000014
时空状态向量从时间和空间两个维度来描述道路的交通特征,即认为目标路段的交通状态还与周边区域的交通状态有关,
Figure FDA0002750765130000015
定义如下:
Figure FDA0002750765130000016
其中,
Figure FDA0002750765130000017
代表路段m在时段t的时间状态向量;m1……mn代表路段m的n个流量相似路段,
Figure FDA0002750765130000018
代表路段m的第n个“流量相似路段”的时间状态向量;n代表路段m的流量相似路段的数量,与具体的路网结构有关,利用历史数据通过试验确定,通过公式能够看出,时空状态向量是由目标路段与其空间相邻的“流量相似路段”的“时间状态向量”组成;
S13、流量相似路段的判别方法:使用同一时段内穿过相邻两个路段的浮动车的数量来度量路段之间的流量相似性,如果穿过两个路段的浮动车数量多,说明这两个路段的交通流相似性越大;
S2、构造当前时段下交通流的“当前时空状态向量”;步骤S2的计算具体如下:
S21、根据公式(1)计算当前时段t下,目标路段m的当前时间状态向量
Figure FDA0002750765130000019
及其流量相似路段m1……mn的当前时间状态向量
Figure FDA0002750765130000021
S22、根据S21计算的各路段时间状态向量和公式(2),计算当前时段t下,目标路段m的当前时空状态向量
Figure FDA0002750765130000022
S3、构造历史上不同日期同一时段下交通流的“历史时空状态向量”;步骤S3的计算具体如下:
S31、根据公式(1)计算不同历史日期的时段t下,目标路段m的各历史时间状态向量
Figure FDA0002750765130000023
及其流量相似路段m1……mn的各历史时间状态向量
Figure FDA0002750765130000024
S32、根据S31计算的各路段时间状态向量和公式(2),计算各历史日期的时段t下,目标路段m的各历史时空状态向量
Figure FDA0002750765130000025
S4、使用距离度量函数计算当前和各历史时空状态向量间的“时空相似距离”STD;步骤S4的计算具体如下:
S41、首先计算当前和各历史时间状态向量间的距离:时间相似距离,通过下式计算:
Figure FDA0002750765130000026
其中0≤α≤1,dT(XCT(t),XHT(t))表示当前和历史时间状态向量间的距离,即“时间相似距离”;Vc(t-p)和(Vc(t-p-1)-Vc(t-p))是当前时间状态向量中的元素,分别表示当前t-p时段的交通流和交通流在相邻时段间的变化量;Vh(t-p)和Vh(t-p-1)-Vh(t-p)是历史时间状态向量中的元素,分别表示历史不同日期同一时段的交通流和交通流的变化量;该公式不仅度量了当前交通状态和历史交通状态的差距,也度量了当前交通变化趋势和历史交通变化趋势的差距,这种差距反映了历史状态与当前状态的相似程度;这里用参数α表示交通流差距和交通流变化趋势差距所占的权重,通过交通流历史数据分析确定最优值;
S42、基于公式(3)计算的目标路段和其相似路段的“时间相似距离”,使用距离度量函数
Figure FDA0002750765130000031
计算目标路段当前和各历史时空状态向量间的“时空相似距离”,通过下式计算:
Figure FDA0002750765130000032
其中,
Figure FDA0002750765130000033
代表目标路段自身的“时间相似距离”,
Figure FDA0002750765130000034
表示目标路段的第i个“流量相似路段”的“时间相似距离”;能够看出,“时空相似距离”是由目标路段的和其流量相似路段的加权“时间相似距离”组成;Wk是不同流量相似路段所占的权重,按照“流量相似度”降序排序,通过下式秩次加权的方法计算:
Figure FDA0002750765130000035
其中:rk为第k个候选近邻的顺序,K为近邻的数量;“流量相似度”越大,rk越小,Wk越大,即“流量相似度”越大的路段对目标路段的交通状态影响越大;
S5、选择K个时空相似距离最小的历史时空状态向量所在的日期,查出这K个历史日期对应的预测时段的交通流;步骤S5的计算具体如下:
S51、在上一步计算出当前和各历史时空状态向量间的“时空相似距离”后,对该时空相似距离排序,查出K个时空相似距离最小的历史时空状态向量,并得出对应的K个历史日期;
S52、在历史交通流数据库中,查出这K个历史日期下t+1时段的交通流Vk’(t+1);
S6、基于这K个历史日期对应的预测时段的交通流,使用预测函数计算目标路段下一时段的交通流;步骤S6的计算具体如下:
S61、获得历史上K个历史日期的t+1时段的交通流Vk’(t+1)
S62、使用预测函数计算t+1时段路段m的交通流Vm(t+1),预测函数如下式所示;
Figure FDA0002750765130000041
其中:Vk’(t+1)为历史数据库中搜索到的第k个近邻所对应的下一时段的平均交通流,近邻的度量标准使用的即“距离度量函数”;Wk为Vk’(t+1)所占的权重;
S63、基于秩次加权的权函数Wk通过下式计算:
Figure FDA0002750765130000042
其中:rk为第k个候选近邻的顺序,K为近邻的数量,由于交通***的强时变性,同一路段在不同时期的交通状况差别很大,因此在预测目标路段未来交通状况时,搜索到的不同历史近邻的重要程度也不同,因此使用加权的方式度量不同近邻对预测结果的影响程度;
S7、根据交通流的预测结果和实际结果,对目标路段的预测误差进行评价分析;
在所述步骤S7中,采用以下的评价标准对预测误差进行评价分析:
Figure FDA0002750765130000043
其中,MAPE是平均相对百分比误差,D代表预测的天数;L代表预测的时段数量;FJ,t和OJ,t分别代表目标路段第J天第t个时段的预测值和真实值,使用MAPE对比不同模型的预测精度,更低的MAPE意味着更高的预测精度,并且模型的预测性能由不同的MAPE范围评价,当MAPE≤20%,就认为预测是有效的。
CN201810603991.0A 2018-06-12 2018-06-12 一种基于交通流时空相似性的城市短时交通流预测方法 Active CN108564790B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810603991.0A CN108564790B (zh) 2018-06-12 2018-06-12 一种基于交通流时空相似性的城市短时交通流预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810603991.0A CN108564790B (zh) 2018-06-12 2018-06-12 一种基于交通流时空相似性的城市短时交通流预测方法

Publications (2)

Publication Number Publication Date
CN108564790A CN108564790A (zh) 2018-09-21
CN108564790B true CN108564790B (zh) 2020-12-22

Family

ID=63553526

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810603991.0A Active CN108564790B (zh) 2018-06-12 2018-06-12 一种基于交通流时空相似性的城市短时交通流预测方法

Country Status (1)

Country Link
CN (1) CN108564790B (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109377754B (zh) * 2018-10-29 2021-07-02 东南大学 一种车联网环境下的短时交通流速度预测方法
CN109389835B (zh) * 2018-11-16 2020-06-09 北方工业大学 一种城市道路交通需求与控制的映射方法
CN110288824B (zh) * 2019-05-20 2020-12-01 浙江工业大学 基于Granger causality路网早晚高峰拥堵状况和传播机制分析方法
CN110211375A (zh) * 2019-05-23 2019-09-06 浙江大学 基于改进时空关联knn算法的交通流量预测方法
CN110223517B (zh) * 2019-06-20 2021-05-18 青岛科技大学 基于时空相关性的短时交通流量预测方法
CN110362576A (zh) * 2019-07-09 2019-10-22 浙江工业大学 一种卡***通流量预测方法
CN110827540B (zh) * 2019-11-04 2021-03-12 黄传明 一种多模态数据融合的机动车移动模式识别方法及***
CN111833596B (zh) * 2019-11-19 2022-04-29 东南大学 考虑出行者决策惯性的逐日路段流量预测方法
CN111210088B (zh) * 2020-01-16 2023-06-02 上海理工大学 一种基于时空因素的交通状态指数预测方法
CN113420414B (zh) * 2021-05-27 2022-08-30 四川大学 一种基于动态时空分析的短时交通流预测模型
CN113592136A (zh) * 2021-06-18 2021-11-02 阿波罗智联(北京)科技有限公司 一种交通数据预测方法、装置及电子设备
CN113723191B (zh) * 2021-07-30 2024-03-29 高德软件有限公司 道路拥堵预测方法、基于位置的服务提供方法及程序产品
CN113556253B (zh) * 2021-07-30 2023-05-26 济南浪潮数据技术有限公司 预测交换机端口实时流量的方法、***、设备和存储介质
CN113761020B (zh) * 2021-07-30 2023-06-13 北京交通大学 一种城市轨道交通异常大客流实时预测方法
CN114463972B (zh) * 2022-01-26 2024-02-27 成都和乐信软件有限公司 一种基于etc门架通信数据的路段区间交通分析预测方法
CN115130719B (zh) * 2022-04-19 2023-09-22 北京交通大学 用于城轨路网的新线开通路网客流预测方法及***
CN115440038B (zh) * 2022-08-31 2023-11-03 青岛海信网络科技股份有限公司 一种交通信息确定方法以及电子设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102110365B (zh) * 2009-12-28 2013-11-06 日电(中国)有限公司 基于时空关系的路况预测方法和***
CN101853573A (zh) * 2010-05-19 2010-10-06 北京科技大学 一种城市快速路短时交通信息预测***及方法
CN103247177B (zh) * 2013-05-21 2016-01-20 清华大学 大规模路网交通流实时动态预测***
CN104134351B (zh) * 2014-08-14 2016-08-03 中国科学院自动化研究所 一种短时交通流预测方法
CN106971547B (zh) * 2017-05-18 2019-06-04 福州大学 一种考虑时空相关性的短时交通流预测方法
CN107045788B (zh) * 2017-06-28 2020-04-10 北京数行健科技有限公司 交通路况预测方法及装置
CN107230351B (zh) * 2017-07-18 2019-08-09 福州大学 一种基于深度学习的短时交通流预测方法

Also Published As

Publication number Publication date
CN108564790A (zh) 2018-09-21

Similar Documents

Publication Publication Date Title
CN108564790B (zh) 一种基于交通流时空相似性的城市短时交通流预测方法
CN110570651B (zh) 一种基于深度学习的路网交通态势预测方法及***
Khosravi et al. Prediction intervals to account for uncertainties in travel time prediction
Zhang et al. Network‐wide traffic speed forecasting: 3D convolutional neural network with ensemble empirical mode decomposition
CN115578852B (zh) 一种基于dstgcn的交通预测方法
CN110648014B (zh) 一种基于时空分位数回归的区域风电预测方法及***
CN113420414B (zh) 一种基于动态时空分析的短时交通流预测模型
CN110956807B (zh) 基于多源数据与滑动窗口组合的高速公路流量预测方法
CN110390349A (zh) 基于XGBoost模型的公交车客流量预测建模方法
CN104850734A (zh) 一种基于时空分布特征的空气质量指数预测方法
CN113962472B (zh) 一种基于GAT-Seq2seq模型的时空双注意力地铁客流短时预测方法
CN113496314B (zh) 一种神经网络模型预测道路交通流量的方法
Chen et al. A multiscale-grid-based stacked bidirectional GRU neural network model for predicting traffic speeds of urban expressways
Jiang et al. Advanced traffic congestion early warning system based on traffic flow forecasting and extenics evaluation
Arjona et al. A deep learning approach to real-time parking availability prediction for smart cities
Feng et al. A period-specific combined traffic flow prediction based on travel speed clustering
Faghih et al. Predicting short-term Uber demand using spatio-temporal modeling: A New York City Case Study
CN106779241B (zh) 一种轨道交通短期客流预测方法
CN105469157A (zh) 路侧停车需求对停车费率敏感度的空间异质性分析方法
Li Prediction of rural tourism suitability based on multi-dimensional evaluation model
Widhalm et al. Robust road link speed estimates for sparse or missing probe vehicle data
Cui et al. A deep spatio-temporal attention-based neural network for passenger flow prediction
JP7257276B2 (ja) データ予測システム及びその方法
Munandar Multilayer perceptron (MLP) and autoregressive integrated moving average (ARIMA) models in multivariate input time series data: Solar irradiance forecasting
Wang et al. Using denoised LSTM network for tourist arrivals prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant