CN109598936B - 一种基于动态stknn模型的短时交通预测方法 - Google Patents
一种基于动态stknn模型的短时交通预测方法 Download PDFInfo
- Publication number
- CN109598936B CN109598936B CN201811547414.0A CN201811547414A CN109598936B CN 109598936 B CN109598936 B CN 109598936B CN 201811547414 A CN201811547414 A CN 201811547414A CN 109598936 B CN109598936 B CN 109598936B
- Authority
- CN
- China
- Prior art keywords
- time
- traffic
- space
- road segment
- road
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000012935 Averaging Methods 0.000 claims abstract description 6
- 230000003044 adaptive effect Effects 0.000 claims abstract description 4
- 239000011159 matrix material Substances 0.000 claims description 50
- 238000005192 partition Methods 0.000 claims description 35
- 230000008859 change Effects 0.000 claims description 12
- 239000000126 substance Substances 0.000 claims description 12
- 238000005314 correlation function Methods 0.000 claims description 10
- 238000012804 iterative process Methods 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 9
- 238000000638 solvent extraction Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 7
- 238000005311 autocorrelation function Methods 0.000 claims description 6
- 238000002790 cross-validation Methods 0.000 claims description 6
- 230000001419 dependent effect Effects 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 4
- 230000002457 bidirectional effect Effects 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000007726 management method Methods 0.000 abstract description 3
- 238000013499 data model Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0129—Traffic data processing for creating historical data or processing based on historical data
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0133—Traffic data processing for classifying traffic situation
Landscapes
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Traffic Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于动态STKNN模型的短时交通预测方法,步骤为:a、特征表示:通过对每个道路片段历史天的交通条件求平均值,利用平均速度向量来对每个道路片段进行特征表示;b、交通模式自动识别:通过AP聚类算法自动识别道路网络相似的交通模式;c、自动划分时间区间:针对自动识别出的多种交通模式,通过K‑Means算法自动划分时间区间;d、构建自适应的STKNN模型:针对步骤2和步骤3获取的每个交通模式的每个时间区间,分别构建STKNN模型。本发明可以直接帮助交通管理部门制定合理和高效的策略来缓解交通拥堵,实现道路网络交通流量的再分配,同时可以帮助大众实现准确的路径规划。
Description
技术领域
本发明涉及一种短时交通预测方法,尤其涉及一种基于动态STKNN模型的短时交通预测方法,属于信息技术服务领域。
背景技术
短时交通预测作为智能交通***重要的一部分,可以帮助用户合理的规划路径以及提供智能的位置服务,缓解道路拥堵,从而减少交通排放,同时,可以帮助交通部门实施有效的交通管制、合理配置基础设施以及优化信号灯的时间,从而提高交通的操作效率。
在过去几十年,大量的时空建模方法被提出用于解决短时交通预测的问题,这些方法为短时交通预测提供了可选方案,但依然存在很多未解决的技术问题。考虑到交通条件在时间上具有非线性和非平稳性变化特征,即便是相同的道路片段,在不同的时间区间具有不同的变化模式,例如在峰值区间道路片段的相关性强度要高于平峰区间;在拥堵时空间邻居的大小要小于自由流,因此短时交通预测模型的结构应该能适应交通条件的动态变化。然而,现有技术针对整个时间范围建模,其隐喻的假设是把交通预测当作一个静态的点过程,忽略了交通条件在时间上的动态属性特征,导致模型结构在整个时间范围内仍是固定不变的,例如相同的道路片段在不同的时间区间(早高峰和晚高峰)具有相同数目的空间邻居,这是预测模型无法获得满意结果的一个主要原因。另一方面,现有技术采用人为设定全局固定的时间区间的划分策略,使得不同交通变化模式的道路片段具有相同的时间区间,例如某些道路片段的早高峰在6:00-8:00,而另一些道路片段的早高峰在5:00-7:00,因此无法反映细粒度的时间非平稳性变化特征。
精确的表示时空对于短时交通预测模型精度的提升至关重要,可以通过在预测模型中整合时空信息或交通条件的动态特性来实现。现有技术在整合时空信息方面取得了一定的成功,例如引入时空状态矩阵来表征交通条件;构建自适应的模型来抓取道路交通的异质属性特征,使得短时交通预测模型的精度有了一定的提升。然而,在刻画交通条件在时间上的动态性方面依然存在不足。鉴于此,本发明考虑道路交通的空间异质性和时间非平稳性特征,提出了一种动态的STKNN模型实现短时交通的高效预测。
发明内容
为了解决上述技术所存在的不足之处,本发明提供了一种基于动态STKNN模型的短时交通预测方法。
为了解决以上技术问题,本实用新型采用的技术方案是:一种基于动态STKNN模型的短时交通预测方法,方法的整体步骤为:
a、特征表示:构建表示所有道路片段历史时刻交通条件的三维张量,三维张量的每一个切面代表每个道路片段所有历史天的交通条件变化曲线;通过对每个道路片段历史天的交通条件求平均值,利用平均速度向量来对每个道路片段进行特征表示;
b、交通模式自动识别:通过AP聚类算法自动识别道路网络相似的交通模式;
c、自动划分时间区间:针对自动识别出的多种交通模式,通过K-Means算法自动划分时间区间,用于比较不同时间区间交通条件的变化差异;
d、构建自适应的STKNN模型:针对步骤b和步骤c获取的每个交通模式的每个时间区间,分别构建STKNN模型。
步骤a、特征表示的具体方法为:假设道路网络存在N条道路片段,道路片段u的历史交通条件Xu可表示为其中,表示维度为D×T的二维实数集,表示道路片段u在第i天的时间序列,D表示历史总天数,T表示一天中总的时间间隔,因此,整个道路网络的历史交通条件可以用一个三维张量X表示,则Xu,d,t表示道路片段u在第d天t时刻的交通条件值,表示维度为N×D×T的实数集;对每个道路片段所有历史天的对应时间间隔的交通条件求平均,利用平均时间序列来表示每个道路片段的历史交通条件的平均变化模式,其形式化表示如公式Ⅰ,其中∑为求和符号。
步骤b的具体方法为:将所有交通条件的特征数据集表示为U,可以将看作T维空间内的1个数据点,则待聚类的数据点可用索引表示为{1,2,...,N};将所有样本点看作网络中的节点,输入相似度矩阵S,其中si,k表示数据点i和数据点k之间的相似度,si,k的值越大表示数据点i与数据点k的距离越近,数据点k作为数据点i的聚类中心的能力越强;sk,k称为偏好度,作为数据点k能否成为代表点的评判标准,该值越大表明该点成为代表点的可能性越大,偏好度通常取相似度的中位数;通过节点之间的双向信息传递直至收敛,得到聚类中心集合,使得网络全局函数最大,如公式Ⅱ所示:
其中,F为所有数据点聚类中心点的集合,argmax为当因变量最大时求变量的函数,ci为数据点i的聚类中心点,表示第i个点到其对应的类代表点ci之间的相似度。hk是对潜在代表点ck的惩罚值,表示若数据点ci选择数据点k作为其类代表点,即ci=k,那么数据点k必须选择自身作为聚类中心点,即ck=k;否则,数据点k不能成为聚类中心点;
在AP聚类算法迭代过程中传递两类信息,每种消息考虑不同类型的竞争,分别为吸引度信息ri,k和归属度信息ai,k;其中,ri,k表示从数据点i发送信息到数据点k,表示数据点k适合作为数据点i的聚类中心的程度;ai,k表示从数据点k发送信息到数据点i,描述数据点i选择数据点k作为聚类中心的适合程度;通过建立和聚类准则函数对应的因子图模型,应用置信传播理论进行信息的更新,使得因子图的全局函数最大,完成聚类;其信息更新过程按照公式Ⅲ:
其中,←表示信息更新过程中的赋值操作,k'表示所有满足k'≠k条件的数据点,i'表示所有满足i'≠{i,k}或i'≠k条件的数据点;当算法收敛或达到一定的迭代次数时,每个数据点i的聚类中心ci,当且仅当k满足公式Ⅳ。
步骤c、自动划分时间区间的具体方法为:通过步骤b识别的道路网络交通模式,假设第m个交通模式时间序列zm,i表示第m个交通模式在时间间隔i的交通条件;时间序列分区的目的是划分到km个不相交的同质类 表示将第m个交通模式划分的第i个时间分区,km表示第m个交通模式时间序列的分区个数,可在迭代过程中通过计算平均轮廓系数来自动确定,nm,j表示第m个交通模式下第j个分区的样本数;针对序列数据聚类问题,定义如公式Ⅴ的映射关系:
其中,b为时间序列分区边界点的集合,为映射符号,bj为第m个交通模式下第j个分区的左边界;可定义一个准则函数Jm来度量分区的质量,通过寻找一个分区策略使得准则函数达到最优;准则函数Jm的定义如公式Ⅵ:
其中,Hm,j描述了分区的异质性,μm,j为分区的均值,最小化准则函数直到分区边界点不再移动;在每一步的迭代过程中,引入严格的顺序限制,聚类中前半部分的样本只允许移动到后半部分的样本只允许移动到在聚类中样本zm,j移动到聚类产生的准则函数的变化如公式Ⅶ计算:
当且仅当ΔJ(zj,j,l)<0,才重新分配该样本并更新聚类均值和准则函数的值,此时如公式Ⅷ所示:其中,Zj为第m个交通模式在第j个分区的交通条件,μj为分区的均值,nj为第j个分区的样本数,l表示第l个分区。
步骤d、STKNN模型的建立方法包括步骤:样本构建、距离函数定义、候选邻居选取、预测函数定义、预测值生成。
样本构建的方法为:利用时空状态矩阵表征道路片段每一时刻的交通条件,所有历史时刻的交通条件数据则堆叠形成时空三维立方体,并划分为历史时空数据集、训练时空数据集、测试时空数据集;
假设Ym,j为第m个交通模式的第j个分区的历史交通条件数据集,即Ym,j为整个道路网络的历史交通条件的子集,仅取对应交通模式下的时间区间的交通条件构建预测模型;其中,Nm为第m个交通模式的道路片段数目;Tm,j为第m个交通模式中第j个分区的时间间隔数目,Tm,j=nm,j;为了便于后续计算,我们将Ym,j进行重排,将所有历史天的时间区间按时间顺序排成一列,形成其中Yrm,j表示第m个交通模式的第j个分区所有道路片段的历史交通条件矩阵,Trm,j=D×Tm,j,Trm,j为第m个交通模式中第j个分区在历史总天数的时间间隔数目,即将3维张量转化为2维矩阵;
以第m个交通模式的第j个分区的历史交通条件数据集为例,道路片段u在时间间隔t的时空状态矩阵可定义为其中,ln表示道路片段u的空间邻居个数,lc表示时间窗口的长度,ln∈[1,Nm],lc∈[1Trm,j];为了便于描述,令G=Yrm,j,则Gu表示第m个交通模式的第j个分区下第u个道路片段所有历史天的交通条件时间序列;
其中,为时间序列Gu和时间序列GV在延迟的互相关系数,μu和μv分别为Gu和Gv的均值,σu和σv分别为Gu和GV的标准差,E表示数学期望;通过公式Ⅸ可以看到,互相关函数可看作关于时间延迟的函数,使得互相关函数取值最大的时间延迟值即为周围路段v对预测路段u影响的平均延迟时间,即满足公式Ⅹ:
其中,ψv为平均延迟时间,当且仅当ψv在预测时间范围Δt内,才能对预测道路片段产生影响,即可被选为目标道路片段的空间邻居,形式化定义如公式Ⅺ:
在时间维度,采用自相关函数确定时间窗口的大小;给定预测道路片段u,在时间延迟δ下的自相关函数ρu(δ)可定义为公式Ⅻ:
其中,E表示数学期望,Gu,t表示第m个交通模式的第j个分区下第u个道路片段所有历史天在时间间隔t的交通条件时间序列,μu为Gu的均值,σu为Gu的标准差,Gu,t-δ为第m个交通模式的第j个分区下第u个道路片段所有历史天在时间间隔t不受时间延迟δ影响的交通条件时间序列;
在利用自相关选取时间窗口时,保证在最大延迟范围内,交通条件具有显著的时间依赖性;然后在此范围内,采用交叉验证,选取使得预测模型误差最小的时间延迟,即为最优的时间窗口大小;在获取了空间邻居和时间窗口,按照时间顺序堆叠每个时间间隔的时空状态矩阵,则可得到3维的时空张量,然后按照设定的训练天数和测试天数,可将时空张量划分为历史时空张量、训练时空张量、测试时空张量;
距离函数定义的方法为:分别在时空状态矩阵的时间和空间维度赋予权重来构造权重欧几里得距离函数;采用时空权重欧几里得距离函数来为预测道路片段选取候选邻居;时空权重矩阵的定义如下:在时间维度,按照时间的线性分布赋值道路片段u的时间权重其中ti和tj分别表示时间权重矩阵中第ti和tj个值;在空间维度,利用互相关系数表示空间权重其中si和sj表示空间权重矩阵中第si和sj个值;时空权重的分配方式如公式ⅩⅢ所示:
通过在时空状态矩阵中引入时空权重,时空权重欧几里得距离函数Γu,t定义如公式X IV:
其中,MCu,t定义为道路片段u在时间间隔t的时空状态矩阵;
候选邻居选取方法为:通过计算时空状态矩阵之间的欧几里得距离,得到预测道路的个候选邻居;通过计算任意两个时空状态矩阵MCu,t和MCu,tk之间的权重欧几里得距离d(Γu,t,Γu,tk),MCu,t和MCu,tk分别表示道路片段u在时间间隔t和tk的时空状态矩阵;选取个距离最小的时空状态矩阵,则可得到预测道路的个候选邻,如公式X V:
其中,trac表示矩阵的迹;Γu,t,Γu,tk表示道路片段u在时间间隔t和tk的时空权重状态矩阵;
其中,表示预测道路片段的第个候选邻居下一时刻的交通条件,为预测道路片段的第个候选邻居的权重,第个候选邻居与预测道路片段之间的距离;a为高斯权重参数,采用交叉验证的方式,选取使得预测误差最小的a值作为其参数值;
本发明通过对各路段各时段交通条件的整合与分析实现了对道路拥堵预测的功能;AP聚类算法来自动识别道路网络存在的交通模式,使得相同聚类的道路片段具有强的空间相关性,从而简化了预测模型的输入;利用K-Means算法来为每种交通模式划分时间区间,通过比较不同道路片段在不同交通模式的时间区间下交通条件的差异性,来刻画时间非平稳性特征,从而解决了现有技术采用人为划分时间区间的方式或者针对整个时间范围建模存在的问题。在此基础上,我们提出三维时空张量数据模型来表征交通条件,考虑道路网络存在的空间异质性,为每个道路片段构建自适应的STKNN模型,实现了短时交通的高效预测。本发明可以直接帮助交通管理部门制定合理和高效的策略来缓解交通拥堵,实现道路网络交通流量的再分配,同时可以帮助大众实现准确的路径规划。
附图说明
图1为本发明的总体步骤流程图。
图2为图1中聚类和分区后交通模式1下的效果参考图。
图3为图1中聚类和分区后交通模式N下的效果参考图。
具体实施方式
下面结合具体实施方式对本发明作进一步详细的说明。
如图1~3所示的一种基于动态STKNN模型的短时交通预测方法,方法的整体步骤为:
a、特征表示:构建表示所有道路片段历史时刻交通条件的三维张量,三维张量的每一个切面代表每个道路片段所有历史天的交通条件变化曲线;通过对每个道路片段历史天的交通条件求平均值,利用平均速度向量来对每个道路片段进行特征表示;
假设道路网络存在N条道路片段,道路片段u的历史交通条件Xu可表示为其中,表示维度为D×T的二维实数集,表示道路片段u在第i天的时间序列,D表示历史总天数,T表示一天中总的时间间隔,例如按照5分钟的时间间隔进行采样,则T=288。因此,整个道路网络的历史交通条件可以用一个三维张量X表示,则Xu,d,t表示道路片段u在第d天t时刻的交通条件值,表示维度为N×D×T的实数集。对每个道路片段所有历史天的对应时间间隔的交通条件求平均,利用平均时间序列来表示每个道路片段的历史交通条件的平均变化模式,其形式化表示如公式Ⅰ,其中∑为求和符号。
b、交通模式自动识别:通过AP聚类算法自动识别道路网络相似的交通模式;通过步骤1对每个道路片段的历史交通条件特征进行表示后,本发明采用AP聚类算法来识别道路片段相似的交通模式。将所有交通条件的特征数据集表示为U,可以将看作T维空间内的1个数据点,则待聚类的数据点可用索引表示为{1,2,...,N}。AP聚类算法将所有样本点看作网络中的节点,输入相似度矩阵S,其中si,k表示数据点i和数据点k之间的相似度,使用欧式距离的负值表示,si,k的值越大表示数据点i与数据点k的距离越近,数据点k作为数据点i的聚类中心的能力越强。sk,k称为偏好度,作为数据点k能否成为代表点的评判标准,该值越大表明该点成为代表点的可能性越大,偏好度通常取相似度的中位数。通过节点之间的双向信息传递直至收敛,得到聚类中心集合,使得网络全局函数最大,如公式Ⅱ所示:
其中,F为所有数据点聚类中心点的集合,argmax为当因变量最大时求变量的函数,ci为数据点i的聚类中心点,表示第i个点到其对应的类代表点ci之间的相似度。hk是对潜在代表点ck的惩罚值,表示若数据点ci选择数据点k作为其类代表点,即ci=k,那么数据点k必须选择自身作为聚类中心点,即ck=k;否则,数据点k不能成为聚类中心点。
在AP聚类算法迭代过程中传递两类信息,每种消息考虑不同类型的竞争,分别为吸引度信息ri,k和归属度信息ai,k。其中,ri,k表示从数据点i发送信息到数据点k,表示数据点k适合作为数据点i的聚类中心的程度;ai,k表示从数据点k发送信息到数据点i,描述数据点i选择数据点k作为聚类中心的适合程度。通过建立和聚类准则函数对应的因子图模型,应用置信传播理论进行信息的更新,使得因子图的全局函数最大,完成聚类。其信息更新过程按照公式Ⅲ:
其中,←表示信息更新过程中的赋值操作,k'表示所有满足k'≠k条件的数据点,i'表示所有满足i'≠{i,k}或i'≠k条件的数据点;当算法收敛或达到一定的迭代次数时,每个数据点i的聚类中心ci,当且仅当k满足公式Ⅳ:
c、自动划分时间区间:针对自动识别出的多种交通模式,通过K-Means算法自动划分时间区间,用于比较不同时间区间交通条件的变化差异;通过步骤b识别的道路网络交通模式,本发明利用Warped K-Means算法得到每种交通模式的时间区间划分策略。假设第m个交通模式时间序列zm,i表示第m个交通模式在时间间隔i的交通条件。时间序列分区的目的是划分到km个不相交的同质类 表示将第m个交通模式划分的第i个分区。其中,km表示第m个交通模式时间序列的分区个数,可在迭代过程中通过计算平均轮廓系数来自动确定,nm,j表示第m个交通模式下第j个分区的样本数,j∈[1,km]。针对序列数据聚类问题,定义如公式Ⅴ的映射关系:
其中,b为时间序列分区边界点的集合,为映射符号,bj为第m个交通模式下第j个分区的左边界。可定义一个准则函数Jm来度量分区的质量,通过寻找一个分区策略使得准则函数达到最优。准则函数Jm的定义如公式Ⅵ:
其中,Hm,j描述了分区的异质性,μm,j为分区的均值。利用取样迭代优化策略来最小化准则函数,直到分区边界点不再移动。在每一步的迭代过程中,引入严格的顺序限制,聚类中前半部分的样本只允许移动到后半部分的样本只允许移动到在聚类中样本zm,j移动到聚类产生的准则函数的变化按照如下公式Ⅶ计算:
当且仅当ΔJ(zj,j,l)<0,才重新分配该样本并更新聚类均值和准则函数的值,此时如公式Ⅷ所示:其中,Zj为第m个交通模式在第j个分区的交通条件,μj为分区的均值,nj为第j个分区的样本数,l表示第l个分区。
d、自适应的STKNN模型:针对步骤b和步骤c获取的每个交通模式的每个时间区间,分别构建STKNN模型。
通过步骤b自动识别道路网路的交通模式以及步骤c获取每种交通模式的分区策略,考虑空间异质性和时间非平稳性的存在,本发明针对不同模式下不同时间区间中的不同道路片段构建自适应的STKNN模型,以实现短时交通的预测。具体包括如下步骤:
a、样本构建;利用时空状态矩阵表征道路片段每一时刻的交通条件,所有历史时刻的交通条件数据则堆叠形成时空三维立方体,并划分为历史时空数据集、训练时空数据集、测试时空数据集;假设Ym,j为第m个交通模式的第j个分区的历史交通条件数据集,即Ym,j为整个道路网络的历史交通条件的子集,仅取对应交通模式下的时间区间的交通条件构建预测模型。其中,Nm为第m个交通模式的道路片段数目;Tm,j为第m个交通模式的第j个分区的时间间隔数目,Tm,j=nm,j。为了便于后续计算,我们将Ym,j进行重排,将所有历史天的时间区间按时间顺序排成一列,形成其中Yrm,j表示第m个交通模式的第j个分区所有道路片段的历史交通条件矩阵,Trm,j=D×Tm,j,Trm,j为第m个交通模式中第j个分区在历史总天数的时间间隔数目,即将3维张量转化为2维矩阵。
在道路网络中,道路片段的交通条件通常受其周围道路片段的影响,同时在时间维度具有时间依赖性。因此,本发明利用时空状态矩阵来表征每个道路片段每个时间间隔的交通条件。确定时空状态矩阵的关键在于如何确定空间邻居和时间窗口。以第m个交通模式的第j个分区的历史交通条件数据集为例,道路片段u在时间间隔t的时空状态矩阵可定义为其中,ln表示道路片段u的空间邻居个数,lc表示时间窗口的长度,ln∈[1,Nm],lc∈[1,Trm,j]。为了便于描述,令G=Yrm,j,则Gu表示第m个交通模式的第j个分区下第u个道路片段所有历史天的交通条件时间序列,
其中,为时间序列Gu和时间序列GV在延迟的互相关系数,μu和μv分别为Gu和Gv的均值,σu和σv分别为Gu和GV的标准差,E表示数学期望。通过公式Ⅸ可以看到,互相关函数可看作关于时间延迟的函数,使得互相关函数取值最大的时间延迟值即为周围路段v对预测路段u影响的平均延迟时间,即满足公式Ⅹ:
其中,ψv为平均延迟时间,当且仅当ψv在预测时间范围Δt内,才能对预测道路片段产生影响,即可被选为目标道路片段的空间邻居,形式化定义如公式Ⅺ:
在时间维度,本发明采用自相关函数确定时间窗口的大小。给定预测道路片段u,在时间延迟δ下的自相关函数ρu(δ)可定义为公式Ⅻ:
其中,E表示数学期望,Gu,t表示第m个交通模式的第j个分区下第u个道路片段所有历史天在时间间隔t的交通条件时间序列,μu为Gu的均值,σu为Gu的标准差,Gu,t-δ为第m个交通模式的第j个分区下第u个道路片段所有历史天在时间间隔t不受时间延迟δ影响的交通条件时间序列。
在利用自相关选取时间窗口时,保证在最大延迟范围内,交通条件具有显著的时间依赖性。然后在此范围内,采用交叉验证,选取使得预测模型误差最小的时间延迟,即为最优的时间窗口大小。在获取了空间邻居和时间窗口,按照时间顺序堆叠每个时间间隔的时空状态矩阵,则可得到3维的时空张量,然后按照设定的训练天数和测试天数,可将时空张量划分为历史时空张量、训练时空张量、测试时空张量。
b、距离函数定义;分别在时空状态矩阵的时间和空间维度赋予权重来构造权重欧几里得距离函数;本发明采用时空权重欧几里得距离函数来为预测道路片段选取候选邻居。时空权重矩阵的定义如下:在时间维度,按照时间的线性分布赋值道路片段u的时间权重其中ti和tj分别表示时间权重矩阵中第ti和tj个值。在空间维度,利用互相关系数表示空间权重其中si和sj表示空间权重矩阵中第si和sj个值;时空权重的分配方式如公式ⅩⅢ所示:
通过在时空状态矩阵中引入时空权重,时空权重欧几里得距离函数Γu,t定义如公式X IV:
c、候选邻居选取;通过计算时空状态矩阵之间的欧几里得距离,得到预测道路的个候选邻居;通过计算任意两个时空状态矩阵MCu,t和MCu,tk之间的权重欧几里得距离d(Γu,t,Γu,tk),MCu,t和MCu,tk表示道路片段u在时间间隔t和tk的时空状态矩阵。选取个距离最小的时空状态矩阵,则可得到预测道路的个候选邻,如公式X V:
其中,trac表示矩阵的迹;Γu,t,Γu,tk表示道路片段u在时间间隔t和tk的时空权重状态矩阵。
其中,表示预测道路片段的第个候选邻居下一时刻的交通条件,为预测道路片段的第个候选邻居的权重,第个候选邻居与预测道路片段之间的距离。a为高斯权重参数,采用交叉验证的方式,选取使得预测误差最小的a值作为其参数值,a=0.029。
本发明相比现有技术主要有以下优点:
a、本发明通过AP聚类算法来自动识别道路网络存在的交通模式,使得相同聚类的道路片段具有强的空间相关性,从而简化了预测模型的输入;
b、K-Means算法来为每种交通模式划分时间区间,通过比较不同道路片段在不同交通模式的时间区间下交通条件的差异性,来刻画时间非平稳性特征,从而解决了现有技术采用人为划分时间区间的方式或者针对整个时间范围建模存在的问题;
c、我们提出三维时空张量数据模型来表征交通条件,考虑道路网络存在的空间异质性,为每个道路片段构建自适应的STKNN模型,实现了短时交通的高效预测;
d、本发明可以直接帮助交通管理部门制定合理和高效的策略来缓解交通拥堵,实现道路网络交通流量的再分配,同时可以帮助大众实现准确的路径规划。
上述实施方式并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的技术方案范围内所做出的变化、改型、添加或替换,也均属于本发明的保护范围。
Claims (1)
1.一种基于动态STKNN模型的短时交通预测方法,其特征在于:所述方法的整体步骤为:
a、特征表示:利用道路片段、历史总天数以及一天中总的时间间隔来构建表示所有道路片段历史时刻交通条件的三维张量,三维张量的每一个切面代表每个道路片段所有历史天的交通条件变化曲线;对每个道路片段所有历史天的对应时间间隔的交通条件求平均值,得到平均时间序列,利用平均时间序列来对每个道路片段进行特征表示;
b、交通模式自动识别:通过步骤a对每个道路片段的历史交通条件特征进行表示后,将所有交通条件的特征数据通过AP聚类算法自动识别道路网络相似的交通模式;
c、自动划分时间区间:通过步骤b识别的道路网络交通模式,利用K-Means算法得到每种交通模式的时间区间划分策略,用于比较不同时间区间交通条件的变化差异;
d、构建自适应的STKNN模型:通过步骤b自动识别道路网路的交通模式以及步骤c获取每种交通模式的分区策略,针对不同模式下不同时间区间中的不同道路片段构建自适应的STKNN模型,并利用STKNN模型计算目标道路片段交通条件的预测值,以实现短时交通的预测;
所述步骤a、特征表示的具体方法为:假设道路网络存在N条道路片段,道路片段u的历史交通条件Xu可表示为其中,表示维度为D×T的二维实数集,表示道路片段u在第i天的时间序列,D表示历史总天数,T表示一天中总的时间间隔,因此,整个道路网络的历史交通条件可以用一个三维张量X表示,则Xu,d,t表示道路片段u在第d天t时刻的交通条件值,表示维度为N×D×T的实数集;对每个道路片段所有历史天的对应时间间隔的交通条件求平均,利用平均时间序列来表示每个道路片段的历史交通条件的平均变化模式,其形式化表示如公式Ⅰ:
其中∑为求和符号;
所述步骤b中的AP聚类算法具体为:将所有交通条件的特征数据集表示为U,可以将看作T维空间内的1个数据点,则待聚类的数据点可用索引表示为{1,2,...,N};将所有样本点看作网络中的节点,输入相似度矩阵S,i,k∈[1,N],其中si,k表示数据点i和数据点k之间的相似度,si,k的值越大表示数据点i与数据点k的距离越近,数据点k作为数据点i的聚类中心的能力越强;sk,k称为偏好度,作为数据点k能否成为代表点的评判标准,该值越大表明该点成为代表点的可能性越大,偏好度通常取相似度的中位数;通过节点之间的双向信息传递直至收敛,得到聚类中心集合,使得网络全局函数最大,如公式Ⅱ所示:
其中,F为所有数据点聚类中心点的集合,argmax为当因变量最大时求变量的函数,ci为数据点i的聚类中心点,表示第i个点到其对应的类代表点ci之间的相似度;hk是对潜在代表点ck的惩罚值,表示若数据点ci选择数据点k作为其类代表点,即ci=k,那么数据点k必须选择自身作为聚类中心点,即ck=k;否则,数据点k不能成为聚类中心点;
在AP聚类算法迭代过程中传递两类信息,每种消息考虑不同类型的竞争,分别为吸引度信息ri,k和归属度信息ai,k;其中,ri,k表示从数据点i发送信息到数据点k,表示数据点k适合作为数据点i的聚类中心的程度;ai,k表示从数据点k发送信息到数据点i,描述数据点i选择数据点k作为聚类中心的适合程度;通过建立和聚类准则函数对应的因子图模型,应用置信传播理论进行信息的更新,使得因子图的全局函数最大,完成聚类;其信息更新过程按照公式Ⅲ:
其中,←表示信息更新过程中的赋值操作,k'表示所有满足k'≠k条件的数据点,i'表示所有满足i'≠{i,k}或i'≠k条件的数据点;
当算法收敛或达到一定的迭代次数时,每个数据点i的聚类中心ci,当且仅当k满足公式Ⅳ;
所述步骤c中通过K-Means算法自动划分时间区间的具体方法为:通过步骤b识别的道路网络交通模式,假设第m个交通模式时间序列zm,i表示第m个交通模式在时间间隔i的交通条件;时间序列分区的目的是划分到km个不相交的同质类1<km<<T,表示将第m个交通模式划分的第i个时间分区,km表示第m个交通模式时间序列的分区个数,可在迭代过程中通过计算平均轮廓系数来自动确定,nm,j表示第m个交通模式下第j个分区的样本数;针对序列数据聚类问题,定义如公式Ⅴ的映射关系:
其中,b为时间序列分区边界点的集合,为映射符号,bj为第m个交通模式下第j个分区的左边界;可定义一个准则函数Jm来度量分区的质量,通过寻找一个分区策略使得准则函数达到最优;准则函数Jm的定义如公式Ⅵ:
其中,Hm,j描述了分区的异质性,μm,j为分区的均值,最小化准则函数直到分区边界点不再移动;在每一步的迭代过程中,引入严格的顺序限制,聚类中前半部分的样本只允许移动到后半部分的样本只允许移动到在聚类中样本zm,j移动到聚类产生的准则函数的变化如公式Ⅶ计算:
当且仅当ΔJ(zj,j,l)<0,才重新分配该样本并更新聚类均值和准则函数的值,此时如公式Ⅷ所示:
其中,zj为第m个交通模式在第j个分区的交通条件,μj为分区的均值,nj为第j个分区的样本数,l表示第l个分区;
所述步骤d中STKNN模型的建立方法包括步骤:样本构建、距离函数定义、候选邻居选取、预测函数定义、预测值生成;
所述样本构建的方法为:利用时空状态矩阵表征道路片段每一时刻的交通条件,所有历史时刻的交通条件数据则堆叠形成时空三维立方体,并划分为历史时空数据集、训练时空数据集、测试时空数据集;
假设Ym,j为第m个交通模式的第j个分区的历史交通条件数据集,即Ym,j为整个道路网络的历史交通条件的子集,仅取对应交通模式下的时间区间的交通条件构建预测模型;其中,Nm为第m个交通模式的道路片段数目;Tm,j为第m个交通模式中第j个分区的时间间隔数目,Tm,j=nm,j;为了便于后续计算,将Ym,j进行重排,将所有历史天的时间区间按时间顺序排成一列,形成其中Yrm,j表示第m个交通模式的第j个分区所有道路片段的历史交通条件矩阵,Trm,j=D×Tm,j,Trm,j为第m个交通模式中第j个分区在历史总天数的时间间隔数目,即将3维张量转化为2维矩阵;
第m个交通模式的第j个分区的历史交通条件数据集中,道路片段u在时间间隔t的时空状态矩阵可定义为其中,ln表示道路片段u的空间邻居个数,lc表示时间窗口的长度,ln∈[1,Nm],lc∈[1,Trm,j];为了便于描述,令G=Yrm,j,则Gu表示第m个交通模式的第j个分区下第u个道路片段所有历史天的交通条件时间序列;
其中,为时间序列Gu和时间序列GV在延迟的互相关系数,μu和μv分别为Gu和Gv的均值,σu和σv分别为Gu和GV的标准差,E表示数学期望;通过公式Ⅸ可以看到,互相关函数可看作关于时间延迟的函数,使得互相关函数取值最大的时间延迟值即为周围路段v对预测路段u影响的平均延迟时间,即满足公式Ⅹ:
其中,ψv为平均延迟时间,当且仅当ψv在预测时间范围Δt内,才能对预测道路片段产生影响,即可被选为目标道路片段的空间邻居,形式化定义如公式Ⅺ:
在时间维度,采用自相关函数确定时间窗口的大小;给定预测道路片段u,在时间延迟δ下的自相关函数ρu(δ)可定义为公式Ⅻ:
其中,E表示数学期望,Gu,t表示第m个交通模式的第j个分区下第u个道路片段所有历史天在时间间隔t的交通条件时间序列,μu为Gu的均值,σu为Gu的标准差,Gu,t-δ为第m个交通模式的第j个分区下第u个道路片段所有历史天在时间间隔t不受时间延迟δ影响的交通条件时间序列;
在利用自相关选取时间窗口时,保证在最大延迟范围内,交通条件具有显著的时间依赖性;然后在此范围内,采用交叉验证,选取使得预测模型误差最小的时间延迟,即为最优的时间窗口大小;在获取了空间邻居和时间窗口,按照时间顺序堆叠每个时间间隔的时空状态矩阵,则可得到3维的时空张量,然后按照设定的训练天数和测试天数,可将时空张量划分为历史时空张量、训练时空张量、测试时空张量;
所述距离函数定义的方法为:分别在时空状态矩阵的时间和空间维度赋予权重来构造权重欧几里得距离函数;采用时空权重欧几里得距离函数来为预测道路片段选取候选邻居;时空权重矩阵的定义如下:在时间维度,按照时间的线性分布赋值道路片段u的时间权重其中ti和tj分别表示时间权重矩阵中第ti和tj个值;在空间维度,利用互相关系数表示空间权重其中si和sj表示空间权重矩阵中第si和sj个值;时空权重的分配方式如公式ⅩⅢ所示:
通过在时空状态矩阵中引入时空权重,时空权重欧几里得距离函数Γu,t定义如公式ⅩⅣ:
其中,MCu,t定义为道路片段u在时间间隔t的时空状态矩阵;
所述候选邻居选取的方法为:通过计算时空状态矩阵之间的欧几里得距离,得到预测道路的个候选邻居;通过计算任意两个时空状态矩阵MCu,t和MCu,tk之间的权重欧几里得距离d(Γu,t,Γu,tk),MCu,t和MCu,tk分别表示道路片段u在时间间隔t和tk的时空状态矩阵;选取个距离最小的时空状态矩阵,则可得到预测道路的个候选邻,如公式ⅩⅤ:
其中,trac表示矩阵的迹;Γu,t,Γu,tk表示道路片段u在时间间隔t和tk的时空权重状态矩阵;
其中,表示预测道路片段的第个候选邻居下一时刻的交通条件,为预测道路片段的第个候选邻居的权重,第个候选邻居与预测道路片段之间的距离;a为高斯权重参数,采用交叉验证的方式,选取使得预测误差最小的a值作为其参数值;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811547414.0A CN109598936B (zh) | 2018-12-18 | 2018-12-18 | 一种基于动态stknn模型的短时交通预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811547414.0A CN109598936B (zh) | 2018-12-18 | 2018-12-18 | 一种基于动态stknn模型的短时交通预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109598936A CN109598936A (zh) | 2019-04-09 |
CN109598936B true CN109598936B (zh) | 2020-01-10 |
Family
ID=65963012
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811547414.0A Expired - Fee Related CN109598936B (zh) | 2018-12-18 | 2018-12-18 | 一种基于动态stknn模型的短时交通预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109598936B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111915877A (zh) * | 2019-05-08 | 2020-11-10 | 阿里巴巴集团控股有限公司 | 一种车流路径分布信息的处理方法、装置及电子设备 |
CN110287989B (zh) * | 2019-05-21 | 2021-04-16 | 武汉大学 | 一种基于轮廓系数和ap聚类算法的离散覆盖仓库选址方法 |
CN110299005B (zh) * | 2019-06-10 | 2020-11-17 | 浙江大学 | 一种基于深度集成学习的城市大规模路网交通速度预测方法 |
CN110428614B (zh) * | 2019-07-11 | 2021-02-05 | 银江股份有限公司 | 一种基于非负张量分解的交通拥堵热度时空预测方法 |
CN110706517B (zh) * | 2019-11-07 | 2020-08-28 | 深圳鼎然信息科技有限公司 | 交通工具的智能安全预警方法、装置、***及存储介质 |
CN113553350B (zh) * | 2021-05-27 | 2023-07-18 | 四川大学 | 一种相似演化模式聚类及动态时区划分的交通流分区模型 |
CN113420414B (zh) * | 2021-05-27 | 2022-08-30 | 四川大学 | 一种基于动态时空分析的短时交通流预测模型 |
CN114255591A (zh) * | 2021-12-17 | 2022-03-29 | 重庆中信科信息技术有限公司 | 考虑时空相关性的短时交通流预测方法、装置及存储介质 |
US20230294728A1 (en) * | 2022-03-18 | 2023-09-21 | Gm Cruise Holdings Llc | Road segment spatial embedding |
CN116682262B (zh) * | 2023-06-14 | 2024-03-08 | 中国科学院地理科学与资源研究所 | 一种多模式交通成本评价方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4098526B2 (ja) * | 2002-01-10 | 2008-06-11 | 株式会社アイ・トランスポート・ラボ | 交通情報提供システム及びその方法、交通情報提供プログラム |
JP2004185305A (ja) * | 2002-12-03 | 2004-07-02 | Nippon Telegr & Teleph Corp <Ntt> | 交通渋滞予測方法、交通渋滞予測装置、交通渋滞予測プログラム、およびそのプログラムを記録した記録媒体 |
CN103903452B (zh) * | 2014-03-11 | 2015-10-07 | 东南大学 | 交通流短时预测方法 |
CN106530685B (zh) * | 2015-09-11 | 2019-06-21 | 杭州海康威视数字技术股份有限公司 | 一种交通数据短时预测方法及装置 |
CN105701571A (zh) * | 2016-01-13 | 2016-06-22 | 南京邮电大学 | 一种基于神经网络组合模型的短时交通流量预测方法 |
CN106022385A (zh) * | 2016-05-26 | 2016-10-12 | 华南理工大学 | 基于动态规划和K-means聚类的特征选择算法 |
CN106128100B (zh) * | 2016-06-30 | 2019-01-15 | 华南理工大学 | 一种基于Spark平台的短时交通流量预测方法 |
-
2018
- 2018-12-18 CN CN201811547414.0A patent/CN109598936B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN109598936A (zh) | 2019-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109598936B (zh) | 一种基于动态stknn模型的短时交通预测方法 | |
Tekouabou et al. | Improving parking availability prediction in smart cities with IoT and ensemble-based model | |
CN110827543A (zh) | 一种基于深度学习和时空数据融合的短时交通流控制方法 | |
CN107885778B (zh) | 一种基于动态临近点谱聚类的个性化推荐方法 | |
CN113420414B (zh) | 一种基于动态时空分析的短时交通流预测模型 | |
CN113313947A (zh) | 短期交通预测图卷积网络的路况评估方法 | |
CN115578852B (zh) | 一种基于dstgcn的交通预测方法 | |
Monteiro et al. | On-street parking prediction using real-time data | |
Cheng et al. | Short-term traffic forecasting by mining the non-stationarity of spatiotemporal patterns | |
CN110322064A (zh) | 城市出行需求预测方法 | |
CN111294812B (zh) | 一种资源扩容规划的方法及*** | |
CN103699771B (zh) | 一种冷负荷预测的情景-聚类方法 | |
CN114565124A (zh) | 一种基于改进图卷积神经网络的船舶交通流预测方法 | |
CN110428614B (zh) | 一种基于非负张量分解的交通拥堵热度时空预测方法 | |
CN113037410B (zh) | 信道识别方法、装置、传输方法、传输设备、基站、介质 | |
CN112911626A (zh) | 基于多图卷积的无线网络流量预测方法 | |
CN116110234B (zh) | 基于人工智能的车流量预测方法、装置及其应用 | |
CN112612820A (zh) | 数据处理方法及装置、计算机可读存储介质及处理器 | |
CN117994986B (zh) | 一种基于智能优化算法的交通车流量预测优化方法 | |
Shinkuma et al. | Data assessment and prioritization in mobile networks for real-time prediction of spatial information with machine learning | |
CN116070852A (zh) | 基于群智感知的任务分配方法、装置、设备及存储介质 | |
CN115966083A (zh) | 一种基于时空解耦的分布式交通流预测方法与*** | |
KR101703972B1 (ko) | 공간정보를 이용한 지하수 부존 지역 예측시스템 및 지하수 부존 지역 예측방법 | |
CN113553350A (zh) | 一种相似演化模式聚类及动态时区划分的交通流分区模型 | |
CN114338416A (zh) | 一种时空多指标预测方法、装置和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200110 |