CN103700255B - 一种基于时空关联数据挖掘的交通流预测方法 - Google Patents

一种基于时空关联数据挖掘的交通流预测方法 Download PDF

Info

Publication number
CN103700255B
CN103700255B CN201310749807.0A CN201310749807A CN103700255B CN 103700255 B CN103700255 B CN 103700255B CN 201310749807 A CN201310749807 A CN 201310749807A CN 103700255 B CN103700255 B CN 103700255B
Authority
CN
China
Prior art keywords
data
sensor
traffic flow
forecasting
spacetime correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310749807.0A
Other languages
English (en)
Other versions
CN103700255A (zh
Inventor
史世雄
杨夙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fudan University
Original Assignee
Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fudan University filed Critical Fudan University
Priority to CN201310749807.0A priority Critical patent/CN103700255B/zh
Publication of CN103700255A publication Critical patent/CN103700255A/zh
Priority to PCT/CN2014/081350 priority patent/WO2015100993A1/zh
Application granted granted Critical
Publication of CN103700255B publication Critical patent/CN103700255B/zh
Priority to US15/197,155 priority patent/US9558661B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0108Measuring and analyzing of parameters relative to traffic conditions based on the source of data
    • G08G1/0116Measuring and analyzing of parameters relative to traffic conditions based on the source of data from roadside infrastructure, e.g. beacons
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0129Traffic data processing for creating historical data or processing based on historical data
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications
    • G08G1/0141Measuring and analyzing of parameters relative to traffic conditions for specific applications for traffic information dissemination
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications
    • G08G1/0145Measuring and analyzing of parameters relative to traffic conditions for specific applications for active traffic flow control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明属于交通流预测技术领域,具体为一种基于时空关联数据挖掘的交通流预测方法。本发明主要包括预测模型建立、时空关联数据挖掘以及基于时空关联数据的交通流预测等。预测模型可采用多因子线性回归模型;时空关联数据挖掘是基于多因子线性回归模型并通过稀疏表达的优化方法自动地选取对于预测目标相关的时空关联传感器的数据;基于时空关联数据的交通流预测是以时空关联传感器的数据作为预测模型的输入进行的预测。本发明从整个交通网络中自动地确定与预测目标节点的传感器相关的时空关联传感器,并以时空关联传感器的数据作为预测模型的输入,全自动时空关联数据挖掘提升了预测模型的预测性能。

Description

一种基于时空关联数据挖掘的交通流预测方法
技术领域
本发明属于交通流预测技术领域,具体涉及一种基于时空关联数据挖掘的交通流预测方法。
背景技术
近年来,交通流预测技术一直在智能交通***(ITS)中发挥很重要的作用。交通流预测技术能够帮助通行的个人进行智能的出行路线选择,也可以为交通管理者提供决策支持。
早期的一些技术主要针对单序列的交通流预测。可以根据预测模型的有无参数分为有参数预测模型和无参数预测模型。在有参数预测模型中,季节性ARIMA(Autoregressive Integrate Moving Average)模型是应用最广泛的一种方法(见参考文献[1])。它在基于单时间序列的交通流预测上可以达到最小的均方误差(MSE)。而在无参数预测模型中,最近邻方法(Nearest Neighbor Method)被认为是可替代季节性ARIMA的方案(见参考文献[2]),但是最邻近预测方法的预测效果依赖于历史数据的质量。总体来讲,单序列的交通流预测方法只考虑了序列自身的特征,忽视了不同序列之间的相互作用和关系。
由于交通流的演化是通过交通网中所有节点交通流之间的相互作用而形成的,所以在交通流的预测中,不同节点交通流之间的关系应该被考虑进去。从而,在近些年基于数据时空关联性的多因子交通流预测成为了研究的热点。目前流行的方法大致有三种:1、状态空间模型或卡尔曼滤波器(见参考文献[3]);2、神经网络(Neural Network)等机器学习方法(见参考文献[4]);3、时间序列方法,如Vector Autoregressive Moving Average模型(见参考文献[5])(VARMA)。而时空关联数据的选取则是进行多因子交通流预测的必要步骤。在以往的研究中,时空关联传感器的选取大部分是根据人工经验手动选取目标节点一定邻近范围内的传感器。只选取目标节点邻近范围内的传感器的数据作为与预测模型的输入比较主观,没有反映现实中数据之间真正的时空关联性,无法获得最佳的预测性能,基于人工经验的方法缺乏适应性,很难实施到大型的交通网中。
稀疏表达作为一种数学工具最早应用于信号处理领域,被广泛应用于信号压缩、图像去模糊、特征提取等,本发明提出将其应用于面向交通流预测的时空关联数据挖掘。稀疏表达的主要思想为:一个信号y可以通过一个字典D包含的K个原子信号{d1,d2,...,dj,...,dK}的线性组合表示为y=Dx,其中y∈Rn,dj∈Rn,D∈Rn×K;或者近似表达为y≈Dx,这里其中x∈RK为信号y的表示系数,稀疏表达要求通过尽可能少的原子信号来表示信号y,即要求线性组合系数x包含的非零系数尽可能少,因此,求稀疏解的目标函数可以写作
约束条件:y=Dx
或者
x ^ = arg min x | | x | | 0 约束条件: | | y - Dx | | 2 2 ≤ ϵ 0
上式中的||x||0为x的0范式,表示向量x包含的非零元素的个数。由于已有一些稀疏表达的优化方法方面的数学工具(见参考文献[6]),可以自动从字典中选取有效的原子表示信号,所以本发明将其应用到时空关联性数据挖掘中,以达到从整个交通网络中自动地选取与目标传感器相关的时空关联传感器、并将时空关联传感器的数据作为预测模型的输入用于预测的目的。
参考文献
[1]Williams,B.M.,Durvasula,P.K.,Brown,D.E.,1998.Urban freeway trafficflow prediction:Application of seasonal autoregressive integrated moving averageand exponential smoothing models.Transportation Research Record 1644,132-144.
[2]Smith,B.L.,Williams,B.M.,Oswalsd,R.K.,2002.Comparison ofparametric and nonparametric models for traffic flow forecasting.TransportationResearch Part C 10,303–321.
[3]Stathopouos,A.,Karlaftis,A.,S.,2003.A multivariate state space approachfor urban traffic flow modeling and prediction.Transportation Research Part C 11,121-135.
[4]Vlahogianni,E.I.,Karlaftis,M.G.,Golias,J.C.,2005.Optimized andmeta-optimized neural networks for short-term traffic flow prediction:a geneticapproach.Transportation Research Part C 13,211-234.
[5]Min,W.,Wynter,L.,2011.Real-time road traffic prediction withspatio-temporal correlations.Transportation Research Part C 19,606–616.
[6]Elad,M.,2010.Sparse and redundant representations-From theory toapplication in signal and image processing.Springer.。
发明内容
本发明的目的在于克服现有交通流预测技术在时空关联数据选取上的不足,提出一种基于时空关联数据挖掘的交通流预测方法,从整个交通网络中自动地确定与预测目标节点相关的时空关联传感器。
本发明提出的基于时空关联数据挖掘的交通流预测方法,具体步骤为:
(a)通过布局到交通网各个节点的传感器采集交通流量的原始数据;
(b)通过数据预处理,将采集的原始数据处理为有效的交通流数据;
(c)建立预测模型:令表示交通网中的传感器j在第i个时刻采集的交通流量数据,假设一个交通网中有m个传感器,则在第i个时刻整个交通网的状态表示为提前τ时刻对传感器j采集的交通流量数据进行预测的线性回归模型为:
v ‾ i + τ j = V i w j
上式中的权重为待优化的模型参数,为预测值;
(d)挖掘时空关联性:通过稀疏表达的优化方法自动得到模型参数wj,权重表示整个交通网络的各个传感器的数据对于预测目标传感器j的数据而言的时空关联性,当时,传感器k的数据与传感器j的数据之间没有关联性,否则值的大小表示传感器k的数据与传感器j的数据之间关联程度的强弱,k=1,2,...,m;
(e)以时空关联数据为预测模型的输入进行交通流预测。
本发明中,所述的步骤(d)有三种优化的目标,分别用(d1)、(d2)和(d3)表示,具体如下:
(d1)所述的稀疏表达方法要优化的目标为:
w ^ j = arg min w j | | w j | | 0 约束条件: | | V w j - v j | | 2 2 = Σ i = 1 n | V i w j - v i j | 2 ≤ ϵ 0
上式中,表示从第1到第n时刻所有传感器采集的交通流数据,其中第i个时刻交通网中m个传感器采集的交通流量为 V i = [ v i 1 , v i 2 , . . . , v i m ] , i = 1,2 , · · · , n , v j = [ v τ + 1 j , v τ + 2 j , . . . , v τ + n j ] T 表示传感器j记录的从第τ+1时刻到第τ+n时刻的交通流量,||wj||0表示wj的0范数,即权重向量wj中非零元素的个数,ε0是一个预先设定的门限,用于控制预测误差||Vwj-vj||2,||Vwj-vj||2表示向量Vwj-vj的2范数,即向量中所有元素的平方和的平方根;
(d2)所述的稀疏表达方法要优化的目标为:
w ^ j = arg min w j | | V w j - v j | | 2 2 约束条件:||wj||0≤L0
式中,L0为预先设定的门限,用于控制向量wj中非零元素个数;上式表达的优化目标通过Orthogonal Matching Puisuit(OMP)算法进行求解【Tropp,J.A.,2004.Greed is good:algorithmic results for sparse approximation.IEEE Trans.Information Theory 50,2231-2242.】;
(d3)所述的稀疏表达方法要优化的目标为:
w ^ j = arg min w j | | w j | | 1 约束条件: | | V w j - v j | | 2 2 = Σ i = 1 n | V i w j - v i j | 2 ≤ ϵ 0
式中,||wj||1为wj的1范式,表示向量wj中所有元素绝对值之和,ε0是一个预先设定的门限,用于控制预测误差||Vwj-vj||2;上式表达的优化目标等价地表示为加入拉格朗日乘子λ的无约束条件的优化目标:
w ^ j = arg min w j { λ | | w j | | 1 + 1 2 | | V w j - v j | | 2 2 }
上式表达的优化目标通过Least Angle Regression Stagewise(LARS)算法进行求解【Efron,B.,Hastie,T.,Johnstone,I.,Tibshirani,R.2004.Least angleregression.Annals of Statistics 32(2),407-499.】。
本发明中,预测模型采用多因子线性回归模型外,也可采用向量自回归模型、反向传播神经网络模型、径向基函数神经网络模型等。
本发明提出的方法可以从整个交通网络中自动地确定与预测目标节点的传感器相关的时空关联传感器,并以时空关联传感器的数据作为预测模型的输入,而不需要根据人工经验手动选取目标节点邻近范围的交通路段流量数据作为预测模型的输入,相对于凭借人工经验从邻近范围选取的传感器数据作为输入,本发明提出的全自动时空关联数据挖掘提升了预测模型的预测性能。
附图说明
图1为本发明方法的流程图。
具体实施方式
如图1所示,本发明涉及的交通流预测可分为五个环节,包括数据采集、数据预处理、预测模型建立、时空关联数据挖掘和以交通流预测。其中涉及的数据采集是通过布局到交通网各个节点的传感器获得的交通流量数据;数据预处理是将采集的原始数据处理为有效的交通流数据;时空关联数据挖掘是通过稀疏表达的优化方法自动地选取对于预测目标相关的时空关联数据的方法;交通流预测是以时空关联数据为预测模型的输入进行的预测。具体实施方式如下:
实施例1:
(步骤1)数据采集:通过布局到交通网各个节点的传感器,采集以30秒为单位时间的交通数据流,得到整个交通网络各个传感器记录的数据,用矩阵的形式表示为:
S = s 1 1 s 1 2 . . . s 1 M s 2 1 s 2 2 . . . s 2 M . . . . . . . . . . . . s N 1 s N 2 . . . s N M
其中M为整个交通网中传感器的个数,N为以30秒为单位的时间序列的长度,表示传感器j在第i个时刻对应的30秒内记录的交通流量;
(步骤2)预处理:首先对原始数据进行时间尺度调整,将单位时间为30秒的交通流数据转化为单位时间为10分钟的数据,即数据转化为如下矩阵形式:
V ^ = v 1 1 v 1 2 . . . v 1 M v 2 1 v 2 2 . . . v 2 M . . . . . . . . . . . . v n 1 v n 2 . . . v n M
其中然后对的每一列求得标准差,记std(j)为第j列的标准差,如果std(j)<20,则认为传感器j的记录为无关记录,从矩阵中删除,从而得到有效交通流数据V∈Rm×n,其中m为预处理后参与预测的传感器的个数;完成如上所述的预处理后,用于交通流预测的数据转化为如下矩阵形式:
V = v 1 1 v 1 2 . . . v 1 m v 2 1 v 2 2 . . . v 2 m . . . . . . . . . . . . v n 1 v n 2 . . . v n m
(步骤3)建立预测模型:令表示交通网中的传感器j在第i个时刻记录的交通流数据,对于交通网中参与预测的m个传感器,则在第i个时刻整个交通网的状态表示为提前τ时刻对传感器j的流量进行预测的多因子线性回归模型为:
v ‾ i + τ j = V i w j
上式中的权重为待优化的模型参数,为预测值,τ分别取1、2、3、4、5、6,即分别提前10分钟、20分钟、30分钟、40分钟、50分钟、60分钟对传感器j的流量进行预测;
(步骤4)时空关联性挖掘:通过稀疏表达的优化方法自动得到模型参数wj,权重表示整个交通网络的各个传感器的数据对于预测目标传感器j的数据而言的时空关联性,当时,传感器k的数据与传感器j的数据之间没有关联性,否则值的大小表示传感器k的数据与传感器j的数据之间关联程度的强弱,k=1,2,...,m;首先对V的每一列和进行如下归一化处理,得到
V ‾ = v 1 1 Σ i = 1 n ( v i 1 ) 2 v 1 2 Σ i = 1 n ( v i 2 ) 2 . . . v 1 m Σ i = 1 n ( v i m ) 2 v 2 1 Σ i = 1 n ( v i 1 ) 2 v 2 2 Σ i = 1 n ( v i 2 ) 2 . . . v 2 m Σ i = 1 n ( v i m ) 2 . . . . . . . . . . . . v n 1 Σ i = 1 n ( v i 1 ) 2 v n 2 Σ i = 1 n ( v i 2 ) 2 . . . v n m Σ i = 1 n ( v i m ) 2
v ‾ j = v τ + 1 j Σ i = 1 n ( v τ + i j ) 2 v τ + 2 j Σ i = 1 n ( v τ + i j ) 2 . . . v τ + n j Σ i = 1 n ( v τ + i j ) 2 ;
所述的稀疏表达方法要优化的目标为:
w ^ j = arg min w j | | V ‾ w j - v ‾ j | | 2 2 约束条件:||wj||0≤L0
上式中L0为预先设定的门限,用于控制向量wj中非零元素个数;上式表达的优化目标通过Orthogonal Matching Puisuit(OMP)算法进行求解【Tropp,J.A.,2004.Greed is good:algorithmic results for sparse approximation.IEEE Trans.Information Theory 50,2231-2242.】;
(步骤5)将步骤(4)求解得到的权重代入步骤(3)建立的预测模型,得到如下预测结果:
v ‾ i + τ j = V i w ^ j
上式中,只有中不为零的元素才参与预测,对应于时空关联传感器。
实施例2:
除步骤4外,其余部分与实施例1相同;
(步骤4)首先对V的每一列和进行如下归一化处理,得到
V ‾ = v 1 1 Σ i = 1 n ( v i 1 ) 2 v 1 2 Σ i = 1 n ( v i 2 ) 2 . . . v 1 m Σ i = 1 n ( v i m ) 2 v 2 1 Σ i = 1 n ( v i 1 ) 2 v 2 2 Σ i = 1 n ( v i 2 ) 2 . . . v 2 m Σ i = 1 n ( v i m ) 2 . . . . . . . . . . . . v n 1 Σ i = 1 n ( v i 1 ) 2 v n 2 Σ i = 1 n ( v i 2 ) 2 . . . v n m Σ i = 1 n ( v i m ) 2
v ‾ j = v τ + 1 j Σ i = 1 n ( v τ + i j ) 2 v τ + 2 j Σ i = 1 n ( v τ + i j ) 2 . . . v τ + n j Σ i = 1 n ( v τ + i j ) 2 ;
稀疏表达方法要优化的目标为:
w ^ j = arg min w j | | w j | | 1 约束条件: | | V w j - v j | | 2 2 = Σ i = 1 n | V i w j - v i j | 2 ≤ ϵ 0
上式中||wj||1为wj的1范式,表示向量wj中所有元素绝对值之和,ε0是一个
预先设定的门限,用于控制预测误差 表示向量的2范数,即向量中所有元素的平方和的平方根;上式表达的优化目标等价地表示为加入拉格朗日乘子λ的无约束条件的优化目标:
w ^ j = arg min w j { λ | | w j | | 1 + 1 2 | | V w j - v j | | 2 2 }
上式表达的优化目标通过Least Angle Regression Stagewise(LARS)算法进行求解【Efron,B.,Hastie,T.,Johnstone,I.,Tibshirani,R.2004.Least angleregression.Annals of Statistics 32(2),407-499.】;求解时通过设定λ的值来控制中非零元素的个数,这里根据经验令λ=0.001,以获得较优的模型参数;
实施例3:
除步骤5外,其余部分与实施例2相同;
步骤(5):预测模型为向量自回归(VAR)模型【Chandra,S.R.,Al-Deek,H.,2009.Predictions of freeway traffic speeds and volumes using vector autoregressivemodels.Journal of Intelligent Transportation Systems 13(2),53–72.】,具体计算公式为:
v t j = Σ d = 1 p Σ i = 1 m w i j ψ i j B d v t i + u t j
上式中:B表示迟滞操作符,即Bdvt=vt-d;如果传感器i是传感器j的关联传感器,即(步骤4)得到的向量的第i个元素不为零,则令反之令 为独立标准高斯噪声;为待优化的参数,可通过最大似然法训练得到;
实施例4:
除步骤5外,其余部分与实施例2相同;
步骤(5):预测模型为BP神经网络(参考【Bishop,Ch.M.,1995.NeuralNetworks for Pattern Recognition.Oxford university press,ISBN 0-19-853864-2.】),采用3层网络结构,输入层神经元个数为(步骤4)得到的向量中不为零元素的个数,输入数据来自中不为零元素对应的传感器,隐层神经元设定为5个,输出层神经元为1个,隐含层传输函数为双极性S函数,输出层的传输函数为线性函数;
实施例5:
除步骤5外,其余部分与实施例2相同;
步骤(5):预测模型为RBF神经网络(参考【Bishop,Ch.M.,1995.NeuralNetworks for Pattern Recognition.Oxford university press,ISBN 0-19-853864-2.】),采用的核函数为高斯核函数,输入层神经元个数为(步骤4)得到的向量中不为零元素的个数,输入数据来自中不为零元素对应的传感器,隐层神经元个数和输入层神经元个数相同;
基于实施例2、3、4、5所述的方法,利用真实交通数据测试了预测性能,数据下载网址http://www.d.umn.edu/tkwon/TMCdata/TMCarchive.html,数据来自美国明尼苏达州的一个区域交通管理部门,通过几千个传感器记录了明尼苏达州双子城高速公路的交通流量。实验设置如下:训练数据从2012年2月4日到2012年3月14日总共40天,测试数据从2012年3月15日到2012年4月3日总共20天;经过预处理后,利用来自遍布于整个交通网络的3254个传感器的数据对60个目标传感器的交通流进行预测。
此外,进行了对比实验,除了时空关联传感器的选取方法不同以外,其它实验配置与实施2、3、4、5完全相同,对比实验中,根据人工经验选取预测目标节点一定邻近范围内的传感器作为关联传感器,将来自这些传感器的数据作为预测模型的输入,邻近传感器的个数分别取10、15、20、25、30。
实验表明,本发明提出的时空关联数据挖掘方法与基于人工经验选取邻近传感器作为输入相比,提升了预测模型的预测性能,详细的结果见表1-6,各表中,第一行的“10、15、20、25、30”分别表示取来自目标节点邻近的10、15、20、25、30个传感器的数据作为预测模型的输入,“稀疏”表示使用实施例2的方法自动挖掘出的时空关联传感器的数据作为预测模型的输入。表中所展示预测准确率定义如下【Min,W.,Wynter,L.,2011.Real-time road traffic prediction withspatio-temporal correlations.Transportation Research Part C 19,606–616.】:
Accuracy = 1 - 1 n Σ i = 1 n | v i j - v ‾ i j v i j | × 100 %
上式中n表示预测过的交通数据的总数,表示传感器j采集到的交通流的真实值,为预测值。表1-6列出的精度是60个目标传感器预测精度的平均值。
表1:选取10,15,20,25,30个邻近传感器作为关联传感器与稀疏表达方法挖掘的关联传感器在提前10分钟预测时的准确率
关联传感器 10 15 20 25 30 稀疏
线性回归模型 85.69 85.95 86.12 86.23 86.27 88.59
BP神经网络 87.23 87.49 87.45 87.63 87.59 88.16
RBF神经网络 86.71 86.98 87.01 86.96 86.85 88.17
向量自回归模型 87.39 87.39 87.42 87.43 87.46 87.82
表2:选取10,15,20,25,30个邻近传感器作为关联传感器与稀疏表达方法挖掘的关联传感器在提前20分钟预测时的准确率
关联传感器 10 15 20 25 30 稀疏
线性回归模型 83.50 83.61 83.85 83.94 84.02 86.75
BP神经网络 85.43 85.56 85.51 85.80 85.79 86.25
RBF神经网络 84.92 85.11 84.93 84.60 84.97 86.39
向量自回归模型 85.38 85.32 85.38 85.34 85.42 85.71
表3:选取10,15,20,25,30个邻近传感器作为关联传感器与稀疏表达方法挖掘的关联传感器在提前30分钟预测时的准确率
关联传感器 10 15 20 25 30 稀疏
线性回归模型 82.05 82.20 82.43 82.50 82.63 85.88
BP神经网络 84.31 84.55 84.69 84.68 84.95 85.67
RBF神经网络 83.76 84.01 83.91 83.70 84.04 85.52
向量自回归模型 83.89 83.84 83.88 83.89 83.98 84.69
表4:选取10,15,20,25,30个邻近传感器作为关联传感器点与稀疏表达方法挖掘的关联传感器在提前40分钟预测时的准确率
关联传感器 10 15 20 25 30 稀疏
线性回归模型 80.49 80.62 80.81 80.89 81.01 84.99
BP神经网络 83.16 83.43 83.64 83.58 83.76 85.08
RBF神经网络 82.32 82.68 82.65 82.49 82.88 85.15
向量自回归模型 82.07 82.05 82.15 82.17 82.22 84.10
表5:选取10,15,20,25,30个邻近传感器作为关联传感器与稀疏表达方法挖掘的关联传感器在提前50分钟预测时的准确率
关联传感器 10 15 20 25 30 稀疏
线性回归模型 79.18 79.29 79.52 79.55 79.74 84.26
BP神经网络 82.12 82.50 82.67 82.83 83.15 84.88
RBF神经网络 81.19 81.69 81.63 81.56 81.88 84.43
向量自回归模型 80.55 80.48 80.59 80.61 80.68 83.44
表6:选取10,15,20,25,30个邻近传感器作为关联传感器与稀疏表达方法挖掘的关联传感器在提前60分钟预测时的准确率
关联传感器 10 15 20 25 30 稀疏
线性回归模型 77.97 78.06 78.32 78.32 78.53 83.92
BP神经网络 81.58 81.98 82.15 82.22 82.46 84.42
RBF神经网络 80.31 80.89 81.08 80.98 81.33 84.33
向量自回归模型 79.08 79.09 79.22 79.25 79.34 82.94

Claims (4)

1.一种基于时空关联数据挖掘的交通流预测方法,其特征在于具体步骤为:
(a)通过布局到交通网各个节点的传感器采集交通流量的原始数据;
(b)通过数据预处理,将采集的原始数据处理为有效的交通流数据;
(c)建立预测模型:令                                                表示交通网中的传感器j在第i个时刻采集的交通流量数据,假设一个交通网中有m个传感器,则在第i个时刻整个交通网的状态表示为,提前τ时刻对传感器j采集的交通流量数据进行预测的线性回归模型为:                             
上式中的权重为待优化的模型参数,为预测值;
(d)挖掘时空关联性:通过稀疏表达的优化方法得到模型参数表示整个交通网络的各个传感器的数据对于预测目标传感器j的数据而言的时空关联性,当=0时,传感器k的数据与传感器j的数据之间没有关联性,否则值的大小表示传感器k的数据与传感器j的数据之间关联程度的强弱,k=1,2,...,m
(e)以时空关联数据为预测模型的输入,进行交通流预测。
2.根据权利要求1所述的预测方法,其特征在于步骤(d)所述通过稀疏表达优化方法要优化的目标为:
  约束条件:
上式中表示从第1到第n时刻所有传感器记录的交通流数据,其中第i个时刻交通网中m个传感器记录的交通流量为i=1,2,…,n表示传感器j记录的从第τ+1时刻到第τ+n时刻的交通流量,表示的0范数,即权重向量中非零元素的个数,ε0是一个预先设定的门限,用于控制预测误差表示向量的2范数,即向量中所有元素的平方和的平方根。
3.根据权利要求1所述的预测方法,其特征在于步骤(d)所述稀疏表达优化方法要优化的目标为:
   约束条件:
上式中L 0为预先设定的门限,用于控制向量中非零元素个数;上式表达的优化目标通过Orthogonal Matching Puisuit(OMP)算法进行求解。
4.根据权利要求1所述的预测方法,其特征在于步骤(d)所述的稀疏表达优化方法要优化的目标为:
 约束条件:
上式中的1范式,表示向量中所有元素绝对值之和,ε0是一个预先设定的门限,用于控制预测误差;上式表达的优化目标等价地表示为加入拉格朗日乘子λ的无约束条件的优化目标:
上式表达的优化目标通过Least Angle Regression Stagewise( LARS)算法进行求解。
CN201310749807.0A 2013-12-30 2013-12-30 一种基于时空关联数据挖掘的交通流预测方法 Active CN103700255B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201310749807.0A CN103700255B (zh) 2013-12-30 2013-12-30 一种基于时空关联数据挖掘的交通流预测方法
PCT/CN2014/081350 WO2015100993A1 (zh) 2013-12-30 2014-07-01 一种基于时空关联数据挖掘的交通流预测方法
US15/197,155 US9558661B2 (en) 2013-12-30 2016-06-29 Method for traffic flow prediction based on spatio-temporal correlation mining

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310749807.0A CN103700255B (zh) 2013-12-30 2013-12-30 一种基于时空关联数据挖掘的交通流预测方法

Publications (2)

Publication Number Publication Date
CN103700255A CN103700255A (zh) 2014-04-02
CN103700255B true CN103700255B (zh) 2015-10-07

Family

ID=50361770

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310749807.0A Active CN103700255B (zh) 2013-12-30 2013-12-30 一种基于时空关联数据挖掘的交通流预测方法

Country Status (3)

Country Link
US (1) US9558661B2 (zh)
CN (1) CN103700255B (zh)
WO (1) WO2015100993A1 (zh)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103700255B (zh) * 2013-12-30 2015-10-07 复旦大学 一种基于时空关联数据挖掘的交通流预测方法
CN104064023B (zh) * 2014-06-18 2016-12-07 银江股份有限公司 一种基于时空关联的动态交通流预测方法
US9483938B1 (en) 2015-08-28 2016-11-01 International Business Machines Corporation Diagnostic system, method, and recording medium for signalized transportation networks
CN106610980B (zh) * 2015-10-22 2022-03-18 日本电气株式会社 用于对时空序列数据进行分类/预测的设备和方法
CN106611227B (zh) * 2015-10-23 2020-08-11 北斗导航位置服务(北京)有限公司 兴趣点流量动态变化曲线预测方法及***
CN105957329B (zh) * 2016-06-29 2019-04-19 芜湖达成储运有限公司 一种公路信息化智能***
WO2018035058A1 (en) * 2016-08-15 2018-02-22 University Of Southern California Latent space model for road networks to predict time-varying traffic
CN108230698B (zh) * 2016-12-21 2020-06-26 杭州海康威视数字技术股份有限公司 交通流量预测方法及装置
CN108269411B (zh) * 2016-12-31 2020-12-25 南京理工大学 一种高速公路etc车流量预测方法
CN106844585A (zh) * 2017-01-10 2017-06-13 广东精规划信息科技股份有限公司 一种基于多源物联网位置感知的时空关系分析***
CN106875681B (zh) * 2017-03-22 2019-08-13 山东大学 一种交通拥塞趋势预测方法及***
CN106875684A (zh) * 2017-04-01 2017-06-20 广东石油化工学院 基于大规模动态语义图的交通流量预测算法
CN107170234A (zh) * 2017-06-09 2017-09-15 东方网力科技股份有限公司 一种基于svm算法对短时交通路况预测的方法
CN109213869B (zh) * 2017-06-29 2021-08-13 中国科学技术大学 基于多源数据的热点技术预测方法
CN107464419A (zh) * 2017-08-28 2017-12-12 北京工业大学 一种考虑时空特性的短时交通流预测方法
CN108346287B (zh) * 2018-01-30 2020-08-04 浙江大学 基于影响因素分析的交通流量序列模式匹配方法
CN110322037A (zh) * 2018-03-28 2019-10-11 普天信息技术有限公司 基于推理模型的流量预测方法及装置
CN108648446B (zh) * 2018-04-24 2020-08-21 浙江工业大学 一种基于mfd的路网交通信号迭代学习控制方法
CN108960496B (zh) * 2018-06-26 2021-07-23 浙江工业大学 一种基于改进学习率的深度学习交通流预测方法
CN109712393B (zh) * 2019-01-10 2020-08-04 浙江工业大学 基于高斯过程回归算法的智能交通时段划分方法
CN109711640A (zh) * 2019-01-23 2019-05-03 北京工业大学 一种基于模糊c均值交通流量聚类以及误差反馈卷积神经网络的短时交通流预测方法
CN109816983A (zh) * 2019-02-26 2019-05-28 昆明理工大学 一种基于深度残差网络的短时交通流量预测方法
CN109948207A (zh) * 2019-03-06 2019-06-28 西安交通大学 一种航空发动机高压转子装配误差预测方法
US11164007B2 (en) 2019-07-23 2021-11-02 Conduent Business Services, Llc Method and system for detecting the owner of an abandoned object from a surveillance video
CN110619419B (zh) * 2019-07-30 2022-08-05 北京交通大学 城市轨道交通的客流预测方法
CN110570013B (zh) * 2019-08-06 2023-04-07 山东省科学院海洋仪器仪表研究所 一种单站位在线波周期数据的预测诊断方法
CN110517485B (zh) * 2019-08-09 2021-05-07 大连理工大学 一种基于时段划分的短时交通流预测方法
CN110533341A (zh) * 2019-09-04 2019-12-03 东北大学 一种基于bp神经网络的城市宜居性评价方法
CN110569903B (zh) * 2019-09-10 2022-03-29 北京远舢智能科技有限公司 一种数据预测管理***
CN110633853A (zh) * 2019-09-12 2019-12-31 北京彩云环太平洋科技有限公司 时空数据预测模型的训练方法、装置及电子设备
WO2021058099A1 (en) * 2019-09-25 2021-04-01 Huawei Technologies Co., Ltd. Multi-step traffic prediction
CN110610611B (zh) * 2019-09-26 2021-08-03 江苏大学 面向混行交通流中智能网联车辆的行车安全性评价方法
CN110866649B (zh) * 2019-11-19 2022-09-20 中国科学院深圳先进技术研究院 一种短期地铁客流预测方法、***及电子设备
CN111260118B (zh) * 2020-01-10 2022-08-23 天津理工大学 一种基于量子粒子群优化策略的车联网交通流量预测方法
CN111223297A (zh) * 2020-01-17 2020-06-02 宁波工程学院 一种基于Wiener随机过程车辆工况预测方法和***
CN112102610A (zh) * 2020-07-27 2020-12-18 清华大学深圳国际研究生院 一种交通流量预测方法
CN112241814B (zh) * 2020-10-20 2022-12-02 河南大学 一种基于强化时空图神经网络的交通预测方法
CN113159428A (zh) * 2021-04-26 2021-07-23 青岛大学 交通流量预测方法、电子设备及存储介质
CN113205684A (zh) * 2021-04-29 2021-08-03 上海应用技术大学 交通流量预测方法及***
CN113240904B (zh) * 2021-05-08 2022-06-14 福州大学 基于特征融合的交通流预测方法
CN114220271B (zh) * 2021-12-21 2023-06-30 南京理工大学 基于动态时空图卷积循环网络的交通流预测方法、设备及存储介质
CN114863699B (zh) * 2022-06-14 2023-05-23 电子科技大学 一种基于数字孪生的城市车路协同交通流预测方法
CN116386321A (zh) * 2023-01-11 2023-07-04 华南理工大学 基于改进状态空间模型的交通速度预测方法
CN117116051B (zh) * 2023-10-25 2023-12-22 深圳市交投科技有限公司 基于人工智能的智慧交通管理***及其方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10025039A1 (de) * 2000-05-20 2001-11-29 Daimler Chrysler Ag Verfahren zur Ermittlung von Verkehrsregelungsphasendauern
JP2002008183A (ja) * 2000-05-10 2002-01-11 Daimler Chrysler Ag 交通制御されたネットワークノードを含む交通網に対する、報告車両データに基づく交通状況決定方法
CN1707544A (zh) * 2005-05-26 2005-12-14 上海交通大学 城市路网交通流状态估计方法
CN102005135A (zh) * 2010-12-09 2011-04-06 上海海事大学 基于遗传算法优化的支持向量回归船舶交通流量预测方法
CN102110365A (zh) * 2009-12-28 2011-06-29 日电(中国)有限公司 基于时空关系的路况预测方法和***
CN102663224A (zh) * 2012-03-07 2012-09-12 吉首大学 基于信息熵的交通流量集成预测模型

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5696503A (en) * 1993-07-23 1997-12-09 Condition Monitoring Systems, Inc. Wide area traffic surveillance using a multisensor tracking system
US6587781B2 (en) * 2000-08-28 2003-07-01 Estimotion, Inc. Method and system for modeling and processing vehicular traffic data and information and applying thereof
JP2004355537A (ja) * 2003-05-30 2004-12-16 Matsushita Electric Ind Co Ltd 交通流データ予測装置及び方法
US7818412B2 (en) * 2008-06-27 2010-10-19 Microsoft Corporation Selection of sensors for monitoring phenomena considering the value of information and data sharing preferences
US8458109B2 (en) * 2009-05-27 2013-06-04 Yin Zhang Method and apparatus for spatio-temporal compressive sensing
CN102034350B (zh) * 2009-09-30 2012-07-25 北京四通智能交通***集成有限公司 交通流数据短时预测方法及***
CN102169627A (zh) * 2011-01-30 2011-08-31 北京交通大学 基于虚拟速度传感器的快速路旅行时间预测方法
CN103700255B (zh) * 2013-12-30 2015-10-07 复旦大学 一种基于时空关联数据挖掘的交通流预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002008183A (ja) * 2000-05-10 2002-01-11 Daimler Chrysler Ag 交通制御されたネットワークノードを含む交通網に対する、報告車両データに基づく交通状況決定方法
DE10025039A1 (de) * 2000-05-20 2001-11-29 Daimler Chrysler Ag Verfahren zur Ermittlung von Verkehrsregelungsphasendauern
CN1707544A (zh) * 2005-05-26 2005-12-14 上海交通大学 城市路网交通流状态估计方法
CN102110365A (zh) * 2009-12-28 2011-06-29 日电(中国)有限公司 基于时空关系的路况预测方法和***
CN102005135A (zh) * 2010-12-09 2011-04-06 上海海事大学 基于遗传算法优化的支持向量回归船舶交通流量预测方法
CN102663224A (zh) * 2012-03-07 2012-09-12 吉首大学 基于信息熵的交通流量集成预测模型

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
STUDY ON TRAFIFIC FLOW PREDICTION USING RBF NEURAL NETWORK;JIAN-ME1 XIAO 等;《Proceedings of the Third International Conference on Machine Learning and Cybernetics》;20040831;全文 *
基于时空特性和RBF神经网络的短时交通流预测;高为 等;《交通信息与安全》;20111231;第29卷(第1期);全文 *

Also Published As

Publication number Publication date
CN103700255A (zh) 2014-04-02
WO2015100993A1 (zh) 2015-07-09
US9558661B2 (en) 2017-01-31
US20160314686A1 (en) 2016-10-27

Similar Documents

Publication Publication Date Title
CN103700255B (zh) 一种基于时空关联数据挖掘的交通流预测方法
Fu et al. Using LSTM and GRU neural network methods for traffic flow prediction
Perea et al. Optimisation of water demand forecasting by artificial intelligence with short data sets
Alizadeh et al. A new approach for simulating and forecasting the rainfall-runoff process within the next two months
Kim et al. Urban traffic flow prediction system using a multifactor pattern recognition model
Hung et al. An artificial neural network model for rainfall forecasting in Bangkok, Thailand
Luk et al. A study of optimal model lag and spatial inputs to artificial neural network for rainfall forecasting
Ghose et al. Prediction of water table depth in western region, Orissa using BPNN and RBFN neural networks
Sattari et al. Performance evaluation of artificial neural network approaches in forecasting reservoir inflow
Zhang et al. Manage sewer in-line storage control using hydraulic model and recurrent neural network
Lin et al. Development of an effective data-driven model for hourly typhoon rainfall forecasting
CN108009674A (zh) 基于cnn和lstm融合神经网络的空气pm2.5浓度预测方法
Bruen et al. Functional networks in real-time flood forecasting—a novel application
Tapoglou et al. Groundwater-level forecasting under climate change scenarios using an artificial neural network trained with particle swarm optimization
Samantaray et al. Prediction of suspended sediment concentration using hybrid SVM-WOA approaches
Chen et al. Groundwater level prediction using SOM-RBFN multisite model
Sattari et al. Flow estimations for the Sohu Stream using artificial neural networks
CN107170234A (zh) 一种基于svm算法对短时交通路况预测的方法
Shabani et al. Intelligent soft computing models in water demand forecasting
Meng et al. A threshold artificial neural network model for improving runoff prediction in a karst watershed
Latt Application of feedforward artificial neural network in Muskingum flood routing: a black-box forecasting approach for a natural river system
CN116011684A (zh) 一种基于时空图卷积网络的交通流量预测方法
Nguyen et al. Water level forecasting using neuro-fuzzy models with local learning
Turan et al. Predicting monthly river flows by genetic fuzzy systems
CN114572229B (zh) 一种基于图神经网络的车速预测方法、装置、介质及设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant