CN110264744B - 一种基于多元数据的交通流量预测算法 - Google Patents

一种基于多元数据的交通流量预测算法 Download PDF

Info

Publication number
CN110264744B
CN110264744B CN201910511038.8A CN201910511038A CN110264744B CN 110264744 B CN110264744 B CN 110264744B CN 201910511038 A CN201910511038 A CN 201910511038A CN 110264744 B CN110264744 B CN 110264744B
Authority
CN
China
Prior art keywords
data
time
traffic flow
sample
road section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910511038.8A
Other languages
English (en)
Other versions
CN110264744A (zh
Inventor
骆晓
沈智勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN201910511038.8A priority Critical patent/CN110264744B/zh
Publication of CN110264744A publication Critical patent/CN110264744A/zh
Application granted granted Critical
Publication of CN110264744B publication Critical patent/CN110264744B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/04Detecting movement of traffic to be counted or controlled using optical or ultrasonic detectors
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/065Traffic control systems for road vehicles by counting the vehicles in a section of the road or in a parking area, i.e. comparing incoming count with outgoing count

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Traffic Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于多元数据的交通流量预测算法,本次方法基于路口红外仿真数据、出租车GPS数据、手机信令数据针对低数据量样本对交通流量进行预测,方法需要使用非参数回归与仿真数据。本发明与现有技术相比的优势:本方法比较适合数据样本较小的情况;对于数据的利用,利用仿真数据与其他多元数据相结合,在样本较小的情况下具有较大可靠性;对于神经网络,该方式具有较强的推广性,不仅仅局限在某一数据集。

Description

一种基于多元数据的交通流量预测算法
技术领域
本发明涉及一种交通流量预测算法,具体为一种基于多元数据的交通流量预测算法。
背景技术
交通流量预测在智能交通***中占有重要地位,是实现交通诱导的前提。准确实时的短时交通流预测有助于更好的分析路网交通状况,对路网交通规划和交通优化控制有非常重要的作用。随着交通数据采集技术的不断发展,及时获取路网中实时的交通数据已成为可能。
目前,世界各国专家与学者利用各领域的方法,开发出了各种预测模型用于交通流预测,大概可以分成七类模型:基于统计方法的模型、动态交通分配的模型、交通仿真模型、非参数回归模型、神经网络模型、基于混沌理论的模型、综合模型等。对于基于统计方法的模型,会利用历史数据进行预测,并且假设预测的数据与过去的数据具有相同的特性,但大部分模型是基于线性的基础,当交通流变化较大时,预测效果会比较低,对于动态交通分配模型,该模型是通过采集到的交通数据和出行者出行选择的行为来估计时间变换的网络状态,但缺点是,信息获取困难,并且有些模型无法求解并且优化时间较长。对于神经网络模型,神经网络具有识别复杂非线性问题的特性,交通***复杂很适合此模型,但是缺点是训练过程中需要大量的原始数据,数据不足预测效果较差,并且训练完成的网络推广能力差。
通过上述分析,可以看出任何一个模型都具有其优势和缺点,单个模型都存在其局限性,基于传统的统计理论已经不能满足复杂的交通***的精度要求,为了提高预测的精度和可靠性,应博采众长,选取适合我国交通流特性的交通流预测综合模型。
发明内容
本发明的目的是为了提供一种基于多元数据的交通流量预测算法,以解决现有技术的上述问题。
本发明的目的是通过以下技术方案来实现的。
本次方法基于路口红外仿真数据、出租车GPS数据、手机信令数据针对低数据量样本对交通流量进行预测,方法需要使用非参数回归与仿真数据。
一种基于多元数据的交通流量预测算法,其步骤为:
(9)在路口放置多个红外线计数器,车辆每通过一次路口,红外计数器加一;
(10)将计数器的值以5取整;
(11)根据zipf定理,对多个计数器数据进行处理,zipf定率提到:一个单词出现的次数与它在频率表里的排名成反比,即少数数量值将出现在多数的数据中(简单的说,多个计数器中的值将出现多次,如130将出现多次)称这些出些频率高的数据为“真”数据,确定数量K(小于计数器数量),在计算器中找出频率最高的K个数作为该路段的有效交通流量基础数据;
(12)对于上述求解K个频率最高的数,利用基数桶与MG算法进行空间与时间的优化,具体描述如流程图与简要说明所示;
(13)根据K个数据值计算均值A作为该路段的交通流量;
(14)由于利用红外计算器精度与现实存在误差ε,ε=|A-y|,y代表真实值,一般的,y≥A,本次方法使用出租车GPS数据与分时租赁的OD等数据作为弥补误差的差值项,出租车的GPS数据等可以得到在样本数据中该类汽车出现在该路段的可能性。例如在出租车样本中,在该路段只出现10次,则出现在该类样本中出现出租车的概率为
Figure BDA0002093482250000031
m为样本数。先得到该地的全部出租车与分时租赁车辆为M1,N1,乘上该路段的出行概率为出现在该路段的车辆数M,N;
(15)样本交通流量样本变更为A+M+N;
(16)利用非参数回归(局部加权回归方式)对该路段交通流量进行预测:确定该时间该路段的交通流量只与前T分钟的历史数据具有相同统计规律(即只利用前T分钟的数据对该时间该路段的交通路段进行预测),预测结果为R1。
本发明与现有技术相比的优势:
(1)本方法比较适合数据样本较小的情况;
(2)对于数据的利用,利用仿真数据与其他多元数据相结合,
在样本较小的情况下具有较大可靠性;
(3)对于神经网络,该方式具有较强的推广性,不仅仅局限在某一数据集。
附图说明
图1为本发明的具体操作流程图;
图2为基数桶数据结构图;
图3为检测器检测结果模型图。
具体实施方式
下面结合具体实施例与附图进一步阐述本发明的技术特点。
如图1所示的一种基于多元数据的交通流量预测算法,其步骤为:在路口放置多个红外线计数器,车辆每通过一次路口,红外计数器加一;将计数器的值以5取整;根据zipf定理,对多个计数器数据进行处理,zipf定率提到:一个单词出现的次数与它在频率表里的排名成反比,即少数数量值将出现在多数的数据中(简单的说,多个计数器中的值将出现多次,如130将出现多次)称这些出些频率高的数据为“真”数据,确定数量K(小于计数器数量),在计算器中找出频率最高的K个数作为该路段的有效交通流量基础数据;对于上述求解K个频率最高的数,利用基数桶与MG算法进行空间与时间的优化,具体描述如流程图与简要说明所示;根据K个数据值计算均值A作为该路段的交通流量;由于利用红外计算器精度与现实存在误差ε,ε=|A-y|,y代表真实值,一般的,y≥A,本次方法使用出租车GPS数据与分时租赁的OD等数据作为弥补误差的差值项,出租车的GPS数据等可以得到在样本数据中该类汽车出现在该路段的可能性。例如在出租车样本中,在该路段只出现10次,则出现在该类样本中出现出租车的概率为
Figure BDA0002093482250000051
m为样本数。先得到该地的全部出租车与分时租赁车辆为M1,N1,乘上该路段的出行概率为出现在该路段的车辆数M,N;样本交通流量样本变更为A+M+N;利用非参数回归(局部加权回归方式)对该路段交通流量进行预测:确定该时间该路段的交通流量只与前T分钟的历史数据具有相同统计规律(即只利用前T分钟的数据对该时间该路段的交通路段进行预测),预测结果为R1。
基数桶与MG算法:道路上存放N个检测器,分别检测到的数据将依次存放至基数桶中。根据Zipf定理,可以确定基数桶结构是有效的。基数是集合论中的一个概念,将相似的数据放入一个基数桶,并保证基数桶中各集合各自保证非递减有序,数据i进入基数桶中只需进入该对应集合,数据i进入基数桶时对数据的最高位进行划分,如:10最的高位是1,则进入1号基数桶,20的最高位是2,则进入2号基数桶,其优势在于与其他数据保持独立性,当有新的数据进入基数桶如40进入基数桶,只需考虑基数4中集合所存在的元素,由于非递减有序特性,利用***排序对数据进行增加或者更新,具体的基数桶数据结构图如下2所示:
利用红外检测器检测道路流动车流量,并做出如下假设:1、道路是单向的;2、道路没有交叉口;
根据上述假设可以得出:在单向无交叉口的一段连续的道路上的检测器在单位时间内测定的数据值大部分是相同的或是相似连续的(车流量并不能突变)下图3表示在以上假设下检测器检测结果模型图:
当a测出值为5,那么b测出的值应与a的检测值相同或相差车道数m的倍数,且a,b检测值差值不大。根据以上假设推论:如果道路拥有交叉口,那在两条交叉口之间的检测器中的数据大部分是相同的。利用Zipf定理可以得到一个大致的模型,大部分(以90%为例)的道路情况的数据占所有道路情况数据值的10%(10%的数据值分布在不同的路口,有岔路等地),我们可以称这90%的数据是有效数据,剩下10%的数据是无效数据,但这90%的数据中不同的数字只占全部数据的10%,根据以上论述可以得出随机化的合理性和有效性,算法描述如下1所示:
算法1 MG替换算法
Figure BDA0002093482250000061
Figure BDA0002093482250000071
实施例:
对数据进行整理,所需数据集样表如下所示,选区K为5,样本例表如下所示:
表1实验数据样表
Figure BDA0002093482250000081
上述求取平均值为(30+35+45+50+55)/5=43,则一个时间的车流量为43辆,对于非参数回归,只选取T分钟前的数据作为训练样本,这里T取20;
将20组数据传入以下代码进行回归计算,得到结果即可:
Figure BDA0002093482250000082
Figure BDA0002093482250000091
Figure BDA0002093482250000101
Figure BDA0002093482250000111
以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。

Claims (1)

1.一种基于多元数据的交通流量预测算法,其特征在于:其步骤为:
(1)在路口放置多个红外线计数器,车辆每通过一次路口,红外计数器加一;
(2)将计数器的值以5向下取整;
(3)根据zipf定律,对多个计数器数据进行处理,zipf定律提到:一个单词出现的次数与它在频率表里的排名成反比,即少数数量值将出现在多数的数据中称这些出些频率高的数据为“真”数据,确定数量K,在计算器中找出频率最高的K个数作为路段的有效交通流量基础数据;
(4)对于上述求解K个频率最高的数,利用基数桶数据结构与亚线性MG算法进行空间与时间的优化,亚线性MG算法保证了计数器在小于线性的时间内对数据进行平均数的计算;
(5)根据K个数据值计算均值A作为该路段的交通流量;
(6)若只使用红外计数器的计数结果作为路段交通流量,则与现实流量差别过大;设红外计数器结果与现实情况存在误差εε= 丨 A-y丨,y代表真实值,本次方法使用出租车GPS数据M与分时租赁的OD数据N作为弥补误差的差值项,总的分时租赁汽车、出租车的GPS数据得到分时租赁汽车、出租车出现在红外安置路段范围内路段的可能性;其中,设在出租车样本中,在该路段出现若干次,则在该类样本中出现出租车的概率为:次数/m,m为出租车样本数;设分时租赁车辆样本中,在该路段出现若干次,则在该类样本中出现分时租赁车辆的概率为:次数/n,n为分时租赁车辆样本数;在先得到该地的全部出租车与分时租赁车辆计为M1,N1,乘上该路段的出行概率为出现在该路段的车辆数M,N;
(7)样本交通流量样本变更为A+M+N;
利用非参数回归对该路段交通流量进行预测:确定该时间该路段的交通流量只与前T分钟的历史数据具有相同统计规律,预测结果为R1。
CN201910511038.8A 2019-06-13 2019-06-13 一种基于多元数据的交通流量预测算法 Active CN110264744B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910511038.8A CN110264744B (zh) 2019-06-13 2019-06-13 一种基于多元数据的交通流量预测算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910511038.8A CN110264744B (zh) 2019-06-13 2019-06-13 一种基于多元数据的交通流量预测算法

Publications (2)

Publication Number Publication Date
CN110264744A CN110264744A (zh) 2019-09-20
CN110264744B true CN110264744B (zh) 2022-05-27

Family

ID=67918103

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910511038.8A Active CN110264744B (zh) 2019-06-13 2019-06-13 一种基于多元数据的交通流量预测算法

Country Status (1)

Country Link
CN (1) CN110264744B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102881162A (zh) * 2012-09-29 2013-01-16 北京市交通信息中心 大规模交通信息的数据处理及融合方法
CN103280098A (zh) * 2013-05-23 2013-09-04 北京交通发展研究中心 交通拥堵指数计算方法
CN105261212A (zh) * 2015-09-06 2016-01-20 中山大学 一种基于出租车gps数据地图匹配的出行时空分析方法
CN107481533A (zh) * 2017-09-23 2017-12-15 山东交通学院 一种交通流预测***及方法
DE102018000016A1 (de) * 2017-01-10 2018-07-12 Scania Cv Ab Verfahren und System zum Abschätzen von Verkehrsfluss

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102881162A (zh) * 2012-09-29 2013-01-16 北京市交通信息中心 大规模交通信息的数据处理及融合方法
CN103280098A (zh) * 2013-05-23 2013-09-04 北京交通发展研究中心 交通拥堵指数计算方法
CN105261212A (zh) * 2015-09-06 2016-01-20 中山大学 一种基于出租车gps数据地图匹配的出行时空分析方法
DE102018000016A1 (de) * 2017-01-10 2018-07-12 Scania Cv Ab Verfahren und System zum Abschätzen von Verkehrsfluss
CN107481533A (zh) * 2017-09-23 2017-12-15 山东交通学院 一种交通流预测***及方法

Also Published As

Publication number Publication date
CN110264744A (zh) 2019-09-20

Similar Documents

Publication Publication Date Title
Liu et al. Bus arrival time prediction based on LSTM and spatial-temporal feature vector
CN108346292B (zh) 基于卡口数据的城市快速路实时交通指数计算方法
Zheng et al. Detecting collective anomalies from multiple spatio-temporal datasets across different domains
Zhao et al. Truck traffic speed prediction under non-recurrent congestion: Based on optimized deep learning algorithms and GPS data
CN111080029B (zh) 基于多路段时空相关的城市交通路段速度预测方法及***
CN104064028B (zh) 基于多元信息数据的公交到站时间预测方法及***
CN112700072A (zh) 交通状况预测方法、电子设备和存储介质
CN105868861A (zh) 一种基于时空数据融合的公交客流演化分析方法
CN113792929B (zh) 交通流量预测方法、电子设备及存储介质
Liu et al. A two-stage destination prediction framework of shared bicycles based on geographical position recommendation
CN107369318A (zh) 一种速度预测方法及装置
CN104866654A (zh) 一种一体化城市动态交通仿真平台的构建方法
CN101783075A (zh) 一种城市环形道路交通流预测***
Han et al. A bus arrival time prediction method based on position calibration and LSTM
CN112927513B (zh) 一种实时在线交通仿真方法及***
Chen et al. A multiscale-grid-based stacked bidirectional GRU neural network model for predicting traffic speeds of urban expressways
CN110751311A (zh) 偶发***通拥堵持续时间的数据提取与实时预测方法
CN113051811B (zh) 一种基于gru网络的多模式短期交通拥堵预测方法
CN115691120A (zh) 一种基于高速公路流水数据的拥堵识别方法及***
CN112884014A (zh) 一种基于路段拓扑结构分类的交通速度短时预测方法
CN114898556B (zh) 一种基于多尺度计算的数字路网交通状态推算方法
CN113284369B (zh) 一种基于ads-b实测航路数据的预测方法
CN110264744B (zh) 一种基于多元数据的交通流量预测算法
CN112541621A (zh) 一种移动预测方法、智能终端及存储介质
CN110704789B (zh) 一种依托“城市超脑”计算平台的人口动态测算方法和***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant