CN110322695B - 一种基于深度学习的短时交通流预测方法 - Google Patents

一种基于深度学习的短时交通流预测方法 Download PDF

Info

Publication number
CN110322695B
CN110322695B CN201910667478.2A CN201910667478A CN110322695B CN 110322695 B CN110322695 B CN 110322695B CN 201910667478 A CN201910667478 A CN 201910667478A CN 110322695 B CN110322695 B CN 110322695B
Authority
CN
China
Prior art keywords
time
traffic flow
short
neural network
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910667478.2A
Other languages
English (en)
Other versions
CN110322695A (zh
Inventor
田永红
张悦
吴琪
张鹏
张晴晴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inner Mongolia University of Technology
Original Assignee
Inner Mongolia University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inner Mongolia University of Technology filed Critical Inner Mongolia University of Technology
Priority to CN201910667478.2A priority Critical patent/CN110322695B/zh
Publication of CN110322695A publication Critical patent/CN110322695A/zh
Application granted granted Critical
Publication of CN110322695B publication Critical patent/CN110322695B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications
    • G08G1/0145Measuring and analyzing of parameters relative to traffic conditions for specific applications for active traffic flow control

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Chemical & Material Sciences (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Analytical Chemistry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Traffic Control Systems (AREA)

Abstract

首先对天气数据和交通路口过车数据进行分析和预处理,输入到门限循环神经网络(GRU)中提取到交通流的高阶特征,之后将所述高阶特征输入到梯度提升决策树回归模型(GBDT)中进行短时交通流预测。本发明可以对交通流数据进行更加深入的挖掘分析,而且把输出层改为GBDT后,可以有效的提高短时交通流预测的准确率。

Description

一种基于深度学习的短时交通流预测方法
技术领域
本发明属于交通预测技术领域,特别涉及一种基于深度学习的短时交通流预测方法。
背景技术
随着社会各界与日俱增的交通运输需求,交通运输在经济发展中的作用越来越明显,交通拥堵问题成为制约社会发展的一个瓶颈,因而,如何有效地解决交通拥堵问题已成为世界各国政府最棘手的也是最急需解决的难题之一。
短时交通流预测是交通管理和控制部门采取交通诱导措施的主要依据,为了更好的实时性反映交通状态,基于短时交通流量预测模型的研究成为近几十年来流量预测研究的重点。随着新技术的不断发展,智能化***的广泛应用,对于大数据的处理和交通预测模型的精度提出了更高的要求。实时、准确的交通流预测,可以有效的提高交通的通行效率和安全性,并且方便管理部门主动的进行交通规划,并采取合理的交通诱导措施。
传统的交通流预测方法有支持向量机,决策树,卷积神经网络,循环神经网络等,这些交通流预测方法大部分都是只提取交通流的时空特征,而忽略了影响交通流的潜在特征,比如天气特征,速度特征,节假日时间特征等,而且没有对交通流数据进行深入的分析,从而无法获得更加准确的预测。
发明内容
为了克服上述现有技术的缺点,本发明的目的在于提供一种基于深度学习的短时交通流预测方法,加入了影响交通流的潜在特征,可以对交通流数据进行更加深入的挖掘,使得预测出来的效果更加精准。
为了实现上述目的,本发明采用的技术方案是:
一种基于深度学习的短时交通流预测方法,首先对交通流数据进行预处理,然后将预处理的数据输入到门限循环神经网络(GRU)中进行训练,提取得到交通流数据的高阶特征,最后将所述高阶特征输入到梯度提升决策树回归模型(GBDT)中进行短时交通流预测。
所述交通流数据包括天气数据和交通路口过车数据,以车辆速度特征、前一时刻的交通流量特征、节假日时间特征和天气特征作为交通流特征,所述交通路口过车数据包括车辆速度、车辆id、监测点id和车辆行驶时间,所述预处理方法是:假设一个城市某个区域有n个路口,路口集合R={r1,r2,...,ri,...,rn},将一天的24个小时划分为288个5分钟长的时间片t1,t2,...,tj,...,t288,第i个路口ri在第j个时间片tj的交通流量为numij
所述车辆速度特征是路口每5分钟的车辆速度平均值;所述前一时刻的交通流量特征是按照时间序列排列的某一时刻前4个时间片的交通流量,所述天气特征包括天气状况和风力两个因素,所述天气状况划分为3类,分别为晴或者多云,雨,雾,用W1,W2,W3表示,所述风力划分为4个级别,分别为微风,大风,暴风,台风,用A1,A2,A3,A4表示;所述节假日时间特征中,将工作日记为W,将节假日记为H,工作日里的工作时间记为WWT,工作日里的上下班高峰时间记为WGT,工作日的早高峰前和晚高峰后时间记为WQT,其余时间记为WDT;节假日的日间时间记为HFT,其余时间记为HRT。
所述将预处理的数据输入到门限循环神经网络(GRU)中进行训练的过程是:
1)将交通流数据集输入到GRU中;
2)计算各层的更新门、重置门、当前记忆内容和最终记忆内容的值;
3)使用AdaMax优化算法训练网络模型;
4)将训练好的GRU模型中隐含层最后一层的特征提取出来输入到GBDT回归算法对短时交通流进行预测。
所述2)中,在时间片t,更新门zt=σ(wz·[ht-1,xt]),其中σ为Sigmoid激活函数,xt为输入的交通流特征向量,ht-1保存的是前一个时间片t-1的信息,xt和ht-1均经过一个与权重矩阵wz相乘的线性变换,之后相加投入Sigmoid激活函数以输出激活值;
重置门rt=σ(wr·[ht-1,xt]),xt和ht-1均经过一个与权重矩阵wr相乘的线性变换,之后相加投入Sigmoid激活函数以输出激活值;
当前记忆内容
Figure BDA0002140601150000031
其中tanh为双曲正切激活函数,
Figure BDA0002140601150000032
为当前记忆内容的权重,ht-1为前一时间片隐藏层的值,xt为输入的交通流特征向量,
Figure BDA0002140601150000033
为当前记忆内容的偏置,输入xt先与ht-1经过一个与权重矩阵
Figure BDA0002140601150000034
相乘的线性变换,计算重置门rt与ht-1的乘积,即rt与ht-1的对应元素乘积,然后再投入tanh;
当前时间片的最终记忆
Figure BDA0002140601150000035
所述2)中,所述使用AdaMax优化算法训练网络模型的方法如下:
AdaMax是Adam的一种变体,它是随机梯度下降的扩展式。此方法对学习率的上限提供了一个更简单的范围。令,
Figure BDA0002140601150000036
其中Wt为t时刻的门限循环神经网络权重,Wt-1为t-1时刻门限循环神经网络的权重,α为学习率,ε为非常小的数,以防止在实现中除以零,bt为t时刻的门限循环神经网络偏置,bt-1为t-1时刻门限循环神经网络的偏置,vt指的是梯度的指数移动均值在时间t的更新,
Figure BDA0002140601150000037
为mt的纠正;
Figure BDA0002140601150000038
mt=β1·mt-1+(1-β1)·gt
Figure BDA0002140601150000039
mt是梯度的指数移动均值,通过梯度的一阶矩求得,gt为目标函数的t时刻一阶偏导,gt-1为目标函数的t-1时刻的一阶偏导,i为迭代时间,β1,β2是常数,控制指数衰减,
Figure BDA0002140601150000041
表示β1的t次方,
Figure BDA0002140601150000042
表示β2的p次方,|gt|p为gt绝对值的p次方;
令p→∞并定义
vt=limp→∞(vt)1/p
Figure BDA0002140601150000044
然后将计算出来的vt
Figure BDA0002140601150000045
带入Wt,bt公式中对权重和偏置进行更新,利用上述描述的AdaMax优化算法更新网络权重w和偏置b,直到模型收敛,最终模型训练完成后提取出GRU隐层最后一层的特征h作为交通流的高阶特征,h={(h1,y1),(h2,y2),...,(hm,ym)}。
所述将高阶特征输入到梯度提升决策树回归模型(GBDT)中进行短时交通流预测的过程如下:
初始化弱学习器f0(h),
Figure BDA0002140601150000046
其中,L为损失函数,yi为交通流量标签,c为使损失函数极小化的常数值,m为训练样本数;
当迭代次数n=1,2,...,N(其中N为最大迭代次数)有:
1.对于样本i=1,2,...,m,计算负梯度
Figure BDA0002140601150000047
利用(hi,rnj)拟合一颗CART回归树,得到第n棵回归树,其对应的叶子节点区域为Rnj,j=1,2,...,J,其中J为第n棵回归树的叶子节点的个数;
2.对于叶子节点区域j=1,2,...,J,计算最佳拟合值
Figure BDA0002140601150000051
更新强学习器
Figure BDA0002140601150000052
其中:
Figure BDA0002140601150000053
得到强学习器f(h)
Figure BDA0002140601150000054
式中fN(h)为达到最大迭代次数N时更新的强学习器,f(h)即最终的短时交通流预测结果。
本发明通过GRU模型对交通流数据进行训练,本发明使用深圳交警提供的数据,数据量约为60GB,包括20天的交通数据和天气信息。通过深度学习模型提取出交通流数据的本质特征,并且输入到GBDT回归算法中进行预测。与传统的交通流预测模型相比,本发明所提出的模型可以实现对交通流数据更加深入的挖掘,提取出人工无法提取出来的交通流的本质特征,并且输出层改为GBDT回归算法进行预测,比传统的sigmoid函数预测出来的结果精确值提高了12%,从而有效地缓解交通拥堵、提高道路的通行效率。
附图说明
图1是本发明预测流程示意图。
图2是本发明GRU模型的结构示意图。
图3是本发明采用AdaMax算法优化GRU模型时的预测流程示意图。
具体实施方式
下面结合附图和实施例详细说明本发明的实施方式。
本发明为一种基于深度学习的短时交通流预测方法,交通流信息的实时性和可靠性直接关系到交通控制与管理的效果,因而实现对道路交通流的实时掌握和准确预测就成为运用智能交通技术解决交通问题的一个重要基础。由于短时交通流的预测与前几个时刻的交通流量息息相关,因此本发明采用了适用于时间序列方面预测的门限循环神经网络(GRU),并结合梯度提升决策树回归模型(GBDT)实现了较为精准的短时交通流预测。
具体地,本发明的一个实施例如图1所示,步骤如下:
1、对交通流数据进行预处理;
2、然后将预处理的数据输入到门限循环神经网络(GRU)中进行训练,提取得到交通流数据的高阶特征;
3、将该高阶特征输入到梯度提升决策树回归模型(GBDT)中进行短时交通流预测。
本发明可以对交通流数据进行更加深入的挖掘分析,而且把输出层改为GBDT后,可以有效提高短时交通流预测的准确率。
实际生活中影响城市交通状态的因素是非常复杂的,它受不同城市的发展情况和人口数量等影响。同时不同时间段人们的出行状况对交通流也有很大的影响,例如在上班高峰期,节假日外出旅行,高速免费通行容易发生交通拥堵。另外天气状况对交通状况也有直接的影响,例如在大雨天,大雪天更容易发生交通拥堵,而同一车道的交通速度对交通状态也有一定的影响。因此,本发明以车辆速度特征、前一时刻的交通流量特征、节假日时间特征和天气特征作为交通流特征。
具体而言,步骤1中所提到的交通流数据包括:天气数据和交通路口过车数据,交通路口过车数据包括车辆速度,车辆id,监测点id和车辆行驶时间等。交通流数据预处理的具体方法是,假设一个城市某个区域有n个路口,路口集合R={r1,r2,...,ri,...,rn},将一天的24个小时划分为288个5分钟长的时间片t1,t2,...,tj,...,t288,即将影响交通流量的数据按每五分钟时间段进行划分,第i个路口ri在第j个时间片tj的交通流量为numij
天气特征主要包括天气状况和风力两个因素,依据现有的研究,天气状况和风力大小的值会影响交通流量的大小。根据气象局天气状况划分标准将天气状况划分为3类,分别为晴或者多云,雨,雾,用W1,W2,W3表示,根据气象局风力等级划分标准,将风力划分为4个级别,分别为微风(0-5)、大风(6-8)、暴风(9-11)、台风(>11),用A1,A2,A3,A4表示。据经验来考虑,工作日、节假日以及工作日里的工作时间、上下班高峰时间和节假日里用餐、娱乐出行时间为主要影响因子。根据数据统计,节假日时间特征中,将工作日记为W,将节假日记为H,工作日里的工作时间(9:00~17:00)记为WWT,工作日里的上下班高峰时间(7:00~9:00,17:00~20:00)记为WGT,工作日的早高峰前和晚高峰后时间(6:00~7:00,20:00~22:00)记为WQT,其余时间记为WDT;节假日的日间时间(10:00~21:00)记为HFT,其余时间记为HRT。
车辆速度特征对交通流预测也有很大的影响,将路口每5分钟的车辆速度平均值作为车辆速度特征;前几个时间段的交通流量对未来时刻交通流量的预测也有重要的影响,将按照时间序列排列的某一时刻前4个时间片的交通流量作为前一时刻的交通流量特征,例如ri在tj的前4个时间片的交通流量为numij-1,numij-2,numij-3,numij-4,排列作为前一时刻的交通流量特征。
在步骤2中,需要利用门限循环神经网络(GRU)从预处理的数据训练提取得到交通流数据的高阶特征,其具体方法主要是将交通流特征输入到GRU中,然后计算各层的更新门、重置门、当前记忆内容和最终记忆内容的值,GRU模型中隐含层最后一层的特征提取出来即得该高阶特征。
GRU是LSTM网络的一种变体,它较LSTM网络的结构更加简单,而且效果也很好,在LSTM中引入了三个门函数:输入门、遗忘门和输出门来控制输入值、记忆值和输出值。而在GRU模型中只有两个门:分别是更新门和重置门,具体结构如图2所示。
(1)更新门
在时间片t,首先需要使用以下公式计算更新门zt
zt=σ(wz·[ht-1,xt])
其中σ为Sigmoid激活函数,xt为输入的交通流特征向量,ht-1保存的是前一个时间片t-1的信息,xt和ht-1均经过一个与权重矩阵wz相乘的线性变换,之后相加投入Sigmoid激活函数以输出激活值,因此将激活结果压缩到0到1之间。更新门帮助模型决定到底要将多少过去的信息传递到未来,或到底前一时间片和当前时间片的信息有多少是需要继续传递的。这一点非常强大,因为模型能决定从过去复制所有的信息以减少梯度消失的风险。
(2)重置门
本质上来说,重置门主要决定了到底有多少过去的信息需要遗忘,可以使用以下表达式计算:
rt=σ(wr·[ht-1,xt])
该表达式与更新门的表达式是一样的,只是线性变换的参数和用处不一样。如前面更新门所述,xt和ht-1均经过一个与权重矩阵wr相乘的线性变换,之后相加投入Sigmoid激活函数以输出激活值。
(3)当前记忆内容
在重置门的使用中,新的记忆内容将使用重置门储存过去相关的信息,它的计算表达式为:
Figure BDA0002140601150000081
其中tanh为双曲正切激活函数,
Figure BDA0002140601150000082
为当前记忆内容的权重,ht-1为前一时间片隐藏层的值,xt为输入的交通流特征向量,
Figure BDA0002140601150000083
为当前记忆内容的偏置,输入xt先与ht-1经过一个与权重矩阵
Figure BDA0002140601150000084
相乘的线性变换,计算重置门rt与ht-1的乘积,即rt与ht-1的对应元素乘积,因为前面计算的重置门是一个由0到1组成的向量,它会衡量门控开启的大小,然后再投入tanh。
(4)当前时间片的最终记忆
在最后一步,网络需要计算ht,该向量将保留当前单元的信息并传递到下一个单元中。在这个过程中,需要使用更新门,它决定了当前记忆内容ht和前一时间片ht-1中需要收集的信息是什么。这一过程可以表示为:
Figure BDA0002140601150000091
zt为更新门的激活结果,它同样以门控的形式控制了信息的流入。zt与ht-1的Hadamard乘积表示前一时间片保留到最终记忆的信息,该信息加上当前记忆保留至最终记忆的信息就等于最终门控循环单元输出的内容。
门控循环单元不会随时间而清除以前的信息,它会保留相关的信息并传递到下一个单元,因此它利用全部信息而避免了梯度消失问题。
在步骤3中,将步骤2输出的高阶特征输入到梯度提升决策树回归模型(GBDT)中进行短时交通流预测,过程如下:
初始化弱学习器f0(h),
Figure BDA0002140601150000092
其中,L为损失函数,yi为交通流量标签,c为使损失函数极小化的常数值,m为训练样本数;
当迭代次数n=1,2,...,N(其中N为最大迭代次数)有:
1.对于样本i=1,2,...,m,计算负梯度
Figure BDA0002140601150000093
利用(hi,rnj)拟合一颗CART回归树,得到第n棵回归树,其对应的叶子节点区域为Rnj,j=1,2,...,J,其中J为第n棵回归树的叶子节点的个数;
2.对于叶子节点区域j=1,2,...,J,计算最佳拟合值
Figure BDA0002140601150000094
更新强学习器
Figure BDA0002140601150000101
其中:
Figure BDA0002140601150000102
得到强学习器f(h)
Figure BDA0002140601150000103
式中fN(h)为达到最大迭代次数N时更新的强学习器,f(h)即最终的短时交通流预测结果。
参考图3,在本发明的另一个实施例中,门限循环神经网络(GRU)的训练使用AdaMax优化算法,AdaMax是Adam的一种变体,它是随机梯度下降的扩展式。此方法对学习率的上限提供了一个更简单的范围,训练方法如下:
令,
Figure BDA0002140601150000104
其中Wt为t时刻的门限循环神经网络权重,Wt-1为t-1时刻门限循环神经网络的权重,α为学习率,ε为非常小的数,以防止在实现中除以零,bt为t时刻的门限循环神经网络偏置,bt-1为t-1时刻门限循环神经网络的偏置,vt指的是梯度的指数移动均值在时间t的更新,
Figure BDA0002140601150000105
为mt的纠正;
Figure BDA0002140601150000106
mt=β1·mt-1+(1-β1)·gt
Figure BDA0002140601150000107
mt是梯度的指数移动均值,通过梯度的一阶矩求得,gt为目标函数的t时刻一阶偏导,gt-1为目标函数的t-1时刻的一阶偏导,i为迭代时间,β1,β2是常数,控制指数衰减,
Figure BDA0002140601150000111
表示β1的t次方,
Figure BDA0002140601150000112
表示β2的p次方,|gt|p为gt绝对值的p次方;
令p→∞并定义
vt=limp→∞(vt)1/p
Figure BDA0002140601150000113
然后将计算出来的vt
Figure BDA0002140601150000114
带入Wt,bt公式中对权重和偏置进行更新,利用上述描述的AdaMax优化算法更新网络权重w和偏置b,直到模型收敛,最终模型训练完成后提取出GRU隐层最后一层的特征h作为交通流的高阶特征,h={(h1,y1),(h2,y2),...,(hm,ym)}。
利用上述方法,本发明使用深圳交警提供的数据,数据量约为60GB,包括20天的交通数据和天气信息,处理好的交通流数据为:{(x1,y1),(x2,y2),...,(xm,ym)},其中xi表示i时间片的交通流流量特征,ym表示其对应的交通流量预测标签,m表示样本个数,通过GRU提取出交通流数据的本质特征{(h1,y1),(h2,y2),...,(hm,ym)},其中hi为GRU隐藏层最后一层提取出来的特征,之后将其输入到GBDT回归算法中进行预测。我们使用平均绝对误差(MeanAbsolute Deviation,MAE)和均方根误差(Root Mean Squard Error,RMSE)作为评价指标。公式如下所示:
Figure BDA0002140601150000115
Figure BDA0002140601150000116
其中m为样本个数,yi为样本标签实际值,
Figure BDA0002140601150000117
为样本预测值。预测模型的实验结果表现中,MAE与RMSE值越小,则预测模型的预测效果越好。
下表给出传统GRU预测结果和GRU-GBDT的预测结果。
表1不同模型的预测结果
Figure BDA0002140601150000121
从上表可以看出GRU-GBDT预测出来的MAE值和RMSE值都比GRU中sigmoid预测层预测出来的值要小很多,预测效果更好。

Claims (4)

1.一种基于深度学***均值;所述前一时刻的交通流量特征是按照时间序列排列的某一时刻前4个时间片的交通流量,所述天气特征包括天气状况和风力两个因素,所述天气状况划分为3类,分别为晴或者多云,雨,雾,用W1,W2,W3表示,所述风力划分为4个级别,分别为微风,大风,暴风,台风,用A1,A2,A3,A4表示;所述节假日时间特征中,将工作日记为W,将节假日记为H,工作日里的工作时间记为WWT,工作日里的上下班高峰时间记为WGT,工作日的早高峰前和晚高峰后时间记为WQT,其余时间记为WDT;节假日的日间时间记为HFT,其余时间记为HRT;所述将预处理的数据输入到门限循环神经网络(GRU)中进行训练的过程是:
1)将交通流数据集输入到门限循环神经网络(GRU)中;
2)计算各层的更新门、重置门、当前记忆内容和最终记忆内容的值;
3)使用AdaMax优化算法训练网络模型;
4)将训练好的门限循环神经网络(GRU)模型的输出层改为梯度提升决策树回归算法,将训练好的门限循环神经网络(GRU)模型中隐含层最后一层的特征提取出来输入到梯度提升决策树回归算法对短时交通流进行预测。
2.根据权利要求1所述基于深度学习的短时交通流预测方法,其特征在于,所述2)中,在时间片t,更新门zt=σ(wz·[ht-1,xt]),其中σ为Sigmoid激活函数,xt为输入的交通流特征向量,ht-1保存的是前一个时间片t-1的信息,xt和ht-1均经过一个与权重矩阵wz相乘的线性变换,之后相加投入Sigmoid激活函数以输出激活值;
重置门rt=σ(wr·[ht-1,xt]),xt和ht-1均经过一个与权重矩阵wr相乘的线性变换,之后相加投入Sigmoid激活函数以输出激活值;
当前记忆内容
Figure FDA0002626202570000021
其中tanh为双曲正切激活函数,
Figure FDA0002626202570000022
为当前记忆内容的权重,ht-1为前一时间片隐藏层的值,xt为输入的交通流特征向量,
Figure FDA0002626202570000023
为当前记忆内容的偏置,输入xt先与ht-1经过一个与权重矩阵
Figure FDA0002626202570000024
相乘的线性变换,计算重置门rt与ht-1的乘积,即rt与ht-1的对应元素乘积,然后再投入tanh;
当前时间片的最终记忆
Figure FDA0002626202570000025
3.根据权利要求1所述基于深度学习的短时交通流预测方法,其特征在于,所述2)中,所述使用AdaMax优化算法训练网络模型的方法如下:
AdaMax是Adam的一种变体,它是随机梯度下降的扩展式,此方法对学习率的上限提供了一个更简单的范围;令,
Figure FDA0002626202570000026
其中Wt为t时刻的门限循环神经网络权重,Wt-1为t-1时刻门限循环神经网络的权重,α为学习率,ε为非常小的数,以防止在实现中除以零,bt为t时刻的门限循环神经网络偏置,bt-1为t-1时刻门限循环神经网络的偏置,vt指的是指数移动均值在时间t的更新,
Figure FDA0002626202570000027
为mt的纠正;
Figure FDA0002626202570000031
mt=β1·mt-1+(1-β1)·gt
Figure FDA0002626202570000032
mt是梯度的指数移动均值,通过梯度的一阶矩求得,gt为目标函数的t时刻一阶偏导,gt-1为目标函数的t-1时刻的一阶偏导,i为迭代时间,β12是常数,控制指数衰减,
Figure FDA0002626202570000033
表示β1的t次方,
Figure FDA0002626202570000034
表示β2的p次方,|gt|p为gt绝对值的p次方;
令p→∞并定义
vt=limp→∞(vt)1/p
Figure FDA0002626202570000035
然后将计算出来的vt
Figure FDA0002626202570000036
带入Wt,bt公式中对权重和偏置进行更新,利用上述描述的AdaMax优化算法更新网络权重w和偏置b,直到模型收敛,最终模型训练完成后提取出门限循环神经网络(GRU)隐层最后一层的特征h作为交通流的高阶特征,h={(h1,y1),(h2,y2),…,(hm,ym)},y1,y2,…,ym为第1,2,…,m个交通流量标签,m为训练样本数。
4.根据权利要求1所述基于深度学习的短时交通流预测方法,其特征在于,所述将高阶特征输入到梯度提升决策树回归模型(GBDT)中进行短时交通流预测的过程如下:
初始化弱学习器f0(h),
Figure FDA0002626202570000037
其中,L为损失函数,yi为第i个交通流量标签,c为使损失函数极小化的常数值,m为训练样本数;
当迭代次数n=1,2,…,N,N是最大迭代次数:
(1)、对于样本i=1,2,…,m,计算负梯度
Figure FDA0002626202570000041
利用(hi,rnj)拟合一颗CART回归树,得到第n棵回归树,其对应的叶子节点区域为Rnj,j=1,2,…,J,其中J为第n棵回归树的叶子节点的个数;
(2)、对于叶子节点区域j=1,2,…,J,计算最佳拟合值
Figure FDA0002626202570000042
更新强学习器
Figure FDA0002626202570000043
其中:
Figure FDA0002626202570000044
得到强学习器f(h)
Figure FDA0002626202570000045
式中fN(h)为达到最大迭代次数N时更新的强学习器,f(h)即最终的短时交通流预测结果。
CN201910667478.2A 2019-07-23 2019-07-23 一种基于深度学习的短时交通流预测方法 Active CN110322695B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910667478.2A CN110322695B (zh) 2019-07-23 2019-07-23 一种基于深度学习的短时交通流预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910667478.2A CN110322695B (zh) 2019-07-23 2019-07-23 一种基于深度学习的短时交通流预测方法

Publications (2)

Publication Number Publication Date
CN110322695A CN110322695A (zh) 2019-10-11
CN110322695B true CN110322695B (zh) 2020-10-09

Family

ID=68124207

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910667478.2A Active CN110322695B (zh) 2019-07-23 2019-07-23 一种基于深度学习的短时交通流预测方法

Country Status (1)

Country Link
CN (1) CN110322695B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110827544B (zh) * 2019-11-11 2022-09-02 重庆邮电大学 一种基于图卷积循环神经网络的短时交通流控制方法
CN110827543B (zh) * 2019-11-11 2022-02-18 重庆邮电大学 一种基于深度学习和时空数据融合的短时交通流控制方法
CN110837888A (zh) * 2019-11-13 2020-02-25 大连理工大学 一种基于双向循环神经网络的交通缺失数据补全方法
CN111027673B (zh) * 2019-11-14 2023-05-26 中山大学 一种地铁客流量预测方法
CN110889546B (zh) * 2019-11-20 2020-08-18 浙江省交通规划设计研究院有限公司 一种基于注意力机制的交通流量模型训练方法
CN110827546B (zh) * 2019-11-21 2021-02-26 银江股份有限公司 一种信号交叉口路段短期速度预测方法
CN110879921B (zh) * 2019-11-25 2023-05-05 大连大学 一种基于时空相关性的卫星网络流量预测方法
CN111179596B (zh) * 2020-01-06 2021-09-21 南京邮电大学 基于组归一化和网格化协同的交通流预测方法
CN111768622A (zh) * 2020-06-23 2020-10-13 南通大学 一种基于改进灰狼算法的短时交通量预测方法
CN111724596B (zh) * 2020-06-23 2022-11-11 上海电科智能***股份有限公司 一种智能精确自动识别预判快速路瓶颈区方法
CN111860989B (zh) * 2020-07-08 2024-04-19 南通大学 一种基于蚁群算法优化的lstm神经网络短时交通流量预测方法
CN111784084B (zh) * 2020-08-17 2021-12-28 北京市城市规划设计研究院 基于梯度提升决策树的出行生成预测方法、***及装置
CN111950805B (zh) * 2020-08-25 2022-09-20 华润数字科技有限公司 中长期电力负荷预测方法、装置、计算机设备及存储介质
CN112801386A (zh) * 2021-02-04 2021-05-14 北京工业大学 一种基于三阶段模型的短时交通流预测方法
CN112992353A (zh) * 2021-03-11 2021-06-18 杭州和乐科技有限公司 预产期精准预测方法、装置、计算机设备及存储介质
CN113096388B (zh) * 2021-03-22 2022-09-09 北京工业大学 一种基于梯度提升决策树的短时交通流量预测方法
CN113921142A (zh) * 2021-09-07 2022-01-11 杭州和乐科技有限公司 早产风险预测方法、装置、计算机设备及存储介质
CN113888862A (zh) * 2021-09-15 2022-01-04 成都四方伟业软件股份有限公司 一种单个路口的车流量预测方法及装置
CN113971479A (zh) * 2021-10-01 2022-01-25 浙江省机电设计研究院有限公司 一种融合节假日影响的日交通流参数预测方法
CN116050672B (zh) * 2023-03-31 2023-06-20 山东银河建筑科技有限公司 基于人工智能的城市管理方法及***

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10636293B2 (en) * 2017-06-07 2020-04-28 International Business Machines Corporation Uncertainty modeling in traffic demand prediction
CN109272157A (zh) * 2018-09-12 2019-01-25 中交信息技术国家工程实验室有限公司 一种基于门控神经网络的高速公路交通流参数预测方法及***
CN109658695B (zh) * 2019-01-02 2020-09-22 华南理工大学 一种多因素的短时交通流预测方法
CN109886387B (zh) * 2019-01-07 2021-02-26 北京大学 一种基于门控网络和梯度提升回归的交通时序预测方法
CN109993970B (zh) * 2019-03-15 2020-09-29 西南交通大学 一种城市区域交通事故风险预测方法

Also Published As

Publication number Publication date
CN110322695A (zh) 2019-10-11

Similar Documents

Publication Publication Date Title
CN110322695B (zh) 一种基于深度学习的短时交通流预测方法
CN106997669B (zh) 一种基于特征重要性的判断交通拥堵成因的方法
CN109859469A (zh) 一种基于集成lstm神经网络的车流量预测方法
CN109785618B (zh) 一种基于组合逻辑的短时交通流预测方法
CN109886444A (zh) 一种交通短时客流预测方法、装置、设备和存储介质
CN109035761A (zh) 基于辅助监督学习的行程时间估计方法
CN106205156A (zh) 一种针对部分车道车流突变的交叉口自愈合控制方法
CN110555989B (zh) 一种基于Xgboost算法的交通量预测方法
CN111860989B (zh) 一种基于蚁群算法优化的lstm神经网络短时交通流量预测方法
CN111915059A (zh) 基于注意力机制的Seq2seq泊位占有率预测方法
CN109345832B (zh) 一种基于深度递归神经网络的城市道路超车预测方法
Fu et al. Multi-stations’ weather prediction based on hybrid model using 1D CNN and Bi-LSTM
CN106355905A (zh) 一种基于卡口数据的高架信号控制方法
CN111582541A (zh) 一种基于萤火虫算法的内涝模型预测方法
CN111768622A (zh) 一种基于改进灰狼算法的短时交通量预测方法
CN114565187A (zh) 一种基于图时空自编码网络的交通路网数据预测方法
CN114973665A (zh) 一种结合数据分解和深度学习的短时交通流预测方法
Zhang et al. Short-term Traffic Flow Prediction With Residual Graph Attention Network.
Miao et al. A queue hybrid neural network with weather weighted factor for traffic flow prediction
CN112201036A (zh) 一种基于Inception-CNN的城市快速路行程速度短时预测方法
Wang et al. A deep prediction model of traffic flow considering precipitation impact
Jiao et al. Multi-step traffic flow prediction method based on the Conv1D+ LSTM
CN115796030A (zh) 一种基于图卷积的交通流量预测方法
Bao-yu et al. Research on prediction of short-term passenger flow of urban rail transit based on deep neural network
Wang et al. Prediction model for traffic congestion based on the deep learning of convolutional neural network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant