CN106295874B - 基于深信度网络的交通流参数预测方法 - Google Patents
基于深信度网络的交通流参数预测方法 Download PDFInfo
- Publication number
- CN106295874B CN106295874B CN201610643752.9A CN201610643752A CN106295874B CN 106295874 B CN106295874 B CN 106295874B CN 201610643752 A CN201610643752 A CN 201610643752A CN 106295874 B CN106295874 B CN 106295874B
- Authority
- CN
- China
- Prior art keywords
- layer
- traffic flow
- visible
- node
- hidden
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000012360 testing method Methods 0.000 claims abstract description 26
- 238000012549 training Methods 0.000 claims abstract description 24
- 238000013528 artificial neural network Methods 0.000 claims abstract description 21
- 238000010606 normalization Methods 0.000 claims abstract description 16
- 238000007781 pre-processing Methods 0.000 claims abstract description 11
- 238000004458 analytical method Methods 0.000 claims abstract description 6
- 239000010410 layer Substances 0.000 claims description 147
- 101100467856 Mus musculus Rbmy1a1 gene Proteins 0.000 claims description 34
- 101100467858 Mus musculus Rbmy1b gene Proteins 0.000 claims description 34
- 230000006870 function Effects 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000012986 modification Methods 0.000 claims description 4
- 230000004048 modification Effects 0.000 claims description 4
- 210000002569 neuron Anatomy 0.000 claims description 4
- 238000009795 derivation Methods 0.000 claims description 3
- 238000013459 approach Methods 0.000 claims description 2
- 238000011478 gradient descent method Methods 0.000 claims description 2
- 239000011229 interlayer Substances 0.000 claims description 2
- 230000009191 jumping Effects 0.000 claims description 2
- 238000012544 monitoring process Methods 0.000 claims description 2
- 239000000126 substance Substances 0.000 claims description 2
- 101000742844 Homo sapiens RNA-binding motif protein, Y chromosome, family 1 member A1 Proteins 0.000 claims 3
- 102100038040 RNA-binding motif protein, Y chromosome, family 1 member A1 Human genes 0.000 claims 3
- 101001046999 Homo sapiens Kynurenine-oxoglutarate transaminase 3 Proteins 0.000 claims 2
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 claims 1
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 claims 1
- 238000010030 laminating Methods 0.000 claims 1
- 230000002776 aggregation Effects 0.000 abstract description 3
- 238000004220 aggregation Methods 0.000 abstract description 3
- 238000005111 flow chemistry technique Methods 0.000 abstract 1
- 241001123248 Arma Species 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012731 temporal analysis Methods 0.000 description 2
- 238000000700 time series analysis Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000013332 literature search Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Biophysics (AREA)
- Educational Administration (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Primary Health Care (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于深信度网络的交通流参数预测方法,包括以下步骤:根据交通流的预测时间间隔,采集交通流参数,在参数聚合的基础上,用归一化方法,对采集的交通流参数进行预处理;建立基于深信度网络的交通流参数预测方法,将归一化的交通流参数划分为训练数据集合测试数据集,并利用测试数据集训练DBN模型;利用深信度网络预测模型进行交通流参数预测;对比测试数据集和预测数据,进行误差分析。本发明通过分析并选取最佳神经网络结构,提高了参数预测的准确度。
Description
技术领域
本发明涉及智能交通***领域,具体地,涉及一种基于深信度网络的交通流参数预测方法。
背景技术
作为智能交通***(Intelligent Transportation System,ITS)的核心内容之一,智能交通控制与诱导***一直是智能交通***研究的热门课题。智能控制与诱导的实现能有效地缓解交通堵塞、减轻环境污染,提供高效安全的道路通行状况。这些实现的前提和关键是能够对短时交通流量进行准确的预测,预测的准确度直接决定了控制和诱导的有效性。
经对现有技术的文献检索发现,已有的预测模型大致可以分为参数化和非参数化模型两类。早期的研究者们使用基于时间序列分析的参数化模型来预测交通流。Levin等使用Box–Jenkins时间序列分析来预测高速公路交通流,发现差分自回归移动平均(Autoregressive Integrated Moving Average,ARIMA)模型在统计上最有效。由于交通流参数很难用参数化模型解析的数学公式描述,导致预测准确率不够理想。目前研究集中在基于机器学习的非参数模型来预测短时交通流。由于人工神经网络(Artificial NeuralNetwork,ANN)在处理较为复杂的非线性问题上的优势,研究者们提出了各种基于人工神经网络的模型和算法,近几年随着深度学习的提出,也有研究者将深度学习的引入该领域。LvY等使用栈式自动编码器(Stacked Autoencoder,SAE)深度学习模型来对交通流进行建模和预测。但这些模型结构简单,且在模型使用过程中需要进行人工筛选,预测精度较差。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于深信度网络的交通流参数预测方法。
根据本发明提供的基于深信度网络的交通流参数预测方法,包括如下步骤:
步骤1:采集历史交通流参数,并利用归一化方法对交通流参数进行预处理,得到归一化后的数据集;
步骤2:建立基于深信度网络的交通流参数预测模型,将归一化后的数据集划分为训练数据集和测试数据集,用测试数据集训练交通流参数预测模型;
步骤3:利用训练后的基于深信度网络的交通路流参数预测模型预测未来交通流参数,得到预测数据;
步骤4:将测试数据集和预测数据进行比较,分析误差。
优选地,所述步骤1中的历史交通流参数是指:在指定的特定观测点所得到的在指定时间间隔内的车辆数。
优选地,所述步骤1中采用归一化方法对交通流参数进行预处理的具体过程如下:
分别计算历史交通流参数某一样本中的最小值min和最大值max,使用min-max方法对数据进行归一化预处理,使归一化预处理后的历史交通流参数值域为区间[0,1],其中:min-max方法对数据进行归一化的公式如下:
式中:x*表示归一化预处理后数据,min表示样本数据最小值,max表示样本数据最大值,x表示待归一化预处理的历史交通流参数。
优选地,所述步骤2中的基于深信度网络的交通流参数预测方法通过多层限制玻尔兹曼机的堆叠来降低数据维度,并提取特征,在特征提取后加入反向传播算法(ErrorBack Propagation,BP算法),进行预测值输出。
优选地,所述基于深信度网络的交通流参数预测模型的建立步骤如下:
步骤A1:将归一化后的训练数据集作为第一个限制波尔兹曼机的可见层;
步骤A2:进行多层限制波尔兹曼机的堆叠,即每个波尔兹曼机的隐藏层都作为下一个限制波尔兹曼机的可见层;
步骤A3:使用对比散度算法,从第一个限制波尔兹曼机开始,按次序逐个对限制波尔兹曼机进行训练;
步骤A4:在多层限制波尔兹曼机器的堆叠后,再添加2~3层神经元,作为BP算法运用的层,且最后一层只包含一个神经元作为预测值,即归一化的输出值;
步骤A5:训练BP层,直到人工神经网络的输出值与实际值,即与归一化的值之间的误差小于设定阈值;
步骤A6:输入测试集中的交通流参数,逐个训练限制波尔兹曼机,并利用步骤A5中BP层权重,计算得到人工神经网络的输出值;
步骤A7:将人工神经网络的输出值反归一化,得到交通流参数预测值。
优选地,所述步骤4包括:通过平均绝对百分比误差MAPE和均方根误差RMSE来对预测数据进行误差分析,计算公式如下:
式中:表示测试数据集与预测数据的平均绝对百分比误差,表示测试数据集与预测数据的均方根误差,f表示交通流的观测值,表示交通流的预测值,n表示交通流预测值的数量,fi表示测试数据集中的第i个交通流参数,表示预测数据集中的第i个预测交通流参数,i的取值范围为1,2…N,其中N为测试数据集的数据量。
与现有技术相比,本发明具有如下的有益效果:
1、本发明使用深信度网络预测交通流参数,具有深层次记忆历史数据的优点。
2、本发明使用深信度网络预测交通流参数,减少了传统模型中人为判定的环节,提高了实用性,降低了主观判定对预测结果的影响。
3、本发明基于深信度网络的交通流参数方法,结合了限制限制玻尔兹曼机和BP算法,降低了数据维度,提高了预测精度。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明提供的基于深信度网络的交通流参数预测方法的流程图。
图2为本发明采用的深信度网络中限制玻尔兹曼机的架构示意图。
图3为本发明中模型计算所得的短时交流预测值与观测值对比图。
图4为本发明对50个不同观测点测试数据集与预测数据的平均绝对百分比误差对比图。
图5为本发明与多个已有方法之间的百分比误差和均方根误差对比图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
根据本发明提供的基于深信度网络的交通流参数预测方法,包括如下步骤:
步骤S1、采集历史交通流参数,在数据聚合的基础上,利用归一化方法对交通流参数进行预处理;
步骤S2、建立基于深信度网络的交通流参数预测方法。将归一化后的数据集划分为训练数据集和测试数据集,用测试数据集训练深信度网络模型;
步骤S3、利用训练后的深信度网络模型预测未来交通流参数;
步骤S4、比照测试数据集和预测数据,进行误差分析;
下面结合具体实施例对本发明中的技术方案进行详细说明。
实施例
本实施例提供了一种基于深信度网络的交通流参数预测方法,该方法包括如下步骤:
步骤S1、根据预测的时间间隔对历史交通流参数进行聚合,并对聚合后的交通数据进行归一化;
所述历史交通流参数来源于交通数据采集***,可以通过线圈检测、微波传感器、视频监测等方法获得。
获取的历史交通流量数据为特定观测点或路段在一定时间间隔内经过的车辆数。所述指定的时间间隔可以根据预测需求进行指定(例如5分钟)。
将各观测点或路段的指定时间间隔内的若干个交通流量数据分别进行累加,得到各观测点指定时间间隔的交通流量数据。下述某时刻的交通流参数指的是从此时刻开始经过指定时间间隔(例如5分钟)的交通流参数。
历史观测数据集合可表示为F={ft|t=1,2,...,T},其中ft表示路网特定观测点获得的第t个历史交通流参数。T时刻和T+1时刻之间的差值为预测时间间隔Δt(如5分钟)。
对合并后的历史交通流参数进行预处理,主要是使用min-max方法对数据进行归一化;
在交通流参数中计算样本数据的最小值min和最大值max,使用min-max方法对数据进行归一化,使其值域为区间[0,1]。
具体地,根据历史观测数据集合F={ft|t=1,2,...,T}求得集合中的最大值max和最小值min,对集合中的每个数据计算:
从而获得归一化后的历史观测数据集合,其中x*为归一化预处理后数据,min为样本数据最小值,max为样本数据最大值,x为待归一化预处理的历史交通流参数。
步骤S2、建立了基于深信度网络的交通流参数预测方法,该模型通过多层限制限制玻尔兹曼机的堆叠降低数据维度并提取特征,在特征提取后加入BP算法,进行预测值输出。将经过归一化后的历史交通流参数划分为训练数据集和测试数据集,利用训练数据集,在已设定的深信度网络上使用历史数据进行模型训练。
图2是深信度网络中,玻尔兹曼机的架构图。如图2所示:所述模型中波尔兹曼机包含两层的结构,其中一层叫做可见层,即输入数据层;另一层叫做隐藏层,即数据输出层。波尔兹曼机中,全概率分布P(v,h)满足波尔兹曼分布,其中v表示可见层的开闭状态,h表示隐藏层的开闭状态,v、h的开闭状态集合构成了全概率事件,并满足玻尔兹曼分布。
限制波尔兹曼机(RBM)同样包含两层:可见层和隐藏层。相比于波尔兹曼机,在RBM的可见层(和隐藏层)内,各节点是互相独立无连接的,而层间则是全连接的。所有节点vi和Hi的状态为0(关闭)或1(打开)。信息由可见层流向隐藏层,由可见层的状态计算隐藏层各节点状态,隐藏节点的打开概率为
其中,Pj为隐藏节点打开的概率,bj为隐藏节点偏置,vi为可见节点状态,wij为连接隐藏层和可见层的权重矩阵分量,i和j分别代表可见层和隐藏层的节点编号,即i代表靠近输出的一层,j代表靠近输出的一层;σ为sigmoid函数σ(x),其表达形式如下:
通过随机采样后,我们可以确定隐藏节点的状态,即打开(数字1代表)或关闭(数字0代表)。对于给定的RBM状态(v,h),定义能量函数E(v,h)为:
其中ai和bj分别代表可见层节点和隐藏层节点的偏置,vi和bj分别代表可见层节点和隐藏层节点的状态,wij为可见节点和隐藏节点间权重,i和j分别代表可见节点和隐藏节点编号。利用定义的能量函数,可以得到RBM状态(v,h)的联合概率分布P(v,h):
其中,
为归一化因子,也被称为分布函数。在可见层v给定的情况下,条件概率P(h)为:
同样地,在隐藏层h给定的情况下,条件概率P(v)为:
记除hj外所有隐藏节点的集合为
h≠j=(h1,h2,...,hj-1,hj+1,...,hn(hidden)) (8)
各隐藏节点hj间是相互独立且地位平等的,因此隐藏节点hj的打开概率P(hj=1|v)为:
根据v和h间、a和b间的对称性,同样地:
在所有可见节点均为已知的情况下,因为限制波尔兹曼机中隐藏节点间不存在连接,因此所有隐藏节点间是条件独立的,即P(h|v)=P(h1|v)·P(h2|v)·P(h3|v)·P(h4|v)。同理,在所有隐藏节点均为已知的情况下,所有可见节点均间是条件独立的。训练好的RBM中状态(v,h)概率分布P(v,h)满足波尔兹曼分布,此时RBM***的能量函数达到最小。所以当向RBM输入可见层v时,通过P(h|v)可以得到隐藏层h;得到隐藏层h之后,通过P(v|h)可以得到可见层v1。如果v1与输入的可见层v完全相同,那么得到的隐藏层h就是可见层v的另外一种表达方式,即得到的隐藏层h已经包含可见层v的所有特征。使用对比散度算法对RBM进行训练。散度算法步骤如下:
第一步:初始化权重矩阵w、可见层偏置a和隐藏层偏置b;
第二步:重构,根据式(9)和(10)依次计算并采样,依次得到隐藏层h和重构的可见层v;
第三步:权重和偏置更新,计算式:
其中,size(v)和size(h)分别代表可见层和隐藏层的节点数,系数η为RBM的学习率(learning rate),脚标recon代表第二步后的隐藏层或可见层,Δwij、Δai、Δbj分别表示权重、可见节点偏置、隐藏节点偏置的更新量(改变量)。
第四步:监控权重变化,重复第二第三步,直到权重变化足够小为止。
多层RBM的训练,一般采用非监督逐层贪婪方法,逐层训练RBM并获得生成模型的权值。经处理后的数据集直接进入第一层RBM(RBM1),作为RBM1的输入;使用CD算法将RBM1训练好后,将RBM1的隐藏层输入下一层RMB(RBM2),作为后者的可见层;如此递推,RBM(i)训练完成后,其隐藏层输入RBM(i+1)作为后者的可见层。通过逐层层叠,我们可以得到一个多层RBM结构。
反向传播算法(BP算法)将误差反向传播,采用梯度下降的方法,缩小误差函数,从而使整个神经网络的输出逐步向输出目标值靠近。其误差函数一般由以下公式定义
其中,tk为输出目标集合中的第k个输出目标值,Ok为输出集合中的第k个输出值,误差函数E定义为输出值与目标值差的平方和。误差函数也有其它定义方法,视网络输出节点的类型和数量而改变。假设一个多层网络,从输出层起,按接近输出层的程度,分别为L0,L1,L2,...,Lp,所有节点均为sigmoid单元。考虑E对L1层的节点求偏导:
其中,Ok,L0和Ok,L1分别代表L0和L1的节点输出。进一步地,考虑E对L2层的节点输出求偏导:
再进一步,考虑E对L3层、L4层、L5层等层节点输出的偏导,同理。BP算法的目的是修改权重,因此,考虑E对L0和L1层间权重wij偏导
结合梯度法则(Delta Rule)
可以得到权重修改公式
Δwij=η(tj-oj)oj(1-oj)oi (18)
其中,η为BP过程的学习率,取值在(0,1]区间内,0i和0j为节点值。至此,BP过程可概括为:
第一步:按照L1,L2...的顺序,向后逐层计算
第二步:按照...,L2,L1,L0的顺序,向前逐层更新权重:
Δwij=η(tj-oj)oj(1-oj)oi (20)
第三步:按照...,L2,L1,L0的顺序,向前逐层更新神经网络各节点输出
第四步:重新计算神经网络输出误差bperr,ok为神经网络输出端值
第五步:重复以上四步,直到神经网络输出误差小于预设误差值,跳出循环。
步骤S3、利用训练好的模型进行未来交通流参数预测;
步骤S4,对测试数据集和预测数据比较,进行误差分析。具体地,误差可通过两个指标来评估,即平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)和均方根误差(Root Mean Square Error,RMSE),它们的定义如式(23)和式(24)所示,其中f为交通流的观测值,为交通流的预测值。
其中,n表示交通流预测值的数量;
本实施例的有效性可以通过下面的仿真实验来进一步说明。需要说明的是,实验中应用的参数不影响本发明的一般性。
1)仿真条件:
2)仿真内容:
使用美国加州交通局性能测量***(PeMS)获得的数据进行分析建模。随机选取了50条高速公路(同名公路的不同方向视为不同的公路),每条公路随机选取了主线上1个观测点传感器获得的2014年总计11天的交通流参数。实验预测的时间间隔为5分钟,因此,首先将***原始数据的5分钟采样间隔的数据聚合成相应的时间间隔。并使用所述min-max方法对数进行归一化。实验使用前11天的数据作为训练数据集,后1天的数据作为测试数据集。
实验选取了过去已有工作中几个经典的预测模型作为对比:ARMA模型和BP神经网络模型(BPNN),并使用和相关文献一致的调参方法。ARMA模型是最简单的预测模型,它使用当前时间的交通流作为下一时间间隔的预测值,该模型作为预测的基准线。BP神经网络是重要的一类预测模型,实验选择了经典的BP神经对比模型。
对美国加州I405-S高速公路一观测点进行预测实验得到的某工作日5分钟时间间隔交通流观测值和预测值对比如图2所示,可以直观地看出DBN预测模型具有良好的预测准确性。此外,对该高速公路上任意50个观测点进行预测,并进行误差分析,结果如图4所示。由图4可知,DBN的预测误差百分比维持在10%左右,对于波动性较高的交通流参数而言,该预测方案具有较高的准确性。此外,对比ARMA模型和BPNN模型的预测精度,如图5所示,ARMA模型的误差百分比和预测均方误差均较高,SVM模型预测的精度较低,但均方误差较好。而DBN模型的预测精度最高,当期均方误差较低,表明DBN模型的基本预测效果较好,但对于一些非常规的扰动,预测效果不够理想。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。
Claims (1)
1.一种基于深信度网络的交通流参数预测方法,其特征在于,包括如下步骤:
步骤1:采集历史交通流参数,并利用归一化方法对交通流参数进行预处理,得到归一化后的数据集;
步骤2:建立基于深信度网络的交通流参数预测模型,将归一化后的数据集划分为训练数据集和测试数据集,用测试数据集训练交通流参数预测模型;
步骤3:利用训练后的基于深信度网络的交通路流参数预测模型预测未来交通流参数,得到预测数据;
步骤4:将测试数据集和预测数据进行比较,分析误差;
所述步骤1中的历史交通流参数是指:在指定的特定观测点所得到的在指定时间间隔内的车辆数;
所述步骤1中采用归一化方法对交通流参数进行预处理的具体过程如下:
分别计算历史交通流参数某一样本中的最小值min和最大值max,使用min-max方法对数据进行归一化预处理,使归一化预处理后的历史交通流参数值域为区间[0,1],其中:min-max方法对数据进行归一化的公式如下:
式中:x*表示归一化预处理后数据,min表示样本数据最小值,max表示样本数据最大值,x表示待归一化预处理的历史交通流参数;
所述步骤2中的基于深信度网络的交通流参数预测方法通过多层限制玻尔兹曼机的堆叠来降低数据维度,并提取特征,在特征提取后加入反向传播算法,进行预测值输出;
所述基于深信度网络的交通流参数预测模型的建立步骤如下:
步骤A1:将归一化后的训练数据集作为第一个限制波尔兹曼机的可见层;
步骤A2:进行多层限制波尔兹曼机的堆叠,即每个波尔兹曼机的隐藏层都作为下一个限制波尔兹曼机的可见层;
步骤A3:使用对比散度算法,从第一个限制波尔兹曼机开始,按次序逐个对限制波尔兹曼机进行训练;
步骤A4:在多层限制波尔兹曼机器的堆叠后,再添加2~3层神经元,作为BP算法运用的层,且最后一层只包含一个神经元作为预测值,即归一化的输出值;
步骤A5:训练BP层,直到人工神经网络的输出值与实际值,即与归一化的值之间的误差小于设定阈值;
步骤A6:输入测试集中的交通流参数,逐个训练限制波尔兹曼机,并利用步骤A5中BP层权重,计算得到人工神经网络的输出值;
步骤A7:将人工神经网络的输出值反归一化,得到交通流参数预测值;
所述步骤4包括:通过平均绝对百分比误差MAPE和均方根误差RMSE来对预测数据进行误差分析,计算公式如下:
式中:表示测试数据集与预测数据的平均绝对百分比误差,表示测试数据集与预测数据的均方根误差,f表示交通流的观测值,表示交通流的预测值,n表示交通流预测值的数量,fi表示测试数据集中的第i个交通流参数,i的取值范围为1,2…N,其中N为测试数据集的数据量;
限制波尔兹曼机RBM包含可见层和隐藏层,在RBM的可见层和隐藏层内,各节点互相独立无连接,层间全连接,所有节点vi和Hi的状态为关闭0或打开1,信息由可见层流向隐藏层,由可见层的状态计算隐藏层各节点状态,隐藏节点的打开概率为:
其中,Pj为隐藏节点打开的概率,bj为隐藏节点偏置,vi为可见节点状态,wij为连接隐藏层和可见层的权重矩阵分量,i和j分别代表可见层和隐藏层的节点编号,i代表靠近输出的一层,j代表靠近输出的一层;σ为sigmoid函数σ(x),其表达形式如下:
通过随机采样确定隐藏节点的状态,对于给定的RBM状态(v,h),定义能量函数E(v,h)为:
其中ai和bj分别代表可见层节点和隐藏层节点的偏置,vi和hj分别代表可见层节点和隐藏层节点的状态,wij为可见节点和隐藏节点间权重,i和j分别代表可见节点和隐藏节点编号,利用定义的能量函数,得到RBM状态(v,h)的联合概率分布P(v,h):
其中,
为归一化因子,在可见层v给定的情况下,条件概率P(h)为:
在隐藏层h给定的情况下,条件概率P(v)为:
记除hj外所有隐藏节点的集合为:
h≠j=(h1,h2,...,hj-1,hj+1,...,hn(hidden)) (8)
各隐藏节点hj间相互独立且地位平等,因此隐藏节点hj的打开概率P(hj=1|v)为:
根据v和h间、a和b间的对称性,得到:
在所有可见节点均为已知的情况下,P(h|v)=P(h1|v)·P(h2|v)·P(h3|v)·P(h4|v),在所有隐藏节点均为已知的情况下,所有可见节点均间是条件独立的,训练好的RBM中状态(v,h)概率分布P(v,h)满足波尔兹曼分布,此时RBM***的能量函数达到最小;当向RBM输入可见层v时,通过P(h|v)得到隐藏层h;得到隐藏层h之后,通过P(v|h)得到可见层v1;如果v1与输入的可见层v完全相同,则得到的隐藏层h是可见层v的另外一种表达方式,得到的隐藏层h已经包含可见层v的所有特征,使用对比散度算法对RBM进行训练;
散度算法步骤如下:
第一步:初始化权重矩阵w、可见层偏置a和隐藏层偏置b;
第二步:重构,根据式(9)和(10)依次计算并采样,依次得到隐藏层h和重构的可见层v;
第三步:权重和偏置更新,计算式:
其中,size(v)和size(h)分别代表可见层和隐藏层的节点数,系数η为RBM的学习率,脚标recon代表第二步后的隐藏层或可见层,Δwij、Δai、Δbj分别表示权重、可见节点偏置、隐藏节点偏置的更新量;
第四步:监控权重变化,重复第二第三步,直到权重变化符合预设条件为止;
多层RBM的训练,采用非监督逐层贪婪方法,逐层训练RBM并获得生成模型的权值,经处理后的数据集直接进入第一层RBM,记为RBM1,作为RBM1的输入;使用CD算法将RBM1训练好后,将RBM1的隐藏层输入下一层RMB,记为RBM2,作为后者的可见层;依次递推,RBM(i)训练完成后,其隐藏层输入RBM(i+1)作为后者的可见层,通过逐层层叠,得到一个多层RBM结构;
反向传播BP算法将误差反向传播,采用梯度下降的方法,缩小误差函数,从而使整个神经网络的输出逐步向输出目标值靠近,其误差函数一般由以下公式定义:
其中,tk为输出目标集合中的第k个输出目标值,Ok为输出集合中的第k个输出值,误差函数E定义为输出值与目标值差的平方和;
设一个多层网络,从输出层起,按接近输出层的程度,分别为L0,L1,L2,...,Lp,所有节点均为sigmoid单元,考虑E对L1层的节点求偏导:
其中,Ok,L0和Ok,L1分别代表L0和L1的节点输出,考虑E对L2层的节点输出求偏导:
考虑E对L0和L1层间权重wij偏导:
结合梯度法则:
得到权重修改公式:
Δwij=η(tj-oj)oj(1-oj)oi (19)
其中,η为BP过程的学习率,取值在(0,1]区间内,oi和oj为节点值;
BP过程概括为:
第一步:按照L1,L2...的顺序,向后逐层计算:
第二步:按照...,L2,L1,L0的顺序,向前逐层更新权重:
Δwij=η(tj-oj)oj(1-oj)oi (21)
第三步:按照...,L2,L1,L0的顺序,向前逐层更新神经网络各节点输出:
第四步:重新计算神经网络输出误差bperr,ok为神经网络输出端值:
第五步:重复以上四步,直到神经网络输出误差小于预设误差值,跳出循环。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610643752.9A CN106295874B (zh) | 2016-08-08 | 2016-08-08 | 基于深信度网络的交通流参数预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610643752.9A CN106295874B (zh) | 2016-08-08 | 2016-08-08 | 基于深信度网络的交通流参数预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106295874A CN106295874A (zh) | 2017-01-04 |
CN106295874B true CN106295874B (zh) | 2021-02-12 |
Family
ID=57666720
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610643752.9A Active CN106295874B (zh) | 2016-08-08 | 2016-08-08 | 基于深信度网络的交通流参数预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106295874B (zh) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106846834A (zh) * | 2017-01-21 | 2017-06-13 | 亚信蓝涛(江苏)数据科技有限公司 | 一种基于深度学习的交通控制优化方法 |
CN107103397A (zh) * | 2017-06-26 | 2017-08-29 | 广东工业大学 | 一种基于蝙蝠算法的交通流预测方法、装置及*** |
CN107587955B (zh) * | 2017-07-28 | 2019-03-05 | 大连理工大学 | 基于深信度网络的火箭发动机推力偏移量的标定方法 |
CN108133295B (zh) * | 2018-01-11 | 2020-07-07 | 安徽优思天成智能科技有限公司 | 一种针对目标路段的机动车尾气浓度连续时间预测方法 |
CN108281013A (zh) * | 2018-03-22 | 2018-07-13 | 安徽八六物联科技有限公司 | 一种道路车流量监控*** |
CN108830380B (zh) * | 2018-04-11 | 2021-10-01 | 开放智能机器(上海)有限公司 | 一种基于云服务的训练模型生成方法及*** |
CN108847279B (zh) * | 2018-04-27 | 2022-04-01 | 吉林大学 | 一种基于脉搏波数据的睡眠呼吸状态自动判别方法及*** |
CN108960496B (zh) * | 2018-06-26 | 2021-07-23 | 浙江工业大学 | 一种基于改进学习率的深度学习交通流预测方法 |
CN109035779B (zh) * | 2018-08-30 | 2021-01-19 | 南京邮电大学 | 基于DenseNet的高速公路交通流预测方法 |
CN109272157A (zh) * | 2018-09-12 | 2019-01-25 | 中交信息技术国家工程实验室有限公司 | 一种基于门控神经网络的高速公路交通流参数预测方法及*** |
CN109377785A (zh) * | 2018-10-22 | 2019-02-22 | 北京航空航天大学 | 一种基于深度学习的高速公路合流区车辆冲突预警方法 |
CN109598381B (zh) * | 2018-12-05 | 2023-04-18 | 武汉理工大学 | 一种基于状态频率记忆神经网络的短时交通流预测方法 |
CN109886387B (zh) * | 2019-01-07 | 2021-02-26 | 北京大学 | 一种基于门控网络和梯度提升回归的交通时序预测方法 |
CN110543656A (zh) * | 2019-07-12 | 2019-12-06 | 华南理工大学 | 一种基于深度学习的led荧光粉胶涂覆厚度的预测方法 |
CN110782658B (zh) * | 2019-08-16 | 2022-03-29 | 华南理工大学 | 一种基于LightGBM算法的交通量预测方法 |
CN111832790A (zh) * | 2019-10-28 | 2020-10-27 | 吉林建筑大学 | 一种供水管网预测中长期需水量的方法及*** |
CN110926532A (zh) * | 2019-11-29 | 2020-03-27 | 四川省生态环境科学研究院 | 一种基于大数据的城市扬尘数字化监控*** |
CN111260121B (zh) * | 2020-01-12 | 2022-04-29 | 桂林电子科技大学 | 一种基于深度瓶颈残差网络的城市范围的人流量预测方法 |
CN111899894B (zh) * | 2020-08-03 | 2021-06-25 | 东南大学 | 一种抑郁症患者预后药效评估***及其评估方法 |
US11238729B1 (en) | 2020-09-11 | 2022-02-01 | Toyota Motor Engineering & Manufacturing North America, Inc. | Systems and methods for traffic flow prediction |
CN113947904A (zh) * | 2021-10-19 | 2022-01-18 | 北京中交国通智能交通***技术有限公司 | 基于s-g滤波和深信度网络的多尺度短时交通流预测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104809502A (zh) * | 2015-05-19 | 2015-07-29 | 重庆大学 | 一种受限玻尔兹曼机隐含层节点动态调整方法 |
CN105096614A (zh) * | 2015-09-23 | 2015-11-25 | 南京遒涯信息技术有限公司 | 基于生成型深信度网络的新建路***通流量预测方法 |
CN105389980A (zh) * | 2015-11-09 | 2016-03-09 | 上海交通大学 | 基于长短时记忆递归神经网络的短时交通流预测方法 |
CN105635762A (zh) * | 2016-01-15 | 2016-06-01 | 深圳大学 | 一种基于深度信念网络的视频热度预测方法及其*** |
-
2016
- 2016-08-08 CN CN201610643752.9A patent/CN106295874B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104809502A (zh) * | 2015-05-19 | 2015-07-29 | 重庆大学 | 一种受限玻尔兹曼机隐含层节点动态调整方法 |
CN105096614A (zh) * | 2015-09-23 | 2015-11-25 | 南京遒涯信息技术有限公司 | 基于生成型深信度网络的新建路***通流量预测方法 |
CN105389980A (zh) * | 2015-11-09 | 2016-03-09 | 上海交通大学 | 基于长短时记忆递归神经网络的短时交通流预测方法 |
CN105635762A (zh) * | 2016-01-15 | 2016-06-01 | 深圳大学 | 一种基于深度信念网络的视频热度预测方法及其*** |
Also Published As
Publication number | Publication date |
---|---|
CN106295874A (zh) | 2017-01-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106295874B (zh) | 基于深信度网络的交通流参数预测方法 | |
CN108445752B (zh) | 一种自适应选择深度特征的随机权神经网络集成建模方法 | |
CN109785618B (zh) | 一种基于组合逻辑的短时交通流预测方法 | |
CN106022954B (zh) | 基于灰色关联度的多重bp神经网络负荷预测方法 | |
CN110555989B (zh) | 一种基于Xgboost算法的交通量预测方法 | |
CN112434848B (zh) | 基于深度信念网络的非线性加权组合风电功率预测方法 | |
CN106781489A (zh) | 一种基于递归神经网络的路网状态预测方法 | |
CN114399032B (zh) | 一种电能表计量误差预测方法及*** | |
Huang et al. | Deep architecture for traffic flow prediction | |
CN107704970A (zh) | 一种基于Spark的需求侧负荷预测方法 | |
CN112966871A (zh) | 基于卷积长短期记忆神经网络的交通拥堵预测方法及*** | |
CN114580545A (zh) | 一种基于融合模型的风电机组齿轮箱故障预警方法 | |
CN113516845A (zh) | 基于sarima-nar组合模型的道路月度交通量预测方法 | |
CN111723990B (zh) | 基于双向长短期记忆神经网络的共享单车流量预测方法 | |
CN111967308A (zh) | 一种在线路面不平度辨识方法及*** | |
CN116894153A (zh) | 基于奇异谱分析和arima-lstm组合模型的滑坡位移预测方法 | |
CN111141879A (zh) | 一种深度学习的空气质量监测方法以及装置、设备 | |
CN116303786B (zh) | 一种基于多维数据融合算法的区块链金融大数据管理*** | |
CN112241808A (zh) | 路面技术状况预测方法、装置、电子设备及存储介质 | |
Shi et al. | The integrated methodology of rough set theory and artificial neural-network for construction project cost prediction | |
CN112115754A (zh) | 基于烟花差分进化混合算法-极限学习机的短时交通流预测模型 | |
Wang et al. | Short-term passenger flow prediction on bus stop based on hybrid model | |
Ding et al. | Evolving neural network using hybrid genetic algorithm and simulated annealing for rainfall-runoff forecasting | |
Aliyu et al. | Classifying auto-MPG data set using neural network | |
Jackson et al. | Machine learning for classification of economic recessions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |