CN109035761A - 基于辅助监督学习的行程时间估计方法 - Google Patents
基于辅助监督学习的行程时间估计方法 Download PDFInfo
- Publication number
- CN109035761A CN109035761A CN201810658375.5A CN201810658375A CN109035761A CN 109035761 A CN109035761 A CN 109035761A CN 201810658375 A CN201810658375 A CN 201810658375A CN 109035761 A CN109035761 A CN 109035761A
- Authority
- CN
- China
- Prior art keywords
- time
- neural network
- feature
- grid
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000013528 artificial neural network Methods 0.000 claims abstract description 43
- 230000006870 function Effects 0.000 claims abstract description 24
- 230000002457 bidirectional effect Effects 0.000 claims abstract description 15
- 238000000605 extraction Methods 0.000 claims abstract description 14
- 230000002035 prolonged effect Effects 0.000 claims abstract description 14
- 230000000306 recurrent effect Effects 0.000 claims abstract description 13
- 239000000284 extract Substances 0.000 claims abstract description 7
- 239000013598 vector Substances 0.000 claims description 43
- 238000012549 training Methods 0.000 claims description 22
- 239000011159 matrix material Substances 0.000 claims description 16
- 230000006399 behavior Effects 0.000 claims description 11
- 238000003780 insertion Methods 0.000 claims description 9
- 230000037431 insertion Effects 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 230000002123 temporal effect Effects 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 4
- 230000017105 transposition Effects 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 235000019580 granularity Nutrition 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 210000005036 nerve Anatomy 0.000 claims description 2
- 238000005192 partition Methods 0.000 claims description 2
- 230000002441 reversible effect Effects 0.000 claims description 2
- 238000012163 sequencing technique Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000013136 deep learning model Methods 0.000 abstract description 2
- 230000000694 effects Effects 0.000 abstract 1
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 3
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 210000004218 nerve net Anatomy 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0129—Traffic data processing for creating historical data or processing based on historical data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明属于智能交通技术领域,具体为一种基于辅助监督学习的行程时间估计方法。其从海量历史轨迹数据中寻找统计规律,通过端到端的深度学习模型对整个行程的时间进行整体的估计;步骤包括:特征提取和表示阶段,对轨迹数据进行预处理,分别抽取它的时间和空间特征,驾驶状态特征,短时间和长时间的交通状况特征;训练和预测阶段,将这些提取的特征用统一的双向循环神经网络进行训练和预测;循环神经网络每一步都输出通过当前小区域的时间开销;这些小区域的时间开销的总和即为总路径的时间开销。同时,还引入双向区间损失函数来约束中间时间开销。本方法可高效准确地对城市中的车辆行程时间进行估计,在实际环境下具有较好的效果。
Description
技术领域
本发明属于智能交通技术领域,具体涉及一种基于辅助监督学习的行程时间估计方法。
背景技术
行程时间估计是城市交通领域一个必不可少的重要技术,可以为人们的出行通勤提供帮助,也可以为政府规划决策提供支持。但这并不是一个简单的小问题,而是会受到各种动态因素的影响,如交通动态,路口状况,司机驾驶行为的变化和历史周期性的数据演化等等。这些因素导致行程时间估计存在不确定性和难度。随着支持GPS的移动设备的发展和普及,目前已经有大量的轨迹数据在源源不断地产生,并且覆盖城市的各个角落。有了这些海量的历史轨迹数据,我们可以挖掘数据背后的内在规律,通过构建算法模型来学习出行程时间的变化的周期和趋势,从而更加准确地推断当前查询轨迹所需的时间开销。
目前已有的方法大多采用分而治之(divide-and-conquer)的方法,主要是通过将路径分解一系列的路段或者子路径这两类。
(1)基于单一路段的方法:
基于单路段的方法主要通过估计每一条单一路段的轨迹经过时的平均速度,进而根据路段长度计算出经过的平均时间开销,最后将各个路段的时间和累加得到总的时间。但这种方法没有考虑路段之间的路口时间开销。另外,这种估计严重依赖于高质量的速度数据,而这往往在轨迹数据中无法得到。
(2)基于子路径的方法:
基于子路径的方法主要通过将路径分割成一系列的子路径方法,使得路口的时间开销也得到考虑。主要思路都是对历史数据中丰富的公共子路径信息进行拼接和挖掘。尽管这种方法可以克服单一路段方法的许多缺陷,但它仍然是基于启发式设计,而不是直接将行程时间作为算法优化目标。
总而言之,目前已有的方法无法达到令人满意的准确性有两个方面的原因。一个是它们没有把路径看成一个整体,而是拆分成各个子块。在这一拆分过程中,损失了很多有用的信息。并且,它们没有充分利用轨迹数据特有的中间监督标签,也就是每一个中间GPS采样点的时间戳信息。另一方面,随着深度学习技术的发展和繁荣,更多的问题可以通过端到端一体式地解决,相较于传统启发式模型要更为高效。并且,深度学习有着强大的表征能力,与手工模型相比,可以捕捉到更多的潜在特征,能够处理行程估计问题中各种复杂的动态性。
发明内容
本发明的目的是针对传统的两类行程时间估计技术的局限性,提出一种基于辅助监督学习的历史轨迹的行程时间估计方法,以克服现有技术的不足。
本发明方法从海量历史轨迹数据中寻找统计规律,通过端到端的深度学习模型对整个行程的时间进行整体的估计。基本步骤包括:特征提取和表示阶段,对轨迹数据进行预处理,分别抽取它的各方面特征;训练和预测阶段,将这些提取的特征用一个统一的双向循环神经网络进行训练和预测;循环神经网络每一步都输出通过当前小区域的时间开销;这些小区域的时间开销的总和即为总路径的时间开销;为了更加有效地进行训练,还引入了双向区间损失函数来约束中间时间开销。
本发明提出的基于辅助监督学习的历史轨迹的行程时间估计方法,分为如下三个阶段:
(一)特征提取和表示阶段,对历史轨迹数据进行预处理,抽取它的各方面特征(包括时间特征和空间特征,驾驶状态特征,短时间和长时间的交通状况特征等)。具体步骤为:
步骤(1),在城市范围内,根据经纬度坐标对网格进行细粒度划分,形成一个个相邻的矩形小区域。将按时间顺序排序,由GPS坐标组成的轨迹序列中的每一个坐标点映射到对应的小区域中,形成一个由网格坐标组成的序列。对于相邻轨迹点距离较远,落在不连续的小区域内的情况,可以地图匹配等算法得到中间经过路径,补全这部分不连续的区域信息。
步骤(2),对于每一个网格,挖掘它不同方面的特征。首先,使用嵌入向量技术来挖掘潜在语义信息。嵌入向量技术在自然语言处理和社交网络等领域等到了广泛的使用,主要是利用低维的实数向量来代表每一个词或者事物的语义信息,通过向量空间中的距离关系来衡量实物之间的对应关系。本发明利用嵌入向量技术来表征每一个网格小区域在不同空间以及不同时间段的语义信息。这些信息包含了城市不同的功能区域(例如居民区,商业区或工业区等等)空间区位信息,也包括了早高峰,周末等时间信息。具体地,利用低维向量来表示每一个网格的空间向量Vsp,将一天划分成多个时间桶(例如一个小时一个桶),每一条轨迹根据具体落入的时间桶来得到时间向量Vtp。对Vsp和Vtp进行随机初始化,之后在模型训练时跟着模型一起训练。
步骤(3),司机在开车时,在不同的行驶状态时,行驶的速度和驾驶行为都会发生变化。例如,车辆在行驶路径的中间部分时,会更倾向于行驶在大路或者高架上,这时速度会更快。而在刚出发或者快到终点时,由于行驶在小路或者人多的区域,往往速度就会变慢。具体地,使用四维向量Vdri来表示当前行驶阶段是出发阶段,中途阶段,还是结束阶段,以及在各个阶段已经行驶的比例。例如,Vdri=(1,0,0,0.2)表示司机行驶在开始阶段,占了总行程的20%。
步骤(4),在一个区域内的交通状况,往往随着时间演变会有周期性和规律性的变化。例如,如果一个路段在8点到8点半都很堵,那么8点35分它也可能很堵。也就是说,过去短时间内的交通状况信息,对预测当前的交通状态很有帮助。定义该短时间的交通状况特征为Vshort。与此同时,长时间周期性的交通状况变化也能帮助预测当前交通状况,例如工作日和周末的交通状况变化规律。定义该长时间的交通状况特征为Vlong。具体来说,
定义:
表示在过去第j个时间区间内,当前小区域gi的交通状况,其中vj表示历史平均速度,nj表示历史轨迹数据数量,leni/vj表示粗略估计的通过时间。将这些交通状况特征按照历史时间顺序输入到一个子循环神经网络中,可以抽取出交通状况特征。
另外,由于历史数据在不同空间区域分布不均衡,有些区域轨迹经过数量较少,可能会对估计的准确性造成影响。为了解决这一数据稀疏问题,将邻接小区域的交通状况信息也考虑进来,即
定义:
表示距离gi距离不超过d的网格集合,收集它们过去短时的交通状况特征,一起输入到神经网络中。其中,x,y表示网格的坐标,gj表示除gi以外的其他网格。
(二)训练阶段,将历史轨迹数据中提取的特征输入到一个统一的双向循环神经网络(bidirectional LSTM,参考文献:Graves A,Schmidhuber J.Framewise phonemeclassification with bidirectional LSTM and other neural network architectures[J].Neural Networks,2005,18(5-6):602-610.)进行训练,并且以双向区间损失函数作为训练的约束;具体步骤为:
步骤(1),构建循环神经网络。定义网络隐层为输入数据为那么,第t步的输入数据为xt,第t步得到的计算结果为ht,则有:
ht=φ(xt·Wx+ht-1·Wh+b) (3)
其中,是输入数据的权重矩阵(weight matrix),是隐层的权重矩阵,是偏置参数(bias)。φ表示一个非线性激活函数,可以是sigmoid函数,ReLU函数,tanh函数等等。
也就是说隐状态可以表示为函数:
ht=f(ht-1,xt) (4)
在这基础上,定义遗忘门为:
ft=σ(Wf·[ht-1,xt]+bf) (5)
输入门为:
it=σ(Wi·[ht-1,xt]+bi) (6)
输出门为:
ot=σ(Wo[ht-1,xt]+bo) (7)
记忆单元的更新为:
隐层的更新为:
ht=Ot·tanh(Ct) (10)
其中,Wf、Wi、Wo、分别表示遗忘门、输入门、输出门和记忆单元的权重矩阵,bf、bi、bo、则是对应的偏置参数。σ()为一个非线性的激活函数,例如是一个sigmoid函数,是一个双曲正切函数,f( )表示一个包含各层参数的抽象神经网络函数。定义循环神经网络对应的参数为WN;从[-α,α]的均匀分布中对循环神经网络中的每个权重参数进行初始化,其中,α是为一个超参数,设定范围为0.01到1。
双向循环神经网络同时使用一个正向的循环神经网络和一个反向的循环神经网络进行计算。其中正向循环神经网络根据序列的顺序依次将之前步骤提取的网格特征输入,而反向循环神经网络则将序列逆序后输入网格特征。这么做的优点在于,可以使得神经网络同时观察到当前网格距离起点和终点的位置距离,从而拥有一个整体的特征。定义它的隐变量为正向和反向网络的拼接其中表示正向循环神经网络的隐层,表示反向循环神经网络的隐层。
步骤(2),将历史轨迹数据中提取的特征,即空间特征时间特征驾驶状态特征历史上短时间和长时间的交通状态特征和拼接成一个统一的特征向量:
在每一个经过的小网格输入到双向循环神经网络,以得到经过该网格的通过时间,即WT·hi+b。总的行程的时间开销为:
定义分别为计算总时间开销的权重矩阵和偏置参数。WT表示W矩阵的转置。
步骤(3),定义轨迹经过各个网格序列的真实时间开销向量为T。顺序的真实时间开销向量为Tf,逆序的真实时间开销向量为Tb。则神经网络估计得到的时间开销向量为:
使用双向区间损失函数对模型进行辅助监督学习,使其不仅学习整条路径的时间开销,同时可以学习各个中间阶段的通行时间。定义双向区间损失函数为:
其中,M表示轨迹是否经过小区域的掩码,[]表示向量每个元素间的操作。
步骤(4),训练的目标是,最小化损失函数L,即:
其中,θ表示模型的训练参数,ε表示时间和空间上的嵌入向量,S是训练集的大小。最后,使用基于时间顺序的反向传播算法对模型进行参数的更新和优化。反向传播算法参考文献:Chauvin Y,Rumelhart D E.Backpropagation:theory,architectures,andapplications[M].Psychology Press,2013.
(三)预测阶段,用双向循环神经网络对查询路径中提取的特征进行推断并估计行程时间;具体步骤为:
步骤(1),给定一条没有时间戳标记的真实行程作为查询路径,根据经过的实际路径,得到其映射的网格序列。对于每一个经过的小网格,使用特征提取和表示阶段抽取得到的时空特征Vsp和Vtp,驾驶状态特征Vdri,和历史上短时间和长时间的交通状态特征Vshort和Vlong,作为该网格的总特征表示V。其中,时空特征的嵌入向量使用经过训练过程的参数更新后的向量信息。短时和长时间的交通状态特征使用经过训练的子循环神经网络进行特征挖掘。
步骤(2),在每一个经过的网格,将抽取的各方面特征输入到已经经过训练的双向循环神经网络中,得到当前的隐变量ht,那么经过当前区域的估计时间为WT·ht+b。而总的时间开销估计值为:
其中,n表示经过的总网格数目,为经过训练得到的,计算总时间开销的权重矩阵和偏置参数。WT表示W矩阵的转置。
总的来说,本发明方法有以下几个优点。首先,利用端到端(end-to-end)基于历史数据训练的深度学习方法,直接学习出整条路径的特征并估计出整体的通行时间。我们定义了一个双向区间损失函数,可以在监督整体的路径时间的基础上,同时辅助监督通过中间路段的时间开销。这种引入辅助监督的方法既丰富了路径的样本信息,又可以使得反向传播算法对参数更新时传播信号可以更加准确。其次,提出了一个特征抽取结构,通过提取时空嵌入向量,行驶状态,以及短时间和长时间的交通状况等不同维度的动态特征,能有效地估计出路径的通行时间。最后,在实际环境下经过实验验证,具有比已有方法更好的实验结果。
如表1所示,我们用真实的历史轨迹数据进行实验,包括波尔图和上海两个城市。我们用路段平均时间法,子路径动态规划法,网格全连接网络法,网格卷积网络法等已有方法进行对比。其中,路段平均时间法通过统计每个路段的平均通过时间,直接累加得到结果。子路径动态规划法[Yilun Wang,Yu Zheng,and Yexiang Xue.Travel timeestimation of a path using sparse trajecto-ries.In Proceedings of the 20thInternational Conference on Knowledge Discovery and Data Mining(SIGKDD),pages25–34,2014.]利用动态规划找到子路径的最优拼接方法。网格全连接网络法和网格卷积网络法将N×N的整体网格作为输入,分别用全连接网络(Multi-Layer Perceptron)和卷积神经网络(Convolutional Neural Network)进行优化和估计。我们使用MAE,RMSE,MAPE三个误差度量指标衡量方法的好坏。
其中,y表示真实值,表示估计值,n表示样本总数。由表1结果可知,本发明方法在各项指标都要远好于已有的对比方法。例如,在上海数据集上,本发明方法估计MAE误差只有126秒,MAPE误差是13.3%,而已有最好方法的MAE误差在168秒,MAPE误差是19.1%。
表1
附图说明
图1表示一个真实轨迹样本,包含每一个中间GPS轨迹点的时间戳信息,一共经过720s。
图2表示需要查询的路径样本,仅包含具体经过的路径信息,不包含任何时间戳信息。
具体实施方式
下面结合具体实例来说明本发明的具体实施过程:
如图1中的历史轨迹用于训练,并估计图2中的行程时间。
一、预处理阶段,特征提取和表示阶段,对轨迹数据进行预处理,抽取它的各方面特征。以图1为例,具体步骤为:
(1)在城市范围内,进行细粒度网格划分,分成一个个相邻的小区域。如图1中,将地图划分成5×6个网格。将轨迹序列中的每一个坐标点映射到对应的小区域中,形成一个网格序列,即g={g1,g2,…,g10}。
(2)对于每一个网格,挖掘它不同方面的特征。例如,对于g1,使用随机向量和来表示时空语义信息。即:
其次,使用四维向量来表示当前行驶阶段是出发阶段,中途阶段,还是结束阶段,以及在各个阶段已经行驶的比例,即:
最后,使用过去短时间和长时间的交通状况信息来预测当前的交通状况特征和具体来说,定义为过去的第1到6个时间区间(5min)内,当前区域g1的交通状况。例如表示历史平均速度是10m/s,共有8条历史轨迹,平均通过时间估计为20m/s。将将这些交通状况特征按照历史时间顺序输入到一个子循环神经网络中,将最后输出的隐层向量h6作为交通状况特征。
二、训练阶段,具体步骤为:
(1)建立双向循环神经网络(Bi-directional LSTM)模型。随机初始化模型的各项参数,包括遗忘门,输入门,输出门的矩阵参数和偏置参数。
(2)将历史轨迹数据中提取的特征,即空间特征Vsp,时间特征Vsp,驾驶状态特征Vdri,历史上短时间和长时间的交通状态特征Vshort和Vlong,拼接成一个统一的特征向量。以网格g1为例
(3)在每一个经过的小网格输入到双向循环神经网络,以得到经过该网格的通过时间,即WT·hi+b。总的行程的时间开销为:
例如,定义W=(0.1,0.3,..,0.7),10个网格隐层变量值为h1=(0.8,0.3,…,0.2),…,h10=(0.7,0.4,..0.5),偏置值b=0.7,则:
(4)定义轨迹经过各个网格序列的真实时间开销向量为T。顺序的真实时间开销向量为Tf=(70,120,…,720),逆序的真实时间开销向量为Tb=(720,640,…,50)。则神经网络估计得到的时间开销向量为:
使用双向区间损失函数对模型进行辅助监督学习,使其不仅学习整条路径的时间开销,同时可以学习各个中间阶段的通行时间。定义双向区间损失函数为:
其中,M表示轨迹是否经过小区域的掩码,[]表示向量每个元素间的操作。
(5)最小化损失函数L,即:
其中,θ表示模型的训练参数,ε表示时间和空间上的嵌入向量,S是训练集的大小。最后,使用基于时间顺序的反向传播算法对模型进行参数的更新和优化。
三.预测阶段,具体步骤为(以图2为例):
(1)给定一条没有时间戳标记的真实行程作为查询路径g={g1,g2,…,g8},根据经过的实际路径,得到其映射的网格序列。对于每一个经过的小网格g1~g8,使用特征提取和表示阶段抽取得到的时空特征Vsp和Vtp,驾驶状态特征Vdri,和历史上短时间和长时间的交通状态特征Vshort和Vlong,作为该网格的总特征表示V。其中,时空特征的嵌入向量使用经过训练过程的参数更新后的向量信息。短时和长时间的交通状态特征使用经过训练的子循环神经网络进行特征挖掘。
(2)在每一个经过的网格,将抽取的各方面特征输入到已经经过训练的双向循环神经网络中,得到当前的隐变量ht,那么经过当前区域的估计时间为WT·ht+b。而总的时间开销估计值为;
其中,W和b均由之前训练过程中得到的参数。
Claims (1)
1.一种基于辅助监督学习的行程时间估计方法,其特征在于,分为三个阶段:
(一)特征提取和表示阶段,对历史轨迹数据进行预处理,抽取它的各方面特征;
(二)训练阶段,将历史轨迹数据中提取的特征输入到一个统一的双向循环神经网络进行训练,并且以双向区间损失函数作为训练的约束;
(三)预测阶段,用双向循环神经网络对查询路径中提取的特征进行推断并估计行程时间;
(一)特征提取和表示阶段的具体步骤为:
步骤(1),在城市范围内,根据经纬度坐标对网格进行细粒度划分,形成一个个相邻的矩形小区域;将由按时间顺序排序的历史GPS坐标组成的轨迹序列中的每一个坐标点映射到对应的小区域中,形成一个由网格坐标组成的序列;
步骤(2),对于每一个网格,挖掘它不同方面的特征;首先,利用嵌入向量技术来表征每一个网格小区域在不同空间以及不同时间段的语义信息;这些信息包含城市不同的功能区域空间区位信息,也包括早高峰,周末等时间信息;具体地,利用低维向量来表示每一个网格的空间向量Vsp,将一天划分成多个时间桶,每一条轨迹根据具体落入的时间桶来得到时间向量Vtp;对Vsp和Vtp进行随机初始化,之后在模型训练时跟着模型一起训练;
步骤(3),使用四维向量Vdri来表示当前行驶阶段是出发阶段,中途阶段,还是结束阶段,以及在各个阶段已经行驶的比例;
步骤(4),定义短时间交通状况特征为Vshort,定义长时间交通状况特征为Vlong,具体地,
定义:
表示在过去第j个时间区间内,当前小区域gi的交通状况,其中vj表示历史平均速度,nj表示历史轨迹数据数量,leni/vj表示粗略估计的通过时间;将这些交通状况特征按照历史时间顺序输入到一个子循环神经网络中,用以抽取出交通状况特征;
另外,考虑邻接小区域的交通状况信息,即
定义:
表示距离gi距离不超过d的网格集合,收集它们过去短时的交通状况特征,一起输入到神经网络中;其中,x,y表示网格的坐标,gj表示除gi以外的其他网格;
(二)训练阶段的具体步骤为:
步骤(1),构建循环神经网络;定义网络隐层为输入数据为那么,第t步的输入数据为xt,第t步得到的计算结果为ht,则有:
ht=φ(xt·Wx+ht-1·Wh+b) (3)
其中,是输入数据的权重矩阵(weight matrix),是隐层的权重矩阵,是偏置参数(bias);
即隐状态表示为函数:
ht=f(ht-1,xt) (4)
在这基础上,定义遗忘门为:
ft=σ(Wf·[ht-1,xt]+bf) (5)
输入门为:
it=σ(Wi·[ht-1,xt]+bi) (6)
输出门为:
ot=σ(Wo[ht-1,xt]+bo) (7)
记忆单元的更新为:
隐层的更新为:
ht=Ot·tanh(Ct) (10)
其中,Wf,Wi,Wo,分别表示遗忘门,输入门,输出门和记忆单元的权重矩阵,bf,bi,bo,则是对应的偏置参数;σ()为一个非线性的激活函数;f( )表示一个包含各层参数的抽象神经网络函数,定义循环神经网络对应的参数为WN,从[-α,α]的均匀分布中对每个元素进行初始化,其中,α是为一个超参数,设定范围为0.01到1;
双向循环神经网络同时使用正向的循环神经网络和反向的循环神经网络进行计算;其中正向循环神经网络根据序列的顺序依次将之前步骤提取的网格特征输入,反向循环神经网络则将序列逆序后输入网格特征;定义它的隐变量为正向和反向网络的拼接,即:
步骤(2),将历史轨迹数据中提取的特征,即空间特征Vsp,时间特征Vsp,驾驶状态特征Vdri,历史上短时间和长时间的交通状态特征Vshort和Vlong,拼接成一个统一的特征向量:
V=(Vsp,Vsp,Vdri,Vshort,Vlong) (11)
在每一个经过的小网格输入到双向循环神经网络,以得到经过该网格的通过时间,即WT·hi+b,总的行程的时间开销为:
为计算总时间开销的权重矩阵和偏置参数,WT表示W矩阵的转置;
步骤(3),定义轨迹经过各个网格序列的真实时间开销向量为T;顺序的真实时间开销向量为Tf,逆序的真实时间开销向量为Tb;则神经网络估计得到的时间开销向量为:
使用双向区间损失函数对模型进行辅助监督学习,使其不仅学习整条路径的时间开销,同时可以学习各个中间阶段的通行时间;定义双向区间损失函数为:
其中,M表示轨迹是否经过小区域的掩码,[]表示向量每个元素间的操作;
步骤(4),训练的目标是最小化损失函数L,即:
其中,θ表示模型的训练参数,ε表示时间和空间上的嵌入向量,S是训练集的大小;最后,使用基于时间顺序的反向传播算法对模型进行参数的更新和优化;
(三)预测阶段的具体步骤为:
步骤(1),给定一条没有时间戳标记的真实行程作为查询路径,根据经过的实际路径,得到其映射的网格序列;对于每一个经过的小网格,使用特征提取和表示阶段抽取得到的时空特征Vsp和Vtp,驾驶状态特征Vdri,和历史上短时间和长时间的交通状态特征Vshort和Vlong,作为该网格的总特征表示V;其中,时空特征的嵌入向量使用经过训练过程的参数更新后的向量信息;短时间和长时间的交通状态特征使用经过训练的子循环神经网络进行特征挖掘;
步骤(2),在每一个经过的网格,将抽取的各方面特征输入到已经经过训练的双向循环神经网络中,得到当前的隐变量ht,那么经过当前区域的估计时间为WT·ht+b,而总的时间开销估计值为:
其中,n表示经过的总网格数目,为经过训练得到的,计算总时间开销的权重矩阵和偏置参数,WT表示W矩阵的转置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810658375.5A CN109035761B (zh) | 2018-06-25 | 2018-06-25 | 基于辅助监督学习的行程时间估计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810658375.5A CN109035761B (zh) | 2018-06-25 | 2018-06-25 | 基于辅助监督学习的行程时间估计方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109035761A true CN109035761A (zh) | 2018-12-18 |
CN109035761B CN109035761B (zh) | 2021-06-04 |
Family
ID=64611043
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810658375.5A Expired - Fee Related CN109035761B (zh) | 2018-06-25 | 2018-06-25 | 基于辅助监督学习的行程时间估计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109035761B (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109783771A (zh) * | 2019-01-22 | 2019-05-21 | 清华大学 | 将轨迹序列转换为图像矩阵的处理方法、装置和存储介质 |
CN109799533A (zh) * | 2018-12-28 | 2019-05-24 | 中国石油化工股份有限公司 | 一种基于双向循环神经网络的储层预测方法 |
CN110232169A (zh) * | 2019-05-09 | 2019-09-13 | 北京航空航天大学 | 基于双向长短时记忆模型和卡尔曼滤波的轨迹去噪方法 |
CN110488835A (zh) * | 2019-08-28 | 2019-11-22 | 北京航空航天大学 | 一种基于双反向传播神经网络的无人***智能局部路径规划方法 |
CN110675632A (zh) * | 2019-11-11 | 2020-01-10 | 重庆邮电大学 | 针对多特征空间和数据稀疏的车辆短时轨迹预测控制方法 |
CN110942211A (zh) * | 2019-12-12 | 2020-03-31 | 武汉中海庭数据技术有限公司 | 一种基于深度神经网络的预估达到时间预测方法及装置 |
CN111047107A (zh) * | 2019-12-23 | 2020-04-21 | 北京百度网讯科技有限公司 | 公路通行时间预测方法、装置、电子设备和存储介质 |
CN111339156A (zh) * | 2020-02-07 | 2020-06-26 | 京东城市(北京)数字科技有限公司 | 业务数据的长期确定方法、装置和计算机可读存储介质 |
CN111721306A (zh) * | 2019-03-20 | 2020-09-29 | 北京嘀嘀无限科技发展有限公司 | 道路匹配方法、装置、电子设备及可读存储介质 |
CN111738500A (zh) * | 2020-06-11 | 2020-10-02 | 大连海事大学 | 一种基于深度学习的航行时间预测方法及装置 |
CN112017436A (zh) * | 2020-09-09 | 2020-12-01 | 中国科学院自动化研究所 | 城市市内交通旅行时间的预测方法及*** |
CN112101132A (zh) * | 2020-08-24 | 2020-12-18 | 西北工业大学 | 一种基于图嵌入模型和度量学习的交通状况预测方法 |
CN112859898A (zh) * | 2021-01-18 | 2021-05-28 | 中山大学 | 一种基于双通道双向神经网络的飞行器轨迹预测方法 |
CN115394088A (zh) * | 2022-10-31 | 2022-11-25 | 江苏博宇鑫信息科技股份有限公司 | 基于时空注意力机制的路口通行时间预测方法 |
CN116542438A (zh) * | 2023-03-28 | 2023-08-04 | 大连海事大学 | 一种基于无基准真相的公交乘客起止点估计修补方法 |
Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103280110A (zh) * | 2013-06-08 | 2013-09-04 | 北京云星宇交通工程有限公司 | 高速公路旅行时间的预测方法及装置 |
CN104157142A (zh) * | 2014-08-27 | 2014-11-19 | 河海大学 | 一种基于浮动车数据的城市路径行程时间预测方法 |
CN104269059A (zh) * | 2014-10-15 | 2015-01-07 | 河海大学 | 一种基于多源数据融合的城市路径行程时间预测方法 |
CN104299442A (zh) * | 2014-10-15 | 2015-01-21 | 河海大学 | 一种基于模式匹配的城市路径行程时间预测方法 |
CN104408958A (zh) * | 2014-11-11 | 2015-03-11 | 河海大学 | 一种城市动态路径行程时间预测方法 |
CN104615897A (zh) * | 2015-02-13 | 2015-05-13 | 北方工业大学 | 基于低频gps数据的路段行程时间估算方法 |
CN105006147A (zh) * | 2015-06-19 | 2015-10-28 | 武汉大学 | 一种基于道路时空关联关系的路段行程时间推断方法 |
CN105679021A (zh) * | 2016-02-02 | 2016-06-15 | 重庆云途交通科技有限公司 | 基于交通大数据的行程时间融合预测及查询方法 |
CN106023588A (zh) * | 2016-06-15 | 2016-10-12 | 重庆云途交通科技有限公司 | 一种基于交通大数据的行程时间提取、预测及查询方法 |
CN106096767A (zh) * | 2016-06-07 | 2016-11-09 | 中国科学院自动化研究所 | 一种基于lstm的路段行程时间预测方法 |
CN106156531A (zh) * | 2016-08-04 | 2016-11-23 | 复旦大学 | 基于低采样历史轨迹的行程时间估计方法 |
CN106940930A (zh) * | 2016-11-01 | 2017-07-11 | 深圳市城市交通规划设计研究中心有限公司 | 高速公路行程时间预测***和预测方法 |
CN106981198A (zh) * | 2017-05-24 | 2017-07-25 | 北京航空航天大学 | 用于旅行时间预测的深度学习网络模型及其建立方法 |
CN107085943A (zh) * | 2015-12-23 | 2017-08-22 | 青岛海信网络科技股份有限公司 | 一种道路旅行时间短期预测方法和*** |
CN107480786A (zh) * | 2017-08-07 | 2017-12-15 | 复旦大学 | 基于输出状态限制的循环神经网络轨迹似然概率计算方法 |
CN107688556A (zh) * | 2017-07-24 | 2018-02-13 | 中山大学 | 一种基于函数型主成分分析的实时行程时间计算方法 |
CN107945507A (zh) * | 2016-10-13 | 2018-04-20 | 腾讯科技(深圳)有限公司 | 行程时间预测方法及装置 |
CN108073941A (zh) * | 2016-11-17 | 2018-05-25 | 江南大学 | 一种基于深度学习的图像语义生成方法 |
KR20180064692A (ko) * | 2016-12-06 | 2018-06-15 | 현대자동차주식회사 | 내비게이션 장치, 상기 내비게이션 장치가 설치된 차량, 상기 내비게이션 장치의 경로 결정 시스템 및 상기 내비게이션 장치의 제어 방법 |
WO2018109516A1 (ja) * | 2016-12-13 | 2018-06-21 | 日産自動車株式会社 | 自動運転支援方法および装置 |
-
2018
- 2018-06-25 CN CN201810658375.5A patent/CN109035761B/zh not_active Expired - Fee Related
Patent Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103280110A (zh) * | 2013-06-08 | 2013-09-04 | 北京云星宇交通工程有限公司 | 高速公路旅行时间的预测方法及装置 |
CN104157142A (zh) * | 2014-08-27 | 2014-11-19 | 河海大学 | 一种基于浮动车数据的城市路径行程时间预测方法 |
CN104269059A (zh) * | 2014-10-15 | 2015-01-07 | 河海大学 | 一种基于多源数据融合的城市路径行程时间预测方法 |
CN104299442A (zh) * | 2014-10-15 | 2015-01-21 | 河海大学 | 一种基于模式匹配的城市路径行程时间预测方法 |
CN104408958A (zh) * | 2014-11-11 | 2015-03-11 | 河海大学 | 一种城市动态路径行程时间预测方法 |
CN104615897A (zh) * | 2015-02-13 | 2015-05-13 | 北方工业大学 | 基于低频gps数据的路段行程时间估算方法 |
CN105006147A (zh) * | 2015-06-19 | 2015-10-28 | 武汉大学 | 一种基于道路时空关联关系的路段行程时间推断方法 |
CN107085943A (zh) * | 2015-12-23 | 2017-08-22 | 青岛海信网络科技股份有限公司 | 一种道路旅行时间短期预测方法和*** |
CN105679021A (zh) * | 2016-02-02 | 2016-06-15 | 重庆云途交通科技有限公司 | 基于交通大数据的行程时间融合预测及查询方法 |
CN106096767A (zh) * | 2016-06-07 | 2016-11-09 | 中国科学院自动化研究所 | 一种基于lstm的路段行程时间预测方法 |
CN106023588A (zh) * | 2016-06-15 | 2016-10-12 | 重庆云途交通科技有限公司 | 一种基于交通大数据的行程时间提取、预测及查询方法 |
CN106156531A (zh) * | 2016-08-04 | 2016-11-23 | 复旦大学 | 基于低采样历史轨迹的行程时间估计方法 |
CN107945507A (zh) * | 2016-10-13 | 2018-04-20 | 腾讯科技(深圳)有限公司 | 行程时间预测方法及装置 |
CN106940930A (zh) * | 2016-11-01 | 2017-07-11 | 深圳市城市交通规划设计研究中心有限公司 | 高速公路行程时间预测***和预测方法 |
CN108073941A (zh) * | 2016-11-17 | 2018-05-25 | 江南大学 | 一种基于深度学习的图像语义生成方法 |
KR20180064692A (ko) * | 2016-12-06 | 2018-06-15 | 현대자동차주식회사 | 내비게이션 장치, 상기 내비게이션 장치가 설치된 차량, 상기 내비게이션 장치의 경로 결정 시스템 및 상기 내비게이션 장치의 제어 방법 |
WO2018109516A1 (ja) * | 2016-12-13 | 2018-06-21 | 日産自動車株式会社 | 自動運転支援方法および装置 |
CN106981198A (zh) * | 2017-05-24 | 2017-07-25 | 北京航空航天大学 | 用于旅行时间预测的深度学习网络模型及其建立方法 |
CN107688556A (zh) * | 2017-07-24 | 2018-02-13 | 中山大学 | 一种基于函数型主成分分析的实时行程时间计算方法 |
CN107480786A (zh) * | 2017-08-07 | 2017-12-15 | 复旦大学 | 基于输出状态限制的循环神经网络轨迹似然概率计算方法 |
Non-Patent Citations (5)
Title |
---|
DONG WANG, JUNBO ZHANG, WEI CAO, JIAN LI, YU ZHENG: "WhenWill You Arrive? Estimating Travel Time Based on Deep Neural Networks", 《MICROSOFT》 * |
XIAOLEI MA,ZHIMIN TAO, YINHAI WANG, HAIYANG YU: "Long short-term memory neural network for traffic speed", 《TRANSPORTATION RESEARCH PART C》 * |
YANGDONG LIU: "Short-term travel time prediction by deep learning: A comparison of different LSTM-DNN models", 《2017 IEEE 20TH INTERNATIONAL CONFERENCE ON INTELLIGENT TRANSPORTATION SYSTEMS (ITSC)》 * |
张发明,朱欣焰,呙维,胡涛: "利用浮动车大数据进行稀疏路段行程时间推断", 《武汉大学学报· 信息科学版》 * |
杨庆芳,韦学武,林赐云,李志林,刘翔宇: "基于时空贝叶斯模型的行程时间可靠性预测", 《华南理工大学学报( 自然科学版)》 * |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109799533A (zh) * | 2018-12-28 | 2019-05-24 | 中国石油化工股份有限公司 | 一种基于双向循环神经网络的储层预测方法 |
CN109783771A (zh) * | 2019-01-22 | 2019-05-21 | 清华大学 | 将轨迹序列转换为图像矩阵的处理方法、装置和存储介质 |
CN111721306B (zh) * | 2019-03-20 | 2022-07-05 | 北京嘀嘀无限科技发展有限公司 | 道路匹配方法、装置、电子设备及可读存储介质 |
CN111721306A (zh) * | 2019-03-20 | 2020-09-29 | 北京嘀嘀无限科技发展有限公司 | 道路匹配方法、装置、电子设备及可读存储介质 |
CN110232169A (zh) * | 2019-05-09 | 2019-09-13 | 北京航空航天大学 | 基于双向长短时记忆模型和卡尔曼滤波的轨迹去噪方法 |
CN110232169B (zh) * | 2019-05-09 | 2022-01-04 | 北京航空航天大学 | 基于双向长短时记忆模型和卡尔曼滤波的轨迹去噪方法 |
CN110488835A (zh) * | 2019-08-28 | 2019-11-22 | 北京航空航天大学 | 一种基于双反向传播神经网络的无人***智能局部路径规划方法 |
CN110675632B (zh) * | 2019-11-11 | 2021-11-30 | 重庆邮电大学 | 针对多特征空间和数据稀疏的车辆短时轨迹预测控制方法 |
CN110675632A (zh) * | 2019-11-11 | 2020-01-10 | 重庆邮电大学 | 针对多特征空间和数据稀疏的车辆短时轨迹预测控制方法 |
CN110942211A (zh) * | 2019-12-12 | 2020-03-31 | 武汉中海庭数据技术有限公司 | 一种基于深度神经网络的预估达到时间预测方法及装置 |
CN111047107B (zh) * | 2019-12-23 | 2022-05-10 | 北京百度网讯科技有限公司 | 公路通行时间预测方法、装置、电子设备和存储介质 |
CN111047107A (zh) * | 2019-12-23 | 2020-04-21 | 北京百度网讯科技有限公司 | 公路通行时间预测方法、装置、电子设备和存储介质 |
CN111339156B (zh) * | 2020-02-07 | 2023-09-26 | 京东城市(北京)数字科技有限公司 | 业务数据的长期确定方法、装置和计算机可读存储介质 |
CN111339156A (zh) * | 2020-02-07 | 2020-06-26 | 京东城市(北京)数字科技有限公司 | 业务数据的长期确定方法、装置和计算机可读存储介质 |
CN111738500B (zh) * | 2020-06-11 | 2024-01-12 | 大连海事大学 | 一种基于深度学习的航行时间预测方法及装置 |
CN111738500A (zh) * | 2020-06-11 | 2020-10-02 | 大连海事大学 | 一种基于深度学习的航行时间预测方法及装置 |
CN112101132A (zh) * | 2020-08-24 | 2020-12-18 | 西北工业大学 | 一种基于图嵌入模型和度量学习的交通状况预测方法 |
CN112017436B (zh) * | 2020-09-09 | 2021-09-28 | 中国科学院自动化研究所 | 城市市内交通旅行时间的预测方法及*** |
CN112017436A (zh) * | 2020-09-09 | 2020-12-01 | 中国科学院自动化研究所 | 城市市内交通旅行时间的预测方法及*** |
CN112859898B (zh) * | 2021-01-18 | 2022-03-22 | 中山大学 | 一种基于双通道双向神经网络的飞行器轨迹预测方法 |
CN112859898A (zh) * | 2021-01-18 | 2021-05-28 | 中山大学 | 一种基于双通道双向神经网络的飞行器轨迹预测方法 |
CN115394088A (zh) * | 2022-10-31 | 2022-11-25 | 江苏博宇鑫信息科技股份有限公司 | 基于时空注意力机制的路口通行时间预测方法 |
CN116542438A (zh) * | 2023-03-28 | 2023-08-04 | 大连海事大学 | 一种基于无基准真相的公交乘客起止点估计修补方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109035761B (zh) | 2021-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109035761A (zh) | 基于辅助监督学习的行程时间估计方法 | |
Liu et al. | Urban traffic prediction from mobility data using deep learning | |
Li et al. | Traffic speed prediction for intelligent transportation system based on a deep feature fusion model | |
CN108629978A (zh) | 一种基于高维路网和循环神经网络的交通轨迹预测方法 | |
CN105493109A (zh) | 使用多个数据源的空气质量推断 | |
CN114519932B (zh) | 一种基于时空关系抽取的区域交通状况集成预测方法 | |
Rahman et al. | Short-term traffic speed prediction for freeways during hurricane evacuation: a deep learning approach | |
CN112365708B (zh) | 基于多图卷积网络的景区交通量预测模型建立和预测方法 | |
Mikluščák et al. | Using neural networks for route and destination prediction in intelligent transport systems | |
CN115204478A (zh) | 一种结合城市兴趣点和时空因果关系的公共交通流量预测方法 | |
CN116052427B (zh) | 基于私家车出行轨迹数据的城市间跨区域移动性预测方法及装置 | |
Cheng et al. | Developing a travel time estimation method of freeway based on floating car using random forests | |
Rajeh et al. | Modeling multi-regional temporal correlation with gated recurrent unit and multiple linear regression for urban traffic flow prediction | |
Liu et al. | A method for short-term traffic flow forecasting based on GCN-LSTM | |
Wu et al. | Traffic prediction based on GCN-LSTM model | |
Zhang et al. | cst-ml: Continuous spatial-temporal meta-learning for traffic dynamics prediction | |
Hu et al. | Attention mechanism with spatial-temporal joint model for traffic flow speed prediction | |
Xu et al. | A taxi dispatch system based on prediction of demand and destination | |
Naheliya et al. | A hybrid deep learning method for short-term traffic flow forecasting: GSA-LSTM | |
Li et al. | Short term passenger flow forecast of metro based on inbound passenger plow and deep learning | |
Miao et al. | A queue hybrid neural network with weather weighted factor for traffic flow prediction | |
He et al. | Dyna-PTM: OD-enhanced GCN for metro passenger flow prediction | |
Zaman et al. | Assessing the suitability of different machine learning approaches for smart traffic mobility | |
Li et al. | Graph neural networks in urban intelligence | |
Zhou et al. | a Method for Traffic Flow Forecasting in a Large-Scale Road Network Using Multifeatures |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210604 |