CN108417029B - 基于自适应多任务深度学习的城市路网行程时间估计方法 - Google Patents

基于自适应多任务深度学习的城市路网行程时间估计方法 Download PDF

Info

Publication number
CN108417029B
CN108417029B CN201810141263.2A CN201810141263A CN108417029B CN 108417029 B CN108417029 B CN 108417029B CN 201810141263 A CN201810141263 A CN 201810141263A CN 108417029 B CN108417029 B CN 108417029B
Authority
CN
China
Prior art keywords
travel time
task
model
learning
road network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810141263.2A
Other languages
English (en)
Other versions
CN108417029A (zh
Inventor
陈淑燕
唐坤
张斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201810141263.2A priority Critical patent/CN108417029B/zh
Publication of CN108417029A publication Critical patent/CN108417029A/zh
Application granted granted Critical
Publication of CN108417029B publication Critical patent/CN108417029B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于自适应多任务深度学习的城市路网行程时间估计方法,属于智能交通技术领域。首先提取影响路段行程时间的特征,然后以降噪稀疏自编码器为元件构建由多个特征学习层组成的深度网络,逐层学习输入的特征表示;最后,使用基于概率的方法对行程时间的不确定性建模,构建多任务的回归层,由最小化模型输出与观测值之间的误差,使模型自动调整各个任务的权重。本发明克服了现有方法存在的浅层网络难以描述城市路网中复杂非线性的行程时间、需要人为调整联合学习任务权重以及只能利用具有完整任务标签的数据等缺陷,提高了行程时间估计的效率,在城市路网行程时间估计中具有重要的现实意义。

Description

基于自适应多任务深度学习的城市路网行程时间估计方法
技术领域
本发明涉及一种运用自适应权重的多任务深度学习方法进行城市路网行程时间估计的方法,属于智能交通技术领域。
背景技术
在现实生活中,我们通常会把一个大的问题划分成若干高度相关的子问题。把对于每个子问题的学***行训练,共享信息,以实现良好的学习效果。
在城市路网行程时间的估计方面,不同时段下路网上各路段行程时间的估计可以视为不同的任务,如果进行单任务的学习,各任务之间将不能共享信息,浪费了数据背后隐含的规律。如果将不同的行程时间估计任务同时进行多任务学习,就可以让模型共享各个任务之间在时间和空间上的相关信息,使得行程时间估计的精度和效率更为提高。同时,在实际情况下,由于受到车辆数量和车辆经行路线的限制,很难获得所有路段行程时间的观测值,这种标签不完整的数据在训练模型的过程中会带来很多问题,使得模型的训练效果不够理想。针对不完整标签数据的观测样本,进一步提出改进的多任务深度学习模型,只要某一个路段在任何一个任务中存在行程时间标签,就可以对其加以利用,这样可以提高数据的利用效率,使模型拥有更好的路段行程时间估计效果。
发明内容
本发明所要解决的技术问题是:
为了提高了城市路网行程时间估计的效率,本发明提出一种运用自适应权重的多任务深度学习方法进行城市路网行程时间估计的方法
本发明为解决上述技术问题采用以下技术方案:一种基于自适应多任务深度学习的城市路网行程时间估计方法,包括如下步骤:
1)获取路网信息及影响路段上车辆行程时间的特征参数;
2)通过堆叠的降噪稀疏自编码器实现单个时段内路段行程时间估计的单任务学习;
3)将若干时段的路段行程时间估计结合在同一个深度多任务学习模型之中,各任务共享信息,使得部分在单任务学习中无法使用的数据在此加以利用;
4)通过程序自动调节多任务学习模型中各任务所占权重;
5)在模型中应用缺失标签数据;建立最小化模型输出与路段行程时间观测值之间的误差训练模型,估计城市路网中各路段的通行时间。
进一步地,步骤1)所述路网信息包括整个城市路网的路段数量、长度和节点数量;所述影响路段上车辆行程时间的特征参数包括路段特征、环境特征和空间相关特征。
进一步地,步骤2)所述实现单任务学习,步骤具体包括:
201、通过降噪稀疏自编码器获取原始输入中的数据特征;
202、最小化重构误差
Figure GDA0002675032090000021
其中的第一项是基于经验的损失项,N是样本数,xi表示第i个路段行程时间影响因素的特征向量,
Figure GDA0002675032090000022
是xi
Figure GDA0002675032090000023
之间的重构误差,第二项是控制稀疏的正则项,其中β是稀疏性惩罚权重,H是隐层的神经元数量,ρ是恒定的稀疏参数,
Figure GDA0002675032090000024
是训练集中隐层神经元j的稀疏度,KL(·)是Kullback-Leibler差异,或称KL距离,定义如下:
Figure GDA0002675032090000025
203、逐层训练模型。
进一步地,步骤3)所述将若干时段的路段行程时间估计结合在同一个深度多任务学习模型之中的具体方法为:
实现
Figure GDA0002675032090000026
其中,W表示多任务深度学习的模型参数;
Figure GDA0002675032090000027
是第i个路段行程时间影响因素的特征向量,
Figure GDA0002675032090000028
是第j个时间段内第i个路段观测到的行程时间,j=1,2,…,T;i=1,2,…,N;fj(xi;W)是对应于输入xi的第j个任务的输出,
Figure GDA0002675032090000029
是一个损失函数,cj是单个任务的权重;第二项λΩ(W)是一个正则化项,用以惩罚W的复杂度,其中λ>0是正则化参数。
进一步地,所述损失函数L为平方损失函数。
进一步地,步骤4)所述调节多任务学习模型中各任务所占权重具体步骤包括:
通过最小化单任务损失函数的线性加权和来实现最小化多任务损失函数,所述多个任务总的损失函数为
Figure GDA0002675032090000031
结合贝叶斯模型,将上述最优化问题转化为如下优化问题:
Figure GDA0002675032090000032
其中σj是对应于第j个任务的高斯分布的标准差,Lj(W)是第j个任务的损失函数,末项为正则项。
进一步地,步骤5)所述在模型中应用缺失标签数据的具体步骤包括:
构建最小化模型
Figure GDA0002675032090000033
其中aji'表示第i'个样本对于第j个任务是否有标签,定义为:
Figure GDA0002675032090000034
aji'=0表示第i'个样本对于第j个任务没有标签,即没有观测值;
标准化每个任务的损失为:
Figure GDA0002675032090000035
Figure GDA0002675032090000036
表示第j个任务的平均估计损失,上式转化为:
Figure GDA0002675032090000037
将其作为所提出的自适应权重的深度多任务学习模型,估计城市路网中各路段的通行时间;其中,末项是正则项。
进一步地,所述自适应权重的深度多任务学习模型的末项选用
Figure GDA0002675032090000038
范数。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
(1)考虑道路沿线的环境特征对行程时间的影响,提高模型的精度;
(2)相较于浅层神经网络,采用深度神经网络以更好地学习数据中的隐含特征;
(3)多任务学习模型考虑到各个任务之间的相关性,训练过程中各个任务共享特征,相较于单任务学习模型可以实现更高的估计精度;
(4)不再平等对待多任务深度学习模型中的多个任务或是人为确定各个任务的权重,而是采用自适应权重的方法,更合理地调节各个任务的权重,以使得整个模型达到更高的估计精度;
(5)有效地处理了标签不完整的数据,使得这些数据也可以被加以利用。
附图说明
图1是本发明的总体流程图。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明:
本技术领域技术人员可以理解的是,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
参考图1所示,本部分包括以下五个步骤。首先提取影响路段行程时间的特征因素,以此确定模型的输入。考虑将一个时间段内所有路段的行程时间估计作为一个任务,由于实际条件的限制,很多路段上的行程时间数据是没有的,这就导致进行单任务学***等对待或人为指定的,而在此我们让模型自动调整各任务的权重,使得模型能够更好地捕获数据中的特征,取得更高的精度。
(1)输入参数确定
在一个时段内,某一路段的行程时间受到诸多因素的影响,如路段长度、车道数以及相邻路段的交通状况等。对于一个给定的路段i,将影响其行程时间的因素分为以下三类:路段特征、环境特征和空间相关特征。
1)路段特征
一个路段的行程时间主要是受其路段特征g(i)的影响。在本文中,从道路网中提取7个路段特征,包括路段长度、车道数量、路段限速、方向、道路等级、转弯半径以及连接道路的数量,因此
Figure GDA0002675032090000051
路段特征表征了路段在地理空间上的相似程度,有相似路段特征的路段在行程时间上也是相似的。
2)环境特征
一个路段的行程时间也与路段的环境特征c(i),亦即道路沿线各种兴趣点的分布高度相关。在本文中,提取了11个道路沿线的环境特征,包括学校、公司、银行、商场、餐厅、加油站、景点、酒店、交通站点、娱乐设施分布的分布情况以及沿线兴趣点的总数,因此
Figure GDA0002675032090000052
环境特征表征了路段在沿线环境上的相似性,有相似环境特征的路段在行程时间上也是相似的。
3)空间相关特征
一个路段的行程时间除了与路段自身的一些特征有关,也受到相邻路段的影响。在本文中,我们同时提取目标路段及其上下游路段的路段特征和环境特征,将这些特征一起作为目标路段行程时间估计的输入。
模型的输入x(i)如下所示:
Figure GDA0002675032090000053
其中的
Figure GDA0002675032090000054
Figure GDA0002675032090000055
分别是前文提及的路段特征和环境特征,(i-m)和(i+m)分别表示第m个上下游路段。因此一个输入的维度为d=(2m+1)×(7+11)=36×m+18。目标路段的行程时间以y(i)=f(x(i))表示,其中
Figure GDA0002675032090000056
是行程时间关于影响因素的函数。给定一个有m个输入/输出的数据集
Figure GDA0002675032090000057
行程时间估计的过程也就是建立行程时间关于影响因素的关系模型f的过程,使得
Figure GDA0002675032090000058
其中
Figure GDA0002675032090000059
是一个衡量估计误差的损失函数,比如平方误差损失函数。
(2)深度单任务学习
目前应用于行程时间估计的神经网络结构中,多数都是采用了浅层的网络。由于受到交叉口处车辆到达的波动性和交通信号的影响,城市道路上车辆的行程时间具有很大的不确定性。一个隐层难以捕捉行程时间与诸多影响因素之间的非线性特征,鉴于此,一种可行方法就是建立一个能够逐层学习输入特征的深层网络。在此引入一种叫做堆叠降噪稀疏自编码器(Stacked Denoising Sparse Auto-encoders,SDSAEs)的深度结构模型。
1)降噪稀疏自编码器(Denoising Sparse Auto-encoders,DSAEs)
降噪稀疏自编码器通过重构输入来学习隐层的特征。首先增加噪声到输入x中,然后将带有噪声的输入映射到输出y,y=s(Wxnoise+b),s(·)是Sigmoid激活函数,W是编码的权重矩阵,b是偏置项。然后通过解码重构输入,
Figure GDA0002675032090000061
其中W'是解码的权重矩阵,b'是解码的偏置项。给定训练样本{x1,x2,…,xN},降噪稀疏自编码器最小化重构误差,即
Figure GDA0002675032090000062
其中的第一项是基于经验的损失项,N是样本数,xi表示第i个路段行程时间影响因素的特征向量,
Figure GDA0002675032090000063
是xi
Figure GDA0002675032090000064
之间的重构误差,第二项是控制稀疏的正则项,其中β是稀疏性惩罚权重,H是隐层的神经元数量,ρ是恒定的稀疏参数,
Figure GDA0002675032090000065
是训练集中隐层神经元j的稀疏度,KL(·)是Kullback-Leibler差异,或称KL距离,定义如下:
Figure GDA0002675032090000066
2)堆叠降噪稀疏自编码器(StackedDenoisingSparseAuto-encoders,SDSAEs)
堆叠降噪稀疏自编码器是把多层的降噪稀疏自编码器串联起来,前层的输出作为相邻后一层的输入。基于SDSAEs学习到的高层特征,在最后增加一个回归层来估计城市路网中各个路段的行程时间。
(3)深度多任务学习
不同时段的路段行程时间估计可以被视为不同的任务,这些任务之间有高度的相关性。多任务学习考虑到各任务之间的相关性,通过各任务之间共享信息,提高学习的精度和效率。一个路段的行程时间在相邻的时段上是相关的,彼此之间有很多信息可以共享。在此以一定的时间间隔划分时段,每个时段的路段行程时间估计视为一个任务。不同时段的多个任务共享隐层,共享权重,通过反向传播算法协作学习。
假设同时进行T个时间段的路段行程时间估计任务,现在给定了有N个输入/输出的样本
Figure GDA0002675032090000067
其中
Figure GDA0002675032090000068
是第j个路段行程时间影响因素的特征向量,
Figure GDA0002675032090000069
是第i个时段内第j个路段观测到的行程时间。此时多任务深度学习的目标即为实现:
Figure GDA00026750320900000610
其中,W表示多任务深度学习的模型参数;
Figure GDA00026750320900000611
是第i个路段行程时间影响因素的特征向量,
Figure GDA0002675032090000071
是第j个时间段内第i个路段观测到的行程时间,j=1,2,…,T;i=1,2,…,N;fj(xi;W)是对应于输入xi的第j个任务的输出,
Figure GDA0002675032090000072
是一个损失函数,cj是单个任务的权重;第二项λΩ(W)是一个正则化项,用以惩罚W的复杂度,其中λ>0是正则化参数。(4)自适应权重的深度多任务学习
定义
Figure GDA0002675032090000073
为第j个任务的损失函数,则多个任务总的损失函数为
Figure GDA0002675032090000074
最小化多任务损失函数通过最小化单任务损失函数的线性加权和来实现,这时候模型的表现对各任务之间的权重高度敏感。以下通过自适应权重来解决最优化问题。
首先考虑单任务学习的情况。令f(x;W)为单任务深度学习的输出,基于贝叶斯模型考虑如下概率模型:
Figure GDA0002675032090000075
给定W情况下的y符合均值为f(x;W)、方差为σ2的高斯分布。对于独立的观测变量{(x1,y1),(x2,y2),…,(xN,yN)},考虑了W和σ的最优化问题就转化为最大似然估计问题:
Figure GDA0002675032090000076
其等价于最小化平方误差的和函数:
Figure GDA0002675032090000077
通过对W和σ的梯度下降可以求得其局部最优解。
在多任务学习的情况下,用yj表示第j个任务的观测值,fi(x;W)表示对应于输入x的第j个任务的输出。对于所有的j(j=1,2,…,T)个任务,单个任务的似然函数表示为
Figure GDA0002675032090000078
即第j个任务服从均值为fj(x;W)、方差为
Figure GDA0002675032090000079
的高斯分布。对多任务深度学习网络的输出f(x;W)=[f1(x;W),f2(x;W),…,fT(x;W)]进行因式分解,得到如下多任务的似然函数:
Figure GDA0002675032090000081
对于有N个观测样本的数据集,考虑到模型参数W和σj(j=1,2,…,T),则有如下的最大似然估计问题:
Figure GDA0002675032090000082
其中,yji'表示第j个任务的标签,fj(xi';W)是深度多任务学习网络对应于输入xi'的输出。考虑到模型参数W和观测噪声σj,上述最大化问题等价于:
Figure GDA0002675032090000083
其中
Figure GDA0002675032090000084
表示第j个任务的标签和对应于第i'个输入的输出之间的差值。由于第j个任务的损失表示为:
Figure GDA0002675032090000085
所以上述最小化问题可写为如下形式:
Figure GDA0002675032090000086
通过对W和σ12,…,σT进行梯度下降运算求解此最小化问题。为防止过拟合,在此仍含有正则项。
最小化这个关于σ12,…,σT的目标函数的过程,可以理解为学***等对待所有任务或需要人为确定各个任务的权重。
(5)缺失标签数据在模型中的应用
上述提到的多任务深度学习模型只能适用于所有时段所有路段都有行程时间观测值的情况,然而在实际中,难以获取如此大量完整的数据。绝大多数情况下,数据的标签是不完整的。针对不完整标签数据的观测样本,提出如下改进的多任务深度学习模型,只要一个观测样本在任一任务中存在一个标签,即一个路段在某一时段内有行程时间的观测值,就可以对其加以利用。
将缺失标签的数据应用于模型之中,则有:
Figure GDA0002675032090000091
其中aji'表示第i'个样本对于第j个任务是否有标签,定义为:
Figure GDA0002675032090000092
aji'=0表示第i'个样本对于第j个任务没有标签,即没有观测值;这时候,相应的估计损失
Figure GDA0002675032090000093
将会被忽略,在多任务深度学习中,也不会再考虑梯度的问题。
每个任务中样本的数量不一样,所以每个任务的损失也不同。通过任务中的样本数的不同,标准化每个任务的损失如下:
Figure GDA0002675032090000094
Figure GDA0002675032090000095
表示第j个任务的平均估计损失,上式转化为:
Figure GDA0002675032090000096
此即为所提出的自适应权重的深度多任务学习模型,以此来估计城市路网中各路段的通行时间。
本发明提出的一种基于自适应多任务深度学习的城市路网行程时间估计方法,在此以北京的城市道路网络进行示例。
(1)数据说明
北京市整个城市包括148110个结点(交叉口)和196307个路段,路段总长度达22000km。从数字路网中提取道路的路段特征g(i),从北京的POI数据集中提取路段的环境特征c(i),从描述路网结构的道路连接数据集中提取路段的环境特征。路段行程时间的观测值从大规模稀疏的GPS轨迹数据集中获取,该数据集中包括2013年9月1日到10月31日的32670辆出租车的轨迹数据,共计达到6.7×108条。使用地图匹配算法将GPS轨迹数据匹配到路网上,计算通过各路段的车辆行程时间。
将上午7:00-9:00以30分钟为间隔划分为4个时间段。由于涉及到的车辆数量有限且一辆车租车在一个时段中只能通过有限个路段,很多路段会没有行程时间的观测值。表1展示了在不同时段有行程时间观测值的路段数量在路段总数中的占比,在第一个时段(早上7:00-7:30)内,只有50490个路段有行程时间的观测值,占比25.7%。
表1不同时段有行程时间观测值的路段占比
时段 7:00-7:30 7:30-8:00 8:00-8:30 8:30-9:00
有行程时间观测值的路段数量 52604 52616 51291 49396
有观测值的路段数占路段总数的百分比(%) 25.7 26.8 26.1 25.2
受GPS设备及地图匹配算法的影响,从GPS轨迹数据中获取的行程时间数据会有一定的误差。使用高斯混合模型来分析不合理的数据,将其标记为异常值。将3个多变量的高斯函数应用于路段长度和行程时间的对数空间中,将超出99%置信区间的数据标记为异常值。
为评估所提出模型的表现,按照3:1:1的比例,将有行程时间观测值的路段随机地划分为训练集、验证集和测试集。训练集用于有监督的训练,验证集用以判定是否终止训练,基于训练好的模型估计出的测试集中的行程时间用以评估模型效果。
(2)模型建立
为对比所提出模型(即能够处理不完整标签数据的自适应权重深度多任务学习模型,i-WDMTL)在路段行程时间估计上的效果,将其与以下四种方法做对比:反向传播神经网络(BPNN)、深度单任务学习(DSTL)、深度多任务学习(DMTL)、自适应权重的深度多任务学习(WDMTL)。
4个时段作为4个任务,同步进行多任务学习。考虑路段的空间相关特征时,在待估计路段的上下游各取3个路段,即m取3,则对于每一个待估计路段来说,考虑路段特征
Figure GDA0002675032090000101
环境特征
Figure GDA0002675032090000102
和空间相关特征的一个输入为d=(2m+1)×(7+11)=36×3+18=126维。多任务学习时,模型一次产生对应于4个时段的输出,其维度为4。
对于模型中的其他参数,在指定的参数范围中寻找最优值。模型的层数从{2,3,4,5,6}中选取,每层的神经元个数从{32,64,128,256,512,1024}中选取,采用Sigmoid非线性激活函数,权重惩罚系数λ、稀疏惩罚系数β、稀疏系数ρ、噪声系数η以0.001的步长从0到1变化。经过梯度搜索,得到各个模型的最优参数如表2所示。
表2模型结构与参数
Figure GDA0002675032090000111
(3)效果分析
采用三种常用的验证指标:平均绝对误差(MAE)、平均绝对百分比误差(MAPE)、根均方误差(RMSE)来评价所提出模型(i-WDMTL)的效果。表3展示了各种模型在4个时段的路段行程时间估计效果之间的对比,结果表明所提出的模型在行程时间估计上效果良好。
表3模型表现对比
Figure GDA0002675032090000112
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (7)

1.一种基于自适应多任务深度学习的城市路网行程时间估计方法,其特征在于,包括如下步骤:
1)、获取路网信息及影响路段上车辆行程时间的特征参数;
2)、通过堆叠的降噪稀疏自编码器实现单个时段内路段行程时间估计的单任务学习;
3)、将若干个时段的路段行程时间估计结合在同一个深度多任务学习模型之中;
上述步骤3)所述将若干时段的路段行程时间估计结合在同一个深度多任务学习模型之中的具体方法为:
实现
Figure FDA0002675032080000011
其中,W表示多任务深度学习的模型参数;
Figure FDA0002675032080000012
是第i个路段行程时间影响因素的特征向量,
Figure FDA0002675032080000013
是第j个时间段内第i个路段观测到的行程时间,j=1,2,…,T;i=1,2,…,N;fj(xi;W)是对应于输入xi的第j个任务的输出,L:
Figure FDA0002675032080000014
是一个损失函数,cj是单个任务的权重;第二项λΩ(W)是一个正则化项,用以惩罚W的复杂度,其中λ>0是正则化参数;
4)、通过程序自动调节多任务学习模型中各任务所占权重;
5)、在模型中应用缺失标签数据,建立最小化模型输出与路段行程时间观测值之间的误差训练模型,估计城市路网中各路段的通行时间。
2.根据权利要求1所述的基于自适应多任务深度学习的城市路网行程时间估计方法,其特征在于,步骤1)所述路网信息包括整个城市路网的路段数量、长度和节点数量;所述影响路段上车辆行程时间的特征参数包括路段特征、环境特征和空间相关特征。
3.根据权利要求1所述的基于自适应多任务深度学习的城市路网行程时间估计方法,其特征在于,步骤2)中实现单任务学习,步骤具体包括:
201、通过降噪稀疏自编码器获取原始输入中的数据特征;
202、最小化重构误差
Figure FDA0002675032080000015
其中的第一项是基于经验的损失项,N是样本数,xi表示第i个路段行程时间影响因素的特征向量,
Figure FDA0002675032080000016
是xi
Figure FDA0002675032080000017
之间的重构误差,第二项是控制稀疏的正则项,其中β是稀疏性惩罚权重,H是隐层的神经元数量,ρ是恒定的稀疏参数,
Figure FDA0002675032080000018
是训练集中隐层神经元j的稀疏度,KL(·)是Kullback-Leibler差异,或称KL距离,定义如下:
Figure FDA0002675032080000021
203、逐层训练模型。
4.根据权利要求3所述的基于自适应多任务深度学***方损失函数。
5.根据权利要求3所述的基于自适应多任务深度学习的城市路网行程时间估计方法,其特征在于,步骤4)所述调节多任务学习模型中各任务所占权重具体步骤包括:
通过最小化单任务损失函数的线性加权和来实现最小化多任务损失函数,所述多个任务总的损失函数为
Figure FDA0002675032080000022
结合贝叶斯模型,将上述最优化问题转化为如下优化问题:
Figure FDA0002675032080000023
其中σj是对应于第j个任务的高斯分布的标准差,Lj(W)是第j个任务的损失函数,末项为正则项。
6.根据权利要求5所述的基于自适应多任务深度学习的城市路网行程时间估计方法,其特征在于,步骤5)所述在模型中应用缺失标签数据的具体步骤包括:
构建最小化模型
Figure FDA0002675032080000024
其中aji'表示第i'个样本对于第j个任务是否有标签,定义为:
Figure FDA0002675032080000025
aji'=0表示第i'个样本对于第j个任务没有标签,即没有观测值;
标准化每个任务的损失为:
Figure FDA0002675032080000026
Figure FDA0002675032080000031
表示第j个任务的平均估计损失,上式转化为:
Figure FDA0002675032080000032
将其作为所提出的自适应权重的深度多任务学习模型,估计城市路网中各路段的通行时间;其中,末项是正则项。
7.根据权利要求6所述的基于自适应多任务深度学习的城市路网行程时间估计方法,其特征在于,所述自适应权重的深度多任务学习模型的末项选用l2范数。
CN201810141263.2A 2018-02-11 2018-02-11 基于自适应多任务深度学习的城市路网行程时间估计方法 Active CN108417029B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810141263.2A CN108417029B (zh) 2018-02-11 2018-02-11 基于自适应多任务深度学习的城市路网行程时间估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810141263.2A CN108417029B (zh) 2018-02-11 2018-02-11 基于自适应多任务深度学习的城市路网行程时间估计方法

Publications (2)

Publication Number Publication Date
CN108417029A CN108417029A (zh) 2018-08-17
CN108417029B true CN108417029B (zh) 2020-11-06

Family

ID=63128462

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810141263.2A Active CN108417029B (zh) 2018-02-11 2018-02-11 基于自适应多任务深度学习的城市路网行程时间估计方法

Country Status (1)

Country Link
CN (1) CN108417029B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109544919B (zh) * 2018-11-22 2020-11-10 北京交通大学 基于可靠性模型的混行站点路段小汽车通行时间估计方法
CN109712398B (zh) * 2019-01-22 2021-05-28 江苏智通交通科技有限公司 高速公路行程时间估计模型参数优化方法
CN111563639A (zh) * 2019-02-14 2020-08-21 北京嘀嘀无限科技发展有限公司 一种订单分配的方法和***
CN109920249B (zh) * 2019-03-12 2021-09-10 长沙理工大学 一种基于多模型融合的高速匝道行驶时间预测方法
CN111915874B (zh) * 2019-05-08 2021-05-28 中国科学院大学 一种道路平均通行时间预测方法
CN110378744A (zh) * 2019-07-25 2019-10-25 中国民航大学 面向不完备数据***的民航常旅客价值分类方法及***
CN110415521B (zh) * 2019-07-31 2021-03-05 京东城市(北京)数字科技有限公司 交通数据的预测方法、装置和计算机可读存储介质
CN110824142B (zh) * 2019-11-13 2022-06-24 杭州鲁尔物联科技有限公司 一种地质灾害的预测方法、装置及设备
CN110852524B (zh) * 2019-11-19 2023-04-18 腾讯科技(深圳)有限公司 时间窗口的确定方法、装置、设备及存储介质
CN111309915B (zh) * 2020-03-03 2022-09-13 爱驰汽车有限公司 联合学习的自然语言训练方法、***、设备及存储介质
CN113627419B (zh) * 2020-05-08 2024-07-16 百度在线网络技术(北京)有限公司 兴趣区域评估方法、装置、设备和介质
CN111932872B (zh) * 2020-06-29 2022-08-02 阿里巴巴集团控股有限公司 一种交通控制方法、装置及电子设备
CN113159390A (zh) * 2021-03-27 2021-07-23 桂林理工大学 一种面向参数不确定路程规划问题的蚁群寻优方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104091081A (zh) * 2014-07-15 2014-10-08 中国科学院自动化研究所 一种交通数据弥补方法
CN104900063A (zh) * 2015-06-19 2015-09-09 中国科学院自动化研究所 一种短程行驶时间预测方法
CN106251625A (zh) * 2016-08-18 2016-12-21 上海交通大学 大数据环境下立体城市交通路网全局状态预测方法
CN106384507A (zh) * 2016-09-20 2017-02-08 宁波大学 基于稀疏检测器的行程时间实时估计方法
KR20170048029A (ko) * 2015-10-26 2017-05-08 현대오토에버 주식회사 딥 러닝 기반 도로 정보 제공 방법 및 장치
CN106981198A (zh) * 2017-05-24 2017-07-25 北京航空航天大学 用于旅行时间预测的深度学习网络模型及其建立方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07272190A (ja) * 1994-02-09 1995-10-20 Toshiba Corp 信号制御システム
CN114973677A (zh) * 2016-04-18 2022-08-30 北京嘀嘀无限科技发展有限公司 用于确定预计到达时间的方法和设备
CN106096767A (zh) * 2016-06-07 2016-11-09 中国科学院自动化研究所 一种基于lstm的路段行程时间预测方法
CN109993969B (zh) * 2019-03-08 2022-04-15 腾讯大地通途(北京)科技有限公司 一种路况判定信息获取方法、装置及设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104091081A (zh) * 2014-07-15 2014-10-08 中国科学院自动化研究所 一种交通数据弥补方法
CN104900063A (zh) * 2015-06-19 2015-09-09 中国科学院自动化研究所 一种短程行驶时间预测方法
KR20170048029A (ko) * 2015-10-26 2017-05-08 현대오토에버 주식회사 딥 러닝 기반 도로 정보 제공 방법 및 장치
CN106251625A (zh) * 2016-08-18 2016-12-21 上海交通大学 大数据环境下立体城市交通路网全局状态预测方法
CN106384507A (zh) * 2016-09-20 2017-02-08 宁波大学 基于稀疏检测器的行程时间实时估计方法
CN106981198A (zh) * 2017-05-24 2017-07-25 北京航空航天大学 用于旅行时间预测的深度学习网络模型及其建立方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Deep Architecture for Traffic Flow Prediction: Deep;Wenhao Huang;《IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS》;20141031;第15卷;全文 *
基于叠加模型的多任务学习及应用;黄艾青;《中国优秀硕士学位论文全文数据库 信息科技辑》;20150915(第9期);参见正文第7-8页 *

Also Published As

Publication number Publication date
CN108417029A (zh) 2018-08-17

Similar Documents

Publication Publication Date Title
CN108417029B (zh) 基于自适应多任务深度学习的城市路网行程时间估计方法
Qin et al. Red tide time series forecasting by combining ARIMA and deep belief network
CN109919358B (zh) 一种基于神经网络时空注意力机制的实时站点流量预测方法
Xu et al. Real-time prediction of taxi demand using recurrent neural networks
Wen et al. A novel spatiotemporal convolutional long short-term neural network for air pollution prediction
Shahriari et al. Ensemble of ARIMA: combining parametric and bootstrapping technique for traffic flow prediction
Nagendra et al. Artificial neural network approach for modelling nitrogen dioxide dispersion from vehicular exhaust emissions
Lv et al. Stacked autoencoder with echo-state regression for tourism demand forecasting using search query data
Ruiz-Aguilar et al. Hybrid approaches based on SARIMA and artificial neural networks for inspection time series forecasting
Winters Forecasting sales by exponentially weighted moving averages
CN111696355A (zh) 动态图卷积交通速度预测方法
JingTao et al. Guidelines for financial forecasting with neural networks
Joseph Neural hierarchical models of ecological populations
Lorenz et al. Interpretable machine learning for real estate market analysis
CN105493109A (zh) 使用多个数据源的空气质量推断
CN111160622A (zh) 基于混合神经网络模型的景区客流预测方法和装置
CN110162744B (zh) 一种基于张量的车联网数据缺失多重估计新方法
CN112785077A (zh) 基于时空数据的出行需求预测方法及***
CN112071062A (zh) 一种基于图卷积网络和图注意力网络的行车时间估计方法
CN111862592A (zh) 一种基于rgcn的交通流预测方法
CN111242395A (zh) 用于od数据的预测模型构建方法及装置
CN117494871A (zh) 一种考虑船舶交互影响的船舶轨迹预测方法
Li et al. Parking demand forecasting based on improved complete ensemble empirical mode decomposition and GRU model
Shmueli Applications of neural networks in transportation planning
Xu et al. A taxi dispatch system based on prediction of demand and destination

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant