CN106023588B - 一种基于交通大数据的行程时间提取、预测及查询方法 - Google Patents

一种基于交通大数据的行程时间提取、预测及查询方法 Download PDF

Info

Publication number
CN106023588B
CN106023588B CN201610424968.6A CN201610424968A CN106023588B CN 106023588 B CN106023588 B CN 106023588B CN 201610424968 A CN201610424968 A CN 201610424968A CN 106023588 B CN106023588 B CN 106023588B
Authority
CN
China
Prior art keywords
time
data
path
journey
real
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201610424968.6A
Other languages
English (en)
Other versions
CN106023588A (zh
Inventor
付建胜
陈政
王少飞
汤春
周后飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Merchants Chongqing Communications Research and Design Institute Co Ltd
Original Assignee
China Merchants Chongqing Communications Research and Design Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Merchants Chongqing Communications Research and Design Institute Co Ltd filed Critical China Merchants Chongqing Communications Research and Design Institute Co Ltd
Priority to CN201610424968.6A priority Critical patent/CN106023588B/zh
Publication of CN106023588A publication Critical patent/CN106023588A/zh
Application granted granted Critical
Publication of CN106023588B publication Critical patent/CN106023588B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0108Measuring and analyzing of parameters relative to traffic conditions based on the source of data
    • G08G1/0112Measuring and analyzing of parameters relative to traffic conditions based on the source of data from the vehicle, e.g. floating car data [FCD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Traffic Control Systems (AREA)

Abstract

一种基于交通大数据的行程时间提取、预测及查询方法,在线处理部分包括以下步骤:S1:采集历史浮动车数据,构建历史和实时数据库;S2:标定用户的查询模式;S3:自动计时与实时采集浮动车数据;S4:当前时刻t是否等于用户查询的终止时刻;S5:选取路网中其他未处理的路段或路径,进行实时行程时间拟合分析;S6:是否历遍所有路段和路径;S7:是否结束查询。本发明的有益效果提取路网行程时间精度高,同时数据处理快、稳定性高。通过大量浮动车数据来获取和预测路网行程时间的方法可同时进行实时、预测、历史路网行程时间的处理。可在复杂的海量浮动车数据时,保证数据存储与读写的实时性更强,定位精度高,满足用户的需求,用户体验非常好。

Description

一种基于交通大数据的行程时间提取、预测及查询方法
技术领域
本发明涉及智能交通领域,具体涉及一种基于交通大数据的行程时间提取、预测及查询方法。
背景技术
当前,路网交通信息提取的常用方法是利用车载导航设备或路侧设备提供的交通数据,甚至只依赖路侧设备提供的交通数据来获取浮动车交通信息,大范围长时间全部提取所有单车行车路程的定位点,会导致***负荷非常大。
利用路侧设备提供的交通数据来获取行程时间方法主要通过路侧设备或者说是卡口设备来获取经过车辆的行程时间数据,由于信息提取设备单一化,通常会造成比较大的偏差,同时数据处理又比较耗时。通过大量浮动车来获取和预测路网行程时间的方法通常又比较单一简单,如求和、求均等运算,运算精度得不到有效保证。由此可见,通过单一设备来获取和预测行程时间通常会存在稳定性问题,通过大量浮动车来获取和预测行程时间又存在一定的方法论问题。即,现有方法的信息采集手段或处理手段等方面存在许多不足之处。
发明内容
为解决现有的浮动车交通信息提取和轨迹跟踪方法存在实时性较差、精度偏低,交通信息采集或处理手段存在缺陷等方面的问题,本发明提出了一种基于交通大数据的行程时间提取、预测及查询方法。
本发明提出的一种基于交通大数据的行程时间提取、预测及查询方法,包括在线处理部分和离线处理部分,其特征在于,所述在线处理部分包括以下步骤:
S1:采集历史浮动车数据,构建历史和实时数据库;
S2:标定用户的查询模式,其中,所述查询模式包括历史查询、实时查询和预测查询;
S3:自动计时与实时采集浮动车数据;
S4:当前时刻t是否等于用户查询的终止时刻;是则,执行步骤S5;否则执行步骤S7;
S5:选取路网中其他未处理的路段或路径,进行实时行程时间拟合分析;
S6:是否历遍所有路段和路径;是则,执行步骤S7;否则,返回执行步骤S5;
S7:是否结束查询;是则,结束;否则,返回执行步骤S2。
进一步的,所述步骤S7之前还包括步骤S8与S9;
S8:查询路网的历史行程时间是否变化;是则,执行步骤S9;
S9:根据用户标定的查询时间范围和路径集或路段集,从所述历史和实时数据库中读取相应的路网行程时间并按时间先后顺序进行动态显示。
进一步的,所述步骤S7之前还包括步骤S10-S15;
S10:查询路网的实时行程时间是否变化;是则,执行步骤S11;否则,执行步骤S15;
S11:根据用户标定的路径或路段集编号的先后顺序,选取路网中其他未处理的路段或路径,进行路网行程时间实时融合;
S12:用户标定的路径或路段是否全部检索完毕;是则,执行步骤S13;否则,返回执行步骤S11;
S13:将当前时刻t的行程时间投影到路网中进行动态显示;
S14:当前时刻t是否超出用户设定的时间范围;是则,执行步骤S15;否则,返回执行步骤S3;
S15:动态刷新当前时刻t。
进一步的,所述步骤S11的路网行程时间实时融合方法具体为:从所述数据库中获取当前时段Q内的浮动车行程时间数据,通过均值法获取当前时刻t的行程时间F(t);从所述实时数据库中获取上一个时段的实时行程时间拟合(Real-time Travel-time Fitting,RTF)模型参数,通过所述RTF模型获取当前时刻t的行程时间R(t);从实时和历史数据库中获取相应的路段或路径行程时间序列及行程时间短时预测(Travel-time Short-timePrediction,TSP)模型参数,通过所述TSP模型获取当前时刻t的行程时间S(t);对所述F(t)、R(t)和S(t)进行融合处理,获取当前时刻t的最终行程时间U(t)。
进一步的,所述步骤S7之前还包括步骤S16-S19;
S16:查询路网的短时预测行程时间是否变化;是则,执行步骤S17;否则,执行步骤S7;
S17:根据用户标定的路径或路段集编号的先后顺序,选取路网中其他未处理的路段或路径,进行行程时间短时融合预测分析;
S18:用户标定的路径或路段是否完全检索完毕;是则,执行步骤S19;否则,返回执行步骤S17;
S19:按照时间先后顺序,将获取的行程时间短时预测数据投影到路网上进行动态显示。
进一步的,所述步骤S17的行程时间短时融合预测分析方法具体为:根据用户的查询时间范围,标定出所述时间范围内的出行类别或出行类别组合,并从历史数据库中获取相应的TSP模型参数以及相应的覆盖时段;以当前时段Q的起始时刻t0为参考时间点,从历史和实时数据库中读取相应的路段或路径行程时间数据,形成一个行程时间序列G;从实时数据库中获取当前时段Q内的浮动车行程时间数据,并结合行程时间数据G,通过TRF模型获取当前时刻的行程时间U(t);按照时间的先后顺序,将行程时间U(t)与G进行重组合并,形成一个行程时间序列W,将行程时间W作为TSP模型的输入参数,由此获取用户标定时间范围内的行程时间序列Y1;从实时数据库中所述路段或路径的最新RTF模型,通过RTF模型获取查询时间范围内的行程时间预测值Y2;对所述Y1和Y2进行融合处理,获得的预测序列Y即为所述路段或路径的行程时间短时预测序列。
进一步的,所述步骤S1具体包括:从所述历史数据库中读取离线处理信息,所述历史数据库的数据包括:路段相关数据、路径相关数据及时间相关数据;
所述路段相关数据包括:所有路段编号以及相应的历史行程时间拟合(Historical Travel-time Fitting,HTF)模型参数和所述TSP模型参数、所有路段的行程时间及其统计特征等数据;其中,每一条路段行程时间数据包括大小、时间戳、路段属性的信息;
所述路径相关数据包括:所有备选路径编号及其历史行程时间拟合HTF模型参数和TSP模型参数、所有备选路径的行程时间及其统计特征等数据;其中每一条路径行程时间数据包括大小、时间戳、路径属性的信息;
所述时间相关数据包括:以一天为一个循环周期的时间周期划分方式及相应编号、出行类别划分方式及相应编号、行程时间数据的最终时间戳T;其中,所述最终时间戳T表示历史数据库中行程时间数据所对应的最终时间戳,即为时间戳数据中离当前时刻t最近的那个时间戳。
进一步的,所述步骤S2具体包括:
用户选取查询模式,包括历史、实时和预测三种查询模式,用户的查询需求可为一种或多种查询模式;
针对用户选取的任意一种查询模式,由用户设置查询的起始时刻和终止时刻,由此获得相应的查询时间范围,其中实时和预测查询模式的起始时刻默认为当前时刻t;
针对用户选取的任意一种查询模式,由用户选取查询的路网区域或某条路径,由此获得相应的查询路网范围;
针对用户选取的查询模式,当用户查询某个路网区域时,标定出所述路网区域所包含和交叉的所有路段以及相应的路段编号,形成用户在所述查询模式下的查询路段集;
针对用户选定的查询模式,当用户查询某条路径时,将用户选取的路径与历史数据库中的备份路径集进行比较:如果存在匹配路径,标定出相应的查询路径编号;如果不存在匹配路径,标定出所述路径所包含的路段编号,形成用户在所述查询模式下的查询路段集。
进一步的,所述步骤S3具体包括:
快速检索所述历史数据库中路网行程时间数据的最终时间戳T,以最终时间戳T为基准,设置一个步长T1对时间进行动态跟踪和采样处理,按照先后顺序将时间分成若干时段并编号,使得当前时刻t永远落在当前时段内,动态刷新当前时段的编号Q、起始时刻t0和终止时刻t1,则有t0<t≤t1
将最终时间戳T到时刻t0之间的时间段设置为一个时间范围,从所述实时数据库中获取该时间范围内的路网行程时间数据、以及各路段和备份路径的实时行程时间拟合模型参数;
从所述实时数据库中动态采集当前时段Q内的所有浮动车行程时间数据,所述浮动车行程时间数据包括行程时间的大小、路段或路径属性、时间戳、车辆编号;
所述步骤S5具体包括:针对选取的路段或路径,进行实时行程时间拟合(Real-time Travel-time Fitting,RTF)算法分析:设置时段数M,将当前时段Q以及前面M个时段的时间合并成一个时间范围,从实时和历史数据库中获取所述时间范围内的浮动车和路网行程时间数据;设置项数N,构造一个二元N次多项式对路段或路径行程时间数据以及相应的浮动车行程时间数据进行拟合,并采用列文伯格-马夸尔特(Levenberg Marquardt,LM)算法快速求解多项式的系数,所述系数即为RTF模型参数;根据求解出的RTF模型,等时距采样当前时段Q和相邻时段Q+1范围内的路网行程时间序列值,在实时数据库中存储并动态刷新RTF模型参数和行程时间序列值。
进一步的,所述离线处理部分包括以下步骤:
S20:从所述历史数据库中获取路网数据,所述路网数据包括路网拓扑结构数据、所有路段编号以及备份路径编号,从历史数据库中获取浮动车在路网中的行程时间历史数据,包括各路段和路径的历经浮动车行程时间数据;
S21:根据路段和路径编号的先后顺序,选取一条未处理的路段或路径;
S22:针对选定的路段或路径,读取所述路段或路径的历经浮动车行程时间数据,,以每天0:00到24:00为一个周期,依据时间戳的先后顺序对行程时间数据进行周期划分,并对划分的时间周期进行编号;
S23:根据所述时间周期编号的先后顺序,选取一个未处理的时间周期;
S24:历史行程时间拟合(Historical Travel-time Fitting,HTF)模型计算:针对所述时间周期内的浮动车行程时间数据,设置项数N,构造一个二元N次多项式对行程时间数据进行拟合,采用列文伯格-马夸尔特(Levenberg Marquardt,LM)算法快速求解多项式系数,即为HTF模型参数;根据求解出的多项式模型,等间距采样所述时间周期内的行程时间序列值,将所述行程时间序列值作为所述路段或路径在所述时间周期的行程时间序列并存储到历史数据库中;
S25:所有时间周期是否遍历完毕;是则,执行步骤S26;否则,返回执行S23;
S26:按照工作日、休息日、节假日等出行方式,对行程时间的周期进行出行类别划分和编号;
S27:根据出行类别的先后顺序,选取一种未处理的出行类型;
S28:进行行程时间统计分析:采用核密度估计(Kernel Density Estimation,KDE)方法,计算行程时间数据的概率密度,提取概率密度最大值对应的行程时间作为所述路段或路径在该出行类别下的平均行程时间;对概率密度进行积分处理,获得相应的概率分布,对概率分布进行修正和等间距采样,获得行程时间的概率分布序列;将所述路段或路径的行程时间的平均值和概率分布序列存储到历史数据库中;
S29:行程时间短时预测(Travel-time Short-time Prediction,TSP)模型计算:按照时间的先后顺序,将行程时间数据进行排序形成一个长的数据序列;假定所述长序列相邻元素的时距相等,构造一个多项时间序列模型来拟合所述长序列,由此生成一个拟合矩阵方程,用最小二乘法(Least Square Method,LSM)求解该方程并计算相应的拟合误差;变动时间序列模型的项数,用相同方法求解拟合矩阵方程以及相应的拟合误差,并找到拟合误差最小值对应的项数M及相应的时间序列模型,所述时间序列模型即为所述路段或路径在指定出行类别条件下的TSP模型;由项数M计算出所述TSP模型的覆盖时段,将所述TSP模型参数和覆盖时段存入历史数据库中;
S30:所有出行类别是否遍历完毕;是则,执行步骤S31;否则,返回执行S27;
S31:所有路段或路径是否遍历完毕;是则,执行步骤S32;否则,返回执行S21;
S32:离线数据整理和存储:将所有路段和备选路径的行程时间数据、行程时间的平均值及概率分布序列、行程时间数据的最终时间戳、相应的TSP模型参数及覆盖时段的信息存入历史数据库中。
本发明的有益效果为提取路网行程时间精度高,同时数据处理快、稳定性高。通过大量浮动车数据来获取和预测路网行程时间的方法可同时进行实时、预测、历史路网行程时间的处理。可在复杂的海量浮动车数据时,保证数据存储与读写的实时性更强,定位精度高,满足用户的需求,用户体验非常好。
附图说明
图1为本发明一种基于交通大数据的行程时间提取、预测及查询方法的在线处理部分一实施方式的流程图。
图2为本发明一种基于交通大数据的行程时间提取、预测及查询方法的在线处理部分一具体实施例的流程图。
图3为本发明一种基于交通大数据的行程时间提取、预测及查询方法的离线处理部分一实施方式的流程图。
具体实施方式
请参阅图1,为本发明一种基于交通大数据的行程时间提取、预测及查询方法的在线处理部分一实施方式的流程图。
一种基于交通大数据的行程时间提取、预测及查询方法包括以下步骤:包括在线处理部分和离线处理部分。在线处理部分包括以下步骤:S1:采集历史浮动车数据,构建历史和实时数据库;S2:标定用户的查询模式,其中,查询模式包括历史查询、实时查询和预测查询;S3:自动计时与实时采集浮动车数据;S4:当前时刻t是否等于用户查询的终止时刻;是则,执行步骤S5;否则执行步骤S7;S5:选取路网中其他未处理的路段或路径,进行实时行程时间拟合分析;S6:是否历遍所有路段和路径;是则,执行步骤S7;否则,返回执行步骤S5;S7:是否结束查询;是则,结束;否则,返回执行步骤S2。
请参阅图2,为本发明一种基于交通大数据的行程时间提取、预测及查询方法的在线处理部分一具体实施例的流程图。
在本实施方式中,在线处理部分包括以下步骤:S1:采集历史浮动车数据,构建历史和实时数据库;S2:标定用户的查询模式,其中,查询模式包括历史查询、实时查询和预测查询;S3:自动计时与实时采集浮动车数据;S4:当前时刻t是否等于用户查询的终止时刻;是则,执行步骤S5;否则执行步骤S7;S5:选取路网中其他未处理的路段或路径,进行实时行程时间拟合分析;S6:是否历遍所有路段和路径;是则,执行步骤S7;否则,返回执行步骤S5;S7:是否结束查询;是则,结束;否则,返回执行步骤S2。
在本实施例中,步骤S7之前还包括步骤S8与S9。S8:查询路网的历史行程时间是否变化;是则,执行步骤S9。S9:根据用户标定的查询时间范围和路径集或路段集,从历史和实时数据库中读取相应的路网行程时间并按时间先后顺序进行动态显示。
在本实施例中,步骤S7之前还包括步骤S10-S15。S10:查询路网的实时行程时间是否变化;是则,执行步骤S11;否则,执行步骤S15。
S11:根据用户标定的路径或路段集编号的先后顺序,选取路网中其他未处理的路段或路径,进行路网行程时间实时融合。
S12:用户标定的路径或路段是否全部检索完毕;是则,执行步骤S13;否则,返回执行步骤S11。
S13:将当前时刻t的行程时间投影到路网中进行动态显示。
S14:当前时刻t是否超出用户设定的时间范围;是则,执行步骤S15;否则,返回执行步骤S3。
S15:动态刷新当前时刻t。
在一具体实施例中,步骤S11的路网行程时间实时融合方法具体为:从数据库中获取当前时段Q内的浮动车行程时间数据,通过均值法获取当前时刻t的行程时间F(t);从实时数据库中获取上一个时段的实时行程时间拟合(Real-time Travel-time Fitting,RTF)模型参数,通过RTF模型获取当前时刻t的行程时间R(t);从实时和历史数据库中获取相应的路段或路径行程时间序列及TSP模型参数,通过TSP模型获取当前时刻t的行程时间S(t);对F(t)、R(t)和S(t)进行融合处理,获取当前时刻t的最终行程时间U(t)。
在本实施例中,步骤S7之前还包括步骤S16-S19。S16:查询路网的短时预测行程时间是否变化;是则,执行步骤S17;否则,执行步骤S7。S17:根据用户标定的路径或路段集编号的先后顺序,选取路网中其他未处理的路段或路径,进行行程时间短时融合预测分析。S18:用户标定的路径或路段是否完全检索完毕;是则,执行步骤S19;否则,返回执行步骤S17。S19:按照时间先后顺序,将获取的行程时间短时预测数据投影到路网上进行动态显示。
在一具体实施例中,步骤S17的行程时间短时融合预测分析方法具体为:根据用户的查询时间范围,标定出时间范围内的出行类别或出行类别组合,并从历史数据库中获取相应的TSP模型参数以及相应的覆盖时段;以当前时段Q的起始时刻t0为参考时间点,从历史和实时数据库中读取相应的路段或路径行程时间数据,形成一个行程时间序列G;从实时数据库中获取当前时段Q内的浮动车行程时间数据,并结合行程时间数据G,通过TRF模型获取当前时刻的行程时间U(t);按照时间的先后顺序,将行程时间U(t)与G进行重组合并,形成一个行程时间序列W,将行程时间W作为TSP模型的输入参数,由此获取用户标定时间范围内的行程时间序列Y1;从实时数据库中路段或路径的最新RTF模型,通过RTF模型获取查询时间范围内的行程时间预测值Y2;对Y1和Y2进行融合处理,获得的预测序列Y即为路段或路径的行程时间短时预测序列。
步骤S1具体包括:从历史数据库中读取离线处理信息,历史数据库的数据包括:路段相关数据、路径相关数据及时间相关数据。路段相关数据包括:所有路段编号以及相应的历史行程时间拟合(Historical Travel-time Fitting,HTF)模型参数和行程时间短时预测(Travel-time Short-time Prediction,TSP)模型参数、所有路段的行程时间及其统计特征等数据;其中,每一条路段行程时间数据包括大小、时间戳、路段属性的信息。路径相关数据包括:所有备选路径编号及其历史行程时间拟合HTF模型参数和TSP模型参数、所有备选路径的行程时间及其统计特征等数据;其中每一条路径行程时间数据包括大小、时间戳、路径属性的信息。时间相关数据包括:以一天为一个循环周期的时间周期划分方式及相应编号、出行类别划分方式及相应编号、行程时间数据的最终时间戳T;其中,最终时间戳T表示历史数据库中行程时间数据所对应的最终时间戳,即为时间戳数据中离当前时刻t最近的那个时间戳。
步骤S2具体包括:用户选取查询模式,包括历史、实时和预测三种查询模式,用户的查询需求可为一种或多种查询模式。针对用户选取的任意一种查询模式,由用户设置查询的起始时刻和终止时刻,由此获得相应的查询时间范围,其中实时和预测查询模式的起始时刻默认为当前时刻t。针对用户选取的任意一种查询模式,由用户选取查询的路网区域或某条路径,由此获得相应的查询路网范围。针对用户选取的查询模式,当用户查询某个路网区域时,标定出路网区域所包含和交叉的所有路段以及相应的路段编号,形成用户在查询模式下的查询路段集。针对用户选定的查询模式,当用户查询某条路径时,将用户选取的路径与历史数据库中的备份路径集进行比较:如果存在匹配路径,标定出相应的查询路径编号;如果不存在匹配路径,标定出路径所包含的路段编号,形成用户在查询模式下的查询路段集。
步骤S3具体包括:快速检索历史数据库中路网行程时间数据的最终时间戳T,以最终时间戳T为基准,设置一个步长T1对时间进行动态跟踪和采样处理,按照先后顺序将时间分成若干时段并编号,使得当前时刻t永远落在当前时段内,动态刷新当前时段的编号Q、起始时刻t0和终止时刻t1,则有t0<t≤t1。将最终时间戳T到时刻t0之间的时间段设置为一个时间范围,从实时数据库中获取该时间范围内的路网行程时间数据、以及各路段和备份路径的实时行程时间拟合模型参数。从实时数据库中动态采集当前时段Q内的所有浮动车行程时间数据,浮动车行程时间数据包括行程时间的大小、路段或路径属性、时间戳、车辆编号。
步骤S5具体包括:针对选取的路段或路径,进行实时行程时间拟合(Real-timeTravel-time Fitting,RTF)算法分析:设置时段数M,将当前时段Q以及前面M个时段的时间合并成一个时间范围,从实时和历史数据库中获取时间范围内的浮动车和路网行程时间数据。设置项数N,构造一个二元N次多项式对路段或路径行程时间数据以及相应的浮动车行程时间数据进行拟合,并采用列文伯格-马夸尔特(Levenberg Marquardt,LM)算法快速求解多项式的系数,系数即为RTF模型参数。根据求解出的RTF模型,等时距采样当前时段Q和相邻时段Q+1范围内的路网行程时间序列值,在实时数据库中存储并动态刷新RTF模型参数和行程时间序列值。
请参阅图3,为本发明一种基于交通大数据的行程时间提取、预测及查询方法的离线处理部分一实施方式的流程图。
S20:从历史数据库中获取路网数据,路网数据包括路网拓扑结构数据、所有路段编号以及备份路径编号,从历史数据库中获取浮动车在路网中的行程时间历史数据,包括各路段和路径的历经浮动车行程时间数据。
S21:根据路段和路径编号的先后顺序,选取一条未处理的路段或路径。
S22:针对选定的路段或路径,读取路段或路径的历经浮动车行程时间数据,,以每天0:00到24:00为一个周期,依据时间戳的先后顺序对行程时间数据进行周期划分,并对划分的时间周期进行编号。
S23:根据时间周期编号的先后顺序,选取一个未处理的时间周期。
S24:历史行程时间拟合(Historical Travel-time Fitting,HTF)模型计算:针对时间周期内的浮动车行程时间数据,设置项数N,构造一个二元N次多项式对行程时间数据进行拟合,采用列文伯格-马夸尔特(Levenberg Marquardt,LM)算法快速求解多项式系数,即为HTF模型参数;根据求解出的多项式模型,等间距采样时间周期内的行程时间序列值,将行程时间序列值作为路段或路径在时间周期的行程时间序列并存储到历史数据库中。
S25:所有时间周期是否遍历完毕;是则,执行步骤S26;否则,返回执行S23。
S26:按照工作日、休息日、节假日等出行方式,对行程时间的周期进行出行类别划分和编号。
S27:根据出行类别的先后顺序,选取一种未处理的出行类型。
S28:进行行程时间统计分析:采用核密度估计(Kernel Density Estimation,KDE)方法,计算行程时间数据的概率密度,提取概率密度最大值对应的行程时间作为路段或路径在该出行类别下的平均行程时间;对概率密度进行积分处理,获得相应的概率分布,对概率分布进行修正和等间距采样,获得行程时间的概率分布序列;将路段或路径的行程时间的平均值和概率分布序列存储到历史数据库中。
S29:行程时间短时预测(Travel-time Short-time Prediction,TSP)模型计算:按照时间的先后顺序,将行程时间数据进行排序形成一个长的数据序列;假定长序列相邻元素的时距相等,构造一个多项时间序列模型来拟合长序列,由此生成一个拟合矩阵方程,用最小二乘法(Least Square Method,LSM)求解该方程并计算相应的拟合误差;变动时间序列模型的项数,用相同方法求解拟合矩阵方程以及相应的拟合误差,并找到拟合误差最小值对应的项数M及相应的时间序列模型,时间序列模型即为路段或路径在指定出行类别条件下的TSP模型;由项数M计算出TSP模型的覆盖时段,将TSP模型参数和覆盖时段存入历史数据库中。
S30:所有出行类别是否遍历完毕;是则,执行步骤S31;否则,返回执行S27。
S31:所有路段或路径是否遍历完毕;是则,执行步骤S32;否则,返回执行S21。
S32:离线数据整理和存储:将所有路段和备选路径的行程时间数据、行程时间的平均值及概率分布序列、行程时间数据的最终时间戳、相应的TSP模型参数及覆盖时段的信息存入历史数据库中。
本发明的有益效果为提取路网行程时间精度高,同时数据处理快、稳定性高。通过大量浮动车数据来获取和预测路网行程时间的方法可同时进行实时、预测、历史路网行程时间的处理。可在复杂的海量浮动车数据时,保证数据存储与读写的实时性更强,定位精度高,满足用户的需求,用户体验非常好。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于交通大数据的行程时间提取、预测及查询方法,包括在线处理部分和离线处理部分,其特征在于,所述在线处理部分包括以下步骤:
S1:采集历史浮动车数据,构建历史和实时数据库;
S2:标定用户的查询模式,其中,所述查询模式包括历史查询、实时查询和预测查询;
S3:自动计时与实时采集浮动车数据;
S4:当前时刻t是否等于用户查询的终止时刻;是则,执行步骤S5;否则执行步骤S7;
S5:选取路网中其他未处理的路段或路径,进行实时行程时间拟合分析;
S6:是否历遍所有路段和路径;是则,执行步骤S7;否则,返回执行步骤S5;
S7:是否结束查询;是则,结束;否则,返回执行步骤S2;
所述步骤S7之前还包括步骤S10-S15;
S10:查询路网的实时行程时间是否变化;是则,执行步骤S11;否则,执行步骤S15;
S11:根据用户标定的路径或路段集编号的先后顺序,选取路网中其他未处理的路段或路径,进行路网行程时间实时融合;
S12:用户标定的路径或路段是否全部检索完毕;是则,执行步骤S13;否则,返回执行步骤S11;
S13:将当前时刻t的行程时间投影到路网中进行动态显示;
S14:当前时刻t是否超出用户设定的时间范围;是则,执行步骤S15;否则,返回执行步骤S3;
S15:动态刷新当前时刻t;
所述步骤S11的路网行程时间实时融合方法具体为:从所述数据库中获取当前时段Q内的浮动车行程时间数据,通过均值法获取当前时刻t的行程时间F(t);从所述实时数据库中获取上一个时段的实时行程时间拟合(Real-time Travel-time Fitting,RTF)模型参数,通过所述RTF模型获取当前时刻t的行程时间R(t);从实时和历史数据库中获取相应的路段或路径行程时间序列及行程时间短时预测(Travel-time Short-time Prediction,TSP)模型参数,通过所述TSP模型获取当前时刻t的行程时间S(t);对所述F(t)、R(t)和S(t)进行融合处理,获取当前时刻t的最终行程时间U(t)。
2.如权利要求1所述的基于交通大数据的行程时间提取、预测及查询方法,其特征在于,所述步骤S7之前还包括步骤S8与S9;
S8:查询路网的历史行程时间是否变化;是则,执行步骤S9;
S9:根据用户标定的查询时间范围和路径集或路段集,从所述历史和实时数据库中读取相应的路网行程时间并按时间先后顺序进行动态显示。
3.如权利要求1所述的基于交通大数据的行程时间提取、预测及查询方法,其特征在于,所述步骤S7之前还包括步骤S16-S19;
S16:查询路网的短时预测行程时间是否变化;是则,执行步骤S17;否则,执行步骤S7;
S17:根据用户标定的路径或路段集编号的先后顺序,选取路网中其他未处理的路段或路径,进行行程时间短时融合预测分析;
S18:用户标定的路径或路段是否完全检索完毕;是则,执行步骤S19;否则,返回执行步骤S17;
S19:按照时间先后顺序,将获取的行程时间短时预测数据投影到路网上进行动态显示。
4.如权利要求3所述的基于交通大数据的行程时间提取、预测及查询方法,其特征在于,所述步骤S17的行程时间短时融合预测分析方法具体为:根据用户的查询时间范围,标定出所述时间范围内的出行类别或出行类别组合,并从历史数据库中获取相应的TSP模型参数以及相应的覆盖时段;以当前时段Q的起始时刻t0为参考时间点,从历史和实时数据库中读取相应的路段或路径行程时间数据,形成一个行程时间序列G;从实时数据库中获取当前时段Q内的浮动车行程时间数据,并结合行程时间数据G,通过TRF模型获取当前时刻的行程时间U(t);按照时间的先后顺序,将行程时间U(t)与G进行重组合并,形成一个行程时间序列W,将行程时间W作为TSP模型的输入参数,由此获取用户标定时间范围内的行程时间序列Y1;从实时数据库中所述路段或路径的最新RTF模型,通过RTF模型获取查询时间范围内的行程时间预测值Y2;对所述Y1和Y2进行融合处理,获得的预测序列Y即为所述路段或路径的行程时间短时预测序列。
5.根据权利要求1所述的基于交通大数据的行程时间提取、预测及查询方法,其特征在于,所述步骤S1具体包括:从所述历史数据库中读取离线处理信息,所述历史数据库的数据包括:路段相关数据、路径相关数据及时间相关数据;
所述路段相关数据包括:所有路段编号以及相应的历史行程时间拟合(HistoricalTravel-time Fitting,HTF)模型参数和所述TSP模型参数、所有路段的行程时间及其统计特征数据;其中,每一条路段行程时间数据包括大小、时间戳、路段属性的信息;
所述路径相关数据包括:所有备选路径编号及其历史行程时间拟合HTF模型参数和TSP模型参数、所有备选路径的行程时间及其统计特征数据;其中每一条路径行程时间数据包括大小、时间戳、路径属性的信息;
所述时间相关数据包括:以一天为一个循环周期的时间周期划分方式及相应编号、出行类别划分方式及相应编号、行程时间数据的最终时间戳T;其中,所述最终时间戳T表示历史数据库中行程时间数据所对应的最终时间戳,即为时间戳数据中离当前时刻t最近的那个时间戳。
6.根据权利要求1所述的基于交通大数据的行程时间提取、预测及查询方法,其特征在于,所述步骤S2具体包括:
用户选取查询模式,包括历史、实时和预测三种查询模式,用户的查询需求可为一种或多种查询模式;
针对用户选取的任意一种查询模式,由用户设置查询的起始时刻和终止时刻,由此获得相应的查询时间范围,其中实时和预测查询模式的起始时刻默认为当前时刻t;
针对用户选取的任意一种查询模式,由用户选取查询的路网区域或某条路径,由此获得相应的查询路网范围;
针对用户选取的查询模式,当用户查询某个路网区域时,标定出所述路网区域所包含和交叉的所有路段以及相应的路段编号,形成用户在所述查询模式下的查询路段集;
针对用户选定的查询模式,当用户查询某条路径时,将用户选取的路径与历史数据库中的备份路径集进行比较:如果存在匹配路径,标定出相应的查询路径编号;如果不存在匹配路径,标定出所述路径所包含的路段编号,形成用户在所述查询模式下的查询路段集。
7.根据权利要求1所述的基于交通大数据的行程时间提取、预测及查询方法,其特征在于,所述步骤S3具体包括:
快速检索所述历史数据库中路网行程时间数据的最终时间戳T,以最终时间戳T为基准,设置一个步长T1对时间进行动态跟踪和采样处理,按照先后顺序将时间分成若干时段并编号,使得当前时刻t永远落在当前时段内,动态刷新当前时段的编号Q、起始时刻t0和终止时刻t1,则有t0<t≤t1
将最终时间戳T到时刻t0之间的时间段设置为一个时间范围,从所述实时数据库中获取该时间范围内的路网行程时间数据、以及各路段和备份路径的实时行程时间拟合模型参数;及
从所述实时数据库中动态采集当前时段Q内的所有浮动车行程时间数据,所述浮动车行程时间数据包括行程时间的大小、路段或路径属性、时间戳、车辆编号;
所述步骤S5具体包括:针对选取的路段或路径,进行实时行程时间拟合(Real-timeTravel-time Fitting,RTF)算法分析:设置时段数M,将当前时段Q以及前面M个时段的时间合并成一个时间范围,从实时和历史数据库中获取所述时间范围内的浮动车和路网行程时间数据;设置项数N,构造一个二元N次多项式对路段或路径行程时间数据以及相应的浮动车行程时间数据进行拟合,并采用列文伯格-马夸尔特(Levenberg Marquardt,LM)算法快速求解多项式的系数,所述系数即为RTF模型参数;根据求解出的RTF模型,等时距采样当前时段Q和相邻时段Q+1范围内的路网行程时间序列值,在实时数据库中存储并动态刷新RTF模型参数和行程时间序列值。
8.根据权利要求1所述的基于交通大数据的行程时间提取、预测及查询方法,其特征在于,所述离线处理部分包括以下步骤:
S20:从所述历史数据库中获取路网数据,所述路网数据包括路网拓扑结构数据、所有路段编号以及备份路径编号,从历史数据库中获取浮动车在路网中的行程时间历史数据,包括各路段和路径的历经浮动车行程时间数据;
S21:根据路段和路径编号的先后顺序,选取一条未处理的路段或路径;
S22:针对选定的路段或路径,读取所述路段或路径的浮动车行程时间数据,以每天0:00到24:00为一个周期,依据时间戳的先后顺序对行程时间数据进行周期划分,并对划分的时间周期进行编号;
S23:根据所述时间周期编号的先后顺序,选取一个未处理的时间周期;
S24:历史行程时间拟合(Historical Travel-time Fitting,HTF)模型计算:针对所述时间周期内的浮动车行程时间数据,设置项数N,构造一个二元N次多项式对行程时间数据进行拟合,采用列文伯格-马夸尔特(Levenberg Marquardt,LM)算法快速求解多项式系数,即为HTF模型参数;根据求解出的多项式模型,等间距采样所述时间周期内的行程时间序列值,将所述行程时间序列值作为所述路段或路径在所述时间周期的行程时间序列并存储到历史数据库中;
S25:所有时间周期是否遍历完毕;是则,执行步骤S26;否则,返回执行S23;
S26:按照工作日、休息日、节假日出行方式,对行程时间的周期进行出行类别划分和编号;
S27:根据出行类别的先后顺序,选取一种未处理的出行类型;
S28:进行行程时间统计分析:采用核密度估计(Kernel Density Estimation,KDE)方法,计算行程时间数据的概率密度,提取概率密度最大值对应的行程时间作为所述路段或路径在该出行类别下的平均行程时间;对概率密度进行积分处理,获得相应的概率分布,对概率分布进行修正和等间距采样,获得行程时间的概率分布序列;将所述路段或路径的行程时间的平均值和概率分布序列存储到历史数据库中;
S29:行程时间短时预测(Travel-time Short-time Prediction,TSP)模型计算:按照时间的先后顺序,将行程时间数据进行排序形成一个长的数据序列;假定所述长序列相邻元素的时距相等,构造一个多项时间序列模型来拟合所述长序列,由此生成一个拟合矩阵方程,用最小二乘法(Least Square Method,LSM)求解该方程并计算相应的拟合误差;变动时间序列模型的项数,用相同方法求解拟合矩阵方程以及相应的拟合误差,并找到拟合误差最小值对应的项数M及相应的时间序列模型,所述时间序列模型即为所述路段或路径在指定出行类别条件下的TSP模型;由项数M计算出所述TSP模型的覆盖时段,将所述TSP模型参数和覆盖时段存入历史数据库中;
S30:所有出行类别是否遍历完毕;是则,执行步骤S31;否则,返回执行S27;
S31:所有路段或路径是否遍历完毕;是则,执行步骤S32;否则,返回执行S21;
S32:离线数据整理和存储:将所有路段和备选路径的行程时间数据、行程时间的平均值及概率分布序列、行程时间数据的最终时间戳、相应的TSP模型参数及覆盖时段的信息存入历史数据库中。
CN201610424968.6A 2016-06-15 2016-06-15 一种基于交通大数据的行程时间提取、预测及查询方法 Expired - Fee Related CN106023588B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610424968.6A CN106023588B (zh) 2016-06-15 2016-06-15 一种基于交通大数据的行程时间提取、预测及查询方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610424968.6A CN106023588B (zh) 2016-06-15 2016-06-15 一种基于交通大数据的行程时间提取、预测及查询方法

Publications (2)

Publication Number Publication Date
CN106023588A CN106023588A (zh) 2016-10-12
CN106023588B true CN106023588B (zh) 2018-07-06

Family

ID=57089039

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610424968.6A Expired - Fee Related CN106023588B (zh) 2016-06-15 2016-06-15 一种基于交通大数据的行程时间提取、预测及查询方法

Country Status (1)

Country Link
CN (1) CN106023588B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108427684B (zh) * 2017-02-14 2020-12-25 华为技术有限公司 数据查询方法、装置及计算设备
CN108253974B (zh) * 2017-12-29 2019-09-10 深圳市城市交通规划设计研究中心有限公司 浮动车定位数据自适应缓冲路径匹配***及其方法
CN108717427A (zh) * 2018-05-05 2018-10-30 北京交通大学 基于用户查询日志的客运交通需求指数计算方法
CN109035761B (zh) * 2018-06-25 2021-06-04 复旦大学 基于辅助监督学习的行程时间估计方法
CN109615851B (zh) * 2018-07-30 2021-01-29 北京航空航天大学 一种在群智感知***中基于关键路段的感知节点选取方法
CN109308803A (zh) * 2018-07-31 2019-02-05 北京航空航天大学 基于随机波动模型的路径行程时间可靠性分析
CN109544920B (zh) * 2018-11-22 2021-10-22 广东岭南通股份有限公司 基于交易数据的公交出行成本获取、分析方法和***
CN109712389B (zh) * 2018-12-14 2020-06-09 北京航空航天大学 一种基于Copula和Monte-Carlo模拟的路径行程时间估计方法
CN110197293A (zh) * 2019-04-15 2019-09-03 同济大学 基于浮动车数据的分时租赁汽车出行需求预测方法和***
CN110265165B (zh) * 2019-06-18 2021-07-20 中广核核电运营有限公司 核电容器温度调节方法、装置、计算机设备和存储介质
CN112667763B (zh) * 2020-12-29 2022-09-13 电子科技大学 一种基于自适应时间戳与多尺度特征提取的轨迹预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1434946A (zh) * 2000-07-21 2003-08-06 交通预测.Com公司 一种提供旅行时间预测的方法
JP2008123474A (ja) * 2006-10-20 2008-05-29 Nec Corp 旅行時間予測装置、旅行時間予測方法、交通情報提供システム及びプログラム
CN101436347A (zh) * 2008-12-09 2009-05-20 北京交通大学 一种快速路行程时间预测方法
CN105528457A (zh) * 2015-12-28 2016-04-27 重庆云途交通科技有限公司 一种基于大数据技术的交通信息提取和查询方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1434946A (zh) * 2000-07-21 2003-08-06 交通预测.Com公司 一种提供旅行时间预测的方法
JP2008123474A (ja) * 2006-10-20 2008-05-29 Nec Corp 旅行時間予測装置、旅行時間予測方法、交通情報提供システム及びプログラム
CN101436347A (zh) * 2008-12-09 2009-05-20 北京交通大学 一种快速路行程时间预测方法
CN105528457A (zh) * 2015-12-28 2016-04-27 重庆云途交通科技有限公司 一种基于大数据技术的交通信息提取和查询方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
信息融合技术及其在智能交通领域中的应用;付建胜等;《公路交通技术》;20140630(第3期);第120-125页 *
基于交通数据融合技术的行程时间预测模型;李嘉等;《湖南大学学报(自然科学版)》;20140131;第41卷(第1期);第33-38页 *

Also Published As

Publication number Publication date
CN106023588A (zh) 2016-10-12

Similar Documents

Publication Publication Date Title
CN106023588B (zh) 一种基于交通大数据的行程时间提取、预测及查询方法
Punzo et al. Analysis and comparison of microscopic traffic flow models with real traffic microscopic data
US8706459B2 (en) Traffic sensor management
CN103747523A (zh) 一种基于无线网络的用户位置预测***和方法
CN109754594A (zh) 一种路况信息获取方法及其设备、存储介质、终端
Baumann et al. Generic mobility simulation framework (GMSF)
CN107547636A (zh) 一种基于精准位置的共享单车管理方法
CN105528457B (zh) 一种基于大数据技术的交通信息提取和查询方法
Balakrishna et al. Time-dependent origin-destination estimation without assignment matrices
WO2014194480A1 (en) Air quality inference using multiple data sources
CN110836675B (zh) 一种基于决策树的自动驾驶搜索决策方法
Woensel et al. Empirical validation of a queueing approach to uninterrupted traffic flows
CN101783075A (zh) 一种城市环形道路交通流预测***
Garcia‐Dorado et al. Designing large‐scale interactive traffic animations for urban modeling
CN109714709A (zh) 一种基于历史信息的失联车辆位置预测方法和***
KR20150072471A (ko) 시공간 확률 모델을 이용한 교통 흐름 예측 시스템
Yao et al. Sampled trajectory data-driven method of cycle-based volume estimation for signalized intersections by hybridizing shockwave theory and probability distribution
CN102682591A (zh) 旅行时间获取方法和装置
CN114647684A (zh) 基于stacking算法的流量预测方法、装置及相关设备
CN110021161A (zh) 一种交通流向的预测方法及***
CN105825675B (zh) 一种基于大数据的路段旅行时间计算方法和装置
CN115798212B (zh) 一种基于出租车轨迹的交通拥堵检测方法
WO2015125467A1 (ja) 旅行時間演算装置、交通情報データおよび交通情報データ生成装置
D’Apuzzo et al. An introductory step to develop Distance Decay Functions in the Italian context to assess the modal split to e-bike and e-scooter
CN111177294B (zh) 基于车辆轨迹数据求解交叉口中介中心性的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20171113

Address after: 400060 Chongqing Nan'an District University Avenue, No. 33

Applicant after: China Merchants Chongqing Communications Research & Design Institute Co., Ltd.

Address before: 401336, Chongqing City, South Bank Road, No. 8 Jade Road, science and technology innovation center, building No. 7, British building (via the expansion zone)

Applicant before: Chongqing Yun Tu transport science and techonologies company limited

GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180706

Termination date: 20200615