CN110751311A - 偶发***通拥堵持续时间的数据提取与实时预测方法 - Google Patents
偶发***通拥堵持续时间的数据提取与实时预测方法 Download PDFInfo
- Publication number
- CN110751311A CN110751311A CN201910835268.XA CN201910835268A CN110751311A CN 110751311 A CN110751311 A CN 110751311A CN 201910835268 A CN201910835268 A CN 201910835268A CN 110751311 A CN110751311 A CN 110751311A
- Authority
- CN
- China
- Prior art keywords
- congestion
- time
- duration
- road
- sporadic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000013075 data extraction Methods 0.000 title claims abstract description 7
- 238000001514 detection method Methods 0.000 claims abstract description 13
- 238000005516 engineering process Methods 0.000 claims abstract description 7
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 238000009826 distribution Methods 0.000 claims description 23
- 230000004083 survival effect Effects 0.000 claims description 21
- 230000002159 abnormal effect Effects 0.000 claims description 20
- 238000013461 design Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 10
- 230000008859 change Effects 0.000 claims description 6
- 238000012544 monitoring process Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000005315 distribution function Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 238000007476 Maximum Likelihood Methods 0.000 claims description 3
- 150000001875 compounds Chemical class 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 2
- 238000013178 mathematical model Methods 0.000 abstract description 2
- 238000004891 communication Methods 0.000 abstract 1
- 238000004458 analytical method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000000528 statistical test Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明涉及一种偶发***通拥堵持续时间的数据提取与实时预测方法,包括步骤1:交通流参数原始数据的获取与预处理,步骤2:偶发性拥堵事件的提取,步骤3:构造偶发性拥堵事件持续时间的样本数据,步骤4:构建偶发性拥堵持续时间的风险模型,并基于历史数据估计模型参数,步骤5:获取实时数据,对新的偶发性拥堵持续时间进行估计。所述方法基于具体道路情况的速度‑饱和度关系模型和占有率的标准正态变差指标来提取偶发性拥堵事件,通过交通检测***和GIS地图匹配技术获取偶发性拥堵持续时间的样本数据,运用加速失效风险模型构建偶发性拥堵持续时间的数学模型,基于历史数据对模型进行拟合和参数标定,进而对偶发性拥堵事件进行实时预测。
Description
技术领域
本发明涉及一种城市道路偶发***通拥堵持续时间的数据提取与实时预测方法,属于交通运输工程领域。
背景技术
2019年7月19日,高德地图发布2019年第二季度中国主要城市交通分析报告,报告指出我国50个主要城市全天(6-22点)的平均车速约为30km/h,其中广州的全天平均车速最低,为27.49km/h。交通拥堵对社会生活最直接的影响是增加了居民的出行时间和成本,同时还导致了交通事故的增加。交通拥堵不仅会导致经济社会诸项功能的衰退,而且还将引发城市生存环境的持续恶化,成为阻碍城市发展的“顽疾”。
拥堵持续时间是评价交通拥堵的一个关键指标,目前多位学者对拥堵持续时间进行了研究,也有部分专利技术涉及到拥堵持续时间,取得了有益的成果。例如,专利CN102568194A运用元胞传输模型给出了一种城市道路交通拥堵持续时间和空间扩散预测方法;专利CN106910341A通过结合手机位置、速度数据和互联网路况数据来确定拥堵源头和成因,提出了一种多种数据源融合缩短高速公路拥堵持续时间的方法和***;专利CN109191849A结合固定检测器获取的数据与浮动车上传的GPS数据,提出了一种基于多源数据特征提取的交通拥堵持续时间预测方法。总体而言,现有持续时间相关文献的研究都是针对笼统的拥堵事件,没有对常发性拥堵和偶发性拥堵的持续时间进行区别分析。
与常发性拥堵事件相比,偶发性拥堵事件更具有偶然性和随机性,其拥堵事件的持续时间更难预测和控制,给出行者和交管部门带来的不确定性和负面影响也更大。因此,为了减弱偶发性拥堵事件的消极影响,有必要对偶发性拥堵持续时间的特征规律与预测方法进行深入研究。
本发明提出一种偶发***通拥堵持续时间的数据提取与实时预测方法。基于具体道路情况的速度-饱和度关系模型和占有率的标准正态变差指标来提取偶发性拥堵事件,通过交通检测***和GIS地图匹配技术获取偶发性拥堵持续时间的样本数据,运用加速失效风险模型构建偶发性拥堵持续时间的数学模型,基于历史数据对模型进行拟合和参数标定,进而对偶发性拥堵事件进行实时预测。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种城市道路偶发***通拥堵持续时间的数据提取与实时预测方法。
为达到以上目的,本发明采取的技术方案是:
一种偶发***通拥堵持续时间的数据提取与实时预测方法,包括以下几个步骤:
步骤1:交通流参数原始数据的获取与预处理
步骤1.1通过城市道路交通信息实时监测***获取道路各断面的交通流参数,交通流参数具体包括断面、日期、时间、车道号、流量、速度、占有率;
步骤1.2对交通流参数原始数据进行预处理
在对原始数据进行分析之前,需要对原始数据进行预处理,以提高数据质量;数据的预处理主要是对数据中的缺失值和异常值进行处理;
(1)缺失值的处理:缺失值主要表现为缺少属性值,一是断面缺失,即某些断面的记录为空值;二是关键参数缺失,原始数据中某一参数值全部为0或为某一固定值,认为记录数据时发生错误;针对上述缺失值的情况,需要删除缺少属性值的数据文件,保证属性的完整性;
(2)异常值的处理:异常值主要表现为某单个属性的值过大或者过小;(a)速度的异常值,车辆速度大于200km/h认为是异常值,处理方式是用其相连的前后两个时段车辆速度的平均值来替代;(b)流量和占有率的异常值,剔除流量和占有率为负值的数据;
步骤2:偶发性拥堵事件的提取
步骤2.1拥堵事件的判定
道路拥挤度用道路的实际交通需求量与相应道路最大通行能力的比值来衡量,即道路饱和度V/C,通常认为当V/C取值为0.8,1.0,1.1,为道路拥挤度的三个拐点;
根据速度-饱和度的关系,计算出道路拥挤度三个拐点对应的速度临界值,基于速度临界值判定拥堵事件是否发生;
速度-饱和度的关系模型如公式(1)所示:
其中α1根据道路具体情况有所变化,根据各个断面的实际车速U,取其85%分位数作为每个断面的设计速度值U′S,根据各个断面的设计速度值U′S对参数α1进行修正,修正后的回归参数α′1为:
式中,α′1为修正后的回归参数,Us为道路设计速度,U′S为每个断面的设计速度值,
当V/C取值分别为0.8,1.0,1.1时,给定α′1,α2,α3和Us的值,根据公式(1)计算得到三个速度临界值,分别为和根据道路交通信息实时监测***获取的实际车速U来判定道路拥堵状态,当时,道路交通顺畅;当时,道路轻微拥堵;当时,道路中度拥堵;当时,道路严重拥堵;
步骤2.2偶发性拥堵事件的判定
在步骤2.1的基础上,进一步判定拥堵事件是否为偶发性拥堵;若拥堵开始时刻造成道路交通流参数的突变,则该次拥堵事件为偶发性拥堵事件,否则为常发性拥堵事件;
运用标准差法,通过构造占有率的标准正态变差SND来判定偶发性拥堵事件是否发生,SND的数学表达式如下所示:
其中,X为拥堵开始时段的占有率,为X对应时段的前m个时段占有率的平均值,Sm为前m个时段的标准差;
当拥堵开始连续两个时段的标准正态变差SND都大于设定阈值Y时,认为发生了偶发性拥堵事件,其中,m和Y的取值为整数,基于历史数据进行试算得到,一般令m取5,Y取4;
步骤3:构造偶发性拥堵事件持续时间的样本数据
在步骤2的基础上,基于历史数据,以每个偶发性拥堵事件为一个观测样本,统计每个偶发性拥堵事件发生的断面编号、日期、开始时间、结束时间和拥堵持续时间,所述拥堵持续时间为拥堵事件的结束时间与开始时间的差值;
通过交通检测***获取偶发性拥堵事件发生时最初时段内的交通属性和时间属性,运用GIS地图匹配技术,获取相应路段的空间属性和道路环境属性;
每个偶发性拥堵事件为一个观测样本,以每个观测样本的开始时间为关键词,将观测样本的断面编号、日期、结束时间、拥堵持续时间,以及相应时段的交通属性、时间属性,相应路段的空间属性和道路环境属性匹配到观测样本中,构造偶发性拥堵事件持续时间的样本数据;
步骤4:构建偶发性拥堵持续时间的风险模型,并基于历史数据估计模型参数
将偶发性拥堵持续时间视为一种生存持续时间,引入加速失效的风险模型估计偶发性拥堵持续时间及其显著影响因子;
步骤4.1、令T表示非负的随机变量,代表偶发性拥堵持续时间,T的密度函数和分布函数分别为f(t)和F(t),T的生存函数S(t)和风险率函数h(t)分别如式(4)和式(5)所示:
生存函数S(t)表示偶发性拥堵持续时间T长于给定时间t的概率;风险率函数h(t)表示拥堵持续至时间t时没有结束,但在接下来的一个非常小的单位时间间隔Δt内结束的条件概率;
步骤4.2、构建考虑影响因素的偶发性拥堵持续时间加速失效风险模型,偶发性拥堵持续时间的潜在影响因素定义为协变量X,假定偶发性拥堵持续时间T的对数logT与其协变量X之间存在如下线性关系:
log T=βX+ε=β0+β1x1+...βpxp+ε (6)
式中,X={1,x1,x2,x3...xp}′为协变量,β={β0,β1,β2...βp}为系数向量;p为协变量的个数,ε是随机误差项,ε的密度函数为g(ε,d),ε的生存函数为G(ε,d),d是偶发性拥堵持续时间风险模型的辅助参数,偶发性拥堵持续时间T与协变量的X和g的分布有关,g服从不同的分布时,能推导出各种参数分布的偶发性拥堵持续时间风险模型,
步骤4.3、基于历史数据,采用极大似然估计方法估计偶发性拥堵持续时间风险模型的参数,令b=(β,d)表示待估参数向量,设有n个偶发性拥堵持续时间的历史数据样本,分别为t1,t2...tn,则T的概率密度函数为f(ti,b),其中i=1,2,…,n,由于历史数据样本都是完全数据,则偶发性拥堵持续时间样本的对数似然函数,如下式所示:
分别对b中每个待估参数求偏导,并令其为0,构造方程组,运用Newton-Raphson迭代法便可得到待估参数向量b的估计值
步骤4.4、用BIC作为风险模型优劣的衡量指标,BIC的定义如下式所示:
式中,为对数似然函数值,k为偶发性拥堵持续时间风险模型中待估参数的个数,n为样本数量,运用公式计算不同分布风险模型的BIC值并比较,选取BIC值最小的即为偶发性拥堵持续时间的最优参数分布风险模型,则得到偶发性拥堵持续时间风险模型的最终数学表达式;
步骤5:获取实时数据,对新的偶发性拥堵持续时间进行估计
基于步骤4得到的偶发性拥堵持续时间风险模型的最终表达式,从交通检测***获取实时的偶发性拥堵事件及其交通属性、时空属性和道路环境属性作为模型的输入变量数据,即可对当前偶发性拥堵事件的持续时间进行估计或预测。
在上述方案的基础上,步骤3中,所述最初时段为2分钟内,所述交通属性包括平均每车道的交通流量、车速,所述时间属性包括:工作日、周末、高峰期,针对城市快速路环线道路而言,所述空间属性包括内外环、方位,所述道路环境属性包括公交站点、匝道、高架桥等。
附图说明
本发明有如下附图:
图1为本发明的流程图;
图2.给定环境下偶发性拥堵持续时间的生存函数曲线图;
图3.给定环境下偶发性拥堵持续时间的风险函数曲线图。
具体实施方式
以下结合附图1-3对本发明作进一步详细说明。
步骤1:交通流参数原始数据的获取与预处理
步骤1.1通过城市道路交通信息实时监测***获取道路各断面的交通流参数,具体包括断面、日期、时间(一般为每两分钟的间隔)、车道号、流量、速度、占有率等。
步骤1.2对原始数据进行预处理
数据的预处理主要是对数据中的缺失值和异常值的处理。(1)缺失值的处理:缺失值主要表现为缺少属性值,一是断面缺失,即某些断面的记录为空值;二是关键参数缺失,原始数据中某一参数值(例如占有率)全部为0或为某一固定值,认为记录数据时发生错误。针对上述缺失值的情况,需要删除缺少属性值的数据文件,保证属性的完整性;(2)异常值的处理:异常值主要表现为某单个属性的值过大或者过小。(a)速度的异常值,车辆速度大于200km/h认为是异常值,处理方式是用其相连的前后两个时段车辆速度的平均值来替代;(b)流量和占有率的异常值,剔除流量和占有率为负值的数据。
步骤2:偶发性拥堵事件的提取
步骤2.1拥堵事件的判定。
拥堵判定方法方面,不同国家和不同地区有不同的拥堵界定标准,部分地方城市道路交通拥堵评价指标体系中普适性的拥堵定义也不能很好地描述具体状况。针对具体道路环境情况,需要从实际道路条件出发,提出合适的判别指标来判定道路拥堵事件。
道路拥挤度可用道路的实际交通需求量与相应道路最大通行能力的比值来衡量,即道路饱和度V/C。令道路饱和度V/C分别为0.8,1.0,1.1,为道路拥挤度(轻微拥堵、中度拥堵和严重拥堵)的三个拐点,交通检测***检测到的交通流量是实际发生的交通通过量,不是交通需求量,因此道路饱和度V/C不能直接从检测数据中得到。根据速度-饱和度的关系模型计算出拥堵状态对应的速度临界值,基于速度临界值来直接判定拥堵事件是否发生。
其中,速度-饱和度的关系模型,如公式(1)所示:
式中,V/C为道路饱和度,为基于速度-饱和度关系模型拟合的车辆速度值,Us为道路设计速度,α1,α2,α3,β为回归参数。
相应设计速度下的城市快速路,其各参数取值可参考表1。
表1 城市快速路车速-流量通用模型参数表
一条道路各个断面的交通状况和物理条件不尽相同,导致实际行驶速度有所差异,将一条道路所有断面的设计速度Us统一用一个固定值是不符合实际情况,需要根据各个断面的实际行驶速度,其中α1根据道路具体情况而有所变化,根据各个断面的实际行驶速度,取其85%分位数作为每个断面的设计速度值U′S。根据各个断面具体设计速度对参数α1进行修正,修正后的参数α′1为:
式中,α′1为修正后的回归参数,Us为道路设计速度,U′S为每个断面的设计速度值,
当V/C取值分别为0.8,1.0,1.1时,给定α′1,α2,α3和Us的值,根据公式(1)计算得到速度临界值分别令其为和根据实际车速U来判定道路拥堵状态,当时,道路交通顺畅;当时,道路轻微拥堵;当时,道路中度拥堵;当时,道路严重拥堵;总体而言,该方法将速度、流量和拥堵状况三者结合,饱和度的增加为拥堵本质,速度的下降为拥堵表现形式,深刻合理地对拥堵状态进行阐述,因此本发明运用该方法作为交通拥堵事件的判定标准。
步骤2.2:偶发性拥堵事件的判定
步骤2.1判定出拥堵事件后,还需要进一步判定拥堵事件是否为偶发性拥堵。若拥堵开始时刻展现偶发性拥堵的特征,则该次拥堵事件为偶发性拥堵,否则为常发性拥堵。偶发性拥堵事件的一个重要特征是会造成道路交通流参数的突变。因此可以通过判断断面交通流参数在某个时刻是否与之前时刻产生突变来判定拥堵是否为偶发性。
本发明运用标准差法,通过构造占有率的标准正态变差SND来判定拥堵事件是否为偶发性拥堵。SND的数学表达式如下所示:
当拥堵开始连续两个时段的标准正态变差SND都大于设定阈值Y时,认为发生了偶发性拥堵事件。其中,m和Y的值取整数,可基于历史数据进行试算得到,选取偶发性拥堵事件检测准确率最高时的整数值为参数标定值,根据历史数据的统计检验结果,m取5,Y取4时效果最佳。
步骤3:构造偶发性拥堵事件持续时间的样本数据
基于历史数据,以每个偶发性拥堵事件为一个观测样本,统计每个偶发性拥堵事件发生的断面编号、日期、开始时间、结束时间和拥堵持续时间,其中,拥堵事件的结束时间与开始时间的差值即为该拥堵事件的持续时间;
交通属性通过对交通检测***上传的交通流参数数据进行统计分析获取,主要包括偶发性拥堵发生时最初时段(2分钟内)的平均每车道的交通流量、平均车速等。断面的交通流量、平均车速需要对各车道进行汇总求其平均值,流量为平均每车道的车流量,单位是标准小汽车数量(PCU/ln),针对长车流量,统计流量时需要进行折算,可按1.5辆标准小汽车进行折算;平均车速为每次拥堵事件发生时最初时段(2分钟内)各车道车辆的平均速度,单位为千米/小时(km/h),针对各车道车速需要根据各车道的流量进行加权求取整个断面的平均车速。
时间属性包括工作日、周末和高峰期等。工作日和周末通过查找日历来确定拥堵发生的时间是否为工作日、周末或节假日。高峰期通过统计各断面每天每小时的总流量,上午和下午连续流量最大的两个小时分别为早高峰和晚高峰时段,其它时段为平峰时段。
相应路段的空间属性和道路环境属性需要运用GIS地图匹配技术来获取各断面的道路环境属性。根据道路各检测器布设断面的经纬度信息,借助Arcgis10.2软件之中的Arcmap将各断面的经纬度信息展示在地图上,实现可视化,再从地图上查找获取相应断面的道路环境属性。
针对城市快速路环线道路而言,道路环境属性包括内外环、方位、匝道、公交站点、高架桥等。内外环指的是把环线道路分为内环和外环;方位是把环线道路按东南西北分为四段;匝道指的是断面是否受匝道入口(距离130米以内)和匝道出口(距离210米以内)影响;类似的,公交站台表示断面附近(前后200米以内)是否有公交站台,高架桥表示断面附近(前后200米以内)是否有高架桥。
步骤4:构建偶发性拥堵持续时间的风险模型,并基于历史数据估计模型参数。
将偶发性拥堵持续时间视为一种生存持续时间,引入加速失效的风险模型估计偶发性拥堵持续时间及其显著影响因子;
步骤4.1、令T表示非负的随机变量,代表一次偶发性拥堵事件的持续时间,T的密度函数和分布函数分别为f(t)和F(t),拥堵持续时间模型中两个关键概念,T的生存函数S(t)和风险率函数h(t)分别如式(4)和式(5)所示:
生存函数S(t)也称之为累积生存率函数,指的是偶发性拥堵事件的持续时间长于给定时间t的概率;风险率函数h(t)表示拥堵持续至时间t时没有结束,但在接下来的一个非常小的单位时间间隔Δt内结束的条件概率。
步骤4.2、构建考虑影响因素的拥堵持续时间加速失效风险模型。
偶发性拥堵持续时间会受到交通属性、时空属性和道路环境条件的影响,因此,针对偶发性拥堵持续时间的估计,需要引入能考虑潜在影响因素的加速失效风险模型。偶发性拥堵持续时间的潜在影响因素定义为协变量X的矢量。模型假定偶发性拥堵持续时间T的对数(logT)与其协变量X之间存在如下线性关系:
log T=βX+ε=β0+β1x1+...βpxp+ε (6)
式中,X={1,x1,x2,x3...xp}′为协变量,β={β0,β1,β2...βp}为系数向量;p为协变量的个数,ε是随机误差项,ε的密度函数为g(ε,d),ε的生存函数为G(ε,d),d是模型的辅助参数;这表明拥堵持续时间T与协变量的X和g的分布有关,g服从不同的分布时,可推导出T的各种参数分布的风险模型。四种常用的参数分布(Exponential分布、Weibull分布、Lognormal分布和Loglogistic分布)用来拟合模型。
以Lognormal分布为例,基于Lognormal分布的偶发性拥堵持续时间的密度函数f(t)、生存函数S(t)和风险率函数h(t),分别如式(7)、(8)、(9)所示:
步骤4.3、基于历史数据,采用极大似然估计方法估计模型的参数。令b=(β,d)表示待估参数向量,设有n个偶发性拥堵持续时间样本,分别为t1,t2...tn,则T的概率密度函数为f(ti,b),其中i=1,2,…,n。
由于样本都是完全数据,则偶发性拥堵持续时间样本的对数似然函数,如下式所示:
步骤4.4、用BIC作为风险模型优劣的衡量指标,BIC的定义如下式所示:
式中,为对数似然函数值,k为偶发性拥堵持续时间风险模型中待估参数的个数,n为样本数量,运用公式计算不同分布风险模型的BIC值并比较,选取BIC值最小的即为偶发性拥堵持续时间的最优参数分布风险模型,则得到偶发性拥堵持续时间风险模型的最终数学表达式。
步骤5:获取实时数据,对新的偶发性拥堵事件持续时间进行估计。
基于上一步得到的偶发性拥堵持续时间风险模型,包含偶发性拥堵持续时间最优参数分布的数学形式,偶发性拥堵持续时间的协变量及其模型参数的估计值从交通检测***获取实时的偶发性拥堵事件及其交通属性、时空属性和道路环境属性等影响因素值作为模型的输入变量数据,即可估计或预测某次偶发性拥堵事件的持续时间。
以Lognormal分布为例,根据步骤5中的公式(8)和(9),可得到偶发性拥堵持续时间的生存函数和风险率函数。利用样本数据对模型进行拟合,可得到模型回归系数β的估计值以及模型辅助参数的估计值针对具体某一次偶发性拥堵事件,获取其发生时刻的时间属性和发生断面的空间属性以及附近道路环境属性,作为协变量x1,x2,x3...xp的输入值,带入公式(8)。此时,只有t是未知的,任意给定t值,则可计算得到该次偶发性拥堵持续时间大于t的可能性S(t),据此可得到偶发性拥堵事件的生存函数曲线。取S(t)为0.5,即计算其生存函数的中位数值,此时式(8)变为仅包含t的一元方程,求出t的值,即可作为预测偶发性拥堵持续时间的点估计值。同理,根据公式(9)可得到偶发性拥堵持续时间的风险函数曲线h(t),据此用于预测拥堵持续一段时间后,在接下来给定时间内会结束的条件概率。
利用前述给出的偶发性拥堵持续时间的估计方法,通过实际数据,给出具体的案例说明以及案例结果展示。
1案例数据介绍
本发明所使用的数据来自北京市快速路交通信息实时监测***。本文用到的数据为2006年6月2号至6月15号三环74个断面交通流数据。三环路分内、外环车道,不同断面车道数为单向三车道或四车道。三环路作为北京市主要快速路之一,承担大量的交通压力,三环路上拥堵频发,根据检测***获取的交通信息,不考虑轻微拥堵状态,以中度拥堵的速度临界值作为拥堵的指标,运用公式(1)作为拥堵的判定标准,得到两周内拥堵频次为14818次,内外环分开统计,每个断面每天平均拥堵次数为7.15次;运用公式(3)作为偶发性拥堵的判定标准,得到偶发性拥堵频次为894次,再通过交通检测***和GIS地图匹配技术获取每次偶发性拥堵的时空属性和道路环境属性,最终得到894个偶发性拥堵样本数据。
在使用的案例数据中,偶发性拥堵持续时间数据文件基本格式如表2所示示意,各变量的定义解释如下:
第一列序号代表每个偶发性拥堵事件样本的编号。
第二列持续时间代表偶发性拥堵持续时间,单位:min。
第三列状态代表数据的删失属性,1代表完全数据,0代表删失数据,本案例中的样本数据都为完全数据。
第四列流量代表拥堵事件发生时最初2分钟时段内的平均每车道的车流量,单位:PCU/ln。
第五列车速代表拥堵事件发生时最初2分钟时段内车辆的平均速度,单位:km/h。
第六列内外环代表内、外环,0内环,1外环。
第七列方位代表断面所处方位:0:东,1:南,2:西,3:北。
第八列周末代表周末、工作日,0工作日,1周末。
第九列高峰代表是否受高峰期影响。0平峰,1早高峰,2晚高峰。
第10列匝道代表是否受匝道影响,0不受影响,1受影响。
第11列公交站代表是否受公交站点影响,0不受影响,1受影响。
第12列高架桥代表是否受高架桥的影响,0不受影响,1受影响。
表2 样本数据文件的基本格式
2基于案例数据的模型结果展示
将数据处理为表2所示的格式,基于案例数据,拟合偶发性拥堵持续时间风险模型,表3为基于案例数据运用常见四种分布,考虑协变量拟合偶发性拥堵持续时间模型的结果。
表3 四个常见参数分布模型的拟合结果
Lognormal模型有最小的BIC值,说明Lognormal分布风险模型在四种分布里面有最好的拟合效果。
由于部分协变量为分类变量,因此分析时需要设置为虚拟变量的形式对变量系数进行估计,每个分类变量设置一个基准组。表4给出了Lognormal分布风险模型的各变量系数值,从中能发现偶发性拥堵持续时间的显著性影响因子(p值小于0.1),可知偶发性拥堵的交通属性、时空属性对其持续时间有显著影响,而道路环境属性对拥堵持续时间无显著影响。具体而言,交通属性中,偶发性拥堵事件发生时的初始车速越小,其拥堵持续时间越长;时间属性中,工作日的偶发性拥堵事件持续时间比周末的长;空间属性中,外环的偶发性拥堵事件持续时间比内环的短,南三环的比东三环的持续时间短。
表4 Lognormal风险模型的系数估计
3偶发性拥堵持续时间的估计
根据公式(8)和表4拟合结果,时空属性中分别以周末、内环和东三环为基准,令表4中四个显著的影响因素分别为x1,x2,x3,x4,把表4中的系数估计值代入公式(8),可得到偶发性拥堵持续时间风险模型的数学表达式如式(12)所示:
针对某一次具体的偶发性拥堵事件,获取偶发性拥堵事件的初始车速和时空属性,作为变量输入值代入公式中。例如,某一次偶发性拥堵事件发生在南三环外环的工作日早高峰期,发生时的初始车速为15km/h,则可通过公式(12)求得其拥堵持续时间的生存函数为:
式(13)则为该偶发性拥堵事件持续时间的生存函数曲线。基于公式(13),该偶发性拥堵持续时间生存曲线如图2所示,中位数值为6.4min,表明该次偶发性拥堵事件有50%的概率在6.4min内结束;90%的分位数为22.4min,表明该次偶发性拥堵事件有90%的概率在22.4min内结束。计算得到的中位数值6.4min可作为该次偶发性拥堵持续时间的点估计值或预测值。类似的,基于模型拟合结果和公式(9),可计算出该次偶发性拥堵持续时间的风险函数曲线如图3所示,风险率表示的是拥堵持续至时间t后在接下来的非常小的单位间隔内结束的条件概率,从图可知随着时间的增大该拥堵事件持续时间的风险率变化趋势为先下降后上升,在接近20min时风险率最低。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。
Claims (2)
1.一种偶发***通拥堵持续时间的数据提取与实时预测方法,其特征在于,包括以下几个步骤:
步骤1:交通流参数原始数据的获取与预处理
步骤1.1通过城市道路交通信息实时监测***获取道路各断面的交通流参数,交通流参数具体包括断面、日期、时间、车道号、流量、速度、占有率;
步骤1.2对交通流参数原始数据进行预处理
在对原始数据进行分析之前,需要对原始数据进行预处理,以提高数据质量;数据的预处理是对数据中的缺失值和异常值进行处理;
(1)缺失值的处理:缺失值表现为缺少属性值,一是断面缺失,某些断面的记录为空值;二是关键参数缺失,原始数据中某一参数值全部为0或为某一固定值,认为记录数据时发生错误;针对上述缺失值的情况,删除缺少属性值的数据文件,保证属性的完整性;
(2)异常值的处理:异常值表现为某单个属性的值过大或者过小;(a)速度的异常值,车辆速度大于200km/h认为是异常值,处理方式是用其相连的前后两个时段车辆速度的平均值来替代;(b)流量和占有率的异常值,剔除流量和占有率为负值的数据;
步骤2:偶发性拥堵事件的提取
步骤2.1拥堵事件的判定
道路拥挤度用道路的实际交通需求量与相应道路最大通行能力的比值来衡量,即道路饱和度V/C,通常认为当V/C取值为0.8,1.0,1.1,为道路拥挤度的三个拐点;
根据速度-饱和度的关系,计算出道路拥挤度三个拐点对应的速度临界值,基于速度临界值判定拥堵事件是否发生;
速度-饱和度的关系模型如公式(1)所示:
其中α1根据道路具体情况有所变化,根据各个断面的实际车速U,取实际车速U的85%分位数作为每个断面的设计速度值U′S,根据各个断面的设计速度值U′S对参数α1进行修正,修正后的回归参数α′1为:
式中,α′1为修正后的回归参数,Us为道路设计速度,U′S为每个断面的设计速度值,
当V/C取值分别为0.8,1.0,1.1时,给定α′1,α2,α3和Us的值,根据公式(1)计算得到三个速度临界值,分别为和根据道路交通信息实时监测***获取的实际车速U来判定道路拥堵状态,当时,道路交通顺畅;当时,道路轻微拥堵;当时,道路中度拥堵;当时,道路严重拥堵;
步骤2.2偶发性拥堵事件的判定
在步骤2.1的基础上,进一步判定拥堵事件是否为偶发性拥堵;若拥堵开始时刻造成道路交通流参数的突变,则该次拥堵事件为偶发性拥堵事件,否则为常发性拥堵事件;
运用标准差法,通过构造占有率的标准正态变差SND来判定偶发性拥堵事件是否发生,SND的数学表达式如下所示:
当拥堵开始连续两个时段的标准正态变差SND都大于设定阈值Y时,认为发生了偶发性拥堵事件,其中,m和Y的取值为整数,基于历史数据进行试算得到,令m取5,Y取4;
步骤3:构造偶发性拥堵事件持续时间的样本数据
在步骤2的基础上,基于历史数据,以每个偶发性拥堵事件为一个观测样本,统计每个偶发性拥堵事件发生的断面编号、日期、开始时间、结束时间和拥堵持续时间,所述拥堵持续时间为拥堵事件的结束时间与开始时间的差值;
通过交通检测***获取偶发性拥堵事件发生时最初时段内的交通属性和时间属性,运用GIS地图匹配技术,获取相应路段的空间属性和道路环境属性;
每个偶发性拥堵事件为一个观测样本,以每个观测样本的开始时间为关键词,将观测样本的断面编号、日期、结束时间、拥堵持续时间,以及相应时段的交通属性、时间属性,相应路段的空间属性和道路环境属性匹配到观测样本中,构造偶发性拥堵事件持续时间的样本数据;
步骤4:构建偶发性拥堵持续时间的风险模型,并基于历史数据估计模型参数
将偶发性拥堵持续时间视为一种生存持续时间,引入加速失效的风险模型估计偶发性拥堵持续时间及其显著影响因子;
步骤4.1、令T表示非负的随机变量,代表偶发性拥堵持续时间,T的密度函数和分布函数分别为f(t)和F(t),T的生存函数S(t)和风险率函数h(t)分别如式(4)和式(5)所示:
生存函数S(t)表示偶发性拥堵持续时间T长于给定时间t的概率;风险率函数h(t)表示拥堵持续至时间t时没有结束,但在接下来的一个非常小的单位时间间隔Δt内结束的条件概率;
步骤4.2、构建考虑影响因素的偶发性拥堵持续时间加速失效风险模型,偶发性拥堵持续时间的潜在影响因素定义为协变量X,假定偶发性拥堵持续时间T的对数logT与其协变量X之间存在如下线性关系:
logT=βX+ε=β0+β1x1+...βpxp+ε (6)
式中,X={1,x1,x2,x3...xp}′为协变量,β={β0,β1,β2...βp}为系数向量;p为协变量的个数,ε是随机误差项,ε的密度函数为g(ε,d),ε的生存函数为G(ε,d),d是偶发性拥堵持续时间风险模型的辅助参数,偶发性拥堵持续时间T与协变量的X和g的分布有关,g服从不同的分布时,能推导出各种参数分布的偶发性拥堵持续时间风险模型,
步骤4.3、基于历史数据,采用极大似然估计方法估计偶发性拥堵持续时间风险模型的参数,令b=(β,d)表示待估参数向量,设有n个偶发性拥堵持续时间的历史数据样本,分别为t1,t2...tn,则T的概率密度函数为f(ti,b),其中i=1,2,…,n,由于历史数据样本都是完全数据,则偶发性拥堵持续时间样本的对数似然函数,如下式所示:
步骤4.4、用BIC作为风险模型优劣的衡量指标,BIC的定义如下式所示:
式中,为对数似然函数值,k为偶发性拥堵持续时间风险模型中待估参数的个数,n为样本数量,运用公式计算不同分布风险模型的BIC值并比较,选取BIC值最小的即为偶发性拥堵持续时间的最优参数分布风险模型,则得到偶发性拥堵持续时间风险模型的最终数学表达式;
步骤5:获取实时数据,对新的偶发性拥堵持续时间进行估计
基于步骤4得到的偶发性拥堵持续时间风险模型的最终表达式,从交通检测***获取实时的偶发性拥堵事件及其交通属性、时空属性和道路环境属性作为模型的输入变量数据,即可对当前偶发性拥堵事件的持续时间进行估计或预测。
2.如权利要求1所述的偶发***通拥堵持续时间的数据提取与实时预测方法,其特征在于,步骤3中,所述最初时段为2分钟内,所述交通属性包括平均每车道的交通流量、车速,所述时间属性包括工作日、周末、高峰期,所述空间属性包括内外环、方位,所述道路环境属性包括公交站点、匝道、高架桥。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910835268.XA CN110751311B (zh) | 2019-09-05 | 2019-09-05 | 偶发***通拥堵持续时间的数据提取与实时预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910835268.XA CN110751311B (zh) | 2019-09-05 | 2019-09-05 | 偶发***通拥堵持续时间的数据提取与实时预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110751311A true CN110751311A (zh) | 2020-02-04 |
CN110751311B CN110751311B (zh) | 2022-09-13 |
Family
ID=69276167
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910835268.XA Active CN110751311B (zh) | 2019-09-05 | 2019-09-05 | 偶发***通拥堵持续时间的数据提取与实时预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110751311B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111462485A (zh) * | 2020-03-31 | 2020-07-28 | 电子科技大学 | 一种基于机器学习的交通路口拥堵的预测方法 |
CN111815989A (zh) * | 2020-06-19 | 2020-10-23 | 勇鸿(重庆)信息科技有限公司 | 一种基于c-v2x技术的道路事故救援方法及*** |
CN112530163A (zh) * | 2020-11-23 | 2021-03-19 | 腾讯科技(深圳)有限公司 | 交通事故预测方法、装置、电子设备及存储介质 |
CN113345525A (zh) * | 2021-06-03 | 2021-09-03 | 谱天(天津)生物科技有限公司 | 一种用于高通量检测中减少协变量对检测结果影响的分析方法 |
CN115018213A (zh) * | 2022-08-09 | 2022-09-06 | 深圳市城市交通规划设计研究中心股份有限公司 | 高速公路事故持续时间预测方法、电子设备及存储介质 |
CN116777703A (zh) * | 2023-04-24 | 2023-09-19 | 深圳市普拉图科技发展有限公司 | 一种基于大数据的智慧城市管理方法和*** |
CN118172936A (zh) * | 2024-05-13 | 2024-06-11 | 东南大学 | 一种基于车道级交通参数的异常交通事件智能检测方法及*** |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2323115A1 (en) * | 2009-11-09 | 2011-05-18 | Hitachi, Ltd. | Method and apparatus for predicting traffic jam area |
CN103150930A (zh) * | 2013-02-01 | 2013-06-12 | 东南大学 | 针对快速道路常发性拥堵路段的追尾事故实时预测方法 |
CN110111578A (zh) * | 2019-05-25 | 2019-08-09 | 东南大学 | 一种基于张量恢复的偶发***通拥堵检测方法 |
-
2019
- 2019-09-05 CN CN201910835268.XA patent/CN110751311B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2323115A1 (en) * | 2009-11-09 | 2011-05-18 | Hitachi, Ltd. | Method and apparatus for predicting traffic jam area |
CN103150930A (zh) * | 2013-02-01 | 2013-06-12 | 东南大学 | 针对快速道路常发性拥堵路段的追尾事故实时预测方法 |
CN110111578A (zh) * | 2019-05-25 | 2019-08-09 | 东南大学 | 一种基于张量恢复的偶发***通拥堵检测方法 |
Non-Patent Citations (2)
Title |
---|
周映雪,杨小宝,环梅,四兵锋: ""基于生存分析的城市道路交通拥堵持续时间研究"", 《应用数字与力学》 * |
李妍峰,高自友, 李军: ""基于实时交通信息的城市动态网络车辆路径优化问题"", 《***工程理论与实践》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111462485A (zh) * | 2020-03-31 | 2020-07-28 | 电子科技大学 | 一种基于机器学习的交通路口拥堵的预测方法 |
CN111815989A (zh) * | 2020-06-19 | 2020-10-23 | 勇鸿(重庆)信息科技有限公司 | 一种基于c-v2x技术的道路事故救援方法及*** |
CN112530163A (zh) * | 2020-11-23 | 2021-03-19 | 腾讯科技(深圳)有限公司 | 交通事故预测方法、装置、电子设备及存储介质 |
CN113345525A (zh) * | 2021-06-03 | 2021-09-03 | 谱天(天津)生物科技有限公司 | 一种用于高通量检测中减少协变量对检测结果影响的分析方法 |
CN115018213A (zh) * | 2022-08-09 | 2022-09-06 | 深圳市城市交通规划设计研究中心股份有限公司 | 高速公路事故持续时间预测方法、电子设备及存储介质 |
CN115018213B (zh) * | 2022-08-09 | 2022-11-25 | 深圳市城市交通规划设计研究中心股份有限公司 | 高速公路事故持续时间预测方法、电子设备及存储介质 |
CN116777703A (zh) * | 2023-04-24 | 2023-09-19 | 深圳市普拉图科技发展有限公司 | 一种基于大数据的智慧城市管理方法和*** |
CN116777703B (zh) * | 2023-04-24 | 2024-02-02 | 深圳市普拉图科技发展有限公司 | 一种基于大数据的智慧城市管理方法和*** |
CN118172936A (zh) * | 2024-05-13 | 2024-06-11 | 东南大学 | 一种基于车道级交通参数的异常交通事件智能检测方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN110751311B (zh) | 2022-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110751311B (zh) | 偶发***通拥堵持续时间的数据提取与实时预测方法 | |
CN109448367B (zh) | 一种基于大数据图像采集的智能道路交通追踪管理*** | |
CN109558988B (zh) | 一种基于大数据融合的电动汽车能耗预测方法及*** | |
Polus | A study of travel time and reliability on arterial routes | |
CN102087788B (zh) | 基于浮动车车速置信度的交通状态参数估计方法 | |
Alexander et al. | Assessing the impact of real-time ridesharing on urban traffic using mobile phone data | |
CN102737504B (zh) | 一种基于驾驶特性的公交车到站时间实时估计方法 | |
DK2619059T3 (en) | Driver profiling system and method | |
CN110634292B (zh) | 一种基于路阻性能函数的行程时间可靠性估计方法 | |
CN103440768B (zh) | 一种基于动态修正的公交车到达时间实时预测方法 | |
CN110390349A (zh) | 基于XGBoost模型的公交车客流量预测建模方法 | |
CN104123833A (zh) | 一种道路状况的规划方法和装置 | |
Xinghao et al. | Predicting bus real-time travel time basing on both GPS and RFID data | |
CN108573600B (zh) | 一种驾驶员行为诱导与局部交通流优化方法 | |
CN112150802B (zh) | 基于地面公交运行状态可靠性的城市道路等级划分方法 | |
CN112419131A (zh) | 交通起讫点需求估算方法 | |
CN110796315A (zh) | 基于时效信息和深度学习的离港航班延误预测方法 | |
Wang et al. | Vehicle trajectory reconstruction for signalized intersections with low‐frequency floating car data | |
Yang et al. | Potential of low-frequency automated vehicle location data for monitoring and control of bus performance | |
CN111680888B (zh) | 基于rfid数据确定路网容量的方法 | |
CN111915880A (zh) | 一种高速公路异常事件事发点有效通行能力估计方法 | |
CN114202923B (zh) | 一种城市道路交通拥堵时空分布综合指数测评方法 | |
CN114495494A (zh) | 基于交通流参数预测的交通态势评估方法 | |
CN114565155A (zh) | 一种公路安全测试方法、装置、电子设备及存储介质 | |
CN110120154B (zh) | 大规模路网下利用检测器数据的交通路况预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |