CN109754604B - 一种基于交通线圈检测数据质量控制的拥堵区域识别方法 - Google Patents

一种基于交通线圈检测数据质量控制的拥堵区域识别方法 Download PDF

Info

Publication number
CN109754604B
CN109754604B CN201910109042.1A CN201910109042A CN109754604B CN 109754604 B CN109754604 B CN 109754604B CN 201910109042 A CN201910109042 A CN 201910109042A CN 109754604 B CN109754604 B CN 109754604B
Authority
CN
China
Prior art keywords
data
flow
time
abnormal
traffic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910109042.1A
Other languages
English (en)
Other versions
CN109754604A (zh
Inventor
秦夷
阮烜民
蒲辉荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Intellitrains Co ltd
Original Assignee
Jiangsu Intellitrains Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Intellitrains Co ltd filed Critical Jiangsu Intellitrains Co ltd
Publication of CN109754604A publication Critical patent/CN109754604A/zh
Application granted granted Critical
Publication of CN109754604B publication Critical patent/CN109754604B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于交通线圈检测数据质量控制的拥堵区域识别方法,基于原始交通线圈数据中的车速、流量及时间占用率,对超出阈值数据、缺失数据、错误数据、异常属性数据、车流异常数据进行修正。然后构建基于图基平滑法的流量阈值估计模型对流量异常数据进行识别,并结合历史数据,借助多元线性回归进行修正,最终获取合理数据集。借助合理数据集中车速、流量及时间占用率,进行交通拥堵区域的识别。本发明能够简单、高效地对交通线圈检测数据进行质量控制,获取合理数据集,避免噪声数据的干扰,确保了交通拥堵区域识别的准确性。

Description

一种基于交通线圈检测数据质量控制的拥堵区域识别方法
技术领域
本发明属于智能交通领域,尤其涉及一种基于交通线圈检测数据质量控制的拥堵区域识别方法。
背景技术
交通线圈检测技术是一种基于电磁感应的车辆检测技术,由信号处理单元、环型线圈与馈线线路组成调谐电路,工作电流通过线圈时会在其周围形成电磁场,当车辆行驶至线圈上方时,金属车体感应出涡流电流,涡流电流又产生与环路方向相反的电磁场,使得环形线圈中的电感量下降,从而引起电路的谐振频率升高,进而到达交通数据采集的目的,后台数据管理***以一定的时间汇集度进行数据的记录,每条数据包括过车时间、车速、时间占用率、流量、车道位置等属性。
交通线圈检测技术以其适用性强、稳定性好、可靠性高的特点在交通数据采集中得到了广泛的应用。然而,在实际的磁感应线圈检测***中,受硬件碾压故障、外界电磁波干扰、通讯故障、非正常交通状态等因素的影响,致使实时检测的数据并非完全准确,易出现数据缺失、数据错误以及数据异常等问题,大大削弱了磁感应线圈检测器的应用效果。
目前,在检测线圈数据的分析方面均集中在数据挖掘及应用层面,主要借助所获数据拟合交通参数关系,以获取不同交通状态下的拥挤阈值,实现对瓶颈位置的识别,分析瓶颈处的交通拥堵演化规律。这些研究虽然在分析前对原始数据进行了预处理,但方法极为简单,仅局限于缺失及异常数据的识别及剔除,并未给出详细完善的交通线圈检测数据质量控制方法,仍缺乏可直接用于指导数据使用者实际工作的数据质量控制体系。
发明内容
技术问题:本发明提供一种确保了交通线圈检测数据的正确性、合理性的基于交通线圈检测数据质量控制的拥堵区域识别方法,实现了超出阈值数据、缺失数据、错误数据、异常属性数据及流量异常数据的识别及修正,最终确保交通线圈检测数据的质量,为制定科学合理的交通管控措施提供了正确、全面的数据支撑。
技术方案:本发明的基于交通线圈检测数据质量控制的拥堵区域识别方法,包括以下步骤:
1)在原始交通线圈数据中,依据道路通行能力对机动车流量数据进行修正,依据设计车速对机动车车速数据进行修正,获得阈值控制数据集;
2)在阈值控制数据集中,依据车速、流量及时间占用率三项属性的取值情况对缺失数据、错误数据、异常属性数据进行识别,并依据相邻时段数据对缺失数据进行修正,采用取0法对错误数据进行修正,依据三项属性之间的关联性对异常属性数据进行修正,获得有效数据集;
3)在有效数据集中,采用图基平滑法对机动车流量异常数据进行识别,并采用多元线性回归对机动车流量异常数据进行修正,获得合理数据集;
4)依据合理数据集中的车速、流量及时间占用率,进行交通拥堵区域识别。
进一步的,本发明方法中,所述原始交通线圈数据是指车辆驶过线圈检测器时,后台数据管理***按照时间汇集度记录的数据,每条数据包括过车时间、车速、时间占用率、流量、车道位置属性。
进一步的,本发明方法中,所述步骤1)中,根据下式对机动车流量数据进行修正:
Figure BDA0001967363880000021
式中,t为时段编号,每个时段时长均为T;T为后台数据管理***记录数据的时间汇集度;C为某车道的道路通行能力值;Q1(t)为某车道第t时段,车辆数据中流量修正后的值;q(t)为某车道第t时段,车辆数据中的流量值,也即某车道第t时段内驶过线圈检测器的车辆数;T0为单位标准时间,取1小时;
根据下式对机动车车速数据进行修正:
Figure BDA0001967363880000022
式中,VD为某车道的设计车速值;V(t)为某车道第t时段内,驶过线圈检测器所有车辆的平均车速;V1(t)为某车道第t时段车辆数据中车速修正后的值。
进一步的,本发明方法中,所述步骤2)中错误数据包括流量错误数据、车速错误数据及时间占用率错误数据三种类型,异常属性数据包括流量属性异常数据、车速属性异常数据及时间占用率属性异常数据三种类型,对于含有N个时段数据的某车道阈值控制数据集,其中的缺失数据、错误数据及异常属性数据识别步骤如下:
2.1)初始化,t=1,t为时段编号;
2.2)取第t时段的阈值控制数据,每条数据包含流量控制值Q1(t)、车速控制值V1(t)及时间占有率值D1(t),若Q1(t)、V1(t)、D1(t)均缺失,则判定第t时段的数据为缺失数据,进入步骤2.9),否则直接进入步骤2.3);
2.3)若V1(t)=0且D1(t)=0,但Q1(t)≠0或缺失,则判定第t时段的数据为流量错误数据,进入步骤2.9),否则进入步骤2.4);
2.4)若Q1(t)=0且D1(t)=0,但V1(t)≠0或缺失,则判定第t时段的数据为车速错误数据,进入步骤2.9),否则进入步骤2.5);
2.5)若V1(t)=0且Q1(t)=0,但D1(t)≠0或缺失,则判定第t时段的数据为时间占用率错误数据,进入步骤2.9),否则进入步骤2.6);
2.6)若V1(t)≠0且D1(t)≠0,但Q1(t)=0或缺失,则判定第t时段的数据为流量属性异常数据,进入步骤2.9),否则进入步骤2.7);
2.7)若Q1(t)≠0且D1(t)≠0,但V1(t)=0或缺失,则判定第t时段的数据为车速属性异常数据,进入步骤2.9)否则进入步骤2.8);
2.8)若V1(t)≠0且Q1(t)≠0,但D1(t)=0或缺失,则判定第t时段的数据为时间占用率属性异常数据,进入步骤2.9)否则直接进入步骤2.9);
2.9)令t=t+1,若t≤N,则返回步骤2.2)对阈值控制数据集中的下一时段数据进行判断,否则输出所有缺失数据、错误数据及属性异常数据。
进一步的,本发明方法中,所述步骤2)中依据相邻时段数据对缺失数据的修正方法如下:
Figure BDA0001967363880000031
式中,t1表示缺失数据出现的时段;Q2(t1)、V2(t1)、D2(t1)表示t1时段缺失数据中,流量、车速、时间占用率属性修正后的值;Q1(t1-2)、Q1(t1-1)、Q1(t1+1)、Q1(t1+2)表示t1时段前后相邻四个时段的流量控制数据;V1(t1-2)、V1(t1-1)、V1(t1+1)、V1(t1+2)表示t1时段前后相邻四个时段的车速控制数据;D1(t1-2)、D1(t1-1)、D1(t1+1)、D1(t1+2)表示t1时段前后相邻四个时段的时间占用率数据。
进一步的,本发明方法中,所述步骤2)中采用取0法对错误数据进行修正的方法为:对于错误数据出现的时段t2,若为流量错误数据,则取流量修正后的值Q3(t2)=0、若为车速错误数据,则取车速修正后的值V3(t2)=0、若为时间占用率错误数据,则取时间占用率修正后的值D3(t2)=0。
进一步的,本发明方法中,所述步骤2)中依据三项属性之间的关联性对异常属性数据进行修正的具体方式为:对于异常属性数据出现的时段t3,若为流量属性异常数据,则取流量修正后的值
Figure BDA0001967363880000041
若为车速属性异常数据,则取车速修正后的值
Figure BDA0001967363880000042
若为时间占用率属性异常数据,则取时间占用率修正后的值
Figure BDA0001967363880000043
其中,AEVL为平均有效车长。
进一步的,本发明方法中,所述步骤3)中流量异常数据识别的具体步骤如下:
3.1)在有效数据集中,取采集时段相邻的四组车辆数据,得到数据中的流量值分别为Q(t-2),Q(t-1),Q(t),Q(t+1),t为时段编号,取中位数构造一次平滑序列Q1(t);
3.2)取Q1(t-1),Q1(t),Q1(t+1)的中位数构造二次平滑序列Q2(t);
3.3)令
Figure BDA0001967363880000044
构造三次平滑序列Q3(t);
3.4)计算Q3(t)与Q(t)的均方根误差
Figure BDA0001967363880000045
M表示有效数据集中的数据量;
3.5)取第t时段最大、最小流量合理阈值分别为:Qmax(t)=Q3(t)+RMSE,Qmin(t)=Q3(t)-RMSE;
3.6)若
Figure BDA0001967363880000046
则认为t时段的流量数据异常,需要修正,否则认为正常,无需修正。
进一步的,本发明方法中,所述步骤3)中根据下式对流量异常数据进行修正:
C(m)=a0+a1·1Q(m)+a2·2Q(m)+…ar·rQ(m)+e
其中,m为流量异常数据出现的时段,C(m)为时段m的异常流量数据修正后的值;1Q(m),2Q(m),…,rQ(m)为该交通线圈检测器历史上r天,在同一车道、同一时段采集到的正常流量数据;a0为常数项,a1,a2,...,ar为回归系数;e为随机误差。
交通实时数据在交通管理与控制中起着至关重要的作用,数据的缺损、错误、异常直接影响到对交通状态的判断,交通状态的误判将造成交通管理与控制措施的不合理。一般认为,车辆驶过交通线圈检测器时,线圈电流发生变化,检测器便进行车辆的识别,然后后台数据管理***以一定的时间汇集度进行过车数据的记录,该原始交通线圈数据中,每条数据包括过车时间、车速、时间占用率、流量、车道位置等属性。本发明主要针对车速、时间占用率、流量三项属性,对交通线圈检测数据进行质量控制,包括以下三个方面:1)超出阈值数据的修正;2)缺失数据、错误数据、异常属性数据的识别及修正;3)流量异常数据的识别及修正。第一方面,提供了一种超出阈值数据的修正方法。在原始交通线圈数据中,对属性值超出阈值的数据进行修正,包括流量超出数据修正及车速超出数据修正两个方面,得到阈值控制数据集。
进一步地,所述流量超出数据是依据道路通行能力进行修正的,因车道通行能力有限,需对流量数据进行修正,修正方法为:
Figure BDA0001967363880000051
式中,t为时段编号,每个时段时长均为T;T为后台数据管理***进行数据采样的时间汇集度;C为某车道的道路通行能力值;Q1(t)为某车道第t时段,车辆数据中流量修正后的值;q(t)为某车道第t时段,车辆数据中的流量值,也即某车道第t时段内驶过线圈检测器的车辆数;T0为单位标准时间,取1小时。
进一步地,所述车速超出数据是依据道路设计车速进行修正的,因驾驶员有安全舒适的要求,调查发现车速一般不会超过设计车速的1.25倍,据此对车速数据进行修正,修正方法为:
Figure BDA0001967363880000052
式中,VD为某车道的设计车速值;V(t)为某车道第t时段内,驶过线圈检测器所有车辆的平均车速;V1(t)为某车道第t时段车辆数据中车速修正后的值。
第二方面,提供了一种缺失数据、错误数据及异常属性数据的识别及修正方法。在阈值控制数据集基础上,首先,结合流量、车速及时间占用率三项属性的取值情况进行数据识别;然后,依据相邻时段数据对缺失数据进行修正,采用取0法对错误数据进行修正,借助三项属性的关联性对异常属性数据进行修正;最终得到有效数据集。
进一步地,所述缺失数据、错误数据、异常属性数据是依据流量属性值Q、车速属性值V及时间占用率属性值D的取值情况定义的,且错误数据包括流量错误数据、车速错误数据及时间占用率错误数据三种类型,异常属性数据包括流量属性异常数据、车速属性异常数据及时间占用率属性异常数据三种类型。
其中,缺失数据定义为Q、V、D均为缺失的数据;
其中,流量错误数据定义为V=0且D=0,但Q≠0或缺失的数据。车速错误数据定义为Q=0且D=0,但V≠0或缺失的数据。时间占用率错误数据定义为V=0且Q=0,但D≠0或缺失的数据;
其中,流量属性异常数据定义为V≠0且D≠0,但Q=0或缺失的数据。车速属性异常数据定义为Q≠0且D≠0,但V=0或缺失的数据。时间占用率属性异常数据定义为V≠0且Q≠0,但D=0或缺失的数据。
进一步地,所述缺失数据、错误数据、异常属性数据分别采用不同的修正方法进行修正。
其中,缺失数据依据相邻时段的数据进行修正,修正方法如下:
Figure BDA0001967363880000061
式中,t1表示缺失数据出现的时段;Q2(t1)、V2(t1)、D2(t1)表示t1时段缺失数据中,流量、车速、时间占用率属性修正后的值;Q1(t1-2)、Q1(t1-1)、Q1(t1+1)、Q1(t1+2)表示t1时段前后相邻四个时段的流量控制数据;V1(t1-2)、V1(t1-1)、V1(t1+1)、V1(t1+2)表示t1时段前后相邻四个时段的车速控制数据;D1(t1-2)、D1(t1-1)、D1(t1+1)、D1(t1+2)表示t1时段前后相邻四个时段的时间占用率数据。
其中,错误数据采用取0法进行修正,对于错误数据出现的时段t2,若为流量错误数据,则取流量修正后的值Q3(t2)=0、若为车速错误数据,则取车速修正后的值V3(t2)=0、若为时间占用率错误数据,则取时间占用率修正后的值D3(t2)=0。
其中,异常属性数据借助属性关联性进行修正,对于异常属性数据出现的时段t3,若为流量属性异常数据,则取流量修正后的值
Figure BDA0001967363880000062
若为车速属性异常数据,则取车速修正后的值
Figure BDA0001967363880000063
若为时间占用率属性异常数据,则取时间占用率修正后的值
Figure BDA0001967363880000064
其中,AEVL为平均有效车长。
第三方面,提供了流量异常数据的识别及修正方法。在有效数据集基础上,首先,采用图基平滑法对机动车流量异常数据进行识别;然后,采用多元线性回归对机动车流量异常数据进行修正;最终得到合理数据集。
进一步地,流量异常数据是依据流量变化规律构建基于图基平滑法的流量阈值估计模型,通过确定合理流量窗来实识别的,流量异常数据识别方法如下:
Step1在有效数据集中,取采集时段相邻的四组车辆数据,得到数据中的流量值分别为Q(t-2),Q(t-1),Q(t),Q(t+1),t为时段编号,取中位数构造一次平滑序列Q1(t);
Step2取Q1(t-1),Q1(t),Q1(t+1)的中位数构造二次平滑序列Q2(t);
Step3令
Figure BDA0001967363880000071
构造三次平滑序列Q3(t);
Step4计算Q3(t)与Q(t)的均方根误差
Figure BDA0001967363880000072
M表示有效数据集中的数据量;
Step5对平滑序列Q3(t)借助RMSE值构建合理流量阈值模型:
Figure BDA0001967363880000073
式中,Qmax(t)为第t时段的最大流量估计阈值;Qmin(t)为第t时段的最小流量估计阈值;
Step6若
Figure BDA0001967363880000074
则认为t时段的流量数据异常,需要修正,否则认为正常,无需修正。
进一步地,对于流量异常数据出现的时段m,根据多元线性回归对流量异常数据进行修正:
C(m)=a0+a1·1Q(m)+a2·2Q(m)+…ar·rQ(m)+e
式中,C(m)为时段m的异常流量数据修正后的值;1Q(m),2Q(m),…,rQ(m)为该线圈检测器历史上r天,在同一车道、同一时段采集到的正常流量数据;a0为常数项,a1,a2,...,ar为回归系数;e为随机误差。
在城市路段布设交通线圈实现对原始交通数据的获取,再借助前述质量控制方法获取的合理数据集,可进行拥堵区域识别、交通诱导及道路优化设计,避免了噪声数据带来的干扰,确保了方案的正确性、合理性并符合实际交通状况。
进一步地,依据合理数据集中的车速、时间占用率进行拥堵区域识别及交通诱导,包括以下四个步骤:
Step 1给定需要进行拥堵区域识别的时段,计算各线圈检测器在该时段内合理数据集的平均车速、平均时间占用率;
Step 2将平均车速小于拥堵车速,或平均时间占用率大于拥堵占用率的线圈检测器位置称为拥堵点;
Step 3获取城市中研究区域内所有拥堵点,借助DBSCAN空间聚类算法获取主要拥堵区域;
Step 4对于拥堵区域,交通管理部门可借助周边道路制定交通诱导方案,并通过广播告知驾驶员。
进一步地,依据合理数据集中的流量进行道路优化设计,包含以下三个步骤:
Step 1依据道路等级、车道数,结合规范获取道路设计通行能力值;
Step 2将道路设计通行能力与合理数据集中的流量进行对比,若设计通行能力大于流量,则无需进行道路优化;若通行能力小于流量,则现有道路不能满足通行需求,需要进行优化设计;
Step 3对于需要进行优化的道路,取流量与设计通行能力的差值与单个车道的设计通行能力做比,获取需要进行优化时拓宽的合理车道数量。
交通数据是交通管理部门制定交通管理与控制措施的基础,数据质量的优劣直接关乎到所制定管控措施的合理与否,缺损的、错误的、异常的数据源往往会对管控措施的制定带来误导。本发明提供了一种可直接用于指导交通线圈数据使用者实际工作的数据质量控制体系,确保了线圈交通数据的全面性、正确性,为交通管控的决策者提供了合理可靠的数据支撑。
有益效果:目前,交通管理者对交通数据注重于应用层面,较少涉及数据的质量控制,且在进行数据质量控制时也仅是简单的数据清洗,对缺失数据、错误数据、属性异常数据进行二次扫描以确认数据是否真的存在不合理,对这些不合理的数据也仅是进行简单的剔除或者直接使用历史数据进行代替,致使数据存在残缺或不合理的情况。与目前交通数据的清洗相比,本发明结合各项交通属性界限值对超出阈值数据进行了修正,依据交通流相关参数的取值情况及其参数关联性对缺失数据、错误数据、异常属性数据进行的识别及修正,并结合交通流演变规律对流量异常数据进行了识别及修正,避免了传统交通数据清洗带来的残缺与不合理,为交通管理与控制策略的制定提供了全面、合理的数据支撑。
附图说明
图1为本发明的总体流程图;
图2为超出阈值数据修正流程图;
图3为缺失数据、错误数据及异常属性数据质量控制流程图;
图4为缺失数据、错误数据及异常属性数据识别流程图;
图5为缺失数据、错误数据及异常属性数据修正流程图;
图6为流量异常数据识别流程图;
图7为流量异常数据修正流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明提供了一种基于交通线圈检测数据质量控制的拥堵区域识别方法,该方法建立在流量、车速及时间占用率三项属性基础上,主要包括以下三个方面:1)在原始交通线圈数据基础上,进行超出阈值数据的修正,获取阈值控制数据集;2)在阈值控制数据集基础上,进行缺失数据、错误数据、异常属性数据的识别及修正,获取有效数据集;3)在有效数据集基础上,进行流量异常数据的识别及修正,获取合理数据集。
交通线圈检测技术是一种基于电磁感应的车辆检测技术,当车辆行驶至线圈上方时,金属车体感应出涡流电流,涡流电流又产生与环路方向相反的电磁场,使得环形线圈中的电感量下降,从而引起电路的谐振频率升高,进而到达交通数据采集的目的,后台数据管理***以一定的时间汇集度进行数据的记录,原始交通线圈数据中,每条数据包括过车时间、车速、时间占用率、流量、车道位置等属性这些属性数据是否取值合理需借助属性阈值进行判别及修正。调查发现道路实际车速值上限一般不会超出设计车速的125%,因此以设计车速的125%作为车速阈值对数据中的车速属性数据进行控制。此外,道路交通流量不应超过道路最大通行能力,因此以道路最大通行能力作为流量阈值对数据中的流量属性数据进行控制。据此给出流量数据及车速数据的修正方法如图2所示,以1.25倍设计车速VD作为车速阈值、道路通行能力C作为流量阈值,给出流量数据、车速数据的修正方法如下:
(1)流量数据
Figure BDA0001967363880000091
式中,t为时段编号,每个时段时长均为T;T为后台数据管理***进行数据采样的时间汇集度,市场上的交通线圈检测器采样的时间汇集度一般为0秒、1分钟或5分钟;C为某车道的道路通行能力值;Q1(t)为某车道第t时段,车辆数据中流量修正后的值;q(t)为某车道第t时段,车辆数据中的流量值,也即某车道第t时段内驶过线圈检测器的车辆数;T0为单位标准时间,取1小时。
(2)车速数据
Figure BDA0001967363880000101
式中,VD为某车道的设计车速值;V(t)为某车道第t时段内,驶过线圈检测器所有车辆的平均车速;V1(t)为某车道第t时段车辆数据中车速修正后的值。
通过对原始交通线圈数据的流量、车速数据修正,最终可得到阈值控制数据集。
如图3所示,缺失数据、错误数据及异常属性数据的修正是以阈值控制数据集为基础的,包括缺失数据、三类错误数据及三类异常属性数据的识别及修正。首先,通过流量、车速及时间占用率三项属性的取值情况构建缺失数据、错误数据、异常属性数据的识别方法;然后,依据相邻时段的数据对缺失数据进行修正,采用取0法对错误数据进行修正,依据流量、车速及时间占用率三项属性的关系对异常属性数据进行修正,最终获取有效数据集。
进一步地,如图4所示,缺失数据、错误数据及异常属性数据的识别均基于数据中流量、车速及时间占用率三项属性的取值情况,对于含有N个时段数据的某车道阈值控制数据集,其中的缺失数据、错误数据及异常属性数据识别步骤如下:
Step1初始化,t=1,t为时段编号;
Step2取第t时段的阈值控制数据,每条数据包含流量控制值Q1(t)、车速控制值V1(t)及时间占有率值D1(t),若Q1(t)、V1(t)、D1(t)均缺失,则判定第t时段的数据为缺失数据,进入Step9,否则直接进入Step3;
Step3若V1(t)=0且D1(t)=0,但Q1(t)≠0或缺失,则判定第t时段的数据为流量错误数据,进入Step9,否则进入Step4;
Step4若Q1(t)=0且D1(t)=0,但V1(t)≠0或缺失,则判定第t时段的数据为车速错误数据,进入Step9,否则进入Step5;
Step5若V1(t)=0且Q1(t)=0,但D1(t)≠0或缺失,则判定第t时段的数据为时间占用率错误数据,进入Step9,否则进入Step6;
Step6若V1(t)≠0且D1(t)≠0,但Q1(t)=0或缺失,则判定第t时段的数据为流量属性异常数据,进入Step9,否则进入Step7;
Step7若Q1(t)≠0且D1(t)≠0,但V1(t)=0或缺失,则判定第t时段的数据为车速属性异常数据,进入Step9否则进入Step8;
Step8若V1(t)≠0且Q1(t)≠0,但D1(t)=0或缺失,则判定第t时段的数据为时间占用率属性异常数据,进入Step9否则直接进入Step9;
Step9令t=t+1,若t≤N,则返回Step2对阈值控制数据集中的下一时段数据进行判断,否则输出所有缺失数据、错误数据及属性异常数据。
进一步地,如图5所示,对缺失数据,结合相邻时段的数据采用均值发进行修正;对流量错误数据、车速错误数据及时间占用率错误数据三类错误数据,采用取0法进行修正;对流量属性异常数据、车速属性异常数据及时间占用率属性异常数据三类异常属性数据,借助属性关联性进行修正,最终获取有效数据集。
其中,缺失数据依据相邻时段的数据进行修正,修正方法如下:
Figure BDA0001967363880000111
式中,t1表示缺失数据出现的时段;Q2(t1)、V2(t1)、D2(t1)表示t1时段缺失数据中,流量、车速、时间占用率属性修正后的值;Q1(t1-2)、Q1(t1-1)、Q1(t1+1)、Q1(t1+2)表示t1时段前后相邻四个时段的流量控制数据;V1(t1-2)、V1(t1-1)、V1(t1+1)、V1(t1+2)表示t1时段前后相邻四个时段的车速控制数据;D1(t1-2)、D1(t1-1)、D1(t1+1)、D1(t1+2)表示t1时段前后相邻四个时段的时间占用率数据。
其中,错误数据采用取0法进行修正,对于错误数据出现的时段t2,若为流量错误数据,则取流量修正后的值Q3(t2)=0、若为车速错误数据,则取车速修正后的值V3(t2)=0、若为时间占用率错误数据,则取时间占用率修正后的值D3(t2)=0。
其中,异常属性数据借助属性关联性进行修正,对于异常属性数据出现的时段t3,若为流量属性异常数据,则取流量修正后的值
Figure BDA0001967363880000112
若为车速属性异常数据,则取车速修正后的值
Figure BDA0001967363880000113
若为时间占用率属性异常数据,则取时间占用率修正后的值
Figure BDA0001967363880000114
其中,AEVL为平均有效车长。
通过对阈值控制数据集中的缺失数据、错误数据及异常属性数据的识别及修正,即可得到有效数据集。
虽然有效数据集中的数据保证了线圈数据在数值上的正确性及内容上的完整性,但仍可能存在不符合实际流量演变规律的异常流量数据,因此需结合单个交通线圈检测器的流量时变规律对数据做进一步质量控制。异常流量数据的识别及修正以有效数据集为基础,依据流量变化规律构建基于图基平滑法的流量阈值估计模型,以确定合理流量窗,进而实现流量异常数据的识别。结合历史数据,采用多元线性回归对流量异常数据进行修正。
如图6所示,流量异常数据是依据流量变化规律构建基于图基平滑法的流量阈值估计模型,通过确定合理流量窗来实识别的,流量异常数据识别方法如下:
Step1在有效数据集中,取采集时段相邻的四组车辆数据,得到数据中的流量值分别为Q(t-2),Q(t-1),Q(t),Q(t+1),t为时段编号,取中位数构造一次平滑序列Q1(t);
Step2取Q1(t-1),Q1(t),Q1(t+1)的中位数构造二次平滑序列Q2(t);
Step3令
Figure BDA0001967363880000121
构造三次平滑序列Q3(t);
Step4计算Q3(t)与Q(t)的均方根误差
Figure BDA0001967363880000122
M表示有效数据集中的数据量;
Step5对平滑序列Q3(t)借助RMSE值构建合理流量阈值模型:
Figure BDA0001967363880000123
式中,Qmax(t)为第t时段的最大流量估计阈值;Qmin(t)为第t时段的最小流量估计阈值;
Step6若
Figure BDA0001967363880000124
则认为t时段的流量数据异常,需要修正,否则认为正常,无需修正。
如图7所示,对于某流量异常数据出现的时段m,可依据该交通线圈检测器历史上r天,在同一车道、同一时段采集到的正常流量数据1Q(m),2Q(m),…,rQ(m),根据多元线性回归对流量异常数据进行修正:
C(m)=a0+a1·1Q(m)+a2·2Q(m)+…ar·rQ(m)+e
式中,C(m)为时段m的异常流量数据修正后的值;a0为常数项,a1,a2,…,ar为回归系数;e为随机误差。
通过对有效数据集中的流量异常数据的识别及修正,即可得到合理数据集。该合理数据集确保了交通线圈数据的完整性、正确性并符合交通演变规律,避免了异常数据对交通管控决策的误导,为交通管理与控制措施的制定提供了科学的数据支撑。
在城市路段布设交通线圈实现对原始交通数据的获取,借助前述质量控制方法获取的合理数据集,可进行拥堵区域识别、交通诱导及道路优化设计,避免了噪声数据带来的干扰,确保了方案的正确性、合理性并符合实际交通状况。
进一步地,依据合理数据集中的车速、时间占用率、流量进行拥堵区域识别,本发明可以采用包括以下步骤的方法来进行识别:
Step 1给定需要进行拥堵区域识别的时段,计算各线圈检测器在该时段内合理数据集的平均车速、平均时间占用率、平均流量,再结合检测器所处路段的通行能力及平均流量计算交通负荷。其中,路段通行能力依据其等级、车道数,结合规范获取;
Step 2将平均车速小于拥堵车速或时间占用率大于拥堵占用率或交通负荷大于拥堵负荷的线圈检测器位置称为拥堵点。其中,拥堵负荷取相关规范中四级服务水平所对应的交通负荷,拥堵车速取相关规范中四级服务水平所对应的车速,拥堵占用率取0.4~0.6;
Step 3获取城市中研究区域内所有拥堵点,借助DBSCAN空间聚类算法获取主要拥堵区域。
本发明的主要发明点和创新在于得到合理数据集。上述Step 1至Step 3对主要拥堵区域进行识别的步骤是现有常规技术手段,本发明方法中除了采用这一方式进行识别,还可以采用其他现有已知的方法,只要能实现对主要拥堵区域的识别即可。
本发明还可以在以上获取主要拥堵区域的基础上,对于拥堵区域,交通管理部门借助周边道路制定交通诱导方案,并通过广播告知驾驶员。
本发明中还可以依据合理数据集中的流量进行道路优化设计,包含以下三个步骤:
Step 1对于拥堵区域内的道路,依据道路等级、车道数,结合规范获取道路设计通行能力值;
Step 2将道路设计通行能力与合理数据集中的流量进行对比,若设计通行能力大于流量,则无需进行道路优化;若通行能力小于流量,则现有道路不能满足通行需求,需要进行优化设计;
Step 3对于需要进行优化的道路,取流量与设计通行能力的差值与单个车道的设计通行能力做比,获取需要进行优化时拓宽的合理车道数量。
最后应说明的是:尽管就本发明方法进行了示意和描述,但本领域的技术人员应当理解,只要不超出本发明的权利要求所限定的范围,可以对本发明进行各种变化和修改,这些对本发明权利要求进行改进的技术方案,均落入本发明的保护范围。

Claims (6)

1.一种基于交通线圈检测数据质量控制的拥堵区域识别方法,其特征在于,该方法包括以下步骤:
1)在原始交通线圈数据中,依据道路通行能力对机动车流量数据进行修正,依据设计车速对机动车车速数据进行修正,获得阈值控制数据集;对机动车流量数据的修正根据下式进行:
Figure FDA0002741496380000011
式中,t为时段编号,每个时段时长均为T;T为后台数据管理***记录数据的时间汇集度;C为某车道的道路通行能力值;Q1(t)为某车道第t时段,车辆数据中流量修正后的值;q(t)为某车道第t时段,车辆数据中的流量值,也即某车道第t时段内驶过线圈检测器的车辆数;T0为单位标准时间,取1小时;
根据下式对机动车车速数据进行修正:
Figure FDA0002741496380000012
式中,VD为某车道的设计车速值;V(t)为某车道第t时段内,驶过线圈检测器所有车辆的平均车速;V1(t)为某车道第t时段车辆数据中车速修正后的值;
2)在阈值控制数据集中,依据车速、流量及时间占用率三项属性的取值情况对缺失数据、错误数据、异常属性数据进行识别,并依据相邻时段数据对缺失数据进行修正,采用取0法对错误数据进行修正,依据三项属性之间的关联性对异常属性数据进行修正,获得有效数据集,所述错误数据包括流量错误数据、车速错误数据及时间占用率错误数据三种类型,异常属性数据包括流量属性异常数据、车速属性异常数据及时间占用率属性异常数据三种类型,对于含有N个时段数据的某车道阈值控制数据集,其中的缺失数据、错误数据及异常属性数据识别步骤如下:
2.1)初始化,t=1,t为时段编号;
2.2)取第t时段的阈值控制数据,每条数据包含流量控制值Q1(t)、车速控制值V1(t)及时间占有率值D1(t),若Q1(t)、V1(t)、D1(t)均缺失,则判定第t时段的数据为缺失数据,进入步骤2.9),否则直接进入步骤2.3);
2.3)若V1(t)=0且D1(t)=0,但Q1(t)≠0或缺失,则判定第t时段的数据为流量错误数据,进入步骤2.9),否则进入步骤2.4);
2.4)若Q1(t)=0且D1(t)=0,但V1(t)≠0或缺失,则判定第t时段的数据为车速错误数据,进入步骤2.9),否则进入步骤2.5);
2.5)若V1(t)=0且Q1(t)=0,但D1(t)≠0或缺失,则判定第t时段的数据为时间占用率错误数据,进入步骤2.9),否则进入步骤2.6);
2.6)若V1(t)≠0且D1(t)≠0,但Q1(t)=0或缺失,则判定第t时段的数据为流量属性异常数据,进入步骤2.9),否则进入步骤2.7);
2.7)若Q1(t)≠0且D1(t)≠0,但V1(t)=0或缺失,则判定第t时段的数据为车速属性异常数据,进入步骤2.9)否则进入步骤2.8);
2.8)若V1(t)≠0且Q1(t)≠0,但D1(t)=0或缺失,则判定第t时段的数据为时间占用率属性异常数据,进入步骤2.9)否则直接进入步骤2.9);
2.9)令t=t+1,若t≤N,则返回步骤2.2)对阈值控制数据集中的下一时段数据进行判断,否则输出所有缺失数据、错误数据及属性异常数据;
所述依据三项属性之间的关联性对异常属性数据进行修正的具体方式为:对于异常属性数据出现的时段t3,若为流量属性异常数据,则取流量修正后的值
Figure FDA0002741496380000021
若为车速属性异常数据,则取车速修正后的值
Figure FDA0002741496380000022
若为时间占用率属性异常数据,则取时间占用率修正后的值
Figure FDA0002741496380000023
其中,AEVL为平均有效车长;
3)在有效数据集中,采用图基平滑法对机动车流量异常数据进行识别,并采用多元线性回归对机动车流量异常数据进行修正,获得合理数据集;
4)依据合理数据集中的车速、流量及时间占用率,进行交通拥堵区域识别。
2.根据权利要求1所述的一种基于交通线圈检测数据质量控制的拥堵区域识别方法,其特征在于,所述原始交通线圈数据是指车辆驶过线圈检测器时,后台数据管理***按照时间汇集度记录的数据,每条数据包括过车时间、车速、时间占用率、流量、车道位置属性。
3.根据权利要求1或2所述的一种基于交通线圈检测数据质量控制的拥堵区域识别方法,其特征在于,所述步骤2)中依据相邻时段数据对缺失数据的修正方法如下:
Figure FDA0002741496380000031
式中,t1表示缺失数据出现的时段;Q2(t1)、V2(t1)、D2(t1)表示t1时段缺失数据中,流量、车速、时间占用率属性修正后的值;Q1(t1-2)、Q1(t1-1)、Q1(t1+1)、Q1(t1+2)表示t1时段前后相邻四个时段的流量控制数据;V1(t1-2)、V1(t1-1)、V1(t1+1)、V1(t1+2)表示t1时段前后相邻四个时段的车速控制数据;D1(t1-2)、D1(t1-1)、D1(t1+1)、D1(t1+2)表示t1时段前后相邻四个时段的时间占用率数据。
4.根据权利要求1或2所述的一种基于交通线圈检测数据质量控制的拥堵区域识别方法,其特征在于,所述步骤2)中采用取0法对错误数据进行修正的方法为:对于错误数据出现的时段t2,若为流量错误数据,则取流量修正后的值Q3(t2)=0、若为车速错误数据,则取车速修正后的值V3(t2)=0、若为时间占用率错误数据,则取时间占用率修正后的值D3(t2)=0。
5.根据权利要求1或2所述的一种基于交通线圈检测数据质量控制的拥堵区域识别方法,其特征在于,所述步骤3)中流量异常数据识别的具体步骤如下:
3.1)在有效数据集中,取采集时段相邻的四组车辆数据,得到数据中的流量值分别为Q(t-2),Q(t-1),Q(t),Q(t+1),t为时段编号,取中位数构造一次平滑序列Q1(t);
3.2)取Q1(t-1),Q1(t),Q1(t+1)的中位数构造二次平滑序列Q2(t);
3.3)令
Figure FDA0002741496380000032
构造三次平滑序列Q3(t);
3.4)计算Q3(t)与Q(t)的均方根误差
Figure FDA0002741496380000033
M表示有效数据集中的数据量;
3.5)取第t时段最大、最小流量合理阈值分别为:Qmax(t)=Q3(t)+RMSE,Qmin(t)=Q3(t)-RMSE;
3.6)若
Figure FDA0002741496380000034
则认为t时段的流量数据异常,需要修正,否则认为正常,无需修正。
6.根据权利要求5所述的一种基于交通线圈检测数据质量控制的拥堵区域识别方法,其特征在于,所述步骤3)中根据下式对流量异常数据进行修正:
C(m)=a0+a1·1Q(m)+a2·2Q(m)+…ar·rQ(m)+e
其中,m为流量异常数据出现的时段,C(m)为时段m的异常流量数据修正后的值;1Q(m),2Q(m),...,rQ(m)为该交通线圈检测器历史上r天,在同一车道、同一时段采集到的正常流量数据;a0为常数项,a1,a2,...,ar为回归系数;e为随机误差。
CN201910109042.1A 2018-12-03 2019-02-03 一种基于交通线圈检测数据质量控制的拥堵区域识别方法 Active CN109754604B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2018114667150 2018-12-03
CN201811466715 2018-12-03

Publications (2)

Publication Number Publication Date
CN109754604A CN109754604A (zh) 2019-05-14
CN109754604B true CN109754604B (zh) 2021-01-26

Family

ID=66407492

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910109042.1A Active CN109754604B (zh) 2018-12-03 2019-02-03 一种基于交通线圈检测数据质量控制的拥堵区域识别方法

Country Status (1)

Country Link
CN (1) CN109754604B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110727665B (zh) * 2019-09-23 2022-11-08 江河瑞通(北京)技术有限公司 物联网设备上报数据质量分析方法及***
CN111724590B (zh) * 2020-06-03 2022-04-15 重庆大学 基于行程时间修正的高速公路异常事件发生时间估计方法
CN116311930A (zh) * 2023-03-15 2023-06-23 河北省交通规划设计研究院有限公司 一种交通流状态数据时间汇集方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739814A (zh) * 2009-11-06 2010-06-16 吉林大学 基于scats线圈数据的交通状态在线定量评价与预测方法
CN103593973A (zh) * 2012-12-18 2014-02-19 北京科技大学 一种城市道路交通态势评估***
CN103606274A (zh) * 2012-12-18 2014-02-26 北京科技大学 一种城市道路交通状态评估方法
KR101515601B1 (ko) * 2013-11-07 2015-04-27 전자부품연구원 교통정보 분석장치 및 방법

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101527082B (zh) * 2008-03-07 2012-09-19 上海宝康电子控制工程有限公司 一种交通路况采集***以及方法
CN101540103B (zh) * 2008-03-17 2013-06-19 上海宝康电子控制工程有限公司 交通信息采集及事件处理的方法与***
CN101571997A (zh) * 2009-05-31 2009-11-04 上海宝康电子控制工程有限公司 多源交通信息融合处理方法及其装置
CN101833858A (zh) * 2009-12-17 2010-09-15 南京城际在线信息技术有限公司 一种基于信号灯***环形线圈判别道路交通状态的方法
CN102169630B (zh) * 2011-03-31 2013-04-24 上海电科智能***股份有限公司 一种道路连续交通流数据质量控制方法
CN102982678B (zh) * 2012-11-28 2015-04-01 青岛海信网络科技股份有限公司 交通数据信息服务***及实现交通数据信息服务的方法
CN102968901B (zh) * 2012-11-30 2014-11-26 青岛海信网络科技股份有限公司 获取区域拥堵信息的方法及区域拥堵分析装置
CN103971520B (zh) * 2014-04-17 2015-11-18 浙江大学 一种基于时空相关性的交通流量数据恢复方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739814A (zh) * 2009-11-06 2010-06-16 吉林大学 基于scats线圈数据的交通状态在线定量评价与预测方法
CN103593973A (zh) * 2012-12-18 2014-02-19 北京科技大学 一种城市道路交通态势评估***
CN103606274A (zh) * 2012-12-18 2014-02-26 北京科技大学 一种城市道路交通状态评估方法
KR101515601B1 (ko) * 2013-11-07 2015-04-27 전자부품연구원 교통정보 분석장치 및 방법

Also Published As

Publication number Publication date
CN109754604A (zh) 2019-05-14

Similar Documents

Publication Publication Date Title
CN109754604B (zh) 一种基于交通线圈检测数据质量控制的拥堵区域识别方法
CN102592495B (zh) 道路估计设备和用于估计道路的方法
CN102622879B (zh) 交通信息提供装置
US20180261082A1 (en) Method and device for processing traffic road information
US20080077315A1 (en) Automatic update system, automatic updating method, and program therefor
CN103778323B (zh) 基于指数平滑的预测交通流数据的方法和***
CN110867077B (zh) 一种基于交通视频结构化数据质量控制的道路优化方法
WO2017037784A1 (ja) プローブデータ収集方法及びプローブデータ収集装置
CN105674995A (zh) 一种基于用户出行轨迹获取通勤路线的方法及装置
CN108444486B (zh) 一种导航路线排序方法和装置
WO2010124138A4 (en) Predicting expected road traffic conditions based on historical and current data
CN106327866B (zh) 基于rfid的车辆出行od切分方法及其***
CN105551250B (zh) 一种基于区间聚类的城市道路交叉口运行状态判别方法
CN109637143B (zh) 改进的行程时间可靠性分析方法
CN109360415B (zh) 一种道路交通流异常数据识别方法
CN104200701A (zh) 一种车位检测综合判定方法
US10175056B2 (en) Route search system, method, and program
CN112650825A (zh) 异常接驾行为的确定方法、装置、存储介质及电子设备
CN113570864B (zh) 一种电动自行车行驶路径匹配方法、设备及存储介质
CN102087789B (zh) 基于交通状态参数的交通状态判别***和方法
CN114170797B (zh) 交通限制路口的识别方法、装置、设备、介质及产品
CN103942312A (zh) 公交换乘线路规划方法和装置
WO2021012492A1 (zh) 行车轨迹生成方法、装置、计算机设备及存储介质
CN108122408A (zh) 一种路况监测方法、装置及其用于监测道路路况的***
CN109344903B (zh) 基于车载感知数据的城市道路路面故障实时检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant