CN110968617B

CN110968617B - 一种基于位置字段的路网关键路段相关性分析方法

Info

Publication number: CN110968617B
Application number: CN201910984130.6A
Authority: CN
Inventors: 董宏辉; 贾利民; 秦勇; 吴金锁
Original assignee: Beijing Jiaotong University
Current assignee: Beijing Jiaotong University
Priority date: 2019-10-16
Filing date: 2019-10-16
Publication date: 2023-04-07
Anticipated expiration: 2039-10-16
Also published as: CN110968617A

Abstract

本发明提供一种基于位置字段的路网关键路段相关性分析方法，属于城市路网运行管理技术领域。包括获取城市出行车辆的行驶轨迹数据，确定车辆出行经过的位置字段；根据位置字段的重复情况对行驶轨迹进行事务划分；将划分好的事务依据FP‑growth算法进行频繁项集确定；根据得到的频繁项集子轨迹与超轨迹的关系提取路网关键路段；根据得到的关键路段，通过置信度计算，分析城市路网中各节点或路段间的相关性。本发明通过包括车辆出行位置字段的路径信息，确定城市路网中的关键路段，为城市路段等级划分、资源分配、警力调度等提供可靠依据，通过进行相关分析，分析各位置区域及路段潜在的关联程度，为交通规划和政策措施的制定提供具体相识的参考资料。

Description

一种基于位置字段的路网关键路段相关性分析方法

技术领域

本发明涉及城市路网运行管理技术领域，具体涉及一种基于位置字段的路网关键路段相关性分析方法。

背景技术

交通作为维系人际交往、货物流通与城市交流的桥梁，对区域建设以及经济发展起到至关重要的作用。随着近年来我国综合实例的提升，城市道路交通的各项建设也快速发展，大量的人口涌入用地有限的城市空间，很多城市已无法通过传统的修路修桥等方法缓解城市道路交通难题，由此产生一系列如交通拥堵环境污染等问题对城市的综合竞争力及人们的生活水平产生极大的影响，保障城市道路交通的有序运行成为促进城市发展和提高人们生活水平的基础。而根据城市道路车辆的跟驰特性，尤其是传递性和延迟性，承载城市主要交通量的关键路段和重要节点一旦发生意外，对临近路段和节点也产成一定的通行压力，易造成大面积的延误和影响，故关键路段和重要节点对城市整个路网的运行产生重要影响，而城市交通管理部门的资源和精力有限，为保证整个路网的畅通有序，故城市交通管理和设计部门应着重关注城市路网中的关键路段和节点。同时，城市的快速发展导致各区域间的联系更加紧密，各区间的合作和交流可以从路网中的路段或节点的车流变化情况得以反映。因此针对路网中路段或节点间的相关性分析也是研究城市的区域联系、交通渠化、政策制定和未来发展的基础参考资料。

发明内容

本发明的目的在于提供一种基于位置字段的路网关键路段相关性分析方法，以解决上述背景技术中存在的至少一项技术问题。

为了实现上述目的，本发明采取了如下技术方案：

本发明提供的一种基于位置字段的路网关键路段相关性分析方法，包括如下流程步骤：

步骤110：获取城市出行车辆的行驶轨迹数据，其中，某辆车C_i的轨迹组成为C_i＝{p₁,p₂,...,p_x}，其中，p₁,p₂,...,p_x为车辆出行经过的位置字段；

步骤120：根据位置字段的重复情况对行驶轨迹进行事务划分；

步骤130：将划分好的事务依据FP-growth算法进行频繁项集确定；

步骤140：根据得到的频繁项集子轨迹与超轨迹的关系提取路网关键路段；

步骤150：根据得到的关键路段即可产生关联规则，通过置信度计算，分析城市路网中各节点或路段间的相关性。

优选的，所述步骤S120具体包括：

若车辆行驶轨迹中出行两个或两个以上连续的位置字段重复时，则将重复的位置字段作为划分依据，将前重复点作为上一事务的尾项，将后重复点作为下一事务的事项，将轨迹链划分为多个不含重复项的事务；

若车辆两次或两次以上地重复经过某路段，则对每个轨迹数据项做遍历判断重复操作，对首次出现重复位置的前一项作为事务的结尾项，同时复制该数据项，作为下一事务的初始项，依次向后判断该重复位置的情况，添加至该事务，直至整个轨迹被划分完多个事务。

优选的，所述步骤S130具体包括：

步骤131：将各车辆轨迹中的位置字段信息根据出现的频次进行统计，计算所有车辆位置字段的支持度计数，设定合适的阈值，筛掉不符合规则的位置信息，将符合条件的数据按照支持度计数的大小降序排列，构造项头表；

步骤132：构建FP-tree及节点链表；将根节点设为空集，绘制规则绘制每条轨迹的FP-tree；

步骤133：从FP-tree中得到节点的条件模式基，确定以欲查找的项为结尾至根节点之间的路径集合，即该项至根节点的前缀路径；

步骤34：通过条件模式基构造条件FP-tree，筛选符合条件的前缀路径，获取频繁项集。

优选的，所述绘制规则为：

若某项数据为首次出现，则建立该节点，同时在项头表中增加一个指向该节点的指针；否则，继续按路径需求对应的节点，更改各节点数据，将不同节点的相同数据用连线连接，表示二者的连接关系。

优选的，在步骤S140中，所述频繁项集的非空子集也为频繁项集，如果一个项集为非频繁项集，则该项集的超轨迹项集也为非频繁项集，则选择频繁项集中项数最大的频繁项集为路网中的关键路段。

优选的，所述步骤S150中，通过置信度计算公式分析相关性计算公式如下：

通过设置最小置信度获取强关联规则，确定路网中关键路段存在的强相关性关系。

优选的，在步骤S110中，通过基于RFID技术的城市智能交通管理与服务***获取车辆行驶轨迹数据。

本发明有益效果：通过包括车辆出行位置字段的路径信息，确定城市路网中的关键路段，为城市管理部门确定路段的等级划分，资源分配、警力调度提高可靠依据，通过进行相关分析，分析各位置区域及路段潜在的关联程度，为交通规划和政策措施的制定提供具体相识的参考资料。

本发明附加的方面和优点将在下面的描述中部分给出，这些将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例1所述的基于位置字段的路网关键路段相关性分析方法流程图。

图2为本发明实施例2所述的基于位置字段的路网关键路段相关性分析方法流程图。

图3为本发明实施例2所述的根据位置字段的重复情况对行驶轨迹进行事务划分的流程图。

图4为本发明实施例2所述的包含连续重复位置字段的车辆出行时空示意图。

图5为本发明实施例2所述的包含非连续重复位置字段的车辆出行时空示意图。

具体实施方式

下面详细叙述本发明的实施方式，所述实施方式的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过附图描述的实施方式是示例性的，仅用于解释本发明，而不能解释为对本发明的限制。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样定义，不会用理想化或过于正式的含义来解释。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件和/或它们的组。

为便于理解本发明，下面结合附图以具体实施例对本发明作进一步解释说明，且具体实施例并不构成对本发明实施例的限定。

本领域技术人员应该理解，附图只是实施例的示意图，附图中的部件并不一定是实施本发明所必须的。

实施例1

本发明实施例1提供一种基于位置字段的路网关键路段相关性分析方法，该方法包括基于重复位置字段的事务划分、FP-growth算法、频繁项集、关联规则计算等。

所述的基于重复位置字段的事务划分是对针对城市出行车辆的出行路段中存在重复的位置字段进行处理，划分为不同事务以应用于FP-growth算法中。所述的FP-growth算法是本方法的核心算法，是挖掘路网关键路段以及相关性分析的关联规则算法。所述的频繁项集是路网中关键路段的前提，本方法的目的就是从大量的位置字段的轨迹数据中挖掘出频繁项集，然后根据子轨迹和超轨迹的关系提取路网关键路段。所述的关联规则计算即通过频繁项集所产生的非空子集，根据置信度的计算公式分析各路段及节点间的相关性，通过强关联规则可以挖掘出相关性较强的某些路段或节点。

该方法就是通过多个车辆出行的轨迹信息，通过其位置字段作为事务中的项，挖掘频繁项集，通过频繁项集提取关键路段及关联规则，具体的方法步骤如下：

步骤110：获取城市出行车辆的行驶轨迹数据，其中，某辆车C_i的轨迹组成为C_i＝{p₁,p₂,...,p_x}，其中，p₁,p₂,...,p_x为车辆出行经过的位置字段。

步骤120：将获取的城市出行车辆的行驶轨迹根据位置字段的重复情况进行相应的处理。

当车辆行驶轨迹中出行两个或多个连续的位置字段重复时，表明车辆的出行中可能存在停留某处的现象，虽然车辆的运行轨实际上为一辆车的出行信息，但若车辆的轨迹中出现连续的两个相同的位置字段，即车辆在该位置做了或长或短的停留状态，对于路段的繁忙程度来讲，这部分相当于“静止”状态，没有行程路段轨迹，所以可将两个或多个连续重复的位置作为划分事务的依据，将前重复点作为上一事务的尾项，将后重复点作为下一事务的事项，将轨迹链划分为多个不含重复项的事务。例如某车辆的运行轨迹为{a,b,c,d,d,e}，其中车辆在d处可能进行停留，对路段来讲不影响其繁忙状态，故保留一个重复项即可，故该轨迹经过处理后得事务1＝{a,b,c,d}，事务2＝{d,e}。

如果某辆车两次或多次地重复经过某路段，那么以路段的角度来讲，可以将该轨迹链路理解成有两辆车或多辆车经过该路段，故对每个数据项做遍历判断重复操作，对首次出现重复位置的前一项作为事务的结尾项，同时复制该数据项，作为下一事务的初始项，依次向后判断该重复位置的情况，添加至该事务，直至整个轨迹被划分完多个事务。

例如，某车辆的轨迹为{a,b,c,b,b,a}。根据算法描述，数据b为首次出现的重复项，其前项为c，故得事务1{a,b,c}，并复制数据c作为下一次事务的起始项，继续向后判断，由于存在连续位置重复的情况，所以重复的数据b保留一个即可，最终得事务2{c,b}，继续求解得到事务3{b,a}，最终该车辆的轨迹被划分为三个不含重复项的事务。

步骤S130：将处理好的事务依据FP-growth算法进行频繁项集挖掘。

步骤S131：第一次扫描数据。首先将各车辆轨迹中的位置字段信息根据出现的频次进行统计，计算所有车辆位置字段的支持度计数，设定合适的阈值，筛掉不符合规则的位置信息，将符合条件的数据按照支持度计数的大小降序排列，构造项头表。

步骤S132：构建FP-tree及节点链表。首先将根节点设为空集，按规则绘制每条轨迹的FP-tree，规则为若某项数据为首次出现，则建立该节点，同时在项头表中增加一个指向该节点的指针；否则继续按路径需求对应的节点，更改各节点数据，将不同节点的相同数据用连线连接，表示二者的连接关系。

步骤S133：从FP-tree中得到节点的条件模式基。条件模式基是以欲查找的项为结尾至根节点之间的路径集合，也称为该项至根节点的前缀路径。一般从支持度技术较低的节点开始寻找。数据量大时，利用项头表的指针工具可以大大提高搜索效率，快速有效求解。

步骤S134：通过条件模式基构造条件FP-tree。构造条件FP-tree就是筛选符合条件的前缀路径，寻求频繁项集。用户一般自定义设置一个最小计数阈值，然后通过该阈值，筛选不符合条件的节点，依次求解每个节点的条件FP-tree，即通过FP-growth算法完成频繁项集的挖掘。

步骤S140：根据得到的频繁项集子轨迹与超轨迹的关系提取路网关键路段。频繁项集有这样的性质：如果一个项集为频繁项集，则该项集的非空子集也为频繁项集，如果一个项集为非频繁项集，那么该项集的超轨迹项集也为非频繁项集。故可选择频繁项集中项数最大的频繁项集为路网中的关键路段。

步骤S150：根据得到的关键路段即可产生关联规则，一般通过置信度计算公式即可分析各节点或路间的相关性。其形如X→Y，置信度的计算公式如下：

其中，X、Y分别代表两个相关的关键路段频繁项集；最后，通过设置最小置信度可以得到强关联规则，挖掘路网中存在强相关性的关系。

实施例2

本发明实施例2提供的一种基于位置字段的路网关键路段相关性分析方法，该方法以某市基于RFID技术的城市智能交通管理与服务***某工作日的车辆出行数据进行分析。如图2所示，该方法步骤如下：

步骤1：选取该市基于RFID技术的城市智能交通管理与服务***2016年4月某工作日的车辆出行数据进行分析。截止至2016年，该***已经为350多万辆车安装了电子标签，基本上可以采集到该市主城区的全部存量机动车；其中，在该市主城区及近郊区域公路已经建设路面采集点近840多个。

步骤2：本文事先通过相关的数据处理得到车辆出行的位置字段集合即车辆的出行轨迹。包含位置字段的车辆出行轨迹是挖掘城市路网关键路段及相关性分析的数据基础。

步骤3：根据车辆出行轨迹中位置字段的重复情况分别进行处理，得到不含重复项的事务。处理方法主要根据位置字段的重复情况。基于重复位置字段划分事务的流程图如图3所示。

步骤31：当车辆行驶轨迹中出行两个或多个连续的位置字段重复时，表明车辆的出行中可能存在停留某处的现象，虽然车辆的运行轨实际上为一辆车的出行信息，但若车辆的轨迹中出现连续的两个相同的位置字段，即车辆在该位置做了或长或短的停留状态，对于路段的繁忙程度来讲，这部分相当于“静止”状态，没有行程路段轨迹，所以可将两个或多个连续重复的位置作为划分事务的依据，将前重复点作为上一事务的尾项，将后重复点作为下一事务的事项，将轨迹链划分为多个不含重复项的事务。例如某车辆的运行轨迹为{a,b,c,d,d,e}，其中车辆在d处可能进行停留，对路段来讲不影响其繁忙状态，故保留一个重复项即可，故该轨迹经过处理后得事务1＝{a,b,c,d}，事务2＝{d,e}。包含连续重复位置字段的车辆出行时空示意图如图4所示。

步骤32：车辆出行的位置字段出现非连续重复时，从路段的角度考虑，车辆出行的路径可以看作为多辆车通过该段重复路段，而每辆车不包含重复的位置信息，故可对其进行相应处理，划分为多个不含重复位置字段的事务。例如某车辆的轨迹为{a,b,c,b,b,a}。根据算法描述，数据b为首次出现的重复项，其前项为c，故得事务1{a,b,c}，并复制数据c作为下一次事务的起始项，继续向后判断，由于存在连续位置重复的情况，所以重复的数据b保留一个即可，最终得事务2{c,b}，继续求解得到事务3{b,a}，最终该车辆的轨迹被划分为三个不含重复项的事务。包含非连续重复位置字段的车辆出行时空示意图如图5所示。

步骤4：采用FP-growth算法进行频繁项挖掘。将全天的事务数据进行分析，研究发现最小支持度设置过高时，会导致频繁项长度过短，经过反复实验和分析，这里设置最小支持度为1000最为合理。得到路网中的出现最为频繁3项集和频繁4项集近70条。

步骤5：通过计算轨迹的相似度，以轨迹的相似度为特征将热门轨迹分为12类。以结果中车辆多次经过杨公桥至红槽房的路段为例，其包含该点的频繁项为{杨公桥至红槽房，高滩岩至西环，石马河至杨公桥：18564}、{杨公桥至红槽房，高滩岩至西环，石马河至杨公桥，红槽房至高滩岩：17382}、{杨公桥至红槽房，高滩岩至西环，红槽房至高滩岩：26054}和{杨公桥至红槽房，高滩岩至西环，红槽房至高滩岩，西环至凤中：13103}，各频繁项集的相似度较高，将其处理为一类，选取支持度最高或项数最大的项为路网的关键路段。经过分析得到在该天重庆市的前十条关键路段具体信息见表1。

表1该市路网中前十条关键路段

步骤6：通过对关键路段产生的关联规则进行分析，以第一条关键路段为例，频繁项{机场路奥特莱斯，机场路宝圣路，机场两路城区转盘}产生的非空子集为与相应的支持度计数如表2。

表2关键路段1的非空子集

同时，根据置信度公式计算各规则的置信度，得第一条关键路段的各规则及置信度见表3。

表3关键路段1的各规则及置信度

为寻求关键路段中存在的强关联关系，规定置信度最高的前3条规则为强关联规则。所以，关键路段1的强关联规则为第3条、第4条与第6条规则，第6条规则的置信度最高，表明该天该市的出行车辆经过机场路奥特莱斯与机场两路城区转盘中的近80％会同时通过机场路宝圣路。

依次计算得到该天前十条关键路段的强关联规则。由于规则较多，这里展示和分析十条关键路段置信度最高的规则，具体信息见表4。

表4关键路段的强关联规则

综上所述，本发明实施例所述的方法，包括关联规则算法，挖掘频繁模式，关联规则以及基于车辆运行轨迹重复位置划分事务；所述关键路段挖掘及相关性分析是空间对象基于位置字段特征的分析数据，其形式可以为包含位置字段的手机信令数据、GPS数据、RFID数据以及新兴的微博、微信等文本数据格式。所述关联规则算法(FP-growth算法)，是本方法挖掘城市路网中关键路段及相关性分析的主要方法，其事务要求不包含重复项。而车辆出行路径中的位置字段可能包含重复项的情况，需要对车辆出行路径中包含重复位置字段的情况进行处理，使之化为不含重复项的事务。处理车辆出行路径中的重复项应该考虑可能出现的两种情况：车辆出行的位置字段出现连续重复以及车辆出行的位置字段出现非连续的重复。车辆出行的位置字段出现连续重复时，从路段的角度考虑，车辆此时的状态相当于“静止”状态，对其进行直接分割处理。车辆出行的位置字段出现非连续重复时，从路段的角度考虑，车辆出行的路径可以看作为多辆车通过该段重复路段，而每辆车不包含重复的位置信息，故可对其进行相应处理，划分为多个不含重复位置字段的事务。所述FP-growth算法通过挖掘频繁项集，通过频繁项集中的子轨迹以及超轨迹的关系，确定路网中的关键路段。所述FP-growth算法确定路网中的关键路段，通过关键路段产生的非空集合产生关联规则，根据最小置信度阈值求解强关联规则，以此分析关键路段中的强相关性。

本发明实施例所述的方法旨在通过位置字段信息挖掘城市路网中的关键路段非有向路径，故基于位置字段的路径可以是无序的。针对城市道路路网中的关键路段和节点及相关性进，主要以车辆行驶路段的位置字段作为依据，经过相应的数据处理，依据FP-growth算法确定路网中的关键路段，同时通过置信度分析各位置潜在的关联关系，得到强关联规则。有助于提高我国道路交通管理部门对路网中各路段及节点的重要等级划分，有针对性地重点防控，改进道路结构，同时归纳城市车辆的运行规律，感知城市交通状态，为尽可能应用有限的资源保障路网的正常运行、缓解城市拥堵提供了一个崭新的途径，也为今后的关键路段与节点的后续研究奠定了理论与应用基础。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

Claims

1.一种基于位置字段的路网关键路段相关性分析方法，其特征在于，包括如下流程步骤：

步骤S110：获取城市出行车辆的行驶轨迹数据，其中，某辆车C_i的轨迹组成为C_i＝{p₁,p₂,...,p_x}，其中，p₁,p₂,...,p_x为车辆出行经过的位置字段；

步骤S120：根据位置字段的重复情况对行驶轨迹进行事务划分；包括：

若车辆行驶轨迹中出行两个或两个以上连续的位置字段重复时，则将重复的位置字段作为划分依据，将前重复点作为上一事务的尾项，将后重复点作为下一事务的事项，将轨迹链划分为多个不含重复项的事务；若车辆两次或两次以上地重复经过某路段，则对每个轨迹数据项做遍历判断重复操作，对首次出现重复位置的前一项作为事务的结尾项，同时复制该数据项，作为下一事务的初始项，依次向后判断该重复位置的情况，添加至该事务，直至整个轨迹被划分完多个事务；

步骤S130：将划分好的事务依据FP-growth算法进行频繁项集确定；包括：步骤131：将各车辆轨迹中的位置字段信息根据出现的频次进行统计，计算所有车辆位置字段的支持度计数，设定合适的阈值，筛掉不符合规则的位置信息，将符合条件的数据按照支持度计数的大小降序排列，构造项头表；步骤132：构建FP-tree及节点链表；将根节点设为空集，绘制规则绘制每条轨迹的FP-tree；步骤133：从FP-tree中得到节点的条件模式基，确定以欲查找的项为结尾至根节点之间的路径集合，即该项至根节点的前缀路径；步骤34：通过条件模式基构造条件FP-tree，筛选符合条件的前缀路径，获取频繁项集；

步骤S140：根据得到的频繁项集子轨迹与超轨迹的关系提取路网关键路段；

步骤S150：根据得到的关键路段即可产生关联规则，通过置信度计算，分析城市路网中各节点或路段间的相关性。

2.根据权利要求1所述的基于位置字段的路网关键路段相关性分析方法，其特征在于，所述绘制规则为：若某项数据为首次出现，则建立该节点，同时在项头表中增加一个指向该节点的指针；否则，继续按路径需求对应的节点，更改各节点数据，将不同节点的相同数据用连线连接，表示二者的连接关系。

3.根据权利要求1所述的基于位置字段的路网关键路段相关性分析方法，其特征在于，在步骤S140中，所述频繁项集的非空子集也为频繁项集，如果一个项集为非频繁项集，则该项集的超轨迹项集也为非频繁项集，则选择频繁项集中项数最大的频繁项集为路网中的关键路段。

4.根据权利要求3所述的基于位置字段的路网关键路段相关性分析方法，其特征在于：所述步骤S150中，通过置信度计算公式分析相关性计算公式如下：

其中，X、Y分别代表两个相关的关键路段频繁项集；

5.根据权利要求1所述的基于位置字段的路网关键路段相关性分析方法，其特征在于，在步骤S110中，通过基于RFID技术的城市智能交通管理与服务***获取车辆行驶轨迹数据。