CN112543427B - 基于信令轨迹及大数据分析识别城市交通走廊的方法与*** - Google Patents
基于信令轨迹及大数据分析识别城市交通走廊的方法与*** Download PDFInfo
- Publication number
- CN112543427B CN112543427B CN202011388774.8A CN202011388774A CN112543427B CN 112543427 B CN112543427 B CN 112543427B CN 202011388774 A CN202011388774 A CN 202011388774A CN 112543427 B CN112543427 B CN 112543427B
- Authority
- CN
- China
- Prior art keywords
- track
- signaling
- data
- road
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/20—Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明提供一种基于信令轨迹及大数据分析识别城市交通走廊的方法与***,基于用户上报的手机信令数据实现。在具体的实现过程中,通过对信令数据的处理,获得用户的OD链数据,在与路网匹配后可得到完整的路段信息,本发明在基于编辑距离的基础上确定路段的相似度,并基于编辑距离进行轨迹段聚类,通过质心的重置更新不断构造中心轨迹段。最后通过路段与交叉口的关系合并关键的子路径得到候选的路段。结合每个城市的交通运输标准,可预设不同的流量阈值,对于达到阈值标准的路径作为交通走廊。本发明可通过对不同人群的信令分析,获得机动车交通走廊、公交走廊、地铁走廊以及综合交通走廊数据。
Description
技术领域
本发明涉及城市智能交通识别技术领域,尤其是手机信令数据在智能交通上的应用,具体而言涉及一种基于信令轨迹识别城市交通走廊的方法、装置、***及计算机可读存储介质。
背景技术
城市交通走廊对城市土地利用、道路交通组织和社会空间分异具有十分重要的引导与调控作用。交通走廊是城市交通网络的核心架构,不仅代表区域内大多数出行状态,还在一定程度上影响城市功能区划的演进和发展。
城市交通走廊通常是指一组基本平行并且存在相互竞争关系的交通设施,包括多个子***,例如高速路、环线、公共交通等,每一个交通设施子***包含路段和节点构成。现有的交通走廊的研究包括出行OD的识别、道路优化、公共交通线路的优化以及交通灯的智能化控制等,尤其是基于公共交通上下客数据、GPS数据进行交通需求和流量的识别从而优化城市公交或者快速公交(例如BRT等)线路规划以及发行时间排班表。
城市交通走廊的规划由城市规划部门与其他协调部门共同编制、实施,但由于城市建设、规划的跨度大、周期长以及历史原因,使得城市交通走廊在城市实际交通指引中未能充分实现“交通引导、带动用地发展,走廊腹地空间反哺客货流量”的作用。
现有的交通走廊的识别基于流动人口普查来识别浅层的交通流量路径,比较耗时而且消耗大;或者基于多个定义路线段的时间范围内的权值并进行集群计算,以细化路线段的方式进交通走廊的识别,从而提高交通走廊的识别效率。但上述细化路线段是以经纬度来细化路段并分配权值的基础上进行集群运算预测,未基于实际的出行情况进行识别,其预测结果的准确性存在偏差。
现有技术文献:
专利文献1:CN108806254A-城市交通走廊的识别方法、装置及计算机可读存储介质
专利文献2:CN109887297A-基于快速全局K_means谱聚类的城市交通控制子区的划分方法
发明内容
本发明目的在于提供一种基于信令轨迹识别城市交通走廊的方法,基于全量手机信令数据进行聚类分析,以实际交通出行和流量数据为基础挖掘交通走廊的实际路径,提高交通走廊识别的准确性、科学性。
为实现上述目的,本发明的第一方面提出一种基于信令轨迹识别城市交通走廊的方法,包括以下步骤:
步骤1、基于城市边界GIS数据,获取城市范围内的用户移动通信终端上报的信令数据,所述信令数据为移动通信终端进行基站扇区切换时上报的包含终端号码、时间以及基站经纬度的数据;
步骤2、根据移动通信终端的信令数据获得对应的信令轨迹点集合Pcid,Pcid={(P1,T1),(P2,T3),(P3,T3)…(Pn,Tn)},其中Pi表示Ti时刻的基站的经纬度坐标,i表示获得的信令数据的序号,n表示某个移动终端上报的信令数据的总数量;
步骤3、根据信令轨迹点集合进行停留点识别,并确定信令轨迹点集合中的行程中间点和行程结束点,构造用户的信令轨迹;
步骤4、基于质心替换以平滑步骤3获得的用户的信令轨迹;
步骤5、基于停留点为关键点,将平滑后的用户的信令轨迹分为多个以出行结束点为终点的OD链;
步骤6、将OD链中对应的信令轨迹点与GIS路网数据进行路网匹配,得到多个对应的子路段信息,即路段轨迹;
步骤7、针对任意两条路段轨迹,获取任意两条路段轨迹的编辑距离并标准化处理;
步骤8、基于所有路段轨迹中任意两条之间的编辑距离进行轨迹聚类分析,获取中心轨迹簇;
步骤9、判定中心轨迹簇的平均轮廓系数的绝对值是否在[0.95,1]范围内,如果是则输出中心轨迹簇,否则调整步骤8的聚类参数重新构造中心轨迹簇,直到平均轮廓系数满足设定范围,输出最终的中心轨迹簇;
步骤10、基于步骤9输出的中心轨迹簇,得到多个关键子路径对应的路段;再利用GIS路网数据中路段与交叉口的关系,将关键子路径合并组合,得到完整的路径,作为候选走廊;
步骤11、获取每天子路径对应路段的日流量,并基于日流量阈值判定是否达到交通走廊的运输能力标准;
步骤12、根据多个达到交通走廊的运输能力标准的达标路段作为交通走廊
根据本发明另一方面的目的还提出一种基于信令轨迹识别城市交通走廊的***,所述***包括:一个或多个处理器;存储器,存储可***作的指令,所述指令在通过所述一个或多个处理器执行时使得所述一个或多个处理器执行操作,所述操作包括执行前述方法所包含的过程。
与现有技术相比,本发明的显著的有益效果在于:
相对于传统交通走廊分析时,仅考虑道路等级、最短距离等因素,本发明通过跟踪手机信令,尤其是不同类别的人群的手机信令数据,提取完整的出行轨迹,并通过路径匹配,能够获取真实机动车行驶的路径,识别交通走廊组成的具体道路信息。在可选实施方式中,针对不同人群分析时,针对不同的人群(机动车驾驶员、公交乘客、地铁乘客),可分别分析机动车交通走廊、公交走廊、地铁走廊数据,而在不分人群进行分析时,可以获取综合交通走廊。
本发明通过设置不同的聚类参数K值及道路流量阈值,可以适应不同城市等级,另外通过设置分析区域的大小,可以找出城际间交通走廊,或行政区内的热门路径(小流量的交通走廊),使用场景丰富。
应当理解,前述构思以及在下面更加详细地描述的额外构思的所有组合只要在这样的构思不相互矛盾的情况下都可以被视为本公开的发明主题的一部分。另外,所要求保护的主题的所有组合都被视为本公开的发明主题的一部分。
结合附图从下面的描述中可以更加全面地理解本发明教导的前述和其他方面、实施例和特征。本发明的其他附加方面例如示例性实施方式的特征和/或有益效果将在下面的描述中显见,或通过根据本发明教导的具体实施方式的实践中得知。
附图说明
附图不意在按比例绘制。在附图中,在各个图中示出的每个相同或近似相同的组成部分可以用相同的标号表示。为了清晰起见,在每个图中,并非每个组成部分均被标记。现在,将通过例子并参考附图来描述本发明的各个方面的实施例,其中:
图1是本发明示例性实施例的用户上传的信令数据得到的信令轨迹数据的示意图。
图2是本发明示例性实施例的用户上传的信令数据进行平滑后的轨迹示意图。
图3是本发明示例性实施例的用户上传的信令数据构造的OD链进行路网匹配后的示意图。其中原点表示是路网匹配后的起始点描绘的用户可能的路径;三角形为基站位置。
图4是本发明示例性实施例的路网匹配后取离基站最近的匹配路段的结果示意图。
图5是本发明示例性实施例的用户一段时间内的出行轨迹点的示意图,图中以圆点表示信令轨迹点位置(即基站位置)。
图6是本发明示例性实施例的利用停留点集的质心来代替停留点集使得轨迹变得平滑的示意图。
图7是本发明示例性实施例的识别城市交通走廊的方法的流程示意图。
具体实施方式
为了更了解本发明的技术内容,特举具体实施例并配合所附图式说明如下。
在本公开中参照附图来描述本发明的各方面,附图中示出了许多说明的实施例。本公开的实施例不必定意在包括本发明的所有方面。应当理解,上面介绍的多种构思和实施例,以及下面更加详细地描述的那些构思和实施方式可以以很多方式中任意一种来实施,这是因为本发明所公开的构思和实施例并不限于任何实施方式。另外,本发明公开的一些方面可以单独使用,或者与本发明公开的其他方面的任何适当组合来使用。
结合图1-7所示,本发明示例性实施例提出一种基于手机信令识别城市交通走廊的方法,包括以下步骤:
步骤1、基于城市边界GIS数据,获取城市范围内的用户移动通信终端上报的信令数据,所述信令数据为移动通信终端进行基站扇区切换时上报的包含终端号码、时间以及基站经纬度的数据;
步骤2、根据移动通信终端的信令数据获得对应的信令轨迹点集合Pcid,Pcid={(P1,T1),(P2,T3),(P3,T3)…(Pn,Tn)},其中Pi表示Ti时刻的基站的经纬度坐标,i表示获得的信令数据的序号,n表示某个移动终端上报的信令数据的总数量;
步骤3、根据信令轨迹点集合进行停留点识别,并确定信令轨迹点集合中的行程中间点和行程结束点,构造用户的信令轨迹;
步骤4、基于质心替换以平滑步骤3获得的用户的信令轨迹;
步骤5、基于停留点为关键点,将平滑后的用户的信令轨迹分为多个以出行结束点为终点的OD链;
步骤6、将OD链中对应的信令轨迹点与GIS路网数据进行路网匹配,得到多个对应的子路段信息,即路段轨迹;
步骤7、针对任意两条路段轨迹,获取任意两条路段轨迹的编辑距离并标准化处理;
步骤8、基于所有路段轨迹中任意两条之间的编辑距离进行轨迹聚类分析,获取中心轨迹簇;
步骤9、判定中心轨迹簇的平均轮廓系数的绝对值是否在[0.95-1]范围内,如果是则输出中心轨迹簇,否则调整步骤8的聚类参数重新构造中心轨迹簇,直到平均轮廓系数满足设定范围,输出最终的中心轨迹簇;
步骤10、基于步骤9输出的中心轨迹簇,得到多个关键子路径对应的路段;再利用GIS路网数据中路段与交叉口的关系,将关键子路径合并组合,得到完整的路径;
步骤11、获取每天子路径对应路段的日流量,并基于日流量阈值判定是否达到交通走廊的运输能力标准;
步骤12、根据多个达到交通走廊的运输能力标准的达标路段作为交通走廊。
下面结合附图所示,更加具体的阐述前述方法的示例性实施。
本发明的城市交通走廊的识别,是基于用户上报的手机信令数据实现。在具体的实现过程中,可通过对信令数据的处理,获得用户的OD链数据,在与路网匹配后可得到完整的路段信息,本发明在基于编辑距离的基础上确定路段的相似度,并基于编辑距离进行轨迹段聚类分析,通过质心的重置更新不断构造中心轨迹段。最后,在中心轨迹段的基础上,通过路段与交叉口的关系合并关键的子路径得到候选的路段。结合每个城市的交通运输标准,例如直辖市中心城市、一线城市、省会城市、地级市等不同的人流车流标准,可预设不同的流量阈值,对于达到阈值标准的路径作为交通走廊。
在具体实现过程中,可基于不同用户上报的数据,进行轨迹聚类和分析,例如针对不同的人群(机动车驾驶员、公交乘客、地铁乘客),可分别分析机动车交通走廊、公交走廊、地铁走廊数据,而在不分人群进行分析时,可以获取综合交通走廊。
结合图示,在初始阶段,基于城市边界GIS数据,获取城市范围内的用户移动通信终端上报的信令数据,所述信令数据为移动通信终端进行基站扇区切换时上报的包含终端号码、时间以及基站经纬度的数据。如前述的,所述的用户包括不同身份的用户,例如驾驶员、公交乘客、地铁乘客等。
图1示例性地表示了某一用户的一段信令轨迹数据示意。
由于移动通信终端进行基站扇区切换时,由于基站的实际覆盖等原因,会存在比较多的噪声数据,例如ABA、ABC等方式的乒乓切换或者数据漂移。对此,我们在本发明中对信令数据需要进行预处理,即对信令轨迹点进行优化处理,尤其是指乒乓切换优化和过滤漂移点。
在两个或多个基站的交界处,信号往往被多个基站覆盖,并且不同基站的信号强度差距并不明显,使得手机在两个或这个多个基站之间来回切换,但是实际上手机用户并没有移动,我们把这种现象称之为“乒乓效应”,属于异常信令切换行为,包括ABA、ABC以及A=B->C三种类型。
类型1:A->B->A类型。在基站A上报后,切换到基站B后,马上又切换回基站A。本发明的实施例中,根据位置判断和停留时间阈值设置,进行优化处理,剔除异常信令数据。
Step1:将用户的上报信令数据按照上报时间字段升序排序,得到每个用户按照时间顺序产生的定位数据;
Step2:设i的初始值为1,顺序选取第(i,i+1,i+2)三条数据,如果Δti,Δti+1均小于时间阈值T,则转到Step3,否则结束。
Step3:分别比较第(i,i+1,i+2)三条数据的LAC与基站ID字段值,如果i与i+2的LAC与基站ID字段值相同,且i与i+1的LAC与基站ID字段值不同,则判定为乒乓数据,保留第i条记录与第i+2条记录;否则设置i=i+1,同时返回Step2处理,直到所有记录遍历完成。
类型2:由于基站切换迟滞性过大或其他因素,存在用户从基站A切换到基站B后,基站B主控很短时间后,马上进行基站更新,从基站B切换到基站C。此外,也存在部分切换时间迟滞小,导致切换到非运动方向的基站C的情况。
Step1:将用户的上报信令数据按照上报时间字段升序排序,得到每个用户按照时间顺序产生的定位数据;
Step2:设i的初始值为1,顺序选取第(i,i+1,i+2)三条数据,如果Δti+1均小于时间阈值T,则转到Step3,否则结束。
Step3:分别计算(i,i+1,i+2)三个位置点的Haversine距离,分别记为Si→i+1,Si+1→i+2,Si+2→i,如果满足则判定为乒乓数据,保留第i条记录与第i+2条记录;否则设置i=i+1,同时返回Step2处理,直到所有记录遍历完成。
类型3:A=B->C类型。即在同一时间,用户在不同的基站位置上报数据。对于此类乒乓切换,需要对轨迹首先按照距离阈值进行预处理,确保轨迹点间隔一定距离,然后根据算法模型剔除乒乓切换。
Step1:将用户的上报信令数据按照上报时间字段升序排序,得到每个用户按照时间顺序产生的定位数据;
Step2:设i的初始值为1,顺序选取第(i,i+1,i+2,i+3)四条数据,如果t_(i+1)=t_(i+2),则转到Step3,否则结束。
Step3:计算(i,i+1,i+2,i+3)四个位置点的Haversine距离,分别记为S_(i→i+1),S_(i→i+2),S_(i+1→i+3),S_(i+2→i+3)。
如果满足S_(i→i+1)+S_(i+1→i+3)>S_(i→i+2)+S_(i+2→i+3),则判定位置点i+1为异常切换数据,保留第i+2条记录;否则判定位置点i+2为异常切换数据,保留第i+1条记录。最后设置i=i+1,同时返回Step2处理,直到所有记录遍历完成。
漂移处理:使用信令数据进行轨迹分析时,由于基站上报信令中存在基站位置记录异常以及信号切换至较远基站等极端情况,会导致出现用户基站上报位置距离用户实际位置较远的情况。位置点漂移会影响轨迹中速度、距离的计算,进而影响对用户轨迹的进一步分析,因此我们在进行特征值处理前对信令数据进行漂移数据过滤处理。
类型1:远距离异常漂移问题特征比较明显,一般是由于基站位置工参中经纬度信息异常造成。表现方式为用户可能突然切换到距离当前位置很远的位置,然后再次切回到当前位置附近。此类根据速度和距离阈值以及距离倍数系数,以剔除异常漂移点。
定义用户的基站切换序列为P1,P2,P3,...Pi,如果满足下述条件:
{(S_(P_1P_2)>S_(P_1P_(3))*2@S_(P_2P_3)>S_(P_1P_(3))*2)
则判定P2点发生远距离异常漂移。
类型2:临近基站漂移,信令轨迹由基站的位置决定,而基站的分布往往是随机的,且用户上报基站是周围多个基站中的某一个,因此用户的基站轨迹包括大量的临近基站漂移情况。反映在用户轨迹中,就存在大量的回头、锯齿等情况。
不管是远距离漂移和临近基站漂移,反映到具体轨迹问题上,都是基站漂移过程有很多跳跃及折回的线路。
因此需要对切换轨迹进行优化,获取较为平滑移动轨迹,优化具体过程如下:
Step1:假定手机用户在一天内共产生n条定位数据,向量(P)i,lngi,lati分别表示第i条数据产生的事件以及经纬度,其中1≤i≤n。
选取连续的三个上报位置(P_i,P_(i+1),P_(i+2)),为方便展示,以x和y分别替换经纬度信息,替换后三个位置分别为:
P_i(x_i,y_i),P_(i+1)(x_(i+1),y_(i+1)),P_(i+2)(x_(i+2),y_(i+2))
Step2:根据三个位置间的两次切换信息,生成两个切换向量:
Step3:然后通过余弦定理计算切换向量间的夹角θ_(i+1)余弦值信息:
设置夹角的置信度为T,如果cosθi+1>cosT,则认为P_(i+1)点存在漂移,否则认为没有发生漂移。
最后,设置i=i+1,同时返回Step2直到所有记录遍历完成。
Step4:根据配置的优化深度d,重复以上处理步骤d次,得到平滑的移动轨迹。
在对信令数据进行预处理后,根据移动通信终端的信令数据获得对应的信令轨迹点集合Pcid,Pcid={(P1,T1),(P2,T3),(P3,T3)…(Pn,Tn)},其中Pi表示Ti时刻的基站的经纬度坐标,i表示获得的信令数据的序号,n表示某个移动终端上报的信令数据的总数量。
步骤3中,在信令轨迹点集合的基础上,进行停留点识别,并确定信令轨迹点集合中的行程中间点和行程结束点,构造用户的信令轨迹。
在出行链(OD链)分析之前,要先识别用户的每次连续出行轨迹,然后再对每次连续出行轨迹进行细化分析。用户的出行轨迹识别包括3个部分:起始点识别、出行持续状态识别、结束点识别。
优选地,步骤3中根据信令轨迹点集合按照下述方式构造用户的信令轨迹,具体包括:对信令轨迹点集合采用DBSCAN密度聚类算法,根据预设的距离范围阈值Dis以及预设时间阈值Tpre进行停留识别以识别出停留点,并根据停留点确定信令轨迹点集合中的行程中间点和行程结束点,基于行程结束点从而确定出用户每段行程的开始时间、开始位置、结束时间以及结束位置,构造用户的信令轨迹。
在可选的实施例中,本发明的实施例中采用下述方式进行停留点识别。
定义用户出行起始点
用户开始持续运动状态,在指定时间T中,离开指定范围A,则范围A为用户出行开始区域。
用户离开区域的时间,即在区域A最后一次上报的时间,为用户的出行开始时间。
而用户实际出行位置,则通过权重算法模型进行计算。计算用户在区域A的位置重心坐标:
选取距离重心最近的位置上报点作为出行起始点,即:
P=min{(lng(P)-lng(G))2+(lat(P)-lat(G))2}。
定义用户持续出行
对于用户轨迹中任意的位置点P,从P点的时间开始,在指定时间T中,用户活动范围超出P周围指定范围A,则认为用户保持持续运动状态。
定义用户出行结束点
用户结束持续运动状态,在指定时间T中,持续停留在指定范围A,则范围A为用户出行结束区域。
用户到达A区域的时间,即用户在区域A首次出现的时间,为用户的出行结束时间。
而用户实际出行位置,则通过权重算法模型进行计算。计算用户在区域A的位置重心坐标:
选取距离重心最近的位置上报点作为出行结束点,即:
P=min{(lng(P)-lng(G))2+(lat(P)-lat(G))2}。
图5示例性表示了以信令轨迹点为例的信令轨迹示意,每个点表示对应时刻的信令轨迹点位置。
可选地,按照上述定义,在指定时间T(例如30分钟)内,指定范围A(例如500米)的条件下,图6所示的轨迹中,圈内的轨迹点形成了停留状态,如p3,p4,p5是一个停留,如果停留时间=T5-T3小于30分钟,且未超过A范围,则该停留属于短暂停留。形成短暂停留现象的原因非常多,例如出行中交通方式切换时的换乘等待,或者是交通堵塞导致的停滞不前,亦或者是散步中的短暂休息,等等。又如p8,p9,……,p12,如果停留时间=T12-T8大于30分钟,且未超过A范围,则该停留可能是一次出行的结束点。
本发明基于密度聚类DBSCAN算法,参数eps=500,minPts=5,进行停留识别,并通过计算停留时长、停留范围,将停留点识别为行程中间点,行程结束点。继而,按照上述定义推算每个行程的开始时间,开始位置,结束时间,结束位置。
通过上述处理,在将步骤3获得的信令轨迹基础上,对于停留点集采用停留点集的质心进行替代,平滑用户的信令轨迹,使得轨迹变得平滑且简洁,如图6所示。
图2所示为实际根据用户上报的信令数据进行平滑后得到的轨迹的示例,此处的轨迹是指信令轨迹,是基于基站位置进行连线形成的轨迹,其可能穿过实际GIS路网中的道路路段或者偏离路段,并非是指用户实际出行的轨迹。
接下来在步骤5中,基于识别出来的停留点为关键点,将平滑后的用户的信令轨迹分为多个以出行结束点为终点的OD链。
优选地,在所述步骤6中,基于城市专有场景交通基础设施数据及其专有场景专用基站,采用基站经纬度匹配识别OD链条中高铁、动车、轻轨以及轨道交通四种专有出行方式。
优选地,在步骤6中,利用路网的GIS数据及OD链中对应的信令数据中的基站的位置,计算基站位置对应映射到路网的道路上的所有可能的路段信息,并取基站到路网道路上距离最短的路段信息作为OD链匹配到路网中的匹配结果,输出对应的子路段信息。
通过路网匹配,获得了基站位置(即信令轨迹点)对应到实际路网中的路段信息。
如图3所示为路网匹配后可能的路段信息的示意,图4所示为取离基站最近的匹配路段结果的示意。
优选地,在获得路网的路段信息后,在步骤7中基于编辑距离进行轨迹相似度的计算。
对于两条由位置元素组成的轨迹序列traA,traB而言,将其中一个轨迹traA完全转换成另外一条轨迹traB所需要的最少位置元素编辑操作次数称之为两个轨迹的编辑距离。编辑距离越短,则证明这两条轨迹重合度越高,反之则越低。
***(Insertion):将轨迹traA最后一个元素***到轨迹traB中,将traA和traB编辑为完成相同轨迹的操作。
删除(Deletion):将轨迹traB最后一个元素删除,将traA和traB编辑为完全相同轨迹的操作。
替换(Substitution):将轨迹traB的最后一个元素替换为轨迹traA的最后一个元素(两元素相同则认为没有替换,两元素不同则认为替换)的操作。
优选地,在步骤7中,获取任意两条路段轨迹的编辑距离包括:
将任意两个路段轨迹A、B的编辑距离表示为levA,B(|A|,|B|),其中|A|和|B|分别对应路段轨迹A和路段轨迹B的位置元素的个数,那么路段轨迹A和路段轨迹B编辑距离可表示为:
其中,levA,B(i,j)表示路段轨迹A中前i个位置元素和路段轨迹B中前j个位置元素之间的距离;以i,j作为路段轨迹A和B的位置元素个数;路段轨迹的第一个位置元素索引从1开始,因此最后的编辑距离即为i=|A|,j=|B|时的距离levA,B(|A|,|B|);
其中,当min(i,j)=0时,对应路段轨迹A中前i个位置元素和轨迹B中前j个位置元素,此时i,j有一个值为0,表示轨迹traA和轨迹traB中有一个为空轨迹;那么从路段轨迹A转换到B只需要进行max(i,j)次编辑操作即可,所以它们之间的编辑距离为max(i,j),即i,j中的最大者;
当min(i,j)≠0时,levA,B(|A|,|B|)为如下三种情况的最小值:
levA,B(i-1,j)+1表示删除Ai;
levA,B(i,j-1)+1表示增加Bj;
作为可选的方式,下面以a和b路段轨迹为例进行详细计算过程说明,其中以位置元素ID是否相同进行判断。
a轨迹:p1,p2,p2,p3,p4
b轨迹:p1,p2,p4,p5,p6,p7
通过矩阵记录计算好的距离,具体如下:
0 | p1 | p2 | p4 | p5 | p6 | p7 | |
0 | |||||||
p1 | |||||||
p2 | |||||||
p2 | |||||||
p3 | |||||||
p4 |
当min(i,j)=0时,leva,b(i,j)=max(i,j),根据此初始化矩阵的第一行和第一列:
0 | p1 | p2 | p4 | p5 | p6 | p7 | |
0 | 0 | 1 | 2 | 3 | 4 | 5 | 6 |
p1 | 1 | ||||||
p2 | 2 | ||||||
p2 | 3 | ||||||
p3 | 4 | ||||||
p4 | 5 |
依据以上的距离计算公式继续计算:
第二行推导:
第三行推导:
第四行推导:
第五行推导:
第六行推导:
记录结果为:
由此确定编辑距离。
在可选的实施过程中,上述计算过程可通过计算机编程实现:
1)依据两条轨迹(轨迹的元素个数+1)构建矩阵并按照索引求和,将数值填入矩阵完成初始化。
2)对于从矩阵的第二行和第二列开始,按照先行后列的顺序,对轨迹进行编辑计算,并将每一步的编辑距离保存在矩阵中,一直到编辑结束,矩阵的最后一个空间存储的距离为这两条轨迹的编辑距离。
优选地,在获得编辑距离后,为了利于后续的聚类,我们对距离进行标准化处理(归一处理),具体包括:
以路段轨迹中编辑距离的最大值和最小值为基础,获得标准化的编辑距离d’:
其中,maxd表示路段轨迹中编辑距离的最大值,mind表示路段轨迹中编辑距离的最小值,d表示任意两个路段轨迹的编辑距离。
优选地,所述步骤8中,构造中心轨迹簇的处理过程包括:
基于用户的路段轨迹和标准化的编辑距离进行聚类分类,获得中心轨迹簇;
对所获得的中心轨迹簇重新计算质心,并根据更新的质心重新进行聚类分类用户路段轨迹,直到中心轨迹簇不再变化,输出中心轨迹簇。
在一个具体的实现方式中,构造中心轨迹簇的处理过程具体包括:
步骤8-1、设置聚类参数K的初始值,并根据初始值K随机选择K条路段轨迹作为中心轨迹;
步骤8-2、基于所获得的标准化处理后的编辑距离,获取每一条路段轨迹与中心轨迹之间的距离,将路段轨迹分到距离最小的中心轨迹簇中,直到所有的路段轨迹分类结束,得到K个中心轨迹簇;所述中心轨迹簇是指归于某一条中心轨迹的轨迹簇Cluster;
步骤8-3、根据分类号的中心轨迹簇,计算每个轨迹簇Cluster的质心,质心的计算过程包括:
计算轨迹簇Cluster内所有样本点B到其中一个样本点Ai的距离d(Ai,B):
d(Ai,B)=max{DAiB,DBAi}
选出使轨迹簇Cluster方差最小的样本点作为质心:
步骤8-4、重复上述步骤8-2至8-4,直到中心轨迹簇不再变化。
如此,我们获得中心轨迹簇输出。
在步骤9中,判断中心轨迹簇的平均轮廓系数s(i)的绝对值是否在预设的范围内,如果在预设范围,则输出最终的中心轨迹簇;如果不在预设范围内,则调整聚类参数K,重新进行聚类,直到s(i)满足要求。
其中,a(i)表示向量i到所有它属于的簇中其它点的距离的平均值,b(i)表示向量i到所有非本身所在簇中其它点的距离的平均值。
在步骤10中进行日流量计算时,通过计算子路径每天的轨迹数量,获得日流量。其中优选地,剔除30分钟时间内的重复数据。
根据以上实施例,本发明的另一些实施例还提出一种基于信令轨迹识别城市交通走廊的***,该***包括:
一个或多个处理器;
存储器,存储可***作的指令,所述指令在通过所述一个或多个处理器执行时使得所述一个或多个处理器执行操作,所述操作包括执行前述识别交通走廊的方法的过程。
根据以上实施例,本发明的另一些实施例还提出一种存储软件的计算机可读取介质,所述软件包括能通过一个或多个计算机执行的指令,所述指令在被所述一个或多个计算机执行时执行前述识别交通走廊的方法的过程。
虽然本发明已以较佳实施例揭露如上,然其并非用以限定本发明。本发明所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰。因此,本发明的保护范围当视权利要求书所界定者为准。
Claims (9)
1.一种基于信令轨迹识别城市交通走廊的方法,其特征在于,包括以下步骤:
步骤1、基于城市边界GIS数据,获取城市范围内的用户移动通信终端上报的信令数据,所述信令数据为移动通信终端进行基站扇区切换时上报的包含终端号码、时间以及基站经纬度的数据;
步骤2、根据移动通信终端的信令数据获得对应的信令轨迹点集合Pcid,Pcid={(P1,T1),(P2,T3),(P3,T3)…(Pn,Tn)},其中Pi表示Ti时刻的基站的经纬度坐标,i表示获得的信令数据的序号,n表示某个移动终端上报的信令数据的总数量;
步骤3、根据信令轨迹点集合进行停留点识别,并确定信令轨迹点集合中的行程中间点和行程结束点,构造用户的信令轨迹;
步骤4、基于质心替换以平滑步骤3获得的用户的信令轨迹;
步骤5、基于停留点为关键点,将平滑后的用户的信令轨迹分为多个以出行结束点为终点的OD链;
步骤6、将OD链中对应的信令轨迹点与GIS路网数据进行路网匹配,得到多个对应的子路段信息,即路段轨迹;
步骤7、针对任意两条路段轨迹,获取任意两条路段轨迹的编辑距离并标准化处理;
步骤8、基于所有路段轨迹中任意两条之间的编辑距离进行轨迹聚类分析,获取中心轨迹簇;
步骤9、判定中心轨迹簇的平均轮廓系数的绝对值是否在[0.95,1]范围内,如果是则输出中心轨迹簇,否则调整步骤8的聚类参数重新构造中心轨迹簇,直到平均轮廓系数满足设定范围,输出最终的中心轨迹簇;
步骤10、基于步骤9输出的中心轨迹簇,得到多个关键子路径对应的路段;再利用GIS路网数据中路段与交叉口的关系,将关键子路径合并组合,得到完整的路径;
步骤11、获取每天子路径对应路段的日流量,并基于日流量阈值判定是否达到交通走廊的运输能力标准;
步骤12、根据多个达到交通走廊的运输能力标准的达标路段作为交通走廊。
2.根据权利要求1所述的基于信令轨迹识别城市交通走廊的方法,其特征在于,所述步骤2中,还包括以下步骤:
对信令轨迹点集合Pcid中的信令轨迹点信息进行优化处理,包括:
1)过滤信令轨迹数据中乒乓切换位置信息,进行乒乓切换优化处理
2)过滤信令轨迹数据中漂移点数据。
3.根据权利要求1所述的基于信令轨迹识别城市交通走廊的方法,其特征在于,所述步骤3中,根据信令轨迹点集合按照下述方式构造用户的信令轨迹:
对信令轨迹点集合采用DBSCAN密度聚类算法,根据预设的距离范围阈值Dis以及预设时间阈值Tpre进行停留识别以识别出停留点,并根据停留点确定信令轨迹点集合中的行程中间点和行程结束点,基于行程结束点从而确定出用户每段行程的开始时间、开始位置、结束时间以及结束位置,构造用户的信令轨迹。
4.根据权利要求1所述的基于信令轨迹识别城市交通走廊的方法,其特征在于,在所述步骤4中,在将步骤3获得的信令轨迹基础上,对于停留点集采用停留点集的质心进行替代,平滑用户的信令轨迹。
5.根据权利要求1所述的基于信令轨迹识别城市交通走廊的方法,其特征在于,所述步骤6中,利用路网的GIS数据及OD链中对应的信令数据中的基站的位置,计算基站位置对应映射到路网的道路上的所有可能的路段信息,并取基站到路网道路上距离最短的路段信息作为OD链匹配到路网中的匹配结果,输出对应的子路段信息。
6.根据权利要求1-5中任意一项所述的基于信令轨迹识别城市交通走廊的方法,其特征在于,所述步骤7中,获取任意两条路段轨迹的编辑距离包括:
将任意两个路段轨迹A、B的编辑距离表示为levA,B(|A|,|B|),其中|A|和|B|分别对应路段轨迹A和路段轨迹B的位置元素的个数,那么路段轨迹A和路段轨迹B编辑距离可表示0为:
其中,levA,B(i,j)表示路段轨迹A中前i个位置元素和路段轨迹B中前j个位置元素之间的距离;以i,j作为路段轨迹A和B的位置元素个数;路段轨迹的第一个位置元素索引从1开始,因此最后的编辑距离即为i=|A|,j=|B|时的距离levA,B(|A|,|B|);
其中,当min(i,j)=0时,对应路段轨迹A中前i个位置元素和轨迹B中前j个位置元素,此时i,j有一个值为0,表示轨迹traA和轨迹traB中有一个为空轨迹;那么从路段轨迹A转换到B只需要进行max(i,j)次编辑操作即可,所以它们之间的编辑距离为max(i,j),即i,j中的最大者;
当min(i,j)≠0时,levA,B(|A|,|B|)为如下三种情况的最小值:
levA,B(i-1,j)+1表示删除Ai;
levA,B(i,j-1)+1表示增加Bj;
8.根据权利要求6所述的基于信令轨迹识别城市交通走廊的方法,其特征在于,所述步骤8中,构造中心轨迹簇的处理过程包括:
基于用户的路段轨迹和标准化的编辑距离进行聚类分类,获得中心轨迹簇;
对所获得的中心轨迹簇重新计算质心,并根据更新的质心重新进行聚类分类用户路段轨迹,直到中心轨迹簇不再变化,输出中心轨迹簇。
9.一种基于信令轨迹识别城市交通走廊的***,其特征在于,所述***包括:
一个或多个处理器;
存储器,存储可***作的指令,所述指令在通过所述一个或多个处理器执行时使得所述一个或多个处理器执行操作,所述操作包括执行所述权利要求1-8中任意一项所述方法的过程。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011388774.8A CN112543427B (zh) | 2020-12-01 | 2020-12-01 | 基于信令轨迹及大数据分析识别城市交通走廊的方法与*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011388774.8A CN112543427B (zh) | 2020-12-01 | 2020-12-01 | 基于信令轨迹及大数据分析识别城市交通走廊的方法与*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112543427A CN112543427A (zh) | 2021-03-23 |
CN112543427B true CN112543427B (zh) | 2021-11-09 |
Family
ID=75015348
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011388774.8A Active CN112543427B (zh) | 2020-12-01 | 2020-12-01 | 基于信令轨迹及大数据分析识别城市交通走廊的方法与*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112543427B (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113447040B (zh) * | 2021-08-27 | 2021-11-16 | 腾讯科技(深圳)有限公司 | 行驶轨迹确定方法、装置、设备以及存储介质 |
CN114245314B (zh) * | 2021-12-17 | 2024-01-05 | 高创安邦(北京)技术有限公司 | 一种人员轨迹修正方法、装置、存储介质及电子设备 |
CN114416710B (zh) * | 2021-12-29 | 2023-04-07 | 苏州大学 | 一种快速路车辆od位置提取方法及*** |
CN114501419B (zh) * | 2021-12-30 | 2023-05-12 | 中国联合网络通信集团有限公司 | 信令数据处理方法、装置和存储介质 |
CN114639238B (zh) * | 2022-02-23 | 2023-02-14 | 东南大学 | 基于归一化谱聚类算法的城市快速路交通状态估计方法 |
CN116776210A (zh) * | 2022-03-07 | 2023-09-19 | 中兴通讯股份有限公司 | 用户分簇方法、装置及计算机存储介质 |
CN114724407B (zh) * | 2022-03-25 | 2023-05-30 | 中电达通数据技术股份有限公司 | 一种道路拟合中基于多数据源的正确车道识别方法 |
CN114758498B (zh) * | 2022-04-01 | 2023-06-20 | 中南大学 | 基于多向最优扩展的城市有向交通廊道识别方法 |
CN114741612B (zh) * | 2022-06-13 | 2022-09-02 | 北京融信数联科技有限公司 | 一种基于大数据的消费习惯分类方法、***和存储介质 |
CN115731734A (zh) * | 2022-11-09 | 2023-03-03 | 支付宝(杭州)信息技术有限公司 | 基于交通出行量数据处理进行出行线路规划的方法及*** |
CN116129643B (zh) * | 2023-02-14 | 2024-07-12 | 广州市城市规划勘测设计研究院 | 一种公交车出行特征识别方法、装置、设备及介质 |
CN116311932B (zh) * | 2023-03-16 | 2024-03-01 | 东南大学 | 一种MaaS背景下考虑混合均衡的动态交通分配方法 |
CN117119387B (zh) * | 2023-10-25 | 2024-01-23 | 北京市智慧交通发展中心(北京市机动车调控管理事务中心) | 基于手机信令数据的用户出行链的构建方法和装置 |
CN117807450B (zh) * | 2024-01-02 | 2024-06-11 | 浙江恒隆智慧科技集团有限公司 | 一种城市智能化公共交通***及方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105206041A (zh) * | 2015-08-12 | 2015-12-30 | 东南大学 | 一种考虑时序dbscan的智能手机轨迹链簇识别方法 |
CN105243837A (zh) * | 2015-11-03 | 2016-01-13 | 东南大学 | 一种公交客流走廊甄别方法 |
CN105844031A (zh) * | 2016-03-29 | 2016-08-10 | 东南大学 | 一种基于手机定位数据的城市交通廊道识别方法 |
CN105844916A (zh) * | 2016-05-18 | 2016-08-10 | 上海美慧软件有限公司 | 一种基于手机信令数据计算交通走廊客流的方法 |
CN108806254A (zh) * | 2018-06-28 | 2018-11-13 | 中国联合网络通信有限公司深圳市分公司 | 城市交通走廊的识别方法、装置及计算机可读存储介质 |
CN111681421A (zh) * | 2020-06-10 | 2020-09-18 | 南京瑞栖智能交通技术产业研究院有限公司 | 基于手机信令数据的对外客运枢纽集疏空间分布分析方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2973494A4 (en) * | 2013-03-15 | 2016-11-23 | Caliper Corp | VEHICLE NAVIGATION AT TRACK HEIGHT FOR ROUTE PLANNING AND TRANSPORT MANAGEMENT |
CN112000755B (zh) * | 2020-08-14 | 2024-03-12 | 青岛市城市规划设计研究院 | 一种基于手机信令数据的区域出行廊道识别方法 |
-
2020
- 2020-12-01 CN CN202011388774.8A patent/CN112543427B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105206041A (zh) * | 2015-08-12 | 2015-12-30 | 东南大学 | 一种考虑时序dbscan的智能手机轨迹链簇识别方法 |
CN105243837A (zh) * | 2015-11-03 | 2016-01-13 | 东南大学 | 一种公交客流走廊甄别方法 |
CN105844031A (zh) * | 2016-03-29 | 2016-08-10 | 东南大学 | 一种基于手机定位数据的城市交通廊道识别方法 |
CN105844916A (zh) * | 2016-05-18 | 2016-08-10 | 上海美慧软件有限公司 | 一种基于手机信令数据计算交通走廊客流的方法 |
CN108806254A (zh) * | 2018-06-28 | 2018-11-13 | 中国联合网络通信有限公司深圳市分公司 | 城市交通走廊的识别方法、装置及计算机可读存储介质 |
CN111681421A (zh) * | 2020-06-10 | 2020-09-18 | 南京瑞栖智能交通技术产业研究院有限公司 | 基于手机信令数据的对外客运枢纽集疏空间分布分析方法 |
Non-Patent Citations (1)
Title |
---|
基于多源数据的公交客运廊道识别方法;温馨,陈龙;《交通与运输》;20200125;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112543427A (zh) | 2021-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112543427B (zh) | 基于信令轨迹及大数据分析识别城市交通走廊的方法与*** | |
CN112542045B (zh) | 基于手机信令识别交通出行方式的方法与*** | |
CN110111575B (zh) | 一种基于复杂网络理论的城市交通流量网络分析方法 | |
CN112530166B (zh) | 基于信令数据与大数据分析识别公交出行上下车站点的方法与*** | |
CN105387864B (zh) | 路径规划装置及方法 | |
US7391341B2 (en) | System and method of optimizing a fixed-route transit network | |
CN103325245B (zh) | 一种黑名单车辆的时空行驶轨迹预测方法 | |
CN111653096B (zh) | 一种基于手机信令数据的城市出行方式识别方法 | |
CN108848460B (zh) | 基于rfid和gps数据的人车关联方法 | |
Patnaik et al. | Divisive Analysis (DIANA) of hierarchical clustering and GPS data for level of service criteria of urban streets | |
CN112542043B (zh) | 基于手机信令以及大数据分析识别公交线网覆盖盲区的方法与*** | |
CN105608505A (zh) | 一种基于手机信令数据的居民轨道交通出行方式识别方法 | |
CN110942198A (zh) | 一种用于轨道交通运营的乘客路径识别方法和*** | |
CN110084308B (zh) | 一种基于车辆轨迹分析构建通勤路径的方法 | |
CN114363842B (zh) | 基于手机信令数据的公交乘客下车站点预测方法及装置 | |
CN110472999B (zh) | 基于地铁和共享单车数据的客流模式分析方法及装置 | |
CN114416710B (zh) | 一种快速路车辆od位置提取方法及*** | |
CN108765922A (zh) | 一种公交车辆行驶轨迹的分段方法 | |
CN102567389B (zh) | 组合交通网络的形成方法和设备、路径搜索方法和设备 | |
CN110598917B (zh) | 一种基于路径轨迹的目的地预测方法、***及存储介质 | |
CN112036757A (zh) | 基于手机信令和浮动车数据的停车换乘停车场的选址方法 | |
CN110021161B (zh) | 一种交通流向的预测方法及*** | |
CN110766940A (zh) | 道路信号交叉口运行状况评估方法 | |
CN110379159A (zh) | 基于机动车电子标识数据的出行链提取方法 | |
CN115272994A (zh) | 自动驾驶预测模型训练方法、装置、终端及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |