CN112133090A - 一种基于手机信令数据的多方式交通分布模型构建方法 - Google Patents

一种基于手机信令数据的多方式交通分布模型构建方法 Download PDF

Info

Publication number
CN112133090A
CN112133090A CN202010980271.3A CN202010980271A CN112133090A CN 112133090 A CN112133090 A CN 112133090A CN 202010980271 A CN202010980271 A CN 202010980271A CN 112133090 A CN112133090 A CN 112133090A
Authority
CN
China
Prior art keywords
traffic
travel
mobile phone
mode
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010980271.3A
Other languages
English (en)
Inventor
沈剑
陆振波
薛广鸣
刘杰
那成慧
张改
周臣
龙振
万紫吟
刘娟
张静芬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Traffic Police Brigade Of Kunshan Public Security Bureau
Nanjing Ruiqi Intelligent Transportation Technology Industry Research Institute Co ltd
Original Assignee
Traffic Police Brigade Of Kunshan Public Security Bureau
Nanjing Ruiqi Intelligent Transportation Technology Industry Research Institute Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Traffic Police Brigade Of Kunshan Public Security Bureau, Nanjing Ruiqi Intelligent Transportation Technology Industry Research Institute Co ltd filed Critical Traffic Police Brigade Of Kunshan Public Security Bureau
Publication of CN112133090A publication Critical patent/CN112133090A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0108Measuring and analyzing of parameters relative to traffic conditions based on the source of data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/20Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel

Landscapes

  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Analytical Chemistry (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种基于手机信令数据的多方式交通分布模型构建方法,基于时空聚类算法识别停驻点,根据手机信令数据提取用户出行的基站轨迹信息,通过概率决策方法完成出行链中基站与路网交叉口的匹配,获取用户在城市路网的出行轨迹信息。然后将居民出行调查数据与手机信令数据进行规则匹配,获取有交通方式标签的手机信令轨迹数据。融合多源数据提取特征参数,采用卡方检验筛选特征参数,运用随机森林分类算法构建交通方式划分模型,并通过扩样完成全样本的分方式出行OD估计。量化用地布局和交通方式对交通分布的影响,基于重力模型构建多方式交通分布模型,利用全样本分方式出行OD完成模型参数标定,最终完成多方式交通分布预测工作。

Description

一种基于手机信令数据的多方式交通分布模型构建方法
技术领域
本发明涉及电子技术领域及通信领域,具体是一种基于手机信令数据的多方式交通分布模型构建方法。
背景技术
近年来,随着信息化技术的快速发展,手机作为一种携带便捷的通讯设备已经在国民中快速普及。庞大的手机用户以及数据传输量带来的是接近全样本的人口观测数据。在使用过程中,手机终端为了满足用户通讯和上网的需求会与邻近的蜂窝基站建立联系,此时用户接入基站的时间和基站的位置信息就被记录下来,产生手机信令数据。它能够实时追踪个体并提供用户位置,为出行信息的采集提供了新思路。
尽管手机信令数据相对传统交通数据存在诸多优势,并在诸多城市交通规划及交通信息***中得以应用,但是手机信令数据很难得到充分挖掘。此外,利用现有大数据改善传统交通模型也是当前研究难点。传统交通模型是基于传统居民调查数据构建的,而手机信令数据这类大数据也不是专门为交通模型提出的,因此如何融合大数据与传统交通模型是当前亟需解决的关键技术与研究重点。
发明内容
本发明为解决背景技术中存在的问题,提出了一种基于手机信令数据的多方式交通分布模型构建方法。
技术方案:
一种基于手机信令数据的多方式交通分布模型构建方法,步骤如下:
(1)根据基站轨迹点的时空特性,利用时空聚类算法识别出行停驻点,并提取出行链信息,以便与实际路网进行匹配;
(2)通过概率决策的方法将出行链中的基站与路网中的交叉口进行匹配,获取手机用户在城市路网中的出行轨迹信息,用于与居民出行调查数据的匹配;
(3)利用规则匹配的方法,将居民出行调查数据与路网中的出行轨迹信息匹配,获取带有交通方式标签的手机信令轨迹数据作为样本空间;
(4)基于卡方检验筛选特征参数,运用随机森林分类算法构建交通方式划分模型,将基站OD转化为交通小区间的出行OD,通过扩样完成全样本的分方式出行OD估计;
(5)根据用地布局和交通方式对交通分布的内在影响,利用重力模型构建多方式交通分布模型;
(6)利用获取的全样本的分方式出行OD完成模型参数标定工作,完成模型构建。
优选的:所述步骤(1)的过程包括:
S1获取手机信令数据对应的基站位置信息,将一天内所有的基站位置信息按照时间序列排序提取用户该天大致的活动位置信息;
S2根据时空聚类算法,设定时间、距离、速度阈值;
S3利用时间、速度阈值参数将轨迹点分为确定停留点、可能停留点和位移点;
S4利用距离阈值参数对可能停留点进行二次判别,最终得到轨迹点中的所有确定停留点,得到出行链信息。
优选的:所述步骤(2)的过程包括:
S1通过ArcGIS的邻域分析工具生成基站覆盖范围,然后通过空间连接工具得到交叉口与道路对应表、基站与交叉口对应表、基站覆盖范围内道路对应表;
S2对每一条出行基站轨迹序列进行编号,假设集合Si={j1,j2,…,jn}表示一条轨迹,其中ji表示轨迹中所占用的基站;
S3根据基站道路对应表累加轨迹Si中每个基站ji覆盖的道路,得到该轨迹的覆盖道路频次表Fi
S4针对每一个基站ji,根据基站与交叉口对应表提取覆盖范围内的交叉口以及对应交叉口组成的道路集合Ri
S5根据统计得到的频次表Fi,标记出Ri中频次最高的道路
Figure BDA0002687265480000021
并筛选出由该道路组成的交叉口,且当
Figure BDA0002687265480000022
时,删除该基站ji
S6计算从上一步中筛选出来的交叉口与基站之间的距离D,根据距离最小原则将基站与路网交叉口对应起来;
S7循环匹配轨迹序列中所有基站,得到一个交叉口序列Ci,对于不相邻的交叉口,调用最短路函数将其连接得到一条在路网上完整相连的交叉口序列;
S8循环判断交叉口序列Ci中相邻三条数据C(i-1),Ci,C(i+1)是否为A-B-A型数据,若存在,则删除交叉口Ci,C(i+1)
S9将相邻交叉口连接起来获得用户在路网上的轨迹数据,即手机用户在城市路网中的出行轨迹信息,用于与居民出行调查数据进行匹配。
优选的:所述步骤(3)的过程包括:
S1通过居民出行调查获得居民的性别、年龄、每条出行记录的出发交通小区编号、到达交通小区编号、出发时间、到达时间;
S2将居民出行调查数据的日期、出发交通小区和到达交通小区与从手机信令数据提取的出行轨迹信息进行匹配,进行初步筛选;
S3根据每一条居民出行调查数据的出发时间对手机数据轨迹信息进行第二次筛选;
S4根据性别和年龄属性进行最终的匹配,如果匹配成功,将居民出行调查数据的出行方式定义为某手机出行轨迹对应的出行方式即获得带有交通方式标签的手机信令轨迹数据。
优选的:所述步骤(4)的过程包括:
S1融合手机信令数据与GPS导航数据,分别根据轨迹时空特性与路径导航特性提取特征参数;
S2使用卡方检验方法来筛选每个特征维度下的最优模型精度,即通过观测实际值和理论值之间的偏差大小进行筛选,检验公式如下:
Figure BDA0002687265480000031
式中:chi2表示偏差,E为理论值,xi为样本观察值,n为特征参数总数;选择精度最高所对应的特征个数;
S3根据以下公式获得各特征参数重要度,对特征参数重要性进行分析,根据随机森林算法构建交通方式划分模型;
Figure BDA0002687265480000032
式中:G(p)为特征参数重要度,K为分类个数,pk为样本点属于第k类的概率;
S4使用传统的交通小区划分方法,以行政边界为主,利用行政区内的自然障碍作为主要划分依据,采用面到面,点到面或者点到点的匹配方法完成基站与交通小区的匹配,将基站OD转化为交通小区间的出行OD;
S5考虑手机运营的商市场份额比例以及移动电话普及率,完成从手机到手机用户的扩样,从单一运营商到所有运营商的扩样,从所有手机用户到全部出行居民的扩样,获得全样本的分方式OD估计。
优选的:所述步骤(5)的过程包括:
S1建立不同类型用地性质的土地与小区出行量之间的关系,通过拟合得到各种用地性质的单位土地发生吸引率;
S2将出行距离作为交通阻抗,从高德API提取同一起讫点之间不同交通方式的出行距离和出行时间作为参考因素,分别考虑步行、自行车、电动车、公交以及小汽车的广义成本函数;
S3考虑用地布局影响因素情况下,对重力模型基础模型作对数化处理,根据各用地性质的交通发生吸引率以及对应性质用地面积,获得小区发生吸引量,得到模型公式:
ln(Tij)=α ln(Ri(u))+β ln(Rj(u))+γ ln(Cij)+k
式中:Tij为交通小区i与交通小区j的出行量;Ri(u)为出发小区i的交通发生量;Rj(u)为到达小区j的交通吸引量;Cij为交通小区i与交通小区j的出行阻抗;α,β,γ,k均为待定系数;
S4、出行阻抗Cij在不同交通方式下的模型公式如下:
步行的效用函数:
Fw=ω1lw1tw
式中:lw表示步行出行距离;tw表示步行出行时间;ω1、θ1均为待定参数。
自行车的效用函数:
Fb=ω2lb2(tb+2)
式中:lb表示自行车出行距离;tb表示自行车出行时间;ω2、θ2均为待定参数;2定义为停车时间2min;
电动车的效用函数:
Fe=ω3le3(te+2)
式中:le表示电动车出行距离;te表示电动车出行时间;ω3、θ3均为待定参数;2定义为停车时间2min;
公交车的效用函数:
Fp=ω4lp4tp5fp
式中:lp表示公交车出行距离;tp表示公交车出行时间;fp表示公交车车票费用;ω4、θ4、θ5均为待定参数;
小汽车的效用函数:
Fc=ω6lc6tc7fc
式中:lc表示小汽车出行距离;tc表示小汽车出行时间;fc表示小汽车停车费用;ω6、θ6、θ7均为待定参数。
优选的:所述步骤(6)的过程包括:
S1根据用地性质分类标准划分用地,使用GIS软件连接用地性质图层与控规单元图层并编号,计算各类用地性质的面积;
S2假定出行的起终点为交通小区的重心,获得各交通小区的经纬度,利用python从高德地图API爬取各交通小区之间各种交通费用;
S3将交通小区的出行量和吸引量与交通小区各类用地性质进行拟合分析,得到各类用地性质出行率,总结获取各交通方式的交通分布模型参数选择表;
S4结合已获得的全样本的分方式出行OD信息,按照参数选择表拟合对应交通分布模型,得到的各种交通方式的交通分布模型公式。
本发明的有益效果
1、在对手机信令数据的出行特性分析方面:
手机信令数据在收集过程中存在很多数据属性的固有缺陷(如采样偏差和噪声等等);与传统居民出行调查数据不同,手机信令数据缺少一些属性,例如人口的社会统计属性、出行目的、出行方式等出行特性;手机信令数据数量大,种类繁多,现有的理论和技术对手机信令数据的挖掘程度有限。而本发明创新的运用规则匹配方法,将实际居民出行调查数据与手机信令数据较好的匹配获得带交通出行方式标签的手机信令轨迹数据。
2、在交通方式划分方面:
目前国内外关于从轨迹数据中挖掘出行方式的方法主要归类为三类,包括基于规则启发的交通方式划分、基于概率统计的交通方式划分以及基于机器学习的交通方式划分。比较现有三种交通方式划分方法,基于规则启发的方法至少需要检测的交通方式有先验知识才能构建规则集划分交通方式;基于概率统计的方法要对先验知识进行抽象转化,适用于区分特征变量明显不同的方法;基于机器学习的方法分为无监督和有监督,区别在于是否有带标签的数据用于建模训练中。目前有监督的机器学习方法受到更加广泛的应用,但是利用手机信令数据无法获取大量带有标签的样本数据且提取的特征变量还仅仅局限在出行特征方面,因此方式识别精度无法令人满意。而本发明首先着手获取带标签的模型数据,又提取了全面特征变量,然后在带标签的样本数据空间内运用随机森林算法进行交通方式划分,根据实例分析,模型精度较高,总体精度达到90.2%。
3、在交通分布模型方面:
国内外关于交通分布模型方面的研究不胜枚举,但是这些经典的交通分布模型都或多或少存在各种问题,可以总结成如下三点:(1)决定交通分布中小区到小区之间的出行量与交通方式、用地布局很多因素有关,但传统模型中仅仅用一个调节系数k来衡量且没有任何含义;(2)小区之间的阻抗矩阵与交通分布产生的出行OD紧密相关,传统模型仅用出行时间或者出行距离来代替,会产生很多误差。(3)最大的误差是居民出行调查中受访者对往返时间的估计,一般受访者不会刻意去记录出发到达时刻。本发明慎重考虑交通方式与用地布局对交通分布的影响,分方式的对交通阻抗进行考虑,利用效用函数衡量交通阻抗,选择全面的模型变量,构建多方式交通分布模型,根据实例分析,拟合效果较好,平均拟合水平达到0.801。
附图说明
图1为本发明的整体流程图
图2为实施例中手机基站轨迹点的三维立体展示图
图3为实施例中某用户的一条出行轨迹的路径匹配图
图4为实施例中规则匹配流程图
图5为实施例中各特征维度下的最优模型精度统计图
图6为实施例中最优特征空间下特征重要度统计图
图7为实施例中交通方式划分结果统计图
图8为实施例中昆山市出行方式结构图
图9为实施例中算法识别公交全天客流分布图
图10为实施例中2019年年报全天公交客流走廊
图11为实施例中识别小汽车全天客流分布图
图12为实施例中双向流量大于15000道路分布图
图13为实施例中昆山市各类用地性质分布图例
具体实施方式
下面结合实施例对本发明作进一步说明,但本发明的保护范围不限于此:
本发明基于时空聚类算法识别停驻点,根据手机信令数据提取用户出行的基站轨迹信息,通过概率决策方法完成出行链中基站与路网交叉口的匹配,获取用户在城市路网的出行轨迹信息。然后将居民出行调查数据与手机信令数据进行规则匹配,获取有交通方式标签的手机信令轨迹数据。融合多源数据提取特征参数,采用卡方检验筛选特征参数,运用随机森林分类算法构建交通方式划分模型,并通过扩样完成全样本的分方式出行OD估计。量化用地布局和交通方式对交通分布的影响,基于重力模型构建多方式交通分布模型,利用全样本分方式出行OD完成模型参数标定,最终完成多方式交通分布预测工作。其整体流程图如图1所示,具体内容详见技术方案,此处不再赘述。
下面结合一个具体实例对本发明的技术内容进行解释说明。
结合昆山市手机基站的定位精度,定义手机用户一次出行的两个条件:1)用户在某一位置停留时间超过了时间阈值,则该位置为一个停留点;2)连续两个出行端点间的距离大于500m,且两点的信令触发时间差大于5分钟,则认为这两点之间构成一次出行。记录一天内某用户手机数据的所有基站位置信息,如图2手机基站轨迹点的三维立体展示图,X轴和Y轴分别表示轨迹点的经度和纬度,Z轴为时间轴,将轨迹点按照时间顺序绘制,利用时间、速度、距离阈值识别所有停留点,如圆点所示,剩下的为位移点,如三角形所示,获得用户大致出行轨迹。
根据路径匹配算法将手机信令数据的基站轨迹序列转化为城市路网中的交叉口序列,如图3某用户的一条出行轨迹的路径匹配图,其中圆点表示从手机信令数据中提取出的出行轨迹点(基站位置),十字表示经过匹配和最短路填补后对应的交叉口,十字连线线条表示该用户真实出行轨迹,闭合线条表示昆山市内环高架。可看出该用户在路网中的出行是从西北方向上高架后一路向东行进,在东南方向下高速后返程回家。使用路径匹配后的交叉口基本沿着十字连线真实路径。
2017年南京市城市与交通规划设计研究院股份有限公司与苏州规划设计研究院股份有限公司在昆山联合开展了一次大规模综合交通调查,此次调查随机抽取了城市集中建设区家庭5150户,***村镇250户,最终收集到有效的出行数据共38598条。按照图4规则匹配流程图,将居民出行调查数据与手机信令数据规则匹配。
依据昆山市的出行结构和交通工具的行驶特点将出行方式划分为步行、自行车、电动车、公交以及小汽车这五种交通方式。匹配成功的手机出行轨迹数据共5861条,其中步行样本为1656个,自行车样本为610个,电动车样本为3997个,公交车样本为589个,小汽车样本为2777个,作为带有交通方式标签的手机信令轨迹数据样本空间。部分匹配数据如下表所示,id为居民出行调查数据的编号,type为出行方式的类别,1为步行、2为自行车、3为小汽车、4为公交车、5为小汽车,O_time和D_time分别表示调查数据中填写的出发时刻和到达时刻,O_id和D_id分别表示起终点所在交通小区编号,sex为该用户的性别,age为年龄,leave_time和arrive_time分别表示匹配成功的手机出行轨迹中出发时间和到达时间。
Figure BDA0002687265480000071
Figure BDA0002687265480000081
从出行轨迹时空特性和路径规划特征两个方面提取的20个特征参数,利用卡方检验对每个特征维度下的最优模型精度进行统计,如图5所示:
当特征个数达到17个时,模型精度最高,达到了0.902,即为最佳特征个数。对最优特征空间进行特征重要性分析,如图6最优特征空间下特征重要度统计图:
基于python中提供的关于机器学习的第三方模块Scikit-learn(sklearn)进行随机森林模型构建。通过随机函数将样本按照3:1的比例进行随机划分,其中四分之三的样本为模型训练样本,剩余四分之一的样本作为测试样本。在1466个测试样本集中,通过随机森林模型正确识别的个数达到了1322个样本,总体准确率达到了90.2%,其中步行和小汽车的准确率达到98%。样本模型训练结果如下表所示:
Figure BDA0002687265480000082
根据2020年工信部年度报告显示,移动用户大致占昆山手机用户总量的70%。根据昆山市2017年居民出行调查资料显示,平均出行次数约为2.82次。利用2019年移动手机信令数据,结合昆山人口计算,2019年平均出行次数为2.85人次。从人均出行次数来看,OD扩样结果准确性较高。
根据方式划分结果进行统计分析,各方式占比如图7所示。从昆山市综合交通规划(2017-2035)得知,2017年昆山市集中建设区调查人口出行方式结构如图8所示。交通方式划分结果基本呈现准确形式,从整体说明了方式划分的有效性。
由于地图匹配算法直接将基站序列转化为路网中的交叉口序列,可以直接将扩样后的分方式出行链汇聚到路网中,观察与真实数据的对比情况。选取公交和小汽车在昆山路网中的客流分布进行分析,图9为算法识别的公交客流分布图,图10为昆山市2019年报中全天客流走廊分布图。可以看出公交客流大于1500人次的道路与年报中所识别的公交客流走廊基本吻合。然后是小汽车的全天流量分布如图11所示,双向流量大于15000的道路分析如图12所示,除了明显的中环路网被识别出来外,包括主城区到花桥、周市、锦溪等周边行政区的主干路同样也被识别出流量较大,符合昆山市道路交通状态基本规律。
根据城市规划部门对于城市总体规划需要以及城市用地分类与规划建设用地标准(GB50137-2011),昆山市用地性质分布如图13所示。
交通小区间各类交通方式费用成本参数如下表:
Figure BDA0002687265480000091
将交通小区的出行量和吸引量与交通小区各类用地性质进行拟合分析,如表6-16所示,得到各类用地性质出行率:
Figure BDA0002687265480000092
Figure BDA0002687265480000101
其中**表示拟合显著性小于0.01,*表示显著性小于0.05。为了建模的可靠性与准确性,在最后的建模过程中仅考虑公共管理与公共服务用地、商业服务业设施用地、工业用地以及居住用地这四种用地性质对交通分布产生的影响。
各交通方式的模型参数选择表如下:
Figure BDA0002687265480000102
Figure BDA0002687265480000111
根据参数选择表,结合交通分布模型(ln(Tij)=α ln(Ri(u))+β ln(Rj(u))+γ ln(Cij)+k)以及各交通方式效用函数(Fw=ω1lw1tw、Fb=ω2lb2(tb+2)、Fe=ω3le3(te+2)、Fp=ω4lp4tp5fp、Fc=ω6lc6tc7fc),利用SPSS软件,输入参数变量(参数代号的数值由调查数据获得),拟合各种交通方式的交通分布模型,完成参数标定,公式如下:
1.步行方式交通分布模型
ln(Tij-71.623)
=0.914ln(70.692OB+11.201OM+114.035OR)+0.865ln(52.562DB+7.533DM+81.785DR)-3.069ln(0.025lw+0.092tw)
2.自行车方式交通分布模型
ln(Tij+3.734)
=0.861ln(24.118OB+6.576OM+45.843OR)+0.898ln(22.330DB+4.245DM+24.290DR)-2.203ln(0.017lb+0.003tb)
3.电动车方式交通分布模型
ln(Tij+6.838)
=0.877ln(71.423OB+22.708OM+89.895OR)+0.962ln(55.346DA+29.553DB+43.796DM+51.883DR)-2.414ln(0.279le+0.001te)
4.公交方式交通分布模型
ln(Tij-29.742)
=1.307ln(16.293OB+3.864OM+10.912OR)+1.233ln(59.861DB+16.562DM+46.743DR)-2.466ln(0.110lp+0.081tp+3.682fp)
5.小汽车方式交通分布模型
ln(Tij-38.199)
=1.051ln(9.473OB+2.557OM+8.885OR)+0.898ln(4.014DB+1.228DM+5.756DR)-1.450ln(0.095lc+0.008tc+0.052fc)
对模型进行检验,多方式交通分布模型的拟合度如下表:
Figure BDA0002687265480000121
平均水平达到0.801,可见该方法模型的拟合效果较好。
本文中所描述的具体实施例仅仅是对本发明精神做举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims (7)

1.一种基于手机信令数据的多方式交通分布模型构建方法,其特征在于步骤如下:
(1)根据基站轨迹点的时空特性,利用时空聚类算法识别出行停驻点,并提取出行链信息,以便与实际路网进行匹配;
(2)通过概率决策的方法将出行链中的基站与路网中的交叉口进行匹配,获取手机用户在城市路网中的出行轨迹信息,用于与居民出行调查数据的匹配;
(3)利用规则匹配的方法,将居民出行调查数据与路网中的出行轨迹信息匹配,获取带有交通方式标签的手机信令轨迹数据作为样本空间;
(4)基于卡方检验筛选特征参数,运用随机森林分类算法构建交通方式划分模型,将基站OD转化为交通小区间的出行OD,通过扩样完成全样本的分方式出行OD估计;
(5)根据用地布局和交通方式对交通分布的内在影响,利用重力模型构建多方式交通分布模型;
(6)利用获取的全样本的分方式出行OD完成模型参数标定工作,完成模型构建。
2.如权利要求1所述的一种基于手机信令数据的多方式交通分布模型构建方法,其特征在于:所述步骤(1)的过程包括:
S1获取手机信令数据对应的基站位置信息,将一天内所有的基站位置信息按照时间序列排序提取用户该天大致的活动位置信息;
S2根据时空聚类算法,设定时间、距离、速度阈值;
S3利用时间、速度阈值参数将轨迹点分为确定停留点、可能停留点和位移点;
S4利用距离阈值参数对可能停留点进行二次判别,最终得到轨迹点中的所有确定停留点,得到出行链信息。
3.如权利要求1所述的一种基于手机信令数据的多方式交通分布模型构建方法,其特征在于:所述步骤(2)的过程包括:
S1通过ArcGIS的邻域分析工具生成基站覆盖范围,然后通过空间连接工具得到交叉口与道路对应表、基站与交叉口对应表、基站覆盖范围内道路对应表;
S2对每一条出行基站轨迹序列进行编号,假设集合Si={j1,j2,…,jn}表示一条轨迹,其中ji表示轨迹中所占用的基站;
S3根据基站道路对应表累加轨迹Si中每个基站ji覆盖的道路,得到该轨迹的覆盖道路频次表Fi
S4针对每一个基站ji,根据基站与交叉口对应表提取覆盖范围内的交叉口以及对应交叉口组成的道路集合Ri
S5根据统计得到的频次表Fi,标记出Ri中频次最高的道路
Figure FDA0002687265470000021
并筛选出由该道路组成的交叉口,且当
Figure FDA0002687265470000022
时,删除该基站ji
S6计算从上一步中筛选出来的交叉口与基站之间的距离D,根据距离最小原则将基站与路网交叉口对应起来;
S7循环匹配轨迹序列中所有基站,得到一个交叉口序列Ci,对于不相邻的交叉口,调用最短路函数将其连接得到一条在路网上完整相连的交叉口序列;
S8循环判断交叉口序列Ci中相邻三条数据C(i-1),Ci,C(i+1)是否为A-B-A型数据,若存在,则删除交叉口Ci,C(i+1)
S9将相邻交叉口连接起来获得用户在路网上的轨迹数据,即手机用户在城市路网中的出行轨迹信息,用于与居民出行调查数据进行匹配。
4.如权利要求1所述的一种基于手机信令数据的多方式交通分布模型构建方法,其特征在于:所述步骤(3)的过程包括:
S1通过居民出行调查获得居民的性别、年龄、每条出行记录的出发交通小区编号、到达交通小区编号、出发时间、到达时间;
S2将居民出行调查数据的日期、出发交通小区和到达交通小区与从手机信令数据提取的出行轨迹信息进行匹配,进行初步筛选;
S3根据每一条居民出行调查数据的出发时间对手机数据轨迹信息进行第二次筛选;
S4根据性别和年龄属性进行最终的匹配,如果匹配成功,将居民出行调查数据的出行方式定义为某手机出行轨迹对应的出行方式即获得带有交通方式标签的手机信令轨迹数据。
5.如权利要求1所述的一种基于手机信令数据的多方式交通分布模型构建方法,其特征在于:所述步骤(4)的过程包括:
S1融合手机信令数据与GPS导航数据,分别根据轨迹时空特性与路径导航特性提取特征参数;
S2使用卡方检验方法来筛选每个特征维度下的最优模型精度,即通过观测实际值和理论值之间的偏差大小进行筛选,检验公式如下:
Figure FDA0002687265470000023
式中:chi2表示偏差,E为理论值,xi为样本观察值,n为特征参数总数;选择精度最高所对应的特征个数;
S3根据以下公式获得各特征参数重要度,对特征参数重要性进行分析,根据随机森林算法构建交通方式划分模型;
Figure FDA0002687265470000031
式中:G(p)为特征参数重要度,K为分类个数,pk为样本点属于第k类的概率;
S4使用传统的交通小区划分方法,以行政边界为主,利用行政区内的自然障碍作为主要划分依据,采用面到面,点到面或者点到点的匹配方法完成基站与交通小区的匹配,将基站OD转化为交通小区间的出行OD;
S5考虑手机运营的商市场份额比例以及移动电话普及率,完成从手机到手机用户的扩样,从单一运营商到所有运营商的扩样,从所有手机用户到全部出行居民的扩样,获得全样本的分方式OD估计。
6.如权利要求1所述的一种基于手机信令数据的多方式交通分布模型构建方法,其特征在于:所述步骤(5)的过程包括:
S1建立不同类型用地性质的土地与小区出行量之间的关系,通过拟合得到各种用地性质的单位土地发生吸引率;
S2将出行距离作为交通阻抗,从高德API提取同一起讫点之间不同交通方式的出行距离和出行时间作为参考因素,分别考虑步行、自行车、电动车、公交以及小汽车的广义成本函数;
S3考虑用地布局影响因素情况下,对重力模型基础模型作对数化处理,根据各用地性质的交通发生吸引率以及对应性质用地面积,获得小区发生吸引量,得到模型公式:
ln(Tij)=αln(Ri(u))+βln(Rj(u))+γln(Cij)+k
式中:Tij为交通小区i与交通小区j的出行量;Ri(u)为出发小区i的交通发生量;Rj(u)为到达小区j的交通吸引量;Cij为交通小区i与交通小区j的出行阻抗;α,β,γ,k均为待定系数;
S4、出行阻抗Cij在不同交通方式下的模型公式如下:
步行的效用函数:
Fw=ω1lw1tw
式中:lw表示步行出行距离;tw表示步行出行时间;ω1、θ1均为待定参数。
自行车的效用函数:
Fb=ω2lb2(tb+2)
式中:lb表示自行车出行距离;tb表示自行车出行时间;ω2、θ2均为待定参数;2定义为停车时间2min;
电动车的效用函数:
Fe=ω3le3(te+2)
式中:le表示电动车出行距离;te表示电动车出行时间;ω3、θ3均为待定参数;2定义为停车时间2min;
公交车的效用函数:
Fp=ω4lp4tp5fp
式中:lp表示公交车出行距离;tp表示公交车出行时间;fp表示公交车车票费用;ω4、θ4、θ5均为待定参数;
小汽车的效用函数:
Fc=ω6lc6tc7fc
式中:lc表示小汽车出行距离;tc表示小汽车出行时间;fc表示小汽车停车费用;ω6、θ6、θ7均为待定参数。
7.如权利要求1所述的一种基于手机信令数据的多方式交通分布模型构建方法,其特征在于:所述步骤(6)的过程包括:
S1根据用地性质分类标准划分用地,使用GIS软件连接用地性质图层与控规单元图层并编号,计算各类用地性质的面积;
S2假定出行的起终点为交通小区的重心,获得各交通小区的经纬度,利用python从高德地图API爬取各交通小区之间各种交通费用;
S3将交通小区的出行量和吸引量与交通小区各类用地性质进行拟合分析,得到各类用地性质出行率,总结获取各交通方式的交通分布模型参数选择表;
S4结合已获得的全样本的分方式出行OD信息,按照参数选择表拟合对应交通分布模型,得到的各种交通方式的交通分布模型公式。
CN202010980271.3A 2020-08-14 2020-09-17 一种基于手机信令数据的多方式交通分布模型构建方法 Pending CN112133090A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010817373 2020-08-14
CN2020108173733 2020-08-14

Publications (1)

Publication Number Publication Date
CN112133090A true CN112133090A (zh) 2020-12-25

Family

ID=73846041

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010980271.3A Pending CN112133090A (zh) 2020-08-14 2020-09-17 一种基于手机信令数据的多方式交通分布模型构建方法

Country Status (1)

Country Link
CN (1) CN112133090A (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112734216A (zh) * 2021-01-04 2021-04-30 长安大学 一种基于通信定位数据的居民出行目的的识别方法
CN112949784A (zh) * 2021-05-13 2021-06-11 深圳市城市交通规划设计研究中心股份有限公司 一种居民出行链模型构建方法及居民出行链获取方法
CN113111271A (zh) * 2021-04-20 2021-07-13 智慧足迹数据科技有限公司 出行od数据扩样方法、装置、计算机设备及存储介质
CN113407906A (zh) * 2021-05-13 2021-09-17 东南大学 一种基于手机信令数据的交通出行分布阻抗函数的确定方法
CN113487871A (zh) * 2021-08-13 2021-10-08 同济大学 基于网络集计策略的快速交通分配方法、装置及存储介质
CN113569977A (zh) * 2021-08-05 2021-10-29 东南大学 一种基于手机信令数据的出行目的识别方法
CN113709660A (zh) * 2021-07-30 2021-11-26 东南大学 一种运用手机信令数据的出行路径精确提取方法
CN113901109A (zh) * 2021-10-11 2022-01-07 交通运输部规划研究院 城际公路客货车出行方式总人数及时间分布的计算方法
CN114141008A (zh) * 2021-10-29 2022-03-04 东南大学 一种基于手机信令数据的新型共享公共交通服务区域选取方法
CN114245329A (zh) * 2021-12-21 2022-03-25 北京红山信息科技研究院有限公司 通行方式识别方法、装置、设备及存储介质
CN114501419A (zh) * 2021-12-30 2022-05-13 中国联合网络通信集团有限公司 信令数据处理方法、装置和存储介质
CN114639239A (zh) * 2022-02-24 2022-06-17 东南大学 一种改进重力模型交通分布预测方法
CN114694378A (zh) * 2022-03-21 2022-07-01 东南大学 一种两阶段的交通分布预测方法
CN114999162A (zh) * 2022-08-02 2022-09-02 北京交研智慧科技有限公司 一种道路交通流量获取方法和装置
CN115457758A (zh) * 2022-07-08 2022-12-09 北京交通大学 一种移动终端信令数据交通出行方式识别方法
CN115472006A (zh) * 2022-08-26 2022-12-13 武汉大学 一种利用手机信令数据的路网新增路段通勤车流预估方法
CN115967950A (zh) * 2023-02-17 2023-04-14 东南大学 基于手机信令数据的特征与时序的城际出行模式辨识方法
CN116070035A (zh) * 2022-08-31 2023-05-05 荣耀终端有限公司 数据处理方法和电子设备
CN116206452A (zh) * 2023-05-04 2023-06-02 北京城建交通设计研究院有限公司 一种城市交通出行的稀疏数据特征分析方法和***
CN116233759A (zh) * 2023-04-25 2023-06-06 北京城建交通设计研究院有限公司 一种居民出行轨迹调查方法及***
CN116628455A (zh) * 2023-07-25 2023-08-22 中路高科交通科技集团有限公司 一种城市交通碳排放监测与决策支持方法及***

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101800927A (zh) * 2009-02-11 2010-08-11 同济大学 基于手机用户到发量的交通起讫点信息获取方法
CN105117789A (zh) * 2015-07-29 2015-12-02 西南交通大学 基于手机信令数据的居民出行方式综合判别的方法
CN107040894A (zh) * 2017-04-21 2017-08-11 杭州市综合交通研究中心 一种基于手机信令数据的居民出行od获取方法
CN109978224A (zh) * 2019-01-14 2019-07-05 南京大学 一种分析获取不同性质建筑的交通出行率的方法
CN110160538A (zh) * 2019-05-09 2019-08-23 东南大学 一种基于手机信令数据的地图匹配方法
US20200245182A1 (en) * 2019-01-29 2020-07-30 Cisco Technology, Inc. Mobile edge computing with low latency traffic segregation within a pdn using dedicated bearers

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101800927A (zh) * 2009-02-11 2010-08-11 同济大学 基于手机用户到发量的交通起讫点信息获取方法
CN105117789A (zh) * 2015-07-29 2015-12-02 西南交通大学 基于手机信令数据的居民出行方式综合判别的方法
CN107040894A (zh) * 2017-04-21 2017-08-11 杭州市综合交通研究中心 一种基于手机信令数据的居民出行od获取方法
CN109978224A (zh) * 2019-01-14 2019-07-05 南京大学 一种分析获取不同性质建筑的交通出行率的方法
US20200245182A1 (en) * 2019-01-29 2020-07-30 Cisco Technology, Inc. Mobile edge computing with low latency traffic segregation within a pdn using dedicated bearers
CN110160538A (zh) * 2019-05-09 2019-08-23 东南大学 一种基于手机信令数据的地图匹配方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
刘娟: "基于手机数据的交通出行方式识别研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 *
毛晓汶: "基于手机信令技术的区域交通出行特征研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 *
赵再先 等: "大数据时代"四阶段"交通模型体系技术升级方法", 《交通与运输 交通模型》 *
马静 等: "基于用地结构熵的广义熵重力模型", 《长安大学学报(自然科学版)》 *

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112734216A (zh) * 2021-01-04 2021-04-30 长安大学 一种基于通信定位数据的居民出行目的的识别方法
CN113111271A (zh) * 2021-04-20 2021-07-13 智慧足迹数据科技有限公司 出行od数据扩样方法、装置、计算机设备及存储介质
CN113111271B (zh) * 2021-04-20 2023-08-29 智慧足迹数据科技有限公司 出行od数据扩样方法、装置、计算机设备及存储介质
CN112949784A (zh) * 2021-05-13 2021-06-11 深圳市城市交通规划设计研究中心股份有限公司 一种居民出行链模型构建方法及居民出行链获取方法
CN113407906A (zh) * 2021-05-13 2021-09-17 东南大学 一种基于手机信令数据的交通出行分布阻抗函数的确定方法
CN112949784B (zh) * 2021-05-13 2021-10-29 深圳市城市交通规划设计研究中心股份有限公司 一种居民出行链模型构建方法及居民出行链获取方法
CN113407906B (zh) * 2021-05-13 2024-02-02 东南大学 一种基于手机信令数据的交通出行分布阻抗函数的确定方法
CN113709660B (zh) * 2021-07-30 2022-06-24 东南大学 一种运用手机信令数据的出行路径精确提取方法
CN113709660A (zh) * 2021-07-30 2021-11-26 东南大学 一种运用手机信令数据的出行路径精确提取方法
CN113569977A (zh) * 2021-08-05 2021-10-29 东南大学 一种基于手机信令数据的出行目的识别方法
CN113569977B (zh) * 2021-08-05 2022-11-18 东南大学 一种基于手机信令数据的出行目的识别方法
CN113487871A (zh) * 2021-08-13 2021-10-08 同济大学 基于网络集计策略的快速交通分配方法、装置及存储介质
CN113901109B (zh) * 2021-10-11 2022-11-18 交通运输部规划研究院 城际公路客货车出行方式总人数及时间分布的计算方法
CN113901109A (zh) * 2021-10-11 2022-01-07 交通运输部规划研究院 城际公路客货车出行方式总人数及时间分布的计算方法
CN114141008A (zh) * 2021-10-29 2022-03-04 东南大学 一种基于手机信令数据的新型共享公共交通服务区域选取方法
CN114245329A (zh) * 2021-12-21 2022-03-25 北京红山信息科技研究院有限公司 通行方式识别方法、装置、设备及存储介质
CN114501419B (zh) * 2021-12-30 2023-05-12 中国联合网络通信集团有限公司 信令数据处理方法、装置和存储介质
CN114501419A (zh) * 2021-12-30 2022-05-13 中国联合网络通信集团有限公司 信令数据处理方法、装置和存储介质
CN114639239A (zh) * 2022-02-24 2022-06-17 东南大学 一种改进重力模型交通分布预测方法
CN114694378A (zh) * 2022-03-21 2022-07-01 东南大学 一种两阶段的交通分布预测方法
CN114694378B (zh) * 2022-03-21 2023-02-14 东南大学 一种两阶段的交通分布预测方法
CN115457758A (zh) * 2022-07-08 2022-12-09 北京交通大学 一种移动终端信令数据交通出行方式识别方法
CN115457758B (zh) * 2022-07-08 2024-02-20 北京交通大学 一种移动终端信令数据交通出行方式识别方法
CN114999162A (zh) * 2022-08-02 2022-09-02 北京交研智慧科技有限公司 一种道路交通流量获取方法和装置
CN115472006A (zh) * 2022-08-26 2022-12-13 武汉大学 一种利用手机信令数据的路网新增路段通勤车流预估方法
CN116070035A (zh) * 2022-08-31 2023-05-05 荣耀终端有限公司 数据处理方法和电子设备
CN116070035B (zh) * 2022-08-31 2023-10-20 荣耀终端有限公司 数据处理方法和电子设备
CN115967950A (zh) * 2023-02-17 2023-04-14 东南大学 基于手机信令数据的特征与时序的城际出行模式辨识方法
CN116233759A (zh) * 2023-04-25 2023-06-06 北京城建交通设计研究院有限公司 一种居民出行轨迹调查方法及***
CN116233759B (zh) * 2023-04-25 2023-07-28 北京城建交通设计研究院有限公司 一种居民出行轨迹调查方法及***
CN116206452A (zh) * 2023-05-04 2023-06-02 北京城建交通设计研究院有限公司 一种城市交通出行的稀疏数据特征分析方法和***
CN116206452B (zh) * 2023-05-04 2023-08-15 北京城建交通设计研究院有限公司 一种城市交通出行的稀疏数据特征分析方法和***
CN116628455A (zh) * 2023-07-25 2023-08-22 中路高科交通科技集团有限公司 一种城市交通碳排放监测与决策支持方法及***
CN116628455B (zh) * 2023-07-25 2023-10-03 中路高科交通科技集团有限公司 一种城市交通碳排放监测与决策支持方法及***

Similar Documents

Publication Publication Date Title
CN112133090A (zh) 一种基于手机信令数据的多方式交通分布模型构建方法
CN102595323B (zh) 基于手机定位数据的居民出行特征参数的获取方法
CN111653099B (zh) 基于手机信令数据的公交客流od获取方法
CN111653096B (zh) 一种基于手机信令数据的城市出行方式识别方法
Veloso et al. Sensing urban mobility with taxi flow
CN109561386A (zh) 一种基于多源定位数据的城市居民出行活动模式获取方法
Zhang et al. Green travel mobility of dockless bike-sharing based on trip data in big cities: A spatial network analysis
CN111341135B (zh) 基于兴趣点及导航数据的手机信令数据出行方式识别方法
CN110413855B (zh) 一种基于出租车下客点的区域出入口动态提取方法
CN112036757A (zh) 基于手机信令和浮动车数据的停车换乘停车场的选址方法
CN113569977B (zh) 一种基于手机信令数据的出行目的识别方法
CN115168529B (zh) 一种基于手机定位数据的枢纽客流溯源方法
CN105844031B (zh) 一种基于手机定位数据的城市交通廊道识别方法
CN113079463A (zh) 一种基于手机信令数据的旅游景点游客出行活动识别方法
CN116562545A (zh) 融合多源大数据分析与需求预测的公交规划gis平台
CN112000755A (zh) 一种基于手机信令数据的区域出行廊道识别方法
CN114141008B (zh) 一种基于手机信令数据的共享公共交通服务区域选取方法
CN117056823A (zh) 一种识别共享单车通勤用户职业类型的方法及***
CN113573238B (zh) 一种基于手机信令的联程旅客出行链识别方法
CN109800903A (zh) 一种基于出租车轨迹数据的盈利路线规划方法
Chung et al. Investigating the effects of POI-based land use on traffic accidents in Suzhou Industrial Park, China
Lwin et al. Identification of various transport modes and rail transit behaviors from mobile CDR data: A case of Yangon City
Huang et al. Recognition of Functional Areas in an Old City Based on POI: A Case Study in Fuzhou, China
CN110942622B (zh) 一种基于停车场实时运营大数据的停车场规划方法
CN106485921A (zh) 一种基于社交数据的区域高速路网车流状态分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201225