CN114611622A - 一种利用手机数据识别跨城通勤人群的方法 - Google Patents

一种利用手机数据识别跨城通勤人群的方法 Download PDF

Info

Publication number
CN114611622A
CN114611622A CN202210267171.5A CN202210267171A CN114611622A CN 114611622 A CN114611622 A CN 114611622A CN 202210267171 A CN202210267171 A CN 202210267171A CN 114611622 A CN114611622 A CN 114611622A
Authority
CN
China
Prior art keywords
user
city
travel
trips
ratio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210267171.5A
Other languages
English (en)
Other versions
CN114611622B (zh
Inventor
王春松
赖见辉
李金龙
陈艳艳
陈庚
龙莹洁
张建利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN202210267171.5A priority Critical patent/CN114611622B/zh
Publication of CN114611622A publication Critical patent/CN114611622A/zh
Application granted granted Critical
Publication of CN114611622B publication Critical patent/CN114611622B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/021Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Tourism & Hospitality (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种利用手机数据识别跨城通勤人群的方法,分为三部分,过程如下:一是获取已知用户类型的手机数据,每个数据集标记道路类型标签,对手机数据进行预处理,提取用户出行OD,筛选出有跨城出行行为的用户,获取数据集中相关用户出行指标,作为数据模型样本;二是构建决策树模型。利用k折交叉验证对决策树进行训练,通过比较每次的模型指标评分,确定最终人群类别识别模型;三是获取未知用户类型的手机数据,对手机数据进行预处理,提取用户出行相关指标,将该出行相关指标输入上一步得到的识别模型中,输出相应的用户类型标签,即识别出用户类型。

Description

一种利用手机数据识别跨城通勤人群的方法
技术领域
本发明涉及大数据技术领域,具体涉及一种手机用户中跨城通勤人口的识别方法。
背景技术
伴随着城市规模的扩大和城际之间交通条件改善尤其是高速公路和铁路的出现,相邻城市辐射区域不断接近并有部分重合,城市之间经济联系越来越密切,相互影响越来越大,诱发大量跨城出行。原本存在于同一城市内的居住、工作、游憩等基本活动扩散到都市圈相邻城市,产生了居住、工作、游憩等城市基本功能分散在不同城市之间的模式,也就是跨城通勤。跨城通勤作为连接居住与工作地之间的主要出行模式,近些年已在全国不同城际内部得到显著增加。然而,传统的数据资源与技术难以准确地定位跨城通勤人口、识别并长时间追踪通勤出行。随着大数据时代的到来,数据资源日益丰富,手机信令数据具有样本量大、可持续追踪的特点,可应用于交通特征的量化分析,为准确的识别跨城通勤,分析跨城通勤特征提取了可能。
发明内容
本发明提供了一种利用手机数据识别跨城通勤人群的方法,为手机数据在跨城通勤及城市群发展与建设中的研究奠定了基础,方法分为三部分,过程如下:一是获取已知用户类型的手机数据,每个数据集标记道路类型标签,对手机数据进行预处理,提取用户出行OD,筛选出有跨城出行行为的用户,获取数据集中相关用户出行指标,作为数据模型样本;二是构建决策树模型。利用k折交叉验证对决策树进行训练,通过比较每次的模型指标评分,确定最终人群类别识别模型;三是获取未知用户类型的手机数据,对手机数据进行预处理,提取用户出行相关指标,将该出行相关指标输入上一步得到的识别模型中,输出相应的用户类型标签,即识别出用户类型。
本发明采用的技术方案为一种利用手机数据识别跨城通勤的方法,本方法具体包括以下几个步骤:
步骤1:获取已知用户类型的手机信令数据,手机信令数据包括用户编号、基站经度、基站纬度和信令记录产生时间。
步骤2:对获取的手机信令数据进行预处理,识别用户停留点,进一步提取用户出行OD,并根据出行OD是否在同一城市;如果是同一城市则为同城出行,如果不是同一城市则为跨城出行。
步骤3:根据步骤2中所提取的用户出行OD,删除掉所有出行中没有跨城出行行为的用户,即删除所有出行OD均在同一个城市的用户,筛选出有跨城行为的用户。
步骤4:构建跨城行为的用户类别集合,C={c1,c2,c3},其中c1表示跨城周通勤人群,c2跨城日通勤人群,c1和c2可统称为跨城通勤人群,c3表示非跨城通勤人群。定义所有训练集样本数据的类别标签,确定跨城通勤人群的高峰出行时段与高峰出行日期。
步骤5:根据通勤出行的特点,获取各个手机用户出行指标,其中,包括周平均出行次数N,高峰时段出行占比Pg、高峰日期跨城出行比例Pd、工作日非高峰时段出行占比Pf、工作日出行占比Pw、跨城出行占比Pc。各指标具体计算方法如下:
1)周平均出行次数N:指用户每周出行次数的平均值。
Figure BDA0003552284090000031
其中Qj表示用户第j周出行的总次数,n表示研究期间内共包含n周。
2)高峰时段出行占比Pg:指用户在高峰时段的出行次数与总出行次数的比值。
Figure BDA0003552284090000032
其中:Qg表示用户高峰时段的出行次数,Q表示用户的总出行次数。
3)高峰日期跨城出行比例Pd:指用户在高峰日期的出行次数与总跨城出行次数的比值。
Figure BDA0003552284090000033
其中:Qd表示用户高峰日期跨城出行的次数,Qc表示用户跨城出行的总次数。
4)工作日非高峰时段出行占比Pf:指用户在工作日期间非高峰时段的出行次数与总出行次数的比值。
Figure BDA0003552284090000034
其中:Qf表示用户工作日期间非高峰时段的出行次数。
5)工作日出行占比Pw:指用户在工作日期间的出行次数与总出行次数的比值。
Figure BDA0003552284090000035
其中:Qw表示用户早工作日期间的出行次数。
6)跨城出行占比Pc:指用户跨城出行的次数与总出行次数的比值。
Figure BDA0003552284090000036
步骤6:将训练集分为k份,其中一份作为验证集,另外k-1份作为训练集,将选取的验证集输入训练后的决策树模型,验证模型指标评分并保存。
步骤7:重复步骤6k次,每一次选取的验证集均不相同,得到k个模型指标评分,取k个模型指标评分的平均值即得到决策树模型的最终评分。
步骤8:将未知用户类型的手机数据按照步骤1和步骤2进行数据处理,并计算用户出行指标。将出行指标输入到步骤6和步骤7所得到的决策树识别模型中,输出相应用户类型标签。
与现有技术相比较,本发明应用交通特征的量化分析,能够识别跨城通勤,分析跨城通勤特征;并且通过利用手机数据识别跨城通勤人群,为用户类型进行了准确大数据分析;同时,也为手机数据在跨城通勤及城市群发展与建设中的研究奠定了基础。
附图说明
图1为本发明实施例提供的一种利用手机数据识别跨城通勤人群的方法的流程图;
图2为本发明实施例提供的决策树构建流程图;
图3为本发明实施例提供的最终决策树算法分类结果树状示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,本方法整体流程分为三部分,一是获取已知用户类型的手机数据,每个数据集标记道路类型标签,对手机数据进行预处理,提取用户出行OD,筛选出有跨城出行行为的用户,获取数据集中相关用户出行指标,作为数据模型样本;二是构建决策树模型。利用k折交叉验证对决策树进行训练,通过比较每次的模型指标评分,确定最终人群类别识别模型;三是获取未知用户类型的手机数据,对手机数据进行预处理,提取用户出行相关指标,将该出行相关指标输入步骤2得到的识别模型中,输出相应的用户类型标签,即识别出用户类型。
下面以一组手机数据为例进行说明:
步骤1:获取已知用户类型的手机信令数据,手机信令数据包括用户编号、基站经度、基站纬度和信令记录产生时间。例如:第n个用户的第i条手机数据记为
Figure BDA0003552284090000051
其中UserIDn表示第n个用户的唯一标识码,
Figure BDA0003552284090000052
表示n个用户第i条记录所处的位置横坐标,Yi n表示n个用户第i条记录所处的位置纵坐标,Ti n表示n个用户第i条记录发生的时间点,如表1所示。
表1:手机信令数据
Figure BDA0003552284090000053
Figure BDA0003552284090000061
步骤2:利用“一种利用手机定位数据判断用户移动与停留状态的方法”(专利号:CN106203505B),确定用户的停留点,得到用户停留点信息表,第n个用户的第i个停留点数据记为
Figure BDA0003552284090000062
其中UserIDn表示第n个用户的唯一标识码,
Figure BDA0003552284090000063
表示n个用户第i个停留点处的位置横坐标,Yi n表示n个用户第i个停留点所处的位置纵坐标,ETi n表示n个用户到达第i个停留点的时间点,LTi n表示n个用户离开第i个停留点的时间点,如表2所示。
进一步,将用户的停留点按照时间排序,相邻两个停留点为用户的一次出行,前一个点为起始点,后一个点为终点,得到用户的出行OD信息表,第n个用户的第i个出行OD数据记为
Figure BDA0003552284090000064
其中UserIDn表示第n个用户的唯一标识码,
Figure BDA0003552284090000065
表示n个用户第i条OD数据的起始位置坐标,
Figure BDA0003552284090000066
表示n个用户第i条OD数据的终点位置坐标,OTi n表示n个用户第i条OD数据从起始点出发的时间点,DTi n表示n个用户第i条OD数据到达终点的时间点,如表3所示。最后根据出行OD是否在同一城市,确定此次出行是否为跨城出行。
表2:用户停留点数据
Figure BDA0003552284090000071
表3:用户出行OD数据
Figure BDA0003552284090000072
步骤3:根据步骤中所提取的用户出行OD,删除掉所有出行中没有跨城行为的用户,即删除所有出行OD均在同一个城市的用户。筛选出在有跨城行为的用户。
步骤4:构建人群类别集合,C={c1,c2,c3},其中c1表示跨城周通勤人群,c2跨城日通勤人群,c1和c2可统称为跨城通勤人群,c3表示非跨城通勤人群。定义所有训练集样本数据的类别标签,确定跨城通勤人群的高峰出行时段与跨城周通勤人群高峰出行日期,例如,经统计分析,跨城通勤人群早高峰时段为6:00-8:00,晚高峰出行时段为5:00-7:00,跨城周通勤人群下班高峰出行日期为周五,上班高峰出行日期为周日与周一。
表4:用户出行OD数据
Figure BDA0003552284090000073
步骤5:根据通勤出行的特点,获取各个手机用户出行出行指标,其中,包括周平均出行次数N,高峰时段出行占比Pg、高峰日期跨城出行比例Pd、工作日非高峰时段出行占比Pf、工作日出行占比Pw、跨城出行占比Pc。各指标具体计算方法如下:
1)周平均出行次数N:指用户每周出行次数的平均值。
Figure BDA0003552284090000081
其中Qj表示用户第j周出行的总次数,n表示研究期间内共包含n周。例如某用户在四周内,每周的出行次数分别为14,17,12,16,周平均出行次数
Figure BDA0003552284090000082
2)高峰时段出行占比Pg:指用户在高峰时段的出行次数与总出行次数的比值。
Figure BDA0003552284090000083
其中:Qg表示用户高峰时段的出行次数,Q表示用户的总出行次数。例如,某用户在一周内出行总次数为18次,其中高峰时段出行次数为12次,则高峰时段出行占比
Figure BDA0003552284090000084
3)高峰日期跨城出行比例Pd:指用户在高峰日期的出行次数与总出行次数的比值。
Figure BDA0003552284090000085
其中:Qd表示用户高峰日期跨城的出行次数,Qc表示用户跨城出行的总次数。例如,某用户在高峰出行日期(周一、周五、周日)跨城出行次数为2次,一周内跨城出行总次数为4次,则工作日出行占比
Figure BDA0003552284090000086
4)工作日非高峰时段出行占比Pf:指用户在工作日期间非高峰时段的出行次数与总出行次数的比值。
Figure BDA0003552284090000087
其中:Qf表示用户工作日期间非高峰时段的出行次数。例如,某用户在一周内总出行次数为18次,在周一至周五工作日期间非高峰时段出行次数为4次,则工作日非高峰时段出行占比
Figure BDA0003552284090000091
5)工作日出行占比Pw:指用户在工作日期间的出行次数与总出行次数的比值。
Figure BDA0003552284090000092
其中:Qw表示用户早工作日期间的出行次数。例如,某用户在一周内总出行次数为18次,在周一至周五工作日期间16次,则工作日出行占比
Figure BDA0003552284090000093
6)跨城出行占比Pc:指用户跨城出行的次数与总出行次数的比值。
Figure BDA0003552284090000094
例如,某用户在一周内总出行次数为18次,跨城出行次数为10次,则工作日出行占比
Figure BDA0003552284090000095
步骤6:假设经过数据处理与筛选,共有1000名用户手机数据作为训练样本。将训练集分为10份,其中一份作为验证集,另外9份作为训练集,将选取的验证集输入训练后的决策树模型,验证模型指标评分并保存。
决策树算法流程如下:
决策树构建的关键在于利用信息增益确定分类结果的“纯度”,设训练数据集为D,|D|表示其样本容量。设有K个类Ck,k=1,2,3,...,K,|Ck|为属于类Ck的样本个数。设特征值A有n个不同的取值{a1,a2,...,an},根据特征值A的取值将D划分为n个子集D1,D2,...Dn,|Di|为Di的样本个数。记子集Di中属于类Ck的样本集合为Dik,即Dik=Di∩Ck,|Dik|为Dik的样本个数。则数据集D的信息熵为
Figure BDA0003552284090000096
特征值A对于数据集D的条件熵
Figure BDA0003552284090000097
则特征A对于数据集D的信息增益g(D,A)=H(D)-H(D|A)。
构建本案例中的决策树,第一步计算样本集合D的信息熵
Figure BDA0003552284090000101
第二步计算出当前属性集合{N,Pg,Pd,Pf,Pw,Pc,Fs}中每个属性的信息增益,比较信息增益的大小,使用信息增益最大的属性进行划分,并得到划分后的数据子集;第三步对每一个数据子集按照“第二步”继续划分,得到最终的决策树。
另外,为了验证分类结果的优劣性,这里选择基尼指数(Gini Index)来进行衡量,计算公式为:
Figure BDA0003552284090000102
其中,pk表示选中的样本属于k类别的概率,则这个样本被分错的概率是(1-pk),样本集合中有n个类别,一个随机选中的样本可以属于这n个类别中的任意一个,因而对类别的概率就加和。
对于连续值的处理思路就是将连续的特征离散化。给定样本集D和连续属性a,假定a在D上出现了n个不同的取值,将这些值从小到大进行排序,记为{a1,a2,...,an}。基于划分点t可将D分为子集
Figure BDA0003552284090000103
Figure BDA0003552284090000104
其中
Figure BDA0003552284090000105
包含那些在属性a上取值不大于t的样本,而
Figure BDA0003552284090000106
则包含那些在属性a上取值大于t的样本。显然,对相邻的属性取值ai与ai+1来说,t在区间[ai,ai+1)中取任意值所产生的划分结果相同。因此,对于连续属性a,考察包含n-1个元素的候选划分集合:
Figure BDA0003552284090000107
即把区间[ai,ai+1)的中位点
Figure BDA0003552284090000108
作为候选划分点。然后就可像离散属性值一样来考察这些划分点,选取最优的划分点进行样本集合的划分。
步骤7:重复“步骤6”10次,每一次选取的验证集均不相同,共得到10个模型指标评分:[0.8352,0.7932,0.8716,0.8925,0.9623,0.8159,0.9399,0.9015,0.8367,0.8566],取平均值即得到决策树模型的最终评分为:0.87054。最终得到决策树模型,如图3所示。
步骤8:将未知用户类型的手机数据按照步骤1和步骤2进行数据处理,并计算用户出行指标。将出行指标输入到步骤6和步骤7所得到的决策树识别模型中,输出相应用户类型标签。例如,表4中将三名用户的特征值输入到决策树中,可得到相应的用户类型。
Figure BDA0003552284090000111

Claims (2)

1.一种利用手机数据识别跨城通勤的方法,其特征在于:包括以下几个步骤:
步骤1:获取已知用户类型的手机信令数据,手机信令数据包括用户编号、基站经度、基站纬度和信令记录产生时间;
步骤2:对获取的手机信令数据进行预处理,识别用户停留点,进一步提取用户出行OD,并根据出行OD是否在同一城市;如果是同一城市则为同城出行,如果不是同一城市则为跨城出行;
步骤3:根据步骤2中所提取的用户出行OD,删除掉所有出行中没有跨城出行行为的用户,即删除所有出行OD均在同一个城市的用户,筛选出有跨城行为的用户;
步骤4:构建跨城行为的用户类别集合,C={c1,c2,c3},其中c1表示跨城周通勤人群,c2跨城日通勤人群,c1和c2可统称为跨城通勤人群,c3表示非跨城通勤人群;定义所有训练集样本数据的类别标签,确定跨城通勤人群的高峰出行时段与高峰出行日期;
步骤5:根据通勤出行的特点,获取各个手机用户出行指标,其中,包括周平均出行次数N,高峰时段出行占比Pg、高峰日期跨城出行比例Pd、工作日非高峰时段出行占比Pf、工作日出行占比Pw、跨城出行占比Pc
步骤6:将训练集分为k份,其中一份作为验证集,另外k-1份作为训练集,将选取的验证集输入训练后的决策树模型,验证模型指标评分并保存;
步骤7:重复步骤6k次,每一次选取的验证集均不相同,得到k个模型指标评分,取k个模型指标评分的平均值即得到决策树模型的最终评分;
步骤8:将未知用户类型的手机数据按照步骤1和步骤2进行数据处理,并计算用户出行指标;将出行指标输入到步骤6和步骤7所得到的决策树识别模型中,输出相应用户类型标签。
2.根据权利要求1所述的一种利用手机数据识别跨城通勤的方法,其特征在于:步骤5中,各指标具体计算方法如下:
1)周平均出行次数N:指用户每周出行次数的平均值;
Figure FDA0003552284080000011
其中Qj表示用户第j周出行的总次数,n表示研究期间内共包含n周;
2)高峰时段出行占比Pg:指用户在高峰时段的出行次数与总出行次数的比值;
Figure FDA0003552284080000021
其中:Qg表示用户高峰时段的出行次数,Q表示用户的总出行次数;
3)高峰日期跨城出行比例Pd:指用户在高峰日期的出行次数与总跨城出行次数的比值;
Figure FDA0003552284080000022
其中:Qd表示用户高峰日期跨城出行的次数,Qc表示用户跨城出行的总次数;
4)工作日非高峰时段出行占比Pf:指用户在工作日期间非高峰时段的出行次数与总出行次数的比值;
Figure FDA0003552284080000023
其中:Qf表示用户工作日期间非高峰时段的出行次数;
5)工作日出行占比Pw:指用户在工作日期间的出行次数与总出行次数的比值;
Figure FDA0003552284080000024
其中:Qw表示用户早工作日期间的出行次数;
6)跨城出行占比Pc:指用户跨城出行的次数与总出行次数的比值;
Figure FDA0003552284080000025
CN202210267171.5A 2022-03-17 2022-03-17 一种利用手机数据识别跨城通勤人群的方法 Active CN114611622B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210267171.5A CN114611622B (zh) 2022-03-17 2022-03-17 一种利用手机数据识别跨城通勤人群的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210267171.5A CN114611622B (zh) 2022-03-17 2022-03-17 一种利用手机数据识别跨城通勤人群的方法

Publications (2)

Publication Number Publication Date
CN114611622A true CN114611622A (zh) 2022-06-10
CN114611622B CN114611622B (zh) 2024-06-04

Family

ID=81864604

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210267171.5A Active CN114611622B (zh) 2022-03-17 2022-03-17 一种利用手机数据识别跨城通勤人群的方法

Country Status (1)

Country Link
CN (1) CN114611622B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115440040A (zh) * 2022-09-02 2022-12-06 重庆大学 一种基于高速公路通行数据的通勤车辆识别方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105101092A (zh) * 2015-09-01 2015-11-25 上海美慧软件有限公司 一种基于c4.5决策树的手机用户出行方式识别方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105101092A (zh) * 2015-09-01 2015-11-25 上海美慧软件有限公司 一种基于c4.5决策树的手机用户出行方式识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
方珊珊;陈艳艳;刘小明;魏攀一;赖见辉;: "基于手机信令数据的快递人员辨识方法", 北京工业大学学报, no. 03, 31 March 2017 (2017-03-31), pages 414 - 415 *
李振邦;应俊杰;顾承华;张扬;翟希;: "基于数据挖掘的手机用户出行方式识别研究", 黑龙江科技信息, no. 34, 5 December 2014 (2014-12-05), pages 55 - 57 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115440040A (zh) * 2022-09-02 2022-12-06 重庆大学 一种基于高速公路通行数据的通勤车辆识别方法
CN115440040B (zh) * 2022-09-02 2023-09-22 重庆大学 一种基于高速公路通行数据的通勤车辆识别方法

Also Published As

Publication number Publication date
CN114611622B (zh) 2024-06-04

Similar Documents

Publication Publication Date Title
CN110245981B (zh) 一种基于手机信令数据的人群类型识别方法
CN111582948B (zh) 一种基于手机信令数据与poi兴趣点的个体行为分析方法
CN106651424A (zh) 基于大数据技术的电力用户画像建立与分析方法
CN106931974B (zh) 基于移动终端gps定位数据记录计算个人通勤距离的方法
CN111985710A (zh) 一种公交乘客出行站点预测方法、存储介质及服务器
CN107194525A (zh) 一种基于手机信令的城市中心评估方法
Yao et al. Data-driven choice set generation and estimation of route choice models
CN112215666A (zh) 一种基于手机定位数据的不同出行活动目的特征识别方法
CN107016042B (zh) 一种基于用户位置日志的地址信息校验***
CN112949784B (zh) 一种居民出行链模型构建方法及居民出行链获取方法
Mo et al. Individual mobility prediction in mass transit systems using smart card data: An interpretable activity-based hidden Markov approach
CN115086880B (zh) 一种出行特征识别方法、装置、设备及存储介质
CN111510368B (zh) 家庭群组识别方法、装置、设备及计算机可读存储介质
CN116437291B (zh) 一种基于手机信令的文化圈规划方法和***
Chen et al. An analysis of movement patterns between zones using taxi GPS data
CN117056823A (zh) 一种识别共享单车通勤用户职业类型的方法及***
CN114611622B (zh) 一种利用手机数据识别跨城通勤人群的方法
CN108596664A (zh) 一种电子车票的单边交易费用确定方法、***及装置
CN111104468A (zh) 一种基于语义轨迹推断用户活动的方法
CN113158084B (zh) 移动轨迹数据处理的方法、装置、计算机设备及存储介质
CN112364776A (zh) 一种城市功能区识别模型建立、分类方法及装置
Yang et al. Mobility pattern identification based on mobile phone data
Xu et al. MM-UrbanFAC: Urban functional area classification model based on multimodal machine learning
CN112685654B (zh) 学生识别方法及装置、计算设备及可读计算机存储介质
Afolabi et al. When and where? Proactively predicting traffic accident in South Africa: our machine learning competition winning approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant