CN112734216A - 一种基于通信定位数据的居民出行目的的识别方法 - Google Patents
一种基于通信定位数据的居民出行目的的识别方法 Download PDFInfo
- Publication number
- CN112734216A CN112734216A CN202110004350.5A CN202110004350A CN112734216A CN 112734216 A CN112734216 A CN 112734216A CN 202110004350 A CN202110004350 A CN 202110004350A CN 112734216 A CN112734216 A CN 112734216A
- Authority
- CN
- China
- Prior art keywords
- travel
- index
- time
- stay
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000004891 communication Methods 0.000 title claims abstract description 35
- 238000012549 training Methods 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 13
- 230000000694 effects Effects 0.000 claims description 12
- 230000003442 weekly effect Effects 0.000 claims description 7
- 239000002131 composite material Substances 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 11
- 238000007726 management method Methods 0.000 abstract description 4
- 238000012545 processing Methods 0.000 abstract description 2
- 238000005065 mining Methods 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 description 13
- 238000011835 investigation Methods 0.000 description 11
- 238000011161 development Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 230000011664 signaling Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/021—Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/023—Services making use of location information using mutual or relative location information between multiple location based services [LBS] targets or of distance thresholds
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/025—Services making use of location information using location based information parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Software Systems (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Physics (AREA)
- Mathematical Analysis (AREA)
- Algebra (AREA)
- Probability & Statistics with Applications (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于通信定位大数据的居民出行目的识别方法,涉及通信数据处理技术领域。依托4G/5G通信定位获取个体全过程出行时空轨迹数据,将手机定位与GIS信息相结合,挖掘构建个体出行目的识别相关参数知识图谱,建立时间类、用地类、历史规律类、出行特征类4层出行目的识别证据链体系;以此为基础,构建贝叶斯信念树概率模型识别居民出行全过程出行目的,识别结果全面包括上班、上学、回家、就医、接送人、访友、娱乐、其他,8种日常生活常见出行目的。在当前手机普及率高的背景下,本发明可有效解决居民出行目的信息采集困难的局面,实现全市大范围居民出行信息识别与采集,为精细化交通规划与管理提供支撑。
Description
技术领域
本发明涉及通信数据处理技术领域,特别是涉及一种基于通信定位数据的居民出行目的的识别方法。
背景技术
个体出行目的识别是城市交通规划和管理政策制定的重要基础。尤其对于我国大、中城市,依托居民出行目的信息采集,进而分析居民在完成不同活动目的时交通出行特征、规律和意愿,对于城市交通基础设施选址、交通需求分析与交通疏导、公交路网规划和管理政策制定有重要指导价值,是城市提高交通服务水平和满意度的重要途径。
然而,出行目的识别长期以来一直是交通领域的一大痛点和“老大难”问题。与出行方式、出行速度、交通量等交通参数不同,这些参数能够依靠视频、雷达、线圈等现代化交通检测器自动采集,但对于出行目的识别,当前有效的设备和方法非常匮乏,尤其在我国土地利用高度复合化与复杂化背景下,依托间接监测数据来推断出行目的难度进一步增加。当前有关出行目的信息采集的方法主要有两种:1)居民出行问卷调查,2)GPS定位+土地利用性质识别。
居民出行问卷调查是当前最常用的出行目的信息采集手段。这类方法依靠调查人员进入到各居民社区进行抽样问卷,被调查者回忆过去一天的出行过程来获取出行目的数据。长期以来,居民出行调查方法饱受诟病,主要存在以下方面不足:1)数据质量低:由于调查过程时间长、信息量大,被调查者通常配合意愿较低,主观回忆造成的信息偏差、遗漏、错误现象普遍,更有居民出于隐私安全顾虑直接拒绝调查。2)调查成本高、组织难度大:对于城市级别的居民出行调查,通常需要成立专门调查筹备小组,由市政府高层牵头,交通局、规划局、公安局、社区居委会等多部门分工协作,同时需要大量调查者入户问卷,组织和开展过程非常繁琐复杂。由此产生的人力、物力调查成本很高,大多城市交通出行调查费用高达几百万甚至上千万元。3)调查周期长、数据更新困难:由于调查组织困难、成本高等原因,通常居民出行调查5-10年开展一次,数据更新周期长,且这些陈旧的交通调查数据也很难支撑城市快速发展的真实交通出行分析需求,由此制定的交通发展方案难以切实解决城市交通问题。
近年来,随着卫星定位、电子地图技术的快速发展,有学者提出了基于“GPS+土地利用”的个体出行目的推断方法,依托GPS定位将个体出行轨迹导入电子地图,以此为基础,通过识别个体停留位置的土地利用性质(如住宅、商业、学校等)来识别出行目的。该类技术相较于传统居民出行问卷调查,其智能化水平、时效性都有良好的提升,但在出行目的识别精度方面还存在较大不足,主要缺点体现在出行目的识别种类受限方面。我国土地高度复杂与复合化利用背景下,同一GPS定位点或定位给建筑的出行目的存在多样化特征,如对于万达大楼,同一建筑的不同楼层可能是购物、餐饮、办公、居住等不同出行目的。因此基于“GPS+土地利用”的出行目的识别方法存在识别种类受限问题,通常只对用地性质单一的学校、医院识别精度较好,但对于综合土地开发的上班、娱乐、购物、访友等其他出行目的识别效果不佳。此外,GPS定位技术只适用于户外出行定位,在建筑物内GPS卫星信号受到遮挡,无法获取个体室内出行信息。
因此,从当前个体出行目的识别技术来看,存在精度、信度和调查成本等多方面问题,当前迫切需要研发新技术来支撑出行目的信息采集,为现代化城市交通规划提供支撑。
发明内容
本发明实施例提供了一种基于通信定位数据的居民出行目的的识别方法,可以解决现有技术中存在的问题。
本发明提供了一种基于通信定位数据的居民出行目的的识别方法,包括以下步骤:
步骤1,采集基础数据,包括通信定位数据、GIS数据和出行日志数据;
步骤2,根据通信定位数据判断个体处在活动还是停留状态,对于停留状态,计算停留状态的持续时长,根据停留状态的持续时长判断个体是否达到目的地;
步骤3,构建时间类证据,包括工作日/节假日指标以及达到时间、离开时间和停留时长指标,所述达到时间、离开时间和停留时长指标根据步骤2确定的停留状态计算得到;
步骤4,构建用地类证据,包括用地性质指标和容积率指标,均根据所述GIS数据得到;
步骤5,构建历史规律类证据,包括周到访次数指标、到访间隔指标和平均逗留时长指标,均通过历史记录的出行目的数据得到;
步骤6,构建出行特征类证据,包括交通方式指标、出行距离指标和兴趣点指标,所述交通方式指标和出行距离指标均根据步骤2确定的停留状态计算得到,所述兴趣点指标根据GIS数据计算得到;
步骤7,建立贝叶斯信念树概率模型,将步骤3-6获得的训练数据输入模型,将出行日志数据作为输出,对模型进行训练,完成训练后保存模型;
通过步骤1-6获取待识别的数据,输入训练好的模型后,输出识别得到的出行目的。
优选地,步骤2具体包括:
步骤2.1:计算定位点平均离散距离;
以一定时间为间隔,计算各定位点的中心坐标,并基于中心坐标计算各定位点与中心坐标的平均离散距离,将平均离散距离与设定的阈值进行比较,判断个体处在运动还是停留状态;
步骤2.2:计算停留状态持续时长;
将相邻间隔时间中识别结果为停留的状态进行同状态合并,即当相邻若干个时间间隔的活动状态均为停留时,将这几个停留时段合并为一个,相应的停留状态持续时长为各间隔时长的累计值,将停留状态持续时长与设定的阈值比较,判断个体是否达到目的地。
优选地,步骤3具体包括:
步骤3.1:确定工作日/节假日指标;
当出行日期为除法定节假日外周一至周五任意天时,标定为工作日,用数字0表示;当出行日期为周六、周日或任意法定节假日时,标定为节假日,用数字1表示;
步骤3.2:计算达到时刻、离开时刻、停留时长指标;
提取个体处于停留状态的起始时间为该次停留的到达时刻;提取停留状态的终止时间为该次停留的离开时刻;计算离开时刻与到达时刻的差值为停留时长。
优选地,步骤4具体包括:
步骤4.1:确定用地性质指标;
将用地性质分为住宅、办公、学校、医院、酒店、园林、复合用地7大类,上述各类用地性质依次用数字1-7表示;
步骤4.2:确定容积率指标;
容积率根据获得的GIS数据直接表达。
优选地,步骤5具体包括:
步骤5.1:计算周到访次数指标;
将城市范围划分为150*150米网格,认为出行目的地在同一网格的为一趟历史出行,统计近一个月内周到访次数的平均值作为最终周到访次数指标;
步骤5.2:计算到访间隔指标;
统计过去一个月内所有到访时间间隔的平均值作为该目的地的最终到访间隔指标;
步骤5.3:计算平均逗留时长指标;
计算特定历史时间范围内,每次到访同一目的地的停留时长平均值。
优选地,步骤6具体包括:
步骤6.1:确定交通方式指标;
根据每趟出行的路段平均行程速度来表达所采用的交通方式;
步骤6.2:计算出行距离指标;
计算目的地停留点与出发地停留点的空间距离,作为出行距离指标;
步骤6.3:确定兴趣点指标;
统计出行目的地所在区域150*150米范围内兴趣点的数量作为最终兴趣点指标值。
优选地,步骤7中的贝叶斯信念树概率模型由MATLAB贝叶斯信念树工具箱创建。
本发明中的一种基于通信定位数据的居民出行目的的识别方法,以4G/5G通信定位大数据为依托,通过构建多维度、多视角、细粒度的个体出行目的识别证据链体系,再辅以城市GIS信息,将显著提升个体出行目的识别效果,具备以下方面技术优势:
1.与传统问卷调查技术相比,能够有效避免信息采集遗漏和错误现象,数据质量和可靠性大幅提升。与GPS分析技术相比,通信定位技术能够从通信运营商处直接获取海量样本,大幅降低了数据采集设备购买与采集成本,推广应用前景更好,且通信定位技术能够有效弥补GPS无法室内定位的缺陷。
2.依托4G/5G手机定位大数据,与传统依靠被调查者主观回忆和“GPS+土地性质”推断方法相比,出行目的识别类型、识别精度都能够得到显著提升,且该技术避免了被调查者的主观回忆过程,居民参与意愿更高、信息采集智能化水平更好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明中基于贝叶斯信念树的出行目的识别模型;
图2为定位点平均离散距离示意图;
图3为实验中出行停留点的识别结果;
图4为实验中的出行目的识别结果。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1,本发明提供了一种基于通信定位数据的居民出行目的的识别方法,该方法包括以下步骤:
步骤1,采集基础数据,包括通信定位数据、GIS数据和出行日志数据。
其中通信定位数据为从移动/联通/电信等通信运营商处获取的4G/5G数据,与传统2G/3G常用的7号信令口采集数据不同,为保证数据的内容和质量,本发明从4G/5G通信网络架构的MC、GB、IUPS等***接口采集信令数据。数据内容及格式如下:
表1 4G/5G通信数据内容及格式
需要指出,由于4G/5G通信定位技术相较于传统2G/3G发生大幅革新,其定位精度和定位频率得到显著提升,因此本发明的用户定位经纬度数据(数据内容10和11)是通过信纹定位、三角定位、三边定位等技术获得的精确个***置数据。目前部分基站还未完成定位技术更新时,仍然采用传统基站接近定位技术,即将提供实时服务的通信基站位置坐标作为用户定位坐标。
GIS数据通过城市规划、交通规划、互联网电子地图等方式获取,主要包括城市各地块的土地利用性质、容积率、出行兴趣点等数据。
出行日志数据指个体在出行过程中手动记录的真实出行时间、出行轨迹和出行目的信息。这些真实数据将用于后续模型的标定、训练和识别结果的精度对比。
步骤2,识别活动状态。
识别活动状态的目的是要判别个体出行是否到达了出行目的地,即通过个体活动状态(运动或停留)识别,结合相应状态的持续时长来判断是否到达了出行目的地。本发明应用如下方法进行活动状态识别:
步骤2.1:定位点平均离散距离。以5分钟为间隔,利用公式(1)计算各定位点的中心坐标(Xci,Yci),并利用公式(2)计算各定位点与中心坐标的平均离散距离Li。平均离散距离反映了个体在该5分钟内所有定位点的聚集水平。当个体处于运动状态时,轨迹定位点距离中心点较远,平均离散距离较大;而当个体处于停留状态时,各定位点在中心点附近跳动,平均离散距离较小。经过多次实验标定,本发明推荐平均离散距离阈值为160米,当平均离散距离大于或等于160米时,判定个体处在运动状态,当平均离散距离小于160米时,判定个体处在停留状态,技术原理如图2所示。
式中,Li为第i个5分钟间隔内所有定位点与中心坐标的平均离散距离。
步骤2.2:停留状态持续时长。依托步骤1计算获得的个体出行全过程活动状态结果,将相邻5分钟间隔识别结果为“停留”的进行同状态合并,即当相邻若干个时间间隔的活动状态均为“停留”时,将这几个“停留”时段合并为一个,相应的停留时长为各间隔时长的累计值。经过多次实验标定,本发明推荐停留时长阈值为1200秒,当停留时长超过1200秒时,则认为该个体到达了目的地,否则为出行中间短时停留,如交叉口、交通拥堵等。累计停留时长用公式(3)计算:
步骤3,构建时间类证据。
出行目的与出行时间存在密切关系,本发明详细分析了出行目的识别所需的时间类证据信息,根据发挥的证明作用与功能不同,包含以下时间证据:工作日、节假日、到达时刻、离开时刻和停留时长,共5项指标。各指标计算或表达方法如下:
步骤3.1:工作日/节假日指标表达。当出行日期为除法定节假日外周一至周五任意天时,标定为工作日,用数字0表示;同理,当出行日期为周六、周日或任意法定节假日时,标定为节假日,用数字1表示。
步骤3.2:达到时刻、离开时刻、停留时长指标计算。依托步骤2识别的出行停留状态,提取停留状态的起始时间为该次停留的到达时刻;提取停留状态的终止时间为该次停留的离开时刻;计算离开时刻与到达时刻的差值为停留时长;本步骤中,所有时间精度精确到秒。
步骤4,构建用地类证据。
出行目的与该停留点的土地开发情况密切相关。本发明依托从城市规划、交通规划部门获得GIS数据对各停留点用地情况进行分类和证据体系构建,主要包含用地性质和容积率两个指标。各指标计算或表达方法如下:
步骤4.1:用地性质指标表达。本发明将用地性质证据分为住宅、办公、学校、医院、酒店、园林、复合用地7大类。并将用地性质进行数字化转换,以便输入数学模型。上述各类用地性质依次用数字1-7表示。
步骤4.2:容积率指标表达。尤其对于复合用地场景,容积率在一定程度上能够反映该地块用地强度和活动强度,因此,将容积率作为辅助证据参数。容积率根据获得的GIS数据直接表达,精确到一位小数。
步骤5,构建历史规律类证据。
个体出行目的与历史上来该地区的出行规律也存在密切联系。本发明将周到访次数、到访间隔、平均逗留时长作为历史规律指标参数。各指标计算或表达方法如下:
步骤5.1:周到访次数指标计算。指一周当中,个体来访该出行目的地的次数。在实际计算中,将城市范围划分为150*150米网格,认为出行目的地在同一网格的为一趟历史出行,统计近一个月内周到访次数的平均值作为最终周到访次数值,精确到两位小数。
步骤5.2:到访间隔指标计算。指对于同一出行目的地,相邻两次到达时刻的时间间隔。本发明统计过去一个月内所有到访时间间隔的平均值作为该目的地的最终到访间隔数值,精确到小时。
步骤5.3:平均逗留时长指标计算。指对于同一目的地,特定历史时间范围内,例如1-6个月,每次到访的停留时长平均值。本发明统计过去一个月内所有到访停留时长的平均值作为最终平均逗留时长数值,精确到分钟。
步骤6,构建出行特征类证据。
出行特征类证据在于描述本次出行的及时出行特征,反映了个体出行过程的交通方式、出行需求强烈程度、目的地区域环境等信息,这些信息将有助于推断个体出行目的。因此,提出交通方式、出行距离、兴趣点3项出行特征类指标。各指标计算或表达方法如下:
步骤6.1:交通方式指标计算。不同交通方式的平均出行速度存在显著差异,因此,本发明依托每趟出行的路段平均行程速度来间接表达所采用的交通方式。路段行程速度为停留点间距离与出行时间的比值,用公式(4)计算:
式中:Tsi表示停留点i的第1个时刻,Tsi-1,n表示停留点i-1的第n个时刻(即最后一个时刻)。行程速度计算精确到整数。
本发明采用表2关系进行路段平均行程速度与交通方式转换。
表2路段平均行程速度与交通方式转换表
步骤6.2:出行距离指标计算。出行距离可以表示为目的地停留点与出发地停留点的空间距离来表示。因此,可以通过公式(5)计算获得,精确到一位小数,单位km。
步骤6.3:兴趣点指标计算。兴趣点指标是指目的地周边商店、饭店、娱乐场所等的数量,该指标可以通过GIS数据获得。本步骤统计出行目的地所在区域150*150米范围内兴趣点的数量作为最终兴趣点指标值。
步骤7,构建贝叶斯信念树概率模型,对该模型进行训练后用于出行目的识别。
贝叶斯信念树概率模型构建。贝叶斯信念树通过学习输入数据和输出数据的概率关系来获得概率分析函数,获得的概率分析函数能够用于识别新输入数据的出行目的。本发明运用MATLAB贝叶斯信念树工具箱进行模型的创建和设置。模型构建流程和方法如下:
1)模型结构创建。
2)模型训练。将步骤2-6计算获得的多层证据体系作为模型训练的输入参数,将出行日志数据对应的出行目的作为模型训练输出数据,本发明能够识别的出行目的包括上班、上学、回家、就医、接送人、访友、娱乐、其他8类。本发明运用Matlab工具箱进行模型训练,训练达到要求后程序自动停止,然后保存训练结果文件,训练工作完毕。
3)出行目的识别。调用保存的训练结果文件,将新的待识别数据输入模型,输入数据格式与步骤2-6相同,由训练好的贝叶斯信念树概率模型进行出行目的自动识别,保存识别结果。
下面结合具体实验说明本发明的效果。
图3为某志愿者某日出行识别结果。其中小圆点为4G/5G通信定位轨迹点,步骤2识别出了三个停留点①、②、③,因此可将整个出行过程划分为3次出行,分别写入每次出行停留信息表,如表3。
表3三次出行停留相关信息
以此为基础,计算步骤2-6证据体系,得到各层证据数据如表4-7所示。
表4时间类证据
出行 | 工作日 | 节假日 | 到达时刻 | 离开时刻 | 停留时长(秒) |
1-2 | 0 | 1 | 9:38:13 | 10:08:43 | 1830 |
2-3 | 0 | 1 | 10:40:12 | 14:20:28 | 13216 |
3-1 | 0 | 1 | 15:07:12 | 24:00:00 | 31968 |
表5用地性质证据
目的地序号 | 用地性质 | 容积率 |
2 | 6 | 2.8 |
3 | 7 | 3.5 |
1 | 1 | 2.5 |
表6历史规律证据
目的地序号 | 周到访次数 | 到访间隔(小时) | 平均逗留时长(分) |
2 | 0.25 | 720 | 31 |
3 | 3.00 | 71 | 124 |
1 | 7.00 | 14 | 653 |
表7出行特征证据
最后将不同层次证据链输入贝叶斯模型,实现基于多层证据链概率模型的出行目的识别。识别结果如图4所示,三次出行目的分别为接送人、娱乐、回家。与出行日志真实数据对比发现,三次出行的出行目的均识别正确。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (7)
1.一种基于通信定位数据的居民出行目的的识别方法,其特征在于,包括以下步骤:
步骤1,采集基础数据,包括通信定位数据、GIS数据和出行日志数据;
步骤2,根据通信定位数据判断个体处在活动还是停留状态,对于停留状态,计算停留状态的持续时长,根据停留状态的持续时长判断个体是否达到目的地;
步骤3,构建时间类证据,包括工作日/节假日指标以及达到时间、离开时间和停留时长指标,所述达到时间、离开时间和停留时长指标根据步骤2确定的停留状态计算得到;
步骤4,构建用地类证据,包括用地性质指标和容积率指标,均根据所述GIS数据得到;
步骤5,构建历史规律类证据,包括周到访次数指标、到访间隔指标和平均逗留时长指标,均通过历史记录的出行目的数据得到;
步骤6,构建出行特征类证据,包括交通方式指标、出行距离指标和兴趣点指标,所述交通方式指标和出行距离指标均根据步骤2确定的停留状态计算得到,所述兴趣点指标根据GIS数据计算得到;
步骤7,建立贝叶斯信念树概率模型,将步骤3-6获得的训练数据输入模型,将出行日志数据作为输出,对模型进行训练,完成训练后保存模型;
通过步骤1-6获取待识别的数据,输入训练好的模型后,输出识别得到的出行目的。
2.如权利要求1所述的一种基于通信定位数据的居民出行目的的识别方法,其特征在于,步骤2具体包括:
步骤2.1:计算定位点平均离散距离;
以一定时间为间隔,计算各定位点的中心坐标,并基于中心坐标计算各定位点与中心坐标的平均离散距离,将平均离散距离与设定的阈值进行比较,判断个体处在运动还是停留状态;
步骤2.2:计算停留状态持续时长;
将相邻间隔时间中识别结果为停留的状态进行同状态合并,即当相邻若干个时间间隔的活动状态均为停留时,将这几个停留时段合并为一个,相应的停留状态持续时长为各间隔时长的累计值,将停留状态持续时长与设定的阈值比较,判断个体是否达到目的地。
3.如权利要求1所述的一种基于通信定位数据的居民出行目的的识别方法,其特征在于,步骤3具体包括:
步骤3.1:确定工作日/节假日指标;
当出行日期为除法定节假日外周一至周五任意天时,标定为工作日,用数字0表示;当出行日期为周六、周日或任意法定节假日时,标定为节假日,用数字1表示;
步骤3.2:计算达到时刻、离开时刻、停留时长指标;
提取个体处于停留状态的起始时间为该次停留的到达时刻;提取停留状态的终止时间为该次停留的离开时刻;计算离开时刻与到达时刻的差值为停留时长。
4.如权利要求1所述的一种基于通信定位数据的居民出行目的的识别方法,其特征在于,步骤4具体包括:
步骤4.1:确定用地性质指标;
将用地性质分为住宅、办公、学校、医院、酒店、园林、复合用地7大类,上述各类用地性质依次用数字1-7表示;
步骤4.2:确定容积率指标;
容积率根据获得的GIS数据直接表达。
5.如权利要求1所述的一种基于通信定位数据的居民出行目的的识别方法,其特征在于,步骤5具体包括:
步骤5.1:计算周到访次数指标;
将城市范围划分为150*150米网格,认为出行目的地在同一网格的为一趟历史出行,统计近一个月内周到访次数的平均值作为最终周到访次数指标;
步骤5.2:计算到访间隔指标;
统计过去一个月内所有到访时间间隔的平均值作为该目的地的最终到访间隔指标;
步骤5.3:计算平均逗留时长指标;
计算特定历史时间范围内,每次到访同一目的地的停留时长平均值。
6.如权利要求1所述的一种基于通信定位数据的居民出行目的的识别方法,其特征在于,步骤6具体包括:
步骤6.1:确定交通方式指标;
根据每趟出行的路段平均行程速度来表达所采用的交通方式;
步骤6.2:计算出行距离指标;
计算目的地停留点与出发地停留点的空间距离,作为出行距离指标;
步骤6.3:确定兴趣点指标;
统计出行目的地所在区域150*150米范围内兴趣点的数量作为最终兴趣点指标值。
7.如权利要求1所述的一种基于通信定位数据的居民出行目的的识别方法,其特征在于,步骤7中的贝叶斯信念树概率模型由MATLAB贝叶斯信念树工具箱创建。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110004350.5A CN112734216A (zh) | 2021-01-04 | 2021-01-04 | 一种基于通信定位数据的居民出行目的的识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110004350.5A CN112734216A (zh) | 2021-01-04 | 2021-01-04 | 一种基于通信定位数据的居民出行目的的识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112734216A true CN112734216A (zh) | 2021-04-30 |
Family
ID=75590777
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110004350.5A Pending CN112734216A (zh) | 2021-01-04 | 2021-01-04 | 一种基于通信定位数据的居民出行目的的识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112734216A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113569977A (zh) * | 2021-08-05 | 2021-10-29 | 东南大学 | 一种基于手机信令数据的出行目的识别方法 |
CN117173898A (zh) * | 2023-11-03 | 2023-12-05 | 深圳市城市交通规划设计研究中心股份有限公司 | 基于停车场流水数据的分时段分目的出行od提取方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101694706A (zh) * | 2009-09-28 | 2010-04-14 | 深圳先进技术研究院 | 基于多源数据融合的人口时空动态出行特征建模方法 |
CN108062857A (zh) * | 2017-12-22 | 2018-05-22 | 西南交通大学 | 用于出租车乘客出行目的的预测方法 |
CN111737605A (zh) * | 2020-07-09 | 2020-10-02 | 南京瑞栖智能交通技术产业研究院有限公司 | 一种基于手机信令数据的出行目的识别方法及装置 |
CN112133090A (zh) * | 2020-08-14 | 2020-12-25 | 南京瑞栖智能交通技术产业研究院有限公司 | 一种基于手机信令数据的多方式交通分布模型构建方法 |
-
2021
- 2021-01-04 CN CN202110004350.5A patent/CN112734216A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101694706A (zh) * | 2009-09-28 | 2010-04-14 | 深圳先进技术研究院 | 基于多源数据融合的人口时空动态出行特征建模方法 |
CN108062857A (zh) * | 2017-12-22 | 2018-05-22 | 西南交通大学 | 用于出租车乘客出行目的的预测方法 |
CN111737605A (zh) * | 2020-07-09 | 2020-10-02 | 南京瑞栖智能交通技术产业研究院有限公司 | 一种基于手机信令数据的出行目的识别方法及装置 |
CN112133090A (zh) * | 2020-08-14 | 2020-12-25 | 南京瑞栖智能交通技术产业研究院有限公司 | 一种基于手机信令数据的多方式交通分布模型构建方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113569977A (zh) * | 2021-08-05 | 2021-10-29 | 东南大学 | 一种基于手机信令数据的出行目的识别方法 |
CN113569977B (zh) * | 2021-08-05 | 2022-11-18 | 东南大学 | 一种基于手机信令数据的出行目的识别方法 |
CN117173898A (zh) * | 2023-11-03 | 2023-12-05 | 深圳市城市交通规划设计研究中心股份有限公司 | 基于停车场流水数据的分时段分目的出行od提取方法 |
CN117173898B (zh) * | 2023-11-03 | 2024-02-27 | 深圳市城市交通规划设计研究中心股份有限公司 | 基于停车场流水数据的分时段分目的出行od提取方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102595323B (zh) | 基于手机定位数据的居民出行特征参数的获取方法 | |
CN106600960B (zh) | 基于时空聚类分析算法的交通出行起讫点识别方法 | |
CN106096631B (zh) | 一种基于手机大数据的流动人口分类识别分析方法 | |
CN102332210B (zh) | 基于手机定位数据的实时城市道路交通流数据提取方法 | |
CN112133090A (zh) | 一种基于手机信令数据的多方式交通分布模型构建方法 | |
CN110796337B (zh) | 一种评价城市公交站点服务可达性的*** | |
Wang et al. | Estimating dynamic origin-destination data and travel demand using cell phone network data | |
CN101694706A (zh) | 基于多源数据融合的人口时空动态出行特征建模方法 | |
CN108109423B (zh) | 基于WiFi室内定位的地下停车场智能导航方法及*** | |
CN109583640A (zh) | 一种基于多源定位数据的城市出行客流属性识别方法 | |
CN109299438A (zh) | 一种基于网约车数据的公共交通设施供给水平评价方法 | |
US20130166352A1 (en) | Mobile categorization | |
CN110414732A (zh) | 一种出行未来轨迹预测方法、装置、储存介质及电子设备 | |
Zheng et al. | Exploring both home-based and work-based jobs-housing balance by distance decay effect | |
CN107977673A (zh) | 一种基于大数据的经济活动人口识别方法 | |
CN112734216A (zh) | 一种基于通信定位数据的居民出行目的的识别方法 | |
CN102333274A (zh) | 一种基于手机信号数据处理通勤信息的方法及装置 | |
CN112512032B (zh) | 一种基于手机信令数据的对外出行人群识别方法 | |
CN113222327A (zh) | 一种基于服务能力的地块可达性分析方法 | |
CN117056823A (zh) | 一种识别共享单车通勤用户职业类型的方法及*** | |
CN113407906B (zh) | 一种基于手机信令数据的交通出行分布阻抗函数的确定方法 | |
CN117114210B (zh) | 无障碍公共设施布局优化方法、装置、设备及存储介质 | |
CN111400877B (zh) | 一种基于gis数据的智能城市仿真***和方法 | |
CN113256978A (zh) | 一种城市拥堵地区的诊断方法、***及储存介质 | |
CN116233759B (zh) | 一种居民出行轨迹调查方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210430 |
|
RJ01 | Rejection of invention patent application after publication |