CN111862606B - 一种基于多源数据的非法营运车辆识别方法 - Google Patents
一种基于多源数据的非法营运车辆识别方法 Download PDFInfo
- Publication number
- CN111862606B CN111862606B CN202010711331.1A CN202010711331A CN111862606B CN 111862606 B CN111862606 B CN 111862606B CN 202010711331 A CN202010711331 A CN 202010711331A CN 111862606 B CN111862606 B CN 111862606B
- Authority
- CN
- China
- Prior art keywords
- track
- vehicle
- intersection
- base station
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/017—Detecting movement of traffic to be counted or controlled identifying vehicles
- G08G1/0175—Detecting movement of traffic to be counted or controlled identifying vehicles by photographing vehicles, e.g. when violating traffic rules
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/052—Detecting movement of traffic to be counted or controlled with provision for determining speed or overspeed
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/123—Traffic control systems for road vehicles indicating the position of vehicles, e.g. scheduled vehicles; Managing passenger vehicles circulating according to a fixed timetable, e.g. buses, trains, trams
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开了一种基于多源数据的非法营运车辆识别方法,它基于手机信令数据获取用户移动信息,筛选出符合营运车辆特征的用户,结合停留热点区域初步筛选出可疑非法营运车辆,在此基础上与合法运营车辆GPS进行比对筛选疑似车辆车主轨迹信息,最终通过与卡口数据的过车序列进行匹配获取疑似非法营运车辆车牌号码。相比现有技术,该发明能基于现有数据源对全部车辆进行筛查,在可疑车辆排查过程不需要额外加装感知设备以及人为参与。所涉及到的数据源不涉及用户隐私问题,且不需要乘客或其他人员的配合,数据易于获取技术易实施。交通执法人员可以根据车辆轨迹及时调整行动方案打破以往“固定时段、固定地点”的打击模式,提高打击“黑车”的精准度。
Description
技术领域
本发明属于智能交通领域,具体是一种基于多源数据的非法营运车辆识别方法。
背景技术
随着车辆营运市场的不断开放以及出行需求的不断增长,大量非法营运车辆也趁机滋生,尤其在城市的重要交通节点处,不仅带来了巨大的安全隐患也有损城市的整体对外形象。相较于合法出租车以及网约车,非法营运车辆是指未经政府许可,未取得行业监管部门发放的营运执照的出租车、小客车、面包车等机动运输车辆,通常在车站、医院、景点以及学校等人流和出行需求较为集中迫切的区域随意拉客,一方面对运输市场造成了不良的影响严重扰乱了市场运输秩序,另一方面,对乘客而言也造成了较大的安全隐患,合法权益无法得到保障。
目前,对于非法营运车辆的监管较为困难,主要原因是在开放的市场条件下缺少相应的检测手段。由于交通监管部门只掌握正规营运车辆的运营行驶信息,包括车辆牌照,驾驶员手机号码,车辆运行GPS信息等,对于其他私家车其出行轨迹信息监管部门很难获取因此也增加了非法营运车辆的识别监管工作难度。手机信令数据能连续实时追踪用户的位置信息,且获取简单除日常使用的手机外不需要额外的感知设备。随着社会的发展通讯的进步,几乎人人都拥有手机,尤其是司机群体,由于需要导航手机的使用频率更高。发明专利“一种非法营运车辆检测***及方法”(申请号:201410361120.4)公开了一种利用手机信令数据以及现场检测设备的非法营运车辆检测***,通过车牌识别待检测车辆的当前位置,同时结合手机信令分析与该车辆关联的司机手机的当前位置,将二者进行比较,如果司机的手机不在待检测车辆的周围,则认为待检测车辆为非法营运车辆。发明专利“一种基于汽车电子标识数据的非法营运车辆识别方法”(申请号:201910511579.0)主要包括以下步骤:1)针对行驶时间较长的车辆统计多次通过同一电子标识采集点的车辆数据和多次通过市辖区的车辆数据;2)对多次通过同一电子标识采集点的次数项和多次通过市辖区的次数项进行权重分配,建立非法营运车辆嫌疑程度评估数据模型;3)根据模型对车辆进行测评。
现有的非法营运车辆识别方法,主要是针对特定车辆进行识别,并未实现全覆盖排查监测,需要加装现场检测设备,且由于与号码匹配的手机信令数据存在隐私问题,实施起来有一定难度。
发明内容
本发明针对现有技术中存在的问题,本发明融合位置及行业监管数据,以手机信令为核心,基于全样本分析筛选出具有行驶时间距离长且路线不固定特征的运营车辆,通过与出租车网约车GPS数据进行比对匹配初步筛选出可疑非法营运车辆,在此基础上判断在热点区域的营运车辆的停留特性,进一步锁定非法营运车辆轨迹信息。最后基于路径匹配获取可疑非法营运车辆的运行轨迹信息提取其途径交叉口序列与卡口数据进行匹配,确定其车牌号为交通违法管理提供辅助支撑,实现非法营运车辆的精准打击。
技术方案:
本发明公开了一种基于多源数据的非法营运车辆识别方法,它基于手机信令数据获取用户移动信息,筛选出符合营运车辆特征的用户,结合停留热点区域初步筛选出可疑非法营运车辆,在此基础上与合法运营车辆GPS进行比对筛选疑似车辆车主轨迹信息,最终通过与卡口数据的过车序列进行匹配获取疑似非法营运车辆车牌号码。
优选的,它具体包括以下步骤:
S1、数据获取,在移动运营商处获取手机信令数据,对原始信令数据进行预处理,提取用户出行OD信息,包括出发时间、到达时间、出发地、到达地、出行速度;
S2、统计用户一段时间内的出行距离以及出行时耗特性,初步筛选出营运车辆驾驶员出行轨迹信息;
S3、对筛选出的具备营运车辆轨迹特性的信令数据进行路径匹配,将信令数据记录的位置信息转换成路网上的交叉口序列信息;
S4、获取营运车辆包括巡游出租车以及网约车的GPS信息,将其与筛选出来的营运车辆轨迹信息进行匹配,初步确定可疑非法营运车辆出行轨迹;
S5、获取全市非法营运车辆接客热点区域,如火车站、学校等的服务基站集合,分析可疑非法营运车辆在热点区域的停留特性,进一步确定非法营运车辆;
S6、获取卡口数据,将车辆在交叉口的过车轨迹序列与非法营运车辆驾驶员的轨迹序列相匹配,最终确定疑似车辆的车牌号信息。
优选的,步骤S1数据获取具体包括:
S11、从移动运营商处获取原始手机信令数据,对其进行去噪处理包括重复定位、乒乓定位以及漂移定位数据的处理,从而得到较为准确的用户定位轨迹信息;
S12、根据定位点的时空属性识别轨迹中的停留点以及位移点,即计算当前轨迹点的停留时间以及与下一个轨迹点的空间距离,当停留时间大于时间阈值且与下一轨迹点的空间距离大于空间阈值时将其标记为停留点,其余为位移点;具体的时空阈值可根据研究城市的出行特点以及基站覆盖范围决定;
S13、根据识别出的停留点以及位移点信息划分用户出行OD信息,包括出发点、终点、出发时间、到达时间、平均速度。
优选的,步骤S2初步筛选具体包括:
S21、选定一周作为研究时间范围,统计一周内每个手机号码出行轨迹的累计出行距离,其中出行距离的计算方法为轨迹中相邻基站之间的直线距离;
S22、统计每个用户一周中出行速度大于Vcar的OD数量Nweek以及满足条件的OD累计行驶时间Tweek,其中Vcar指城市小汽车运行平均速度;
S23、进一步的,筛选出同时满足日均累计行驶距离>距离阈值Smax、一周内出行速度大于Vcar的OD数量Nweek>正常非营运车辆一周平均行驶次数、累计日均行驶时间Tweek>非营运车辆正常日均行驶时间平均值的用户及其手机信令记录的轨迹信息。
优选的,步骤S3中通过路径匹配算法将基站轨迹序列转换成交叉口序列,路径匹配算法具体包括:
S311:基础数据准备、将手机基站信息导入ArcGIS中通过分析工具生成基站缓冲区,缓冲区半径由城市基站平均覆盖范围决定,通过基站缓冲区面文件与交叉口点文件的相交分析得到每个基站缓冲区内包含的交叉口信息,同时计算基站ID与对应交叉口ID之间的距离,最终得到基站与交叉口对应表;在ArcGIS软件中分析获取每个交叉口所连接对应的道路名称,即交叉口与道路对应表;在ArcGIS中通过基站缓冲区面文件以及道路文件进行相交,得到每个基站覆盖范围内对应的道路,得到基站与道路对应表;
S312:本算法是针对一次出行基站轨迹序列,将从手机信令数据中提取的每一条出行基站轨迹序列进行编号,即对于每一条轨迹Si={j1,j2,…,ji,…,jn},其中ji表示轨迹中所占用的基站,对每一条轨迹分别执行以下算法流程:
S313:对Si={j1,j2,…,ji,…,jn}中的每一个基站ji,根据基站与道路对应表找到该基站对应的所有道路集合Rji,并对每个基站对应的道路集合Rji中的道路进行累加,得到该轨迹的所有覆盖道路的频次表Fi,该表一列为道路名,一列为该道路的累加频次;
S314:对Si中的每一个基站ji,根据基站与交叉口对应表得到基站ji,覆盖范围内的所有交叉口,记做基站覆盖交叉口集合Cji;
S315:根据S314中得到的基站覆盖交叉口集合Cji以及交叉口与道路对应表,得到该基站对应的交叉口集合Cji中的每一个交叉口对应的道路组成道路集合Ri;
S316:根据S313中统计得到的频次表Fi,标记出每个基站对应的集合Ri中频次最高的道路Rmax(Fi),并筛选出由该道路组成的交叉口集合JCji,当Rmax(Fi)=1时,删除该基站ji;
S317:对集合JCji中的每一个交叉口C,计算其与对应基站ji之间的距离D,根据距离最小原则保留与基站空间距离最近的交叉口,标记为该基站在路网上对应交叉口;
S318:循环匹配轨迹序列中所有基站,得到一个交叉口序列Ci,对于不相邻的交叉口,调用最短路函数,最终得到一条在路网上完整相连的交叉口序列。
优选的,步骤S4中初步确定可疑非法营运车辆出行轨迹,具体包括:
S41、通过交管部门获取营运车辆在研究范围内的GPS信息,所述营运车辆包括巡游出租车以及网约车;
S42、将GPS数据匹配至路网上得到带有时间标签的移动交叉口序列信息;
S43、将运营车辆GPS轨迹信息与从手机信令数据中筛选出的营运车辆轨迹信息进行匹配,若匹配成功,则将该车辆的信令轨迹信息进行剔除;若匹配不成功,则保留该车辆的出行轨迹信息将其视为可疑非法营运车辆,进入下一步判断,匹配具体实施方法如下:
S431:对于一条营运车辆GPS轨迹序列,首先在S2步骤中保留的用户轨迹信息中筛选出满足出行时间与在GPS序列运行时间有重叠OD信息,将其作为营运车辆待匹配序列集合X;
S432:营运车辆GPS的一条轨迹序列记为Gi={g1,g2,…,gi,…,gn},其中gi代表步骤S42中匹配得到的交叉口,对于集合X中的每一条匹配序列,判断在轨迹点g1前后一定时间范围内,是否存在满足与g1距离小于距离阈值Smatch的轨迹点信令轨迹序列,存在则认为该点匹配成功,依次遍历该天该条营运车辆GPS轨迹序列中所有的交叉口gi,若有且仅有一条轨迹序列中的所有轨迹点均匹配成功,则认为该手机信令轨迹与营运车辆运行轨迹匹配成功,不属于非法营运车辆,可将其从待匹配序列中剔除;
S433:依次遍历所有营运车辆GPS轨迹序列,待匹配序列中保留的信令轨迹信息则为初次筛选出的可疑非法营运车辆信息。
优选的,步骤S5中进一步确定非法营运车辆,具体步骤为:
S51、根据城市非法营运车辆出入热点区域,将覆盖热点区域的手机基站筛选出来组成集合J;
S52、对S4中保留的可疑车辆手机出行轨迹信息进行分析,计算其在热点基站J范围内的停留次数以及累积停留时间,将满足日均停留次数大于两次,累积停留时间在一定时间范围内的车辆判断为非法营运车辆。
优选的,步骤S6中最终确定疑似车辆的车牌号信息,具体步骤为:
S61、由城市道路的卡口检测***获取车辆号牌数据,卡口需能对每辆过车进行抓拍、车牌识别;对卡口检测***采集的原始数据进行过滤筛选,获取有效的车辆检测数据,需包含车牌号、卡口编号、检测时间这三个字段;
S62、对S5中筛选出的非法营运车辆,提取其经过路径匹配后得到的带有交叉口序列C,将序列中没有卡口数据的交叉口进行剔除;
S63、对于交叉口序列C中的每一个交叉口,筛选出经过该交叉口前后一定时间范围内的过车号牌,依次遍历所有的交叉口,每次在前一个交叉口筛选出的号牌集合中进行判断,直至保留有且仅有一辆车牌号码时则认为匹配成功,该车牌号码即为非法营运车辆的车牌号。
本发明的有益效果
相比现有技术,该发明能基于现有数据源对全部车辆进行筛查,在可疑车辆排查过程不需要额外加装感知设备以及人为参与。所涉及到的数据源不涉及用户隐私问题,且不需要乘客或其他人员的配合,数据易于获取技术易实施。交通执法人员可以根据车辆轨迹及时调整行动方案打破以往“固定时段、固定地点”的打击模式,提高打击“黑车”的精准度。
附图说明
图1为本发明的流程图
具体实施方式
下面结合实施例对本发明作进一步说明,但本发明的保护范围不限于此:
本发明公开了一种基于多源数据的非法营运车辆识别方法,基于手机信令数据获取用户移动信息,筛选出符合营运车辆特征的用户,结合停留热点区域初步筛选出可疑非法营运车辆,在此基础上与合法运营车辆GPS进行比对筛选疑似车辆车主轨迹信息,最终通过与卡口数据的过车序列进行匹配获取疑似非法营运车辆车牌号码。
结合图1,包括以下步骤:
S1、数据获取,在移动运营商处获取手机信令数据,对原始信令数据进行预处理,提取用户出行OD信息,包括出发时间、到达时间、出发地、到达地、出行速度;
S2、统计用户一段时间内的出行距离以及出行时耗特性,初步筛选出营运车辆驾驶员出行轨迹信息;
S3、对筛选出的具备营运车辆轨迹特性的信令数据进行路径匹配,将信令数据记录的位置信息转换成路网上的交叉口序列信息。
S4、获取营运车辆包括巡游出租车以及网约车的GPS信息,将其与筛选出来的营运车辆轨迹信息进行匹配,初步确定可疑非法营运车辆出行轨迹。
S5、获取全市非法营运车辆接客热点区域,如火车站、学校等的服务基站集合,分析可疑非法营运车辆在热点区域的停留特性,进一步确定非法营运车辆。
S6、获取卡口数据,将车辆在交叉口的过车轨迹序列与非法营运车辆驾驶员的轨迹序列相匹配,最终确定疑似车辆的车牌号信息。
优选的,步骤S1数据获取,在移动运营商处获取手机信令数据,对原始信令数据进行预处理,提取用户出行OD信息,包括出发时间、到达时间、出发地、到达地、出行速度;包括以下步骤:
S11、从移动运营商处获取原始手机信令数据,对其进行去噪处理包括重复定位、乒乓定位以及漂移定位数据的处理,从而得到较为准确的用户定位轨迹信息;
S12、根据定位点的时空属性识别轨迹中的停留点以及位移点,即计算当前轨迹点的停留时间以及与下一个轨迹点的空间距离,当停留时间大于40min且与下一轨迹点的空间距离大于800m时将其标记为停留点,其余为位移点。具体的时空阈值可根据研究城市的出行特点以及基站覆盖范围决定。
S13、根据识别出的停留点以及位移点信息划分用户出行OD信息,一段OD由两个连续的停留点以及中间的位移点组成。完整的OD信息应包括出发点、终点、出发时间、到达时间、平均速度。
优选的,步骤S2统计用户一段时间内的出行距离以及出行时耗特性,初步筛选出营运车辆驾驶员出行轨迹信息;包括以下步骤:
S21、选定一周作为研究时间范围,统计一周内每个手机号码对应出行轨迹的出行累计距离,其中行驶距离的计算方法为相邻基站之间的直线距离。
S22、统计出行速度大于20km/h的OD数量以及累计行驶时间。
S23、筛选出同时日均累计行驶距离超过80KM、一周内出行速度大于20km/h的OD数量大于14次、累计日均行驶时间大于4h的用户轨迹信息。
优选的,步骤S3对筛选出的具备营运车辆轨迹特性的信令数据进行路径匹配,将信令数据记录的位置信息转换成路网上的交叉口序列信息。包括以下步骤:
S31、通过路径匹配算法将基站轨迹序列转换成交叉口序列,路径匹配算法具体实施步骤如下:
S311:基础数据准备。将手机基站信息导入ArcGIS中通过分析工具生成基站400m缓冲区,通过基站缓冲区面文件与交叉口点文件的相交分析得到每个基站缓冲区内包含的交叉口信息,同时计算基站ID与对应交叉口ID之间的距离,最终得到基站与交叉口对应表;在ArcGIS软件中分析获取每个交叉口所连接对应的道路名称,即交叉口与道路对应表;在ArcGIS中通过基站400m缓冲区面文件以及道路文件进行相交,得到每个基站覆盖范围内对应的道路,得到基站与道路对应表。
S312:本算法是针对一次出行基站轨迹序列,将从手机信令数据中提取的每一条出行基站轨迹序列进行编号,即对于每一条轨迹Si={j1,j2,…,jn},其中ji表示轨迹中所占用的基站,对每一条轨迹分别执行以下算法流程:
S313:对Si={j1,j2,…,jn}中的每一个基站ji,根据基站与道路对应表找到该基站对应的所有道路集合Rji,并对每个基站对应的道路集合Rji中的道路进行累加,得到该轨迹的所有覆盖道路的频次表Fi,该表一列为道路名,一列为该道路的累加频次。
S314:对Si中的每一个基站ji,根据基站与交叉口对应表得到基站ji,覆盖范围内的所有交叉口,假定为基站覆盖交叉口集合Cji。
S315:根据S314中得到的基站覆盖交叉口集合Cji以及交叉口与道路对应表,得到该基站对应的交叉口集合Cji中的每一个交叉口对应的道路组成道路集合Ri。
S317:对集合JCji中的每一个交叉口C,计算其与对应基站ji之间的距离D,根据距离最小原则保留与基站空间距离最近的交叉口,标记为该基站在路网上对应交叉口。
S318:循环匹配轨迹序列中所有基站,得到一个交叉口序列Ci,对于不相邻的交叉口,调用最短路函数,最终得到一条在路网上完整相连的交叉口序列。
优选的,步骤S4获取营运车辆包括巡游出租车以及网约车的GPS信息,将其与筛选出来的营运车辆轨迹信息进行匹配,初步确定可疑非法营运车辆出行轨迹,包括以下步骤:
S41、通过交管部门获取营运车辆在研究范围内(与手机信令数据时间相对应)包括巡游出租车以及网约车的GPS信息;
S42、将GPS数据匹配至路网上得到带有时间标签的移动交叉口序列信息,由于目前GPS定位精度较高且地图匹配技术较为成熟,本文对GPS的地图匹配方法不再进行详细阐述。
S43、将运营车辆GPS轨迹信息与从手机信令数据中筛选出的营运车辆轨迹信息进行匹配,若匹配成功,则将该车辆的信令轨迹信息进行剔除,若匹配不成功,则保留该车辆的出行轨迹信息将其视为可疑营运车辆,进入下一步判断,匹配具体实施方法如下:
S431:对于一条营运车辆GPS轨迹序列,首先筛选出其运行时间范围内所有存在OD信息的信令轨迹数据作为营运车辆待匹配序列集合X。
S432:对于一条营运车辆GPS轨迹序列Gi={g1,g2,…,gn},其中gi代表步骤S42中匹配得到的交叉口,从g1开始,筛选出待匹配序列集合X满足在g1前后15Min范围内,有连接与g1距离小于1.5KM基站的信令轨迹序列,依次遍历该天该条营运车辆GPS轨迹序列中所有的交叉口,若有且仅有一条轨迹序列满足条件,则认为匹配成功,将其从待匹配序列中剔除。
S433:依次遍历所有营运车辆GPS轨迹序列,待匹配序列中保留的信令轨迹信息则为初次筛选出的可疑非法营运车辆信息,进入下一步判断。
优选的,步骤S5获取全市非法营运车辆接客热点区域,如火车站、学校等的服务基站集合,分析可疑非法营运车辆在热点区域的停留特性,进一步确定非法营运车辆。包括以下步骤:
S51、非法营运车辆为了牟取利益最大化,一般会在火车站、学校等出行需求较大的地方进行揽客,而且会停留一段时间用来等待乘客。根据城市非法营运车辆出入热点区域,将覆盖热点区域的手机基站筛选出来组成集合J。
S52、对S433中保留的可疑车辆手机出行轨迹信息进行分析,计算其在热点基站J范围内的停留次数以及累积停留时间。将满足日均停留次数大于两次,累积停留时间在30min-5h之间的车辆判断为非法营运车辆。
优选的,步骤S6获取卡口数据,将车辆在交叉口的过车轨迹序列与非法营运车辆驾驶员的轨迹序列相匹配,最终确定疑似车辆的车牌号信息,包括以下步骤:
S61、由城市道路的卡口检测***获取车辆号牌数据,卡口需能对每辆过车进行抓拍、车牌识别。对卡口检测***采集的原始数据进行过滤筛选,获取有效的车辆检测数据,需包含车牌号、卡口编号、检测时间这三个字段。
S62、对S52中筛选出的非法营运车辆,提取其经过路径匹配后得到的带有交叉口序列C,将序列中没有卡口数据的交叉口进行剔除。
S63、对于交叉口序列C中的每一个交叉口,筛选出经过该交叉口前后15min时间范围内的过车号牌,依次遍历所有的交叉口,每次在前一个交叉口筛选出的号牌集合中进行判断,直至保留有且仅有一辆车牌号码时则认为匹配成功,该车牌号码即为非法营运车辆的车牌号。
本发明基于交管、运管以及手机信令数据对全市手机用户轨迹数据以及运营车辆轨迹数据进行分析对比,结合非法营运车辆接客热点区域识别疑似非法营运车辆驾驶员轨迹信息,所涉及的数据源获取简单,且排查范围广,不局限于特定车辆,能为交通执法人员在打击非法营运车辆工作中提供辅助决策依据。
由于手机信令数据是经过匿名处理过后的脱敏数据,无法直接得到用户真实的手机号码从而锁定相关车辆信息,本发明通过用户轨迹数据与卡口过车数据进行匹配,解决了非法营运车辆车牌信息获取的问题。
本文中所描述的具体实施例仅仅是对本发明精神做举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
Claims (3)
1.一种基于多源数据的非法营运车辆识别方法,其特征在于它基于手机信令数据获取用户移动信息,筛选出符合营运车辆特征的用户,结合停留热点区域初步筛选出可疑非法营运车辆,在此基础上与合法运营车辆GPS进行比对筛选疑似车辆车主轨迹信息,最终通过与卡口数据的过车序列进行匹配获取疑似非法营运车辆车牌号码;它具体包括以下步骤:
S1、数据获取,在移动运营商处获取手机信令数据,对原始信令数据进行预处理,提取用户出行OD信息,包括出发时间、到达时间、出发地、到达地、出行速度;
S2、统计用户一段时间内的出行距离以及出行时耗特性,初步筛选出营运车辆驾驶员出行轨迹信息;步骤S2初步筛选具体包括:
S21、选定一周作为研究时间范围,统计一周内每个手机号码出行轨迹的累计出行距离,其中出行距离的计算方法为轨迹中相邻基站之间的直线距离;
S23、进一步的,筛选出同时满足日均累计行驶距离>距离阈值Smax、一周内出行速度大于的OD数量Nweek>正常非营运车辆一周平均行驶次数、累计日均行驶时间Tweek>非营运车辆正常日均行驶时间平均值的用户及其手机信令记录的轨迹信息;
S3、对筛选出的具备营运车辆轨迹特性的信令数据进行路径匹配,将信令数据记录的位置信息转换成路网上的交叉口序列信息;路径匹配算法具体包括:
S311:基础数据准备、将手机基站信息导入ArcGIS中通过分析工具生成基站缓冲区,缓冲区半径由城市基站平均覆盖范围决定,通过基站缓冲区面文件与交叉口点文件的相交分析得到每个基站缓冲区内包含的交叉口信息,同时计算基站ID与对应交叉口ID之间的距离,最终得到基站与交叉口对应表;在ArcGIS软件中分析获取每个交叉口所连接对应的道路名称,即交叉口与道路对应表;在ArcGIS中通过基站缓冲区面文件以及道路文件进行相交,得到每个基站覆盖范围内对应的道路,得到基站与道路对应表;
S312:本算法是针对一次出行基站轨迹序列,将从手机信令数据中提取的每一条出行基站轨迹序列进行编号,即对于每一条轨迹Si={j1,j2,…,ji,…,jn},其中ji表示轨迹中所占用的基站,对每一条轨迹分别执行以下算法流程:
S313:对Si={j1,j2,…,ji,…,jn}中的每一个基站ji,根据基站与道路对应表找到该基站对应的所有道路集合Rji,并对每个基站对应的道路集合Rji中的道路进行累加,得到该轨迹的所有覆盖道路的频次表Fi,该表一列为道路名,一列为该道路的累加频次;
S314:对Si中的每一个基站ji,根据基站与交叉口对应表得到基站ji,覆盖范围内的所有交叉口,记做基站覆盖交叉口集合Cji;
S315:根据S314中得到的基站覆盖交叉口集合Cji以及交叉口与道路对应表,得到该基站对应的交叉口集合Cji中的每一个交叉口对应的道路组成道路集合Ri;
S317:对集合JCji中的每一个交叉口C,计算其与对应基站ji之间的距离D,根据距离最小原则保留与基站空间距离最近的交叉口,标记为该基站在路网上对应交叉口;
S318:循环匹配轨迹序列中所有基站,得到一个交叉口序列Ci,对于不相邻的交叉口,调用最短路函数,最终得到一条在路网上完整相连的交叉口序列;
S4、获取营运车辆包括巡游出租车以及网约车的GPS信息,将其与筛选出来的营运车辆轨迹信息进行匹配,初步确定可疑非法营运车辆出行轨迹;步骤S4中初步确定可疑非法营运车辆出行轨迹,具体包括:
S41、通过交管部门获取营运车辆在研究范围内的GPS信息,所述营运车辆包括巡游出租车以及网约车;
S42、将GPS数据匹配至路网上得到带有时间标签的移动交叉口序列信息;
S43、将运营车辆GPS轨迹信息与从手机信令数据中筛选出的营运车辆轨迹信息进行匹配,若匹配成功,则将该车辆的信令轨迹信息进行剔除;若匹配不成功,则保留该车辆的出行轨迹信息将其视为可疑非法营运车辆,进入下一步判断,匹配具体实施方法如下:
S431:对于一条营运车辆GPS轨迹序列,首先在S2步骤中保留的用户轨迹信息中筛选出满足出行时间与在GPS序列运行时间有重叠OD信息,将其作为营运车辆待匹配序列集合X;
S432:营运车辆GPS的一条轨迹序列记为Gi={g1,g2,…,gi,…,gn},其中gi代表步骤S42中匹配得到的交叉口,对于集合X中的每一条匹配序列,判断在轨迹点g1前后一定时间范围内,是否存在满足与g1距离小于距离阈值Smatch的轨迹点信令轨迹序列,存在则认为该点匹配成功,依次遍历该条营运车辆GPS轨迹序列中所有的交叉口gi,若有且仅有一条轨迹序列中的所有轨迹点均匹配成功,则认为该手机信令轨迹与营运车辆运行轨迹匹配成功,不属于非法营运车辆,可将其从待匹配序列中剔除;
S433:依次遍历所有营运车辆GPS轨迹序列,待匹配序列中保留的信令轨迹信息则为初次筛选出的可疑非法营运车辆信息;
S5、获取全市非法营运车辆接客热点区域,分析可疑非法营运车辆在热点区域的停留特性,进一步确定非法营运车辆;步骤S5中进一步确定非法营运车辆,具体步骤为:
S51、根据城市非法营运车辆出入热点区域,将覆盖热点区域的手机基站筛选出来组成集合J;
S52、对S4中保留的可疑车辆手机出行轨迹信息进行分析,计算其在热点基站J范围内的停留次数以及累积停留时间,将满足日均停留次数大于两次,累积停留时间在一定时间范围内的车辆判断为非法营运车辆;
S6、获取卡口数据,将车辆在交叉口的过车轨迹序列与非法营运车辆驾驶员的轨迹序列相匹配,最终确定疑似车辆的车牌号信息。
2.根据权利要求1所述的方法,其特征在于步骤S1数据获取具体包括:
S11、从移动运营商处获取原始手机信令数据,对其进行去噪处理包括重复定位、乒乓定位以及漂移定位数据的处理,从而得到较为准确的用户定位轨迹信息;
S12、根据定位点的时空属性识别轨迹中的停留点以及位移点,即计算当前轨迹点的停留时间以及与下一个轨迹点的空间距离,当停留时间大于时间阈值且与下一轨迹点的空间距离大于空间阈值时将其标记为停留点,其余为位移点;
S13、根据识别出的停留点以及位移点信息划分用户出行OD信息,包括出发点、终点、出发时间、到达时间、平均速度。
3.根据权利要求1所述的方法,其特征在于步骤S6中最终确定疑似车辆的车牌号信息,具体步骤为:
S61、由城市道路的卡口检测***获取车辆号牌数据,卡口需能对每辆过车进行抓拍、车牌识别;对卡口检测***采集的原始数据进行过滤筛选,获取有效的车辆检测数据,需包含车牌号、卡口编号、检测时间这三个字段;
S62、对S5中筛选出的非法营运车辆,提取其经过路径匹配后得到的带有交叉口序列C,将序列中没有卡口数据的交叉口进行剔除;
S63、对于交叉口序列C中的每一个交叉口,筛选出经过该交叉口前后一定时间范围内的过车号牌,依次遍历所有的交叉口,每次在前一个交叉口筛选出的号牌集合中进行判断,直至保留有且仅有一辆车牌号码时则认为匹配成功,该车牌号码即为非法营运车辆的车牌号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010711331.1A CN111862606B (zh) | 2020-07-22 | 2020-07-22 | 一种基于多源数据的非法营运车辆识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010711331.1A CN111862606B (zh) | 2020-07-22 | 2020-07-22 | 一种基于多源数据的非法营运车辆识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111862606A CN111862606A (zh) | 2020-10-30 |
CN111862606B true CN111862606B (zh) | 2022-10-21 |
Family
ID=72949206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010711331.1A Active CN111862606B (zh) | 2020-07-22 | 2020-07-22 | 一种基于多源数据的非法营运车辆识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111862606B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113205700B (zh) * | 2021-03-26 | 2022-08-30 | 福建新大陆软件工程有限公司 | 一种基于手机信令路网匹配的高速车辆位置识别方法 |
CN114116926A (zh) * | 2021-06-10 | 2022-03-01 | 武汉理工大学 | 基于公交站点信息匹配的乘客出行方式识别方法 |
CN114201530B (zh) * | 2021-12-02 | 2024-05-28 | 合肥学院 | 一种疑似非正常营运客车提前甄别及预防式监管方法 |
CN114202929B (zh) * | 2021-12-14 | 2022-12-06 | 广州交信投科技股份有限公司 | 一种基于中小客车通行行为的非法营运车辆识别方法 |
CN114187489B (zh) * | 2021-12-14 | 2024-04-30 | 中国平安财产保险股份有限公司 | 车辆异常驾驶风险检测方法、装置、电子设备及存储介质 |
CN114529311B (zh) * | 2022-02-16 | 2023-04-28 | 安徽宇疆科技有限公司 | 一种基于定位曲线相似性的路线轨迹匹配方法 |
CN114422973B (zh) * | 2022-03-30 | 2022-06-28 | 北京融信数联科技有限公司 | 一种基于大数据的网约车司机智能识别方法、***及可读存储介质 |
CN114786135B (zh) * | 2022-06-20 | 2022-10-18 | 广州万协通信息技术有限公司 | 一种车联网攻击检测方法、装置、电子设备和存储介质 |
CN115880898B (zh) * | 2022-11-10 | 2024-05-10 | 公安部交通管理科学研究所 | 一种私家新能源汽车异常使用的判定方法 |
CN117615363B (zh) * | 2024-01-18 | 2024-05-10 | 北京大也智慧数据科技服务有限公司 | 基于信令数据分析目标车辆内人员的方法、装置、设备 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101465867A (zh) * | 2007-12-18 | 2009-06-24 | 黄金富 | 乘客用手机查证营业车辆的车牌真假的防黑车***和方法 |
CN202306819U (zh) * | 2011-10-25 | 2012-07-04 | 深圳市华盈泰科技有限公司 | 车辆电子身份车载终端 |
CN104123843B (zh) * | 2014-07-25 | 2017-02-15 | 中国科学院自动化研究所 | 一种非法营运车辆检测***及方法 |
CN107657330A (zh) * | 2017-08-16 | 2018-02-02 | 深圳先进技术研究院 | 一种候选公交线路计算方法、***及电子设备 |
CN108389397A (zh) * | 2018-02-28 | 2018-08-10 | 夏莹杰 | 一种基于卡口数据辨别非法营运车辆的方法 |
-
2020
- 2020-07-22 CN CN202010711331.1A patent/CN111862606B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111862606A (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111862606B (zh) | 一种基于多源数据的非法营运车辆识别方法 | |
US10573173B2 (en) | Vehicle type identification method and device based on mobile phone data | |
CN106971534B (zh) | 基于号牌数据的通勤出行特征分析方法 | |
CN111091720B (zh) | 基于信令数据和浮动车数据的拥堵路段识别方法及装置 | |
CN106197458B (zh) | 一种基于手机信令数据和导航路线数据的手机用户出行方式识别方法 | |
CN107730975B (zh) | 超市停车引导反向寻车和出场引导的***和方法 | |
CN102521965B (zh) | 基于车牌识别数据的交通需求管理措施效果评价方法 | |
CN111653096B (zh) | 一种基于手机信令数据的城市出行方式识别方法 | |
US10373494B1 (en) | Method and apparatus for estimating a parking event based on device signal observations | |
CN113194138B (zh) | 基于ai深度学习的出行管理方法和*** | |
CN106611167A (zh) | 一种跟踪方法及*** | |
CN104508719A (zh) | 驾驶辅助***以及驾驶辅助方法 | |
CN106875721A (zh) | 违章信息管理***及其引导路径生成方法 | |
CN108491418A (zh) | 一种交通事故数据信息化采集、管理和分析***及方法 | |
CN105575118A (zh) | 一种失驾人员筛选方法 | |
Kumar et al. | A model based approach to predict stream travel time using public transit as probes | |
CN115035491A (zh) | 一种基于联邦学习的驾驶行为路况预警方法 | |
CN107240264A (zh) | 一种车辆非有效行驶轨迹识别方法和城市道路设施规划方法 | |
CN107784832A (zh) | 一种用于识别交通道路中的事故黑点的方法与设备 | |
CN105991598A (zh) | 用户获取方法及装置 | |
CN113079463A (zh) | 一种基于手机信令数据的旅游景点游客出行活动识别方法 | |
CN114550445A (zh) | 一种城市区域交通安全状态评估方法和装置 | |
CN108351858A (zh) | 用于基于蜂窝数据来识别交通拥堵根本原因以及建议可能的缓解措施的方法和*** | |
White et al. | The use of mobile phone location data for traffic information | |
CN111624638A (zh) | 基于大数据***的行踪追溯及监控报告的生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |