CN110460962A - 轨道交通用户识别方法和装置 - Google Patents

轨道交通用户识别方法和装置 Download PDF

Info

Publication number
CN110460962A
CN110460962A CN201910755903.3A CN201910755903A CN110460962A CN 110460962 A CN110460962 A CN 110460962A CN 201910755903 A CN201910755903 A CN 201910755903A CN 110460962 A CN110460962 A CN 110460962A
Authority
CN
China
Prior art keywords
data
base station
user
rail traffic
approach point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910755903.3A
Other languages
English (en)
Other versions
CN110460962B (zh
Inventor
顾建国
陶周天
朱潇
王乾佳
邹炎炎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Smart Footprint Data Technology Co Ltd
Original Assignee
Smart Footprint Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Smart Footprint Data Technology Co Ltd filed Critical Smart Footprint Data Technology Co Ltd
Priority to CN201910755903.3A priority Critical patent/CN110460962B/zh
Publication of CN110460962A publication Critical patent/CN110460962A/zh
Application granted granted Critical
Publication of CN110460962B publication Critical patent/CN110460962B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/30Services specially adapted for particular environments, situations or purposes
    • H04W4/40Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P]
    • H04W4/42Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P] for mass transport vehicles, e.g. buses, trains or aircraft
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W8/00Network data management
    • H04W8/22Processing or transfer of terminal data, e.g. status or physical capabilities

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Databases & Information Systems (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Train Traffic Observation, Control, And Security (AREA)

Abstract

本发明提供了一种轨道交通用户识别方法和装置;方法包括:获取用户的途径点数据;基于基站与预先获取的轨道交通线路的距离所确定基站区域类型,统计途径点数据中的每个基站区域类型的数量;根据每个基站区域类型的数量从途径点数据中提取轨道交通行程段数据;根据轨道交通行程段数据判断用户是否为轨道交通用户。预先获取包括基站位置的轨道交通线路,将用户的途径点数据包括的基站按照基站与预先获取的轨道交通线路的距离进行分类,划分为不同的基站区域类型,根据基站区域类型的数量提从途径点数据中图区轨道交通行程段数据,根据形成段数据判断用户是否为轨道交通用户。可以增加轨道交通用户识别的准确率,节约成本和时间。

Description

轨道交通用户识别方法和装置
技术领域
本发明涉及手机信令技术领域,尤其是涉及一种轨道交通用户识别方法和装置。
背景技术
相关技术中,为了分辨哪些手机用户为轨道交通乘客,通常采用摄像头监控、抽样调查、问卷调查、电话问询及利用车站内收集信息等非基于运营商的解决方案。但这些非基于运营商的解决方案中方法过于简单,且观测信息不连续,准确率不高,难以大规模应用。另外,非基于运营商的解决方案使用成本较高,费时费力。
发明内容
有鉴于此,本发明的目的在于提供一种轨道交通用户识别方法和装置,以增加轨道交通用户识别的准确率,节约成本和时间。
第一方面,本发明实施例提供了一种轨道交通用户识别方法,包括:获取用户的途径点数据;途径点数据包括:用户的移动终端标识、信令交互时间和每个信令交互的基站的位置信息;基于基站与预先获取的轨道交通线路的距离所确定基站区域类型,统计途径点数据中的每个基站区域类型的数量;其中,同一基站区域类型的基站与轨道交通线路的距离属于同一范围;根据每个基站区域类型的数量从途径点数据中提取轨道交通行程段数据;根据轨道交通行程段数据判断用户是否为轨道交通用户。
在本发明较佳的实施例中,上述获取用户的途径点数据的步骤,包括:获取用户的信令数据;信令数据包括:用户的移动终端标识、信令交互时间和每个信令交互的基站的位置信息;将信令数据按信令交互时间排序,得到信令数据流;去除信令数据流中的无效数据,得到用户的途径点数据。
在本发明较佳的实施例中,上述基于基站与预先获取的轨道交通线路的距离所确定基站区域类型的步骤,包括:如果基站与预先获取的轨道交通线路的距离小于第一阈值,将基站标记为第一区域基站;如果基站与预先获取的轨道交通线路的距离大于等于第一阈值,并且小于第二阈值,将基站标记为第二区域基站;如果基站与预先获取的轨道交通线路的距离大于等于第二阈值,将基站标记为第三区域基站。
在本发明较佳的实施例中,上述根据每个基站区域类型的数量从途径点数据中提取轨道交通行程段数据的步骤,包括:从途径点数据中提取第一目标数据;如果第一目标数据包括的第一区域基站的数量大于预设的第一区域基站数量阈值,第一目标数据的时间长度大于预设的第一时间长度阈值,第一目标数据的行程速度大于预设的速度阈值,并且,第一目标数据的包括的基站数量与途径点数据包括的基站数量的比值大于预设的比值阈值;则第一目标数据为轨道交通行程段数据。
在本发明较佳的实施例中,上述根据每个基站区域类型的数量从途径点数据中提取轨道交通行程段数据的步骤,还包括:从途径点数据中提取第二目标数据;当第二目标数据包括第三区域基站,并且第二目标数据不包括第一区域基站和第二区域基站时;如果第二目标数据的时间长度小于预设的第二时间长度阈值,则第二目标数据为轨道交通行程段数据。
在本发明较佳的实施例中,上述根据每个基站区域类型的数量从途径点数据中提取轨道交通行程段数据的步骤,还包括:从途径点数据中提取第三目标数据;当第三目标数据包括第二区域基站,并且第三目标数据不包括第一区域基站和第三区域基站时;则第三目标数据为轨道交通行程段数据。
在本发明较佳的实施例中,上述根据每个基站区域类型的数量从途径点数据中提取轨道交通行程段数据的步骤,还包括:当途径点数据存在信令缺失时;如果途径点数据中缺失前后的两个数据点的时间差小于等于预设的时间差阈值,则信令缺失的途径点数据为轨道交通行程段数据;当途径点数据存在信令缺失时;如果缺失前后的两个数据点的时间差大于时间差阈值,并且,缺失前后的两个数据点的速度大于等于预设的最小速度阈值,则信令缺失的途径点数据为轨道交通行程段数据。
在本发明较佳的实施例中,上述根据轨道交通行程段数据判断用户是否为轨道交通用户的步骤,包括:根据轨道交通行程段数据计算用户的速度;如果用户的速度大于等于预设的轨道交通速度;则用户为轨道交通用户。
第二方面,本发明实施例还提供一种轨道交通用户识别装置,包括:数据获取模块,用于:获取用户的途径点数据;途径点数据包括:用户的移动终端标识、信令交互时间和每个信令交互的基站的位置信息;基站标记模块,用于:基于基站与预先获取的轨道交通线路的距离所确定基站区域类型,统计途径点数据中的每个基站区域类型的数量;其中,同一基站区域类型的基站与轨道交通线路的距离属于同一范围;行程段提取模块,用于:根据每个基站区域类型的数量从途径点数据中提取轨道交通行程段数据;用户判断模块,用于:根据轨道交通行程段数据判断用户是否为轨道交通用户。
在本发明较佳的实施例中,上述数据获取模块,用于:获取用户的信令数据;信令数据包括:用户的移动终端标识、信令交互时间和每个信令交互的基站的位置信息;将信令数据按信令交互时间排序,得到信令数据流;去除信令数据流中的无效数据,得到用户的途径点数据。
本发明实施例带来了以下有益效果:
本发明实施例提供的轨道交通用户识别方法和装置,预先获取包括基站位置的轨道交通线路,将用户的途径点数据包括的基站按照基站与预先获取的轨道交通线路的距离进行分类,划分为不同的基站区域类型,根据基站区域类型的数量提从途径点数据中图区轨道交通行程段数据,根据形成段数据判断用户是否为轨道交通用户。可以增加轨道交通用户识别的准确率,节约成本和时间。
本公开的其他特征和优点将在随后的说明书中阐述,或者,部分特征和优点可以从说明书推知或毫无疑义地确定,或者通过实施本公开的上述技术即可得知。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种轨道交通用户识别方法的流程图;
图2为本发明实施例提供的另一种轨道交通用户识别方法的流程图;
图3为本发明实施例提供的一种基站区域类型划分示意图;
图4为本发明实施例提供的一种信令缺失的途径点数据的示意图;
图5为本发明实施例提供的一种高铁用户识别方法的流程示意图;
图6为本发明实施例提供的一种轨道交通用户识别装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的多个其他实施例,都属于本发明保护的范围。
传统对轨道交通乘客的分析与和洞察方法通常采用摄像头监控、抽样调查、问卷调查、电话问询及利用车站内收集信息等非基于运营商的解决方案。但这些非基于运营商的解决方案中方法过于简单,且观测信息不连续,准确率不高,难以大规模应用。另外,非基于运营商的解决方案使用成本较高,费时费力。
总之,现有的轨道交通用户识别方法的准确率较低,而且成本较高,费时费力,基于此,本发明实施例提供的一种轨道交通用户识别方法和装置,可以应用于手机信令的技术领域,尤其是通过手机信令数据结合电信运营商的基站工作参数(下文简称基站工参)数据完成对轨道交通用户的数据收集,结合大数据技术实现对轨道交通用户的分析与洞察。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种轨道交通用户识别方法进行详细介绍。
实施例1
参见图1所示的一种轨道交通用户识别方法的流程图,该方法包括如下步骤:
步骤S102,获取用户的途径点数据;上述途径点数据包括:用户的移动终端标识、信令交互时间和每个信令交互的基站的位置信息。
用户需要判断其是否使用轨道交通,轨道交通是指采用轨道进行交通的方法,用户的途径点数据(Journey Via Point,JVP)记录了该用户经过每个基站时的信息。移动终端是指可以向基站发送或接受数据的设备,可以为手机、平板电脑等设备。移动终端标识用来标识用户的移动终端,每一个移动终端均有一个唯一的移动终端标识,这个移动终端标识可以为IMSI码(International Mobile Subscriber Identification Number,国际移动用户识别码),也可以是其他的用来唯一的标识移动终端的号码。
信令交互时间是指用户的移动终端与摸一个基站产生信令交互的时间。信令是在无线通信***中,除了传输用户信息之外,为使全网有轶序地工作,用来保证正常通信所需要的控制信号。基站无线电台站的一种形式,是指在一定的无线电覆盖区中,通过基站与移动终端之间进行信息传递的无线电收发信电台。基站的位置信息用来标明基站的地理坐标。
步骤S104,基于基站与预先获取的轨道交通线路的距离所确定基站区域类型,统计途径点数据中的每个基站区域类型的数量;其中,同一基站区域类型的基站与轨道交通线路的距离属于同一范围。
轨道交通线路通过轨道交通线路图可以确定,其中,轨道交通线路图可以包括沿途基站的位置信息,根据沿途基站与轨道交通线路的直线距离,确定不同的基站区域类型。
举例来说,距离轨道交通线路800米以内的为A类型基站,距离轨道交通线路800米-1000米的为B类型基站,距离轨道交通线路1000米以外的为C类型基站。将轨道交通线路沿线的基站分类后,确定JVP数据中基站分属哪个基站区域类型,并且统计每个基站区域类型的数量。
步骤S106,根据每个基站区域类型的数量从途径点数据中提取轨道交通行程段数据。
JVP数据的某一段数据包括的基站区域类型的数量不同,用户在该段数据中是否采用轨道交通出行的概率不同,某一段数据的与轨道交通线路越接近的基站区域类型的基站数量越多,则该段数据为轨道交通行程段数据的概率越高。
步骤S108,根据上述轨道交通行程段数据判断用户是否为轨道交通用户。
如果上述的轨道交通行程段数据与轨道交通的数据类似,则判定用户为轨道交通用户。例如:上述轨道交通行程段数据的速度符合轨道交通数据的速度要求,上述轨道交通行程段数据的路程符合轨道交通数据的路程要求等。
本发明实施例提供的一种轨道交通用户识别方法,预先获取包括基站位置的轨道交通线路,将用户的途径点数据包括的基站按照基站与预先获取的轨道交通线路的距离进行分类,划分为不同的基站区域类型,根据基站区域类型的数量提从途径点数据中图区轨道交通行程段数据,根据形成段数据判断用户是否为轨道交通用户。可以增加轨道交通用户识别的准确率,节约成本和时间。
实施例2
本发明实施例还提供另一种轨道交通用户识别方法;该方法在上述实施例方法的基础上实现;该方法重点描述获取用户的途径点数据的具体实现方式。
如图2所示的另一种轨道交通用户识别方法的流程图,该方法包括如下步骤:
步骤S202,获取用户的信令数据;上述信令数据包括:用户的移动终端标识、信令交互时间和每个信令交互的基站的位置信息。
在获取JVP数据的过程中,可以通过将信令数据进行数据清洗得到。信令数据是指移动终端与基站进行信令交互所产生的数据。信令数据同样包括:用户的移动终端标识、信令交互时间和每个信令交互的基站的位置信息。除此以外,信令数据还包括:基站所在的省的信息。
步骤S204,将信令数据按信令交互时间排序,得到信令数据流。
信令数据按信令交互时间排序后得到的信令数据按信令交互时间排序可以大致判定用户随时间移动的线路。之后需要对信令数据流进行数据整理。
步骤S206,去除上述信令数据流中的无效数据,得到用户的途径点数据。
信令数据流中含有大量的无效数据。无效数据是指存在字段缺失、数据重复等情况的无用的干扰数据。将这些无效数据提出后,留下的信令数据流就是该用户的途径点数据。
步骤S208,基于基站与预先获取的轨道交通线路的距离所确定基站区域类型,统计途径点数据中的每个基站区域类型的数量;其中,同一基站区域类型的基站与轨道交通线路的距离属于同一范围。
轨道交通线路需要预先获取,也可以通过绘制轨道交通线路图实现。可以按照以下步骤绘制轨道交通线路图:
(1)获取轨道交通线路图和多个基站的位置参数。
轨道交通线路图可以在GIS(Geographic Information System,地理信息***)地图软件中绘制。GIS是能提供存储、显示、分析地理数据功能的软件,主要包括数据输入与编辑、数据管理、数据操作以及数据显示和输出等。本实施例中以高铁作为轨道交通为例。
(2)根据基站的位置参数,在轨道交通线路图中标记基站的位置。
通过GIS可以绘制轨道交通线路图。但是,GIS绘制的轨道交通线路图可能没有标识基站的位置。因此,需要根据获取的轨道交通线路沿线的基站的位置参数,在GIS的交通线路图中增加基站。
通过上述方式,即完成了包括基站的轨道交通线路图的绘制工作。之后,需要对轨道交通线路图中的所有基站进行划分,划分为不同的基站区域类型。具体的划分方法,可以通过以下步骤执行:
(1)如果基站与预先获取的轨道交通线路的距离小于第一阈值,将基站标记为第一区域基站。
第一阈值可以为800米,也就是说将与轨道交通线路的距离小于800米的基站标记为第一区域基站,也可以称作高铁区域基站。
(2)如果基站与预先获取的轨道交通线路的距离大于等于第一阈值,并且小于第二阈值,将基站标记为第二区域基站。
第二阈值可以为1000米,也就是说将与轨道交通线路的距离大于等于800米小于1000米的基站标记为第二区域基站,也可以称作灰区基站。
(3)如果基站与预先获取的轨道交通线路的距离大于等于第二阈值,将基站标记为第三区域基站。
将与轨道交通线路的距离大于等于1000米的基站标记为第三区域基站,也可以称作外部区域基站。
可以参见图3所示的一种基站区域类型划分示意图,图三中的三角形基站与轨道交通线路的距离小于800米,为高铁区域;圆形基站与轨道交通线路的距离大于等于800米,并且小于1000米,为灰区基站;正方形基站与轨道交通线路的距离大于1000米,为外部区域基站。
在完成基站区域类型划分后,还需要将基站信息整合起来,保留一些基础的基站属性信息。需要保留的信息包括:基站编号、经度、纬度、网络制式、范围标签等。基站编号用于标识该基站,纬度和经度用来表示基站的位置,网格制式说明该基站的工作模式,范围标签就是该基站的基站区域类型。
步骤S210,根据每个基站区域类型的数量从途径点数据中提取轨道交通行程段数据。
按照上面的基站区域类型划分方法,可以通过以下步骤提取轨道交通行程段数据:
(1)从途径点数据中提取第一目标数据。
第一目标数据为JVP数据中的一部分,提取第一目标数据后,对该第一目标数据进行数据处理。整个行程记录都符合判定条件的高铁出行可定义为高铁行程段,主要是通过计算JVP中经过的每个点之间的时间差和经纬度差,并转换为直线距离,利用JVP中经过高铁区域基站的数量和速度进行判定,如果满足判断条件,则这段行程被标记为轨道交通行程段。
(2)如果第一目标数据包括的第一区域基站的数量大于预设的第一区域基站数量阈值,第一目标数据的时间长度大于预设的第一时间长度阈值,第一目标数据的行程速度大于预设的速度阈值,并且,第一目标数据的包括的基站数量与途径点数据包括的基站数量的比值大于预设的比值阈值;则第一目标数据为轨道交通行程段数据。
因为轨道交通运行速度快,手机信号不稳定(特别是在山区和隧道),或因为基站工参数据的缺失,或因信令数据在采集和处理过程中存在一定的误差,因此使用信令数据判定轨道交通出行时需要考虑很多因素以提高判断准确率。
第一目标数据包括的第一区域基站的数量大于预设的第一区域基站数量阈值,是指高铁基站的数量超过第一区域基站数量阈值(有选值为3个)。第一目标数据的时间长度大于预设的第一时间长度阈值,是指该段数据中包含的时长需要大于第一时间长度阈值(优选值为300秒)。第一目标数据的行程速度大于预设的速度阈值,是指该段数据中的行程速度要大于速度阈值(优选值为300米/秒)。第一目标数据的包括的基站数量与途径点数据包括的基站数量的比值大于预设的比值阈值,是指该段数据中的高铁区域的基站在该数据所有基站的占比要大于比值阈值(优选值为0.7)。
只有在满足上述所有条件后,才可以判定该第一目标数据为轨道交通行程段数据。之后分析提取的数据不符合上述条件的情况,例如:
(1)从途径点数据中提取第二目标数据;
第二目标数据如果不是轨道交通行程段数据,但是如果满足以下条件,则可以将该第二目标数据合并到轨道交通行程段数据中。
(2)当第二目标数据包括第三区域基站,并且第二目标数据不包括第一区域基站和第二区域基站时;如果第二目标数据的时间长度小于预设的第二时间长度阈值,则第二目标数据为轨道交通行程段数据。
第二目标数据包括如果只包括外部区域基站,但是时间长度要小于第二时间长度阈值(优选值为500秒),如果该时间长度大于等于预设的第二时间长度阈值,则认为第二目标数据不是轨道交通行程段数据。
之后分析第三种情况:(1)从途径点数据中提取第三目标数据。第三目标数据为只包括灰区基站的数据。
(2)当第三目标数据包括第二区域基站,并且第三目标数据不包括第一区域基站和第三区域基站时;则第三目标数据为轨道交通行程段数据。
第三目标数据如果只包括灰区基站,则将该第三目标数据作为轨道交通行程段数据,但是,第三目标数据包括的灰区基站则不被计算。
在JVP数据中,与轨道交通行程段数据相对应的数据为干扰段数据,干扰段是指由不在轨道交通沿线的JVP数据组成的片段。由于信号干扰可能出现在高铁段之内,因此需要对干扰段前后进行计算,并将计算结果纳入或者不纳入轨道交通行程段数据中。
除此以外,对于信令缺失的数据,通过以下步骤判断确实的数据为轨道交通行程段数据或干扰段数据:
(1)当途径点数据存在信令缺失时;如果途径点数据中缺失前后的两个数据点的时间差小于等于预设的时间差阈值,则信令缺失的途径点数据为轨道交通行程段数据。
信令缺失是指某一段途径点数据存在丢失或者中断的情况,如果缺失前后的两个数据点的时间差小于等于预设的时间差阈值(优选值为6400秒),则将该信令缺失的途径点数据判定为轨道交通行程段数据。
(2)当途径点数据存在信令缺失时;如果缺失前后的两个数据点的时间差大于时间差阈值,并且,缺失前后的两个数据点的速度大于等于预设的最小速度阈值,则信令缺失的途径点数据为轨道交通行程段数据。
如果缺失前后的两个数据点的时间差大于预设的时间差阈值,但是,缺失前后的两个数据点的速度大于等于预设的最小速度阈值(30米/秒),也将该信令缺失的途径点数据判定为轨道交通行程段数据。除了上述情况,将该信令缺失的途径点数据判定为干扰段数据。
参见图4所示的一种信令缺失的途径点数据的示意图,图4中的实线代表正常数据,虚线代表信令缺失的数据,如果信令缺失的时间较短,大多由于跨越省边界产生,可以忽略;如果信令缺失的时间较长,则可能由于信号确实、干扰或者跨越省边界产生。
对于轨道交通行程段数据的结束判定,当JVP数据包括的基站只有外部区域基站,当JVP数据判定为并且超过500秒,且下一个发生信令的基站不属于高铁区域基站,则认为高铁出行结束。
步骤S212,根据上述轨道交通行程段数据判断用户是否为轨道交通用户。
可以通过计算用户的速度是否与轨道交通速度的速度相匹配来确定该用户是否为轨道交通用户,可以通过以下步骤执行:
(1)根据轨道交通行程段数据计算用户的速度。
判断前需要将基站工参做些预处理,将高铁区域基站和回去基站放入一个列表备查,不在上述列表的基站均被视为外部区域基站。
高铁行程是通过JVP数据结合用户的停留信息等数据综合形成用户使用高铁出行的出发地和到达地信息。主要逻辑如下:读取用户停留地信息,获得高铁行程前后一个时间段的停留地信息,作为高铁出行的起止城市。
一般来说,信令数据按省份划分,因此,首先采用省内起止JVP数据中基站数据的经纬度进行直线距离的计算,然后把所有段的距离加起来近似计算完整高铁行程的速度,判定出满足高铁速度的目标。
(2)如果用户的速度大于等于预设的轨道交通速度,则用户为轨道交通用户。
高铁的速度一般在250-350公里/小时。因此,预设的轨道交通速度的取值范围在250-350公里/小时,优选值为250公里/小时。当计算出的用户速度大于轨道交通速度,则判定该用户是轨道交通用户。最后将这些数据保存为规整的数据格式并输出。
对于高铁用户的识别,具体的流程可以参见图5所示的一种高铁用户识别方法的流程示意图,首先将基站工参数据加入到高铁线路图中,获取高铁基站及灰区基站列表,同时获取信令数据,处理后得到JVP数据。筛选出高铁行程段中的数据后,如果JVP数据经过的基站在灰区以外,合并各个省份的高铁行程段数据,进行距离计算,与正常高铁段作对比得到高铁数据,规整高铁数据结果并将高铁数据结果输出。
上述方式中,将信令数据按照交互时间排序,去除无效数据后得到用户的途径点数据;介绍了基站区域类型的划分方法;并详细说明了提取轨道交通行程段数据的步骤;对于数据缺失的情况进行了补充说明;介绍了判断用户是否为轨道交通用户的方法。可以增加轨道交通用户识别的准确率,节约成本和时间。
需要说明的是,上述各方法实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
实施例3
对应于上述方法实施例,本发明实施例提供了一种轨道交通用户识别装置,如图6所示的一种轨道交通用户识别装置的结构示意图,该装置包括:
数据获取模块61,用于:获取用户的途径点数据;途径点数据包括:用户的移动终端标识、信令交互时间和每个信令交互的基站的位置信息;
基站标记模块62,用于:基于基站与预先获取的轨道交通线路的距离所确定基站区域类型,统计途径点数据中的每个基站区域类型的数量;其中,同一基站区域类型的基站与轨道交通线路的距离属于同一范围;
行程段提取模块63,用于:根据每个基站区域类型的数量从途径点数据中提取轨道交通行程段数据;
用户判断模块64,用于:根据轨道交通行程段数据判断用户是否为轨道交通用户。
本发明实施例提供的轨道交通用户识别装置,预先获取包括基站位置的轨道交通线路,将用户的途径点数据包括的基站按照基站与预先获取的轨道交通线路的距离进行分类,划分为不同的基站区域类型,根据基站区域类型的数量提从途径点数据中图区轨道交通行程段数据,根据形成段数据判断用户是否为轨道交通用户。可以增加轨道交通用户识别的准确率,节约成本和时间。
在一些实施例中,数据获取模块,用于:获取用户的信令数据;信令数据包括:用户的移动终端标识、信令交互时间和每个信令交互的基站的位置信息;将信令数据按信令交互时间排序,得到信令数据流;去除信令数据流中的无效数据,得到用户的途径点数据。
在一些实施例中,基站标记模块,用于:如果基站与预先获取的轨道交通线路的距离小于第一阈值,将基站标记为第一区域基站;如果基站与预先获取的轨道交通线路的距离大于等于第一阈值,并且小于第二阈值,将基站标记为第二区域基站;如果基站与预先获取的轨道交通线路的距离大于等于第二阈值,将基站标记为第三区域基站。
在一些实施例中,行程段提取模块,用于:从途径点数据中提取第一目标数据;如果第一目标数据包括的第一区域基站的数量大于预设的第一区域基站数量阈值,第一目标数据的时间长度大于预设的第一时间长度阈值,第一目标数据的行程速度大于预设的速度阈值,并且,第一目标数据的包括的基站数量与途径点数据包括的基站数量的比值大于预设的比值阈值;则第一目标数据为轨道交通行程段数据。
在一些实施例中,行程段提取模块,用于:从途径点数据中提取第二目标数据;当第二目标数据包括第三区域基站,并且第二目标数据不包括第一区域基站和第二区域基站时;如果第二目标数据的时间长度小于预设的第二时间长度阈值,则第二目标数据为轨道交通行程段数据。
在一些实施例中,行程段提取模块,用于:从途径点数据中提取第三目标数据;当第三目标数据包括第二区域基站,并且第三目标数据不包括第一区域基站和第三区域基站时;则第三目标数据为轨道交通行程段数据。
在一些实施例中,行程段提取模块,用于:当途径点数据存在信令缺失时;如果途径点数据中缺失前后的两个数据点的时间差小于等于预设的时间差阈值,则信令缺失的途径点数据为轨道交通行程段数据;当途径点数据存在信令缺失时;如果缺失前后的两个数据点的时间差大于时间差阈值,并且,缺失前后的两个数据点的速度大于等于预设的最小速度阈值,则信令缺失的途径点数据为轨道交通行程段数据。
在一些实施例中,用户判断模块,用于:根据轨道交通行程段数据计算用户的速度;如果用户的速度大于等于预设的轨道交通速度;则用户为轨道交通用户。
本发明实施例提供的轨道交通用户识别装置,与上述实施例提供的轨道交通用户识别装方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和/或终端设备的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种轨道交通用户识别方法,其特征在于,包括:
获取用户的途径点数据;所述途径点数据包括:所述用户的移动终端标识、信令交互时间和每个信令交互的基站的位置信息;
基于基站与预先获取的轨道交通线路的距离所确定基站区域类型,统计所述途径点数据中的每个所述基站区域类型的数量;其中,同一基站区域类型的基站与所述轨道交通线路的距离属于同一范围;
根据每个所述基站区域类型的数量从所述途径点数据中提取轨道交通行程段数据;
根据所述轨道交通行程段数据判断所述用户是否为轨道交通用户。
2.根据权利要求1所述的方法,其特征在于,获取用户的途径点数据的步骤,包括:
获取用户的信令数据;所述信令数据包括:所述用户的移动终端标识、信令交互时间和每个信令交互的基站的位置信息;
将所述信令数据按所述信令交互时间排序,得到信令数据流;
去除所述信令数据流中的无效数据,得到用户的途径点数据。
3.根据权利要求1所述的方法,其特征在于,基于基站与预先获取的轨道交通线路的距离所确定基站区域类型的步骤,包括:
如果所述基站与预先获取的轨道交通线路的距离小于第一阈值,将所述基站标记为第一区域基站;
如果所述基站与预先获取的轨道交通线路的距离大于等于所述第一阈值,并且小于第二阈值,将所述基站标记为第二区域基站;
如果所述基站与预先获取的轨道交通线路的距离大于等于所述第二阈值,将所述基站标记为第三区域基站。
4.根据权利要求3所述的方法,其特征在于,根据每个所述基站区域类型的数量从所述途径点数据中提取轨道交通行程段数据的步骤,包括:
从所述途径点数据中提取第一目标数据;
如果所述第一目标数据包括的第一区域基站的数量大于预设的第一区域基站数量阈值,所述第一目标数据的时间长度大于预设的第一时间长度阈值,所述第一目标数据的行程速度大于预设的速度阈值,并且,所述第一目标数据的包括的基站数量与所述途径点数据包括的基站数量的比值大于预设的比值阈值;则所述第一目标数据为轨道交通行程段数据。
5.根据权利要求4所述的方法,其特征在于,根据每个所述基站区域类型的数量从所述途径点数据中提取轨道交通行程段数据的步骤,还包括:
从所述途径点数据中提取第二目标数据;
当所述第二目标数据包括第三区域基站,并且第二目标数据不包括第一区域基站和第二区域基站时;如果所述第二目标数据的时间长度小于预设的第二时间长度阈值,则所述第二目标数据为轨道交通行程段数据。
6.根据权利要求4所述的方法,其特征在于,根据每个所述基站区域类型的数量从所述途径点数据中提取轨道交通行程段数据的步骤,还包括:
从所述途径点数据中提取第三目标数据;
当所述第三目标数据包括第二区域基站,并且第三目标数据不包括第一区域基站和第三区域基站时;则所述第三目标数据为轨道交通行程段数据。
7.根据权利要求1所述的方法,其特征在于,根据每个所述基站区域类型的数量从所述途径点数据中提取轨道交通行程段数据的步骤,还包括:
当所述途径点数据存在信令缺失时;如果所述途径点数据中缺失前后的两个数据点的时间差小于等于预设的时间差阈值,则信令缺失的所述途径点数据为轨道交通行程段数据;
当所述途径点数据存在信令缺失时;如果所述缺失前后的两个数据点的时间差大于所述时间差阈值,并且,所述缺失前后的两个数据点的速度大于等于预设的最小速度阈值,则信令缺失的所述途径点数据为轨道交通行程段数据。
8.根据权利要求1所述的方法,其特征在于,根据所述轨道交通行程段数据判断所述用户是否为轨道交通用户的步骤,包括:
根据所述轨道交通行程段数据计算所述用户的速度;
如果所述用户的速度大于等于预设的轨道交通速度;则所述用户为轨道交通用户。
9.一种轨道交通用户识别装置,其特征在于,包括:
数据获取模块,用于:获取用户的途径点数据;所述途径点数据包括:所述用户的移动终端标识、信令交互时间和每个信令交互的基站的位置信息;
基站标记模块,用于:基于基站与预先获取的轨道交通线路的距离所确定基站区域类型,统计所述途径点数据中的每个所述基站区域类型的数量;其中,同一基站区域类型的基站与所述轨道交通线路的距离属于同一范围;
行程段提取模块,用于:根据每个所述基站区域类型的数量从所述途径点数据中提取轨道交通行程段数据;
用户判断模块,用于:根据所述轨道交通行程段数据判断所述用户是否为轨道交通用户。
10.根据权利要求9所述的装置,其特征在于,数据获取模块,用于:
获取用户的信令数据;所述信令数据包括:所述用户的移动终端标识、信令交互时间和每个信令交互的基站的位置信息;
将所述信令数据按所述信令交互时间排序,得到信令数据流;
去除所述信令数据流中的无效数据,得到用户的途径点数据。
CN201910755903.3A 2019-08-15 2019-08-15 轨道交通用户识别方法和装置 Active CN110460962B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910755903.3A CN110460962B (zh) 2019-08-15 2019-08-15 轨道交通用户识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910755903.3A CN110460962B (zh) 2019-08-15 2019-08-15 轨道交通用户识别方法和装置

Publications (2)

Publication Number Publication Date
CN110460962A true CN110460962A (zh) 2019-11-15
CN110460962B CN110460962B (zh) 2020-11-27

Family

ID=68486950

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910755903.3A Active CN110460962B (zh) 2019-08-15 2019-08-15 轨道交通用户识别方法和装置

Country Status (1)

Country Link
CN (1) CN110460962B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112104975A (zh) * 2020-09-08 2020-12-18 中国联合网络通信集团有限公司 一种无线接入网设备的部署方法及装置
CN112333689A (zh) * 2020-11-24 2021-02-05 智慧足迹数据科技有限公司 广域高铁基站识别方法、装置、服务器及存储介质
CN113543032A (zh) * 2020-04-21 2021-10-22 ***通信集团广东有限公司 模型训练方法和装置、用户识别方法和装置、电子设备
CN114422973A (zh) * 2022-03-30 2022-04-29 北京融信数联科技有限公司 一种基于大数据的网约车司机智能识别方法、***及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105608505A (zh) * 2015-12-22 2016-05-25 重庆邮电大学 一种基于手机信令数据的居民轨道交通出行方式识别方法
CN106658394A (zh) * 2015-11-04 2017-05-10 ***通信集团公司 高铁用户分离方法及装置
CN109525959A (zh) * 2018-12-03 2019-03-26 中国联合网络通信集团有限公司 高速铁路用户分离方法及***、信令数据处理方法及***
CN110099353A (zh) * 2019-05-10 2019-08-06 中国联合网络通信集团有限公司 列车用户识别方法及设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106658394A (zh) * 2015-11-04 2017-05-10 ***通信集团公司 高铁用户分离方法及装置
CN105608505A (zh) * 2015-12-22 2016-05-25 重庆邮电大学 一种基于手机信令数据的居民轨道交通出行方式识别方法
CN109525959A (zh) * 2018-12-03 2019-03-26 中国联合网络通信集团有限公司 高速铁路用户分离方法及***、信令数据处理方法及***
CN110099353A (zh) * 2019-05-10 2019-08-06 中国联合网络通信集团有限公司 列车用户识别方法及设备

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113543032A (zh) * 2020-04-21 2021-10-22 ***通信集团广东有限公司 模型训练方法和装置、用户识别方法和装置、电子设备
CN113543032B (zh) * 2020-04-21 2022-12-16 ***通信集团广东有限公司 模型训练方法和装置、用户识别方法和装置、电子设备
CN112104975A (zh) * 2020-09-08 2020-12-18 中国联合网络通信集团有限公司 一种无线接入网设备的部署方法及装置
CN112104975B (zh) * 2020-09-08 2022-05-13 中国联合网络通信集团有限公司 一种无线接入网设备的部署方法及装置
CN112333689A (zh) * 2020-11-24 2021-02-05 智慧足迹数据科技有限公司 广域高铁基站识别方法、装置、服务器及存储介质
CN112333689B (zh) * 2020-11-24 2021-08-31 智慧足迹数据科技有限公司 广域高铁基站识别方法、装置、服务器及存储介质
CN114422973A (zh) * 2022-03-30 2022-04-29 北京融信数联科技有限公司 一种基于大数据的网约车司机智能识别方法、***及可读存储介质
CN114422973B (zh) * 2022-03-30 2022-06-28 北京融信数联科技有限公司 一种基于大数据的网约车司机智能识别方法、***及可读存储介质

Also Published As

Publication number Publication date
CN110460962B (zh) 2020-11-27

Similar Documents

Publication Publication Date Title
CN110460962A (zh) 轨道交通用户识别方法和装置
CN108959466B (zh) 基于bcs-dbscan的出租车载客热点可视化方法及***
CN107767669B (zh) 基于WiFi和蓝牙识别的公交线路客流OD估计方法
CN108961747B (zh) 一种不完备卡口数据条件下的城市道路交通状态信息提取方法
CN108415975B (zh) 基于bdch-dbscan的出租车载客热点识别方法
CN104217593B (zh) 一种面向手机移动速度的路况信息实时获取方法
CN112512020B (zh) 一种基于多源数据融合的交通状态弱信号感知研判方法
CN105389996A (zh) 一种基于大数据的交通运行状态特征参数提取方法
CN106297288A (zh) 一种公交乘客客流数据采集与分析方法
CN104484993A (zh) 用于交通小区划分的手机信令信息的处理方法
CN111464950B (zh) 一种使用手机信令数据提取出行停驻点的方法
CN105101092A (zh) 一种基于c4.5决策树的手机用户出行方式识别方法
CN104978858A (zh) 一种基于手机信令的高速公路实时路况监测方法
CN106658394A (zh) 高铁用户分离方法及装置
CN109684373A (zh) 基于出行和话单数据分析的重点关系人发现方法
CN107564292B (zh) 基于站点WiFi和车载移动终端的乘客等车时间规律估计方法
CN104636611A (zh) 城市道路/路段的车辆速度评估方法
CN107332704A (zh) 评估高速铁路移动用户使用lte服务质量的方法和***
CN108827285A (zh) 一种基于智能手环的青少年健康数据共享***及方法
CN109190685A (zh) 融合空间聚类和基站序列规则的轨道出行特征提取方法
CN106448173A (zh) 一种基于手机数据的长距离出行交通方式划分方法
CN108091134A (zh) 一种基于手机信令位置轨迹数据的通用数据集生成方法
CN103824448A (zh) 基于众包模式的交通信息推送服务方法和***
CN104361746A (zh) 一种高速公路智能交通路况监控方法
CN107305734B (zh) 一种实时交通信息的采集方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant