CN113569978B - 一种出行轨迹识别方法、装置、计算机设备及存储介质 - Google Patents
一种出行轨迹识别方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN113569978B CN113569978B CN202110896364.2A CN202110896364A CN113569978B CN 113569978 B CN113569978 B CN 113569978B CN 202110896364 A CN202110896364 A CN 202110896364A CN 113569978 B CN113569978 B CN 113569978B
- Authority
- CN
- China
- Prior art keywords
- data
- track
- measurement data
- track data
- measurement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000005259 measurement Methods 0.000 claims abstract description 128
- 230000011664 signaling Effects 0.000 claims abstract description 44
- 238000004140 cleaning Methods 0.000 claims abstract description 18
- 238000004458 analytical method Methods 0.000 claims abstract description 14
- 238000007621 cluster analysis Methods 0.000 claims abstract description 14
- 230000002159 abnormal effect Effects 0.000 claims description 22
- 101150116940 AGPS gene Proteins 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 description 13
- 230000000875 corresponding effect Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000001502 supplementing effect Effects 0.000 description 2
- 238000013475 authorization Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/10—Scheduling measurement reports ; Arrangements for measurement reports
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/20—Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Navigation (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明实施例公开了一种出行轨迹识别方法、装置、计算机设备及存储设备。该方法包括:基于获取的第一测量数据通过指纹定位得到包括全部位置信息的第二测量数据;将所述第二测量数据与获取的信令数据关联得到第一轨迹数据;基于所述第一轨迹数据进行数据清洗得到第二轨迹数据;基于所述第二轨迹数据进行聚类分析确定驻留点,以根据所述驻留点确定用户出行轨迹。本发明实施例结合第一测量数据和信令数据作为分析基础,并借助指纹定位扩充了第一测量数据中的位置信息,以更丰富的数据作为出行轨迹识别基础得到更为精确的识别结果。
Description
技术领域
本发明涉及交通规划技术领域,尤其涉及一种出行轨迹识别方法、装置、计算机设备及存储介质。
背景技术
在交通规划和解决交通拥堵的过程中,通常需要分析各个路段拥堵的根本原因,需要对拥堵路段人群进行追踪溯源OD分析,了解到拥堵路段中的人群来自哪里又去往哪里。从而进行道路分流优化,根本上解决交通堵塞。
目前进行人流OD分析的数据大多数来源于互联网公司的出行软件,如乘车码、滴滴打车、高德导航软件等。这类数据比较片面,各个互联网公司形成了数据孤岛,互不相通。
还有一种方式就是使用运营商的信令数据,但信令数据精度和上报频次都比较低,甚至无法区别用户的出行和驻留状态,这类数据用于交通OD分析价值有限。
发明内容
有鉴于此,本发明提供了一种出行轨迹识别方法、装置、设备及存储介质,以通过指纹定位数据得到包括丰富位置信息的测量数据,以更丰富的测量数据结合信令数据作为出行轨迹识别基础得到更为精确的识别结果。
第一方面,本发明提供了一种出行轨迹识别方法,包括:
基于获取的第一测量数据通过指纹定位得到包括全部位置信息的第二测量数据;
将所述第二测量数据与获取的信令数据关联得到第一轨迹数据;
基于所述第一轨迹数据进行数据清洗得到第二轨迹数据;
基于所述第二轨迹数据进行聚类分析确定驻留点,以根据所述驻留点确定用户出行轨迹。
可选的,在一些实施例中,所述第一测量数据包括带agps数据的建库测量数据和不带agps数据的待定位测量数据,所述基于获取的第一测量数据通过指纹定位得到包括全部位置信息的第二测量数据,包括:
基于所述建库测量数据建立栅格指纹库;
基于所述待定位测量数据与所述栅格指纹库进行无线指标信息匹配以确定所述待定位测量数据的定位位置信息;
将所述定位位置信息回填至所述第一测量数据,得到第二测量数据。
可选的,在一些实施例中,所述将所述第二测量数据与获取的信令数据关联得到第一轨迹数据包括:
按照预设匹配指标确定所述第二测量数据和所述信令数据的关联关系;
根据所述关联关系将所述信令数据中的用户信息回填至所述第二测量数据,得到所述第一轨迹数据。
可选的,在一些实施例中,基于所述第一轨迹数据进行数据清洗得到第二轨迹数据包括:
基于所述第一轨迹数据剔除物联网轨迹数据得到第三轨迹数据;
基于所述第三轨迹数据进行数据抽稀得到第四轨迹数据;
基于所述第四轨迹数据剔除异常轨迹数据得到第二轨迹数据。
可选的,在一些实施例中,所述基于所述第四轨迹数据剔除异常轨迹数据得到第二轨迹数据包括:
基于所述第四轨迹数据按照时间排序确定用户的连续轨迹点;
确定相邻的所述连续轨迹点之间的移动速度,若所述移动速度大于等于预设速度阈值,则判断出现异常轨迹数据,剔除对应的异常轨迹数据。
可选的,在一些实施例中,基于所述第二轨迹数据进行聚类分析确定驻留点,以根据所述驻留点确定用户出行轨迹,包括:
基于所述第二轨迹数据以轨迹点进行时空DBSCAN聚类确定聚类空间、时间和聚类参数;
基于所述聚类空间确定对应的驻留点、以所述时间作为驻留时间确定用户出行轨迹。
可选的,在一些实施例中,以根据所述驻留点确定用户出行轨迹之后,还包括:
按照显示规则可视化显示所述用户出行轨迹。
第二方面,本发明实施例提供了一种出行轨迹识别装置,包括:
指纹定位模块,用于基于获取的第一测量数据通过指纹定位得到包括全部位置信息的第二测量数据;
数据关联模块,用于将所述第二测量数据与获取的信令数据关联得到第一轨迹数据;
数据清洗模块,用于基于所述第一轨迹数据进行数据清洗得到第二轨迹数据;
轨迹分析模块,用于基于所述第二轨迹数据进行聚类分析确定驻留点,以根据所述驻留点确定用户出行轨迹。
第三方面,本发明提供了一种计算机设备,包括存储器和处理器,所述存储器上存储有可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如前述的出行轨迹识别方法。
第四方面,本发明提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被执行时实现前述的出行轨迹识别方法。
本发明提供的出行轨迹识别方法,首先获取终端上报的第一测量数据和信令数据,对第一测量数据通过指纹定位补全位置信息得到第二测量数据,再将第二测量数据与信令数据关联得到第一轨迹数据,对第一轨迹数据进行清洗得到第二轨迹数据,在根据第二轨迹数据进行聚类分析,确定用户的驻留点,从而以驻留点确定用户出行轨迹,该方法结合第一测量数据和信令数据作为分析基础,并借助指纹定位扩充了第一测量数据中的位置信息,以更丰富的数据作为出行轨迹识别基础得到更为精确的识别结果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见的,下面描述中的附图仅仅是本申请的部分实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明实施例一提供的一种出行轨迹识别方法的流程图;
图2是本发明实施例二提供的出行轨迹识别方法的子流程图;
图3是本发明实施例二提供的多数据源协同移动网络问题定位关联表;
图4是本发明实施例二提供的出行轨迹识别方法的子流程图;
图5是本发明实施例二提供的出行轨迹识别方法的子流程图;
图6是本发明实施例二提供的出行轨迹识别方法的子流程图;
图7是本发明实施例三提供的一种出行轨迹识别装置的结构示意图;
图8是本发明实施例四提供的一种计算机设备的结构示意图。
具体实施方式
下面结合本申请实施例中的附图,对本申请实施中的技术方案进行清楚、完整的描述。可以理解的是,此处所描述的具体实施例仅仅是本申请一部分实施例,而不是全部的实施例,仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中使用的术语只是为了描述具体的实施方式的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
此外,术语“第一”、“第二”等可在本文中用于描述各种方向、动作、步骤或元件等,但这些方向、动作、步骤或元件不受这些术语限制。这些术语仅用于将第一个方向、动作、步骤或元件与另一个方向、动作、步骤或元件区分。举例来说,在不脱离本发明的范围的情况下,可以将第一用例称为第二用例,且类似地,可将第二用例称为第一用例。第一用例和第二用例两者都是用例,但其不是同一用例。术语“第一”、“第二”等而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者多个特征的组合。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。需要说明的是,当一个部被称为“固定于”另一个部,它可以直接在另一个部上也可以存在居中的部。当一个部被认为是“连接”到另一个部,它可以是直接连接到另一个部或者可能同时存在居中部。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述,只是为了说明的目的,并不表示是唯一的实施方式。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时处理可以被终止,但是还可以具有未包括在附图中的附加步骤。处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
参见图1,本实施例提供了一种出行轨迹识别方法,可以应用于道路交通管理***,该***包括终端和服务器,其中终端与服务器通过网络进行通信,终端可以但不限于是各种智能手机、平板电脑和便携式可穿戴设备,服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。基于上述***,出行轨迹识别方法可以由终端或服务器执行,也可以通过终端与服务器的交互实现。如图1所示,该方法具体包括:
S110、基于获取的第一测量数据通过指纹定位得到包括全部位置信息的第二测量数据。
第一测量数据指的是终端上报的无线测量数据(MR数据),目前终端在上报无线测量数据时只有部分无线测量数据会携带位置信息(agps数据),这部分无线测量数据通常只占第一测量数据的2%-5%,对于没有携带位置信息的无线测量数据,本实施例中通过指纹定位对其进行位置回填,以得到包括完整位置信息的无线测量数据,也即第二测量数据。
本实施例中第一测量数据可以直接获取终端上传的无线测量数据也可以是通过数据交换平台的FTP/SFTP协议方式对省端的数据进行下载采集(对于全国性的管理中心)后将下载的MR数据和信令数据推送至分布式数据存储***存储以供后续计算。
具体的,本实施例中所使用的指纹定位过程中,以携带agps数据的无线测量数据为建库基础形成栅格指纹库,将未携带agps数据的无线测量数据与栅格指纹库进行匹配,以确定未携带agps数据的无线测量数据的位置信息,进而可以确定第一测量数据的完整位置信息,回填至第一测量数据形成带完整位置信息的第二测量数据。
S120、将所述第二测量数据与获取的信令数据关联得到第一轨迹数据。
信令数据指的是通过众多数据接口(如S1、Uu、X2,S11等结构)获取的第二测量数据中虽然包括了丰富的位置信息,但是其主分析重点围绕服务小区而缺乏用户相关信息,在传统技术中MR数据通常用于定位计算,而信令数据包括了详细的用户事件等重要信息,但是信令数据在位置精度和数据量上存在一定缺陷,因此,本实施例中将信令数据与第二测量数据关联,其实际目的在于将信令数据中的用户信息回填至第二测量数据,从而将用户信息与位置信息关联,得到第一轨迹数据。
S130、基于所述第一轨迹数据进行数据清洗得到第二轨迹数据。
第二轨迹数据由第一轨迹数据通过数据清洗得到,第二数据实际是以轨迹点的形式表示用户的移动情况,具体包括用户的移动坐标(轨迹坐标)和移动时间等数据。具体的,数据清洗的目的在于剔除无效数据以及数据抽稀,这些无效数据包括了非真实用户的轨迹数据,对分析用户的出行轨迹有一定的干扰,数据抽稀的目的在于提高轨迹数据的价值密度(第二轨迹数据相较于传统的道路交通管理数据在数量上过于庞大)。
S140、基于所述第二轨迹数据进行聚类分析确定驻留点,以根据所述驻留点确定用户出行轨迹。
驻留点表示用户一段时间持续停留的地点,此处所指的停留并非指用户保持不移动,而是用户的轨迹点落在一定范围内,可以视为用户驻留在该范围区域内。具体的,本实施例中实际采用时空DBSCAN聚类对第二轨迹数据中的轨迹点进行分析,其按照预设的聚类规则对轨迹点进行聚类分析,以发掘不同的簇,从而识别用户的驻留点,再根据驻留点的驻留时间、属性等信息描述用户出行轨迹。
本实施例提供的出行轨迹识别方法,首先获取终端上报的第一测量数据和信令数据,对第一测量数据通过指纹定位补全位置信息得到第二测量数据,再将第二测量数据与信令数据关联得到第一轨迹数据,对第一轨迹数据进行清洗得到第二轨迹数据,在根据第二轨迹数据进行聚类分析,确定用户的驻留点,从而以驻留点确定用户出行轨迹,该方法结合第一测量数据和信令数据作为分析基础,并借助指纹定位扩充了第一测量数据中的位置信息,以更丰富的数据作为出行轨迹识别基础得到更为精确的识别结果。
实施例二
实施例二提供了一种出行轨迹识别方法,其可以在实施例一的基础上实现,对实施例一中的内容进行了进一步补充,具体包括:
如图2所示,为本实施例提供的出行轨迹识别方法中第二测量数据的生成过程,包括步骤S111-113:
S111、基于所述建库测量数据建立栅格指纹库。
S112、基于所述待定位测量数据与所述栅格指纹库进行无线指标信息匹配以确定所述待定位测量数据的定位位置信息;
S113、将所述定位位置信息回填至所述第一测量数据,得到第二测量数据。
具体的,所述第一测量数据包括带agps数据的建库测量数据和不带agps数据的待定位测量数据,指纹定位的远离是将基站覆盖区域划分为一定大小的栅格,一般为10m乘以10m的栅格区域。然后利用建库测量数据中2%-5%的agps数据和建库测量数据中包含的无线指标信息对栅格的无线环境进行描述,每个栅格的无线环境信息包括了rsrp、rsrq、sinr、ta、AOA、enodebid、cellid。
其他没有agps的待定位测量数据利用无线环境信息与指纹库中栅格的无线环境信息进行匹配,以确定二者间的无线环境信息相似度,取无线环境信息相似度最高的作为候选栅格,将相似度最高的多个候选栅格(通常3个)的中心经纬度进行加权求平均,权值为相似度,从而确定待定位测量数据的位置信息,实现对待定位测量数据的经纬度回填,这样回填后第一测量数据中的每个测量数据都能够确定对应的位置信息,也即得到了全部位置信息,将回填后的第一测量数据称为第二测量数据。
更具体的,在一些实施例中,如图3所示,生成第一轨迹数据的过程,也即步骤S120包括步骤S121-122:
S121、按照预设匹配指标确定所述第二测量数据和所述信令数据的关联关系。
S122、根据所述关联关系将所述信令数据中的用户信息回填至所述第二测量数据,得到所述第一轨迹数据。
本实施例中,预设匹配指标选用五元组:enodbid+eNBS1apid+mmecode+mmegroupid+mmes1apid,基于五元组将信令数据和无线MR数据(第二测量数据)进行关联,在确定关联关系后,按照关联关系将信令数据中包含的用户信息回填到带有agps经纬度位置信息的无线MR数据(即第二测量数据)中,从而得到各个时刻用户丰富的位置信息。
更具体的,在一些实施例中,步骤S130中的数据清洗过程如图4所示,具体包括步骤S131-133:
S131、基于所述第一轨迹数据剔除物联网轨迹数据得到第三轨迹数据。
通过以上步骤得到的用户轨迹不完全是普通用户的轨迹数据,还包含了大量的物联卡上报的经纬度数据,物联卡主要内嵌于无线物联网设备用于无线信息收发,比如无线摄像头等,这类数据不是真实用户,对数据分析有一定的干扰作用应该去除。去除方法主要是以号码段作为区分去除依据,例如电信运营商以号段区分真实用户和物联网业务端:电信共计15个号段,其中149号段为LTE(包含TD-LTE、LTE-FDD)/LTE-A(4G)数据上网号段,141号段为物联网业务专用号段,其余为cdmaOne(2G)、CDMA2000(3G)和LTE/LTE-1(4G)、NR(5G)混合号段,两个卫星手机专用号段,据此可以识别物联网业务端上传的物联网轨迹数据,将其剔除后得到第三轨迹数据。
S132、基于所述第三轨迹数据进行数据抽稀得到第四轨迹数据。
因为无线数据上报周期极短,每十秒上报一次,这样的数据量非常庞大,而且如此高频的经纬度数据对OD(ORIGIN-DESTINATION,出行起始)分析反而成了负担,需要对数据进一步清洗,提高价值密度。其主要思路是针对时间抽稀,例如每个用户每分钟只保留一个点,这样对第三轨迹数据实际进行了数据抽稀操作,得到第四轨迹数据。
S133、基于所述第四轨迹数据剔除异常轨迹数据得到第二轨迹数据。
异常轨迹数据的来源主要是agps漂移、指纹定位误差和用户关联错误等原因导致。判断一个用户的经纬度是否是异常轨迹数据,主要思路是按用户轨迹点的时间排序,根据前后两个相邻轨迹点的距离和时间计算速度,当速度超过一定阈值,就判定为异常点。也即:基于所述第四轨迹数据按照时间排序确定用户的连续轨迹点;确定相邻的所述连续轨迹点之间的移动速度,若所述移动速度大于等于预设速度阈值,则判断出现异常轨迹数据,剔除对应的异常轨迹数据。
更具体的,在一些实施例中,如图5所示步骤S140包括S141-142:
S141、基于所述第二轨迹数据以轨迹点进行时空DBSCAN聚类确定聚类空间、时间和聚类参数。
S142、基于所述聚类空间确定对应的驻留点、以所述时间作为驻留时间确定用户出行轨迹。
本实施例采用的聚类算法中,其核心样本满足要求:样本对象x,满足空间半径<R且时间间隔<t领域内对象个数>=MinPts(定义核心点时的阈值)。
首选任意选取一个点,然后选取满足eps(定义密度时的邻域半径)的所有的点。如果数据点个数小于min_samples,那么这个点被标记为噪声。如果数据点个数大于min_samples,则这个点被标记为核心样本,并被分配一个新的簇标签,核心样本点可达的为同一个簇。
更具体的,在一些实施例中,如图6所示步骤S140之后还包括步骤S210:
S210、按照显示规则可视化显示所述用户出行轨迹。
本实施例中,显示规则用于确定对出行轨迹的显示方式,例如针对不同用于以不同显色显示出行轨迹,在针对单一用户显示用户出行轨迹时,能够以轨迹线条显示实际路线,也能够以距离-时间图简要显示用户移动情况,此处不作限制。
本实施例在前述实施例的基础上,进一步对指纹定位的过程、数据关联的过程、数据清洗的过程以及聚类分析的过程做了进一步解释,使得本实施例中所使用的测量数据和信令数据更适应与出行轨迹识别,提高识别效率和识别精确度。
实施例三
图7为本发明实施例三提供的一种出行轨迹识别装置300的结构示意图,如图7所述,该装置300包括:
指纹定位模块310,用于基于获取的第一测量数据通过指纹定位得到包括全部位置信息的第二测量数据;
数据关联模块320,用于将所述第二测量数据与获取的信令数据关联得到第一轨迹数据;
数据清洗模块330,用于基于所述第一轨迹数据进行数据清洗得到第二轨迹数据;
轨迹分析模块340,用于基于所述第二轨迹数据进行聚类分析确定驻留点,以根据所述驻留点确定用户出行轨迹。
可选的,在一些实施例中,所述第一测量数据包括带agps数据的建库测量数据和不带agps数据的待定位测量数据,所述指纹定位模块310具体用于:
基于所述建库测量数据建立栅格指纹库;
基于所述待定位测量数据与所述栅格指纹库进行无线指标信息匹配以确定所述待定位测量数据的定位位置信息;
将所述定位位置信息回填至所述第一测量数据,得到第二测量数据。
可选的,在一些实施例中,所述数据关联模块320具体用于:
按照预设匹配指标确定所述第二测量数据和所述信令数据的关联关系;
根据所述关联关系将所述信令数据中的用户信息回填至所述第二测量数据,得到所述第一轨迹数据。
可选的,在一些实施例中,所述数据清洗模块330具体用于:
基于所述第一轨迹数据剔除物联网轨迹数据得到第三轨迹数据;
基于所述第三轨迹数据进行数据抽稀得到第四轨迹数据;
基于所述第四轨迹数据剔除异常轨迹数据得到第二轨迹数据。
可选的在,在一些实施例中,所述基于所述第四轨迹数据剔除异常轨迹数据得到第二轨迹数据包括:
基于所述第四轨迹数据按照时间排序确定用户的连续轨迹点;
确定相邻的所述连续轨迹点之间的移动速度,若所述移动速度大于等于预设速度阈值,则判断出现异常轨迹数据,剔除对应的异常轨迹数据。
可选的在,在一些实施例中,所述轨迹分析模块340具体用于:
基于所述第二轨迹数据以轨迹点进行时空DBSCAN聚类确定聚类空间、时间和聚类参数;
基于所述聚类空间确定对应的驻留点、以所述时间作为驻留时间确定用户出行轨迹。
可选的在,在一些实施例中,还包括:
可视化模块,用于按照显示规则可视化显示所述用户出行轨迹。
本实施例提供了一种出行轨迹识别装置,首先获取终端上报的第一测量数据和信令数据,对第一测量数据通过指纹定位补全位置信息得到第二测量数据,再将第二测量数据与信令数据关联得到第一轨迹数据,对第一轨迹数据进行清洗得到第二轨迹数据,在根据第二轨迹数据进行聚类分析,确定用户的驻留点,从而以驻留点确定用户出行轨迹,该方法结合第一测量数据和信令数据作为分析基础,并借助指纹定位扩充了第一测量数据中的位置信息,以更丰富的数据作为出行轨迹识别基础得到更为精确的识别结果。
实施例四
图8为本发明实施例四提供的一种计算机设备400的结构示意图,如图8所示,该设备包括存储器410、处理器420,设备中处理器420的数量可以是一个或多个,图8中以一个处理器420为例;设备中的存储器410、处理器420可以通过总线或其他方式连接,图8中以通过总线连接为例。
存储器410作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的出行轨迹识别方法对应的程序指令/模块(例如,出行轨迹识别***中的指纹定位模块310、数据关联模块320、数据清洗模块330和轨迹分析模块340)。处理器420通过运行存储在存储器410中的软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述的出行轨迹识别方法。
其中,所述处理器420用于运行存储在存储器410中的计算机可执行程序,以实现如下步骤:步骤S110、基于获取的第一测量数据通过指纹定位得到包括全部位置信息的第二测量数据;步骤S120、将所述第二测量数据与获取的信令数据关联得到第一轨迹数据;步骤S130、基于所述第一轨迹数据进行数据清洗得到第二轨迹数据;步骤S140、基于所述第二轨迹数据进行聚类分析确定驻留点,以根据所述驻留点确定用户出行轨迹。
当然,本发明实施例所提供的一种服务器,该设备不限于如上所述的方法操作,还可以执行本发明实施例任意实施例所提供的出行轨迹识别方法中的相关操作。
存储器410可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器410可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器410可进一步包括相对于处理器420远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种出行轨迹识别方法,该出行轨迹识别方法包括:
基于获取的第一测量数据通过指纹定位得到包括全部位置信息的第二测量数据;
将所述第二测量数据与获取的信令数据关联得到第一轨迹数据;
基于所述第一轨迹数据进行数据清洗得到第二轨迹数据;
基于所述第二轨迹数据进行聚类分析确定驻留点,以根据所述驻留点确定用户出行轨迹。
通过以上关于实施方式的描述,所述领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台服务器(可以是个人计算机,设备,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述授权装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (7)
1.一种出行轨迹识别方法,其特征在于,包括:
基于获取的第一测量数据通过指纹定位得到包括全部位置信息的第二测量数据;
将所述第二测量数据与获取的信令数据关联得到第一轨迹数据;其中,所述信令数据包括详细用户事件;
基于所述第一轨迹数据进行数据清洗得到第二轨迹数据;
基于所述第二轨迹数据进行聚类分析确定驻留点,以根据所述驻留点确定用户出行轨迹;
所述基于所述第一轨迹数据进行数据清洗得到第二轨迹数据包括:
基于所述第一轨迹数据剔除物联网轨迹数据得到第三轨迹数据;
基于所述第三轨迹数据进行数据抽稀得到第四轨迹数据;
基于所述第四轨迹数据剔除异常轨迹数据得到第二轨迹数据;
所述基于所述第四轨迹数据剔除异常轨迹数据得到第二轨迹数据包括:
基于所述第四轨迹数据按照时间排序确定用户的连续轨迹点;
确定相邻的所述连续轨迹点之间的移动速度,若所述移动速度大于或等于预设速度阈值,则判断出现异常轨迹数据,剔除对应的异常轨迹数据;
所述将所述第二测量数据与获取的信令数据关联得到第一轨迹数据包括:
基于预设匹配指标将所述信令数据和无线MR数据进行关联,确定所述第二测量数据和所述信令数据的关联关系;其中,所述预设匹配指标为五元组:enodbid+eNBS1apid+mmecode+mmegroupid+mmes1apid,所述无线MR数据为第二测量数据;
根据所述关联关系将所述信令数据中的用户信息回填至所述第二测量数据,得到所述第一轨迹数据。
2.根据权利要求1所述的出行轨迹识别方法,其特征在于,所述第一测量数据包括带agps数据的建库测量数据和不带agps数据的待定位测量数据,所述基于获取的第一测量数据通过指纹定位得到包括全部位置信息的第二测量数据,包括:
基于所述建库测量数据建立栅格指纹库;
基于所述待定位测量数据与所述栅格指纹库进行无线指标信息匹配以确定所述待定位测量数据的定位位置信息;
将所述定位位置信息回填至所述第一测量数据,得到第二测量数据。
3.根据权利要求1所述的出行轨迹识别方法,其特征在于,基于所述第二轨迹数据进行聚类分析确定驻留点,以根据所述驻留点确定用户出行轨迹,包括:
基于所述第二轨迹数据以轨迹点进行时空DBSCAN聚类确定聚类空间、时间和聚类参数;
基于所述聚类空间确定对应的驻留点、以所述时间作为驻留时间确定用户出行轨迹。
4.根据权利要求1所述的出行轨迹识别方法,其特征在于,以根据所述驻留点确定用户出行轨迹之后,还包括:
按照显示规则可视化显示所述用户出行轨迹。
5.一种出行轨迹识别装置,其特征在于,包括:
指纹定位模块,用于基于获取的第一测量数据通过指纹定位得到包括全部位置信息的第二测量数据;
数据关联模块,用于将所述第二测量数据与获取的信令数据关联得到第一轨迹数据;其中,所述信令数据包括详细用户事件;
数据清洗模块,用于基于所述第一轨迹数据进行数据清洗得到第二轨迹数据;
轨迹分析模块,用于基于所述第二轨迹数据进行聚类分析确定驻留点,以根据所述驻留点确定用户出行轨迹;
所述数据清洗模块,具体用于:
基于所述第一轨迹数据剔除物联网轨迹数据得到第三轨迹数据;
基于所述第三轨迹数据进行数据抽稀得到第四轨迹数据;
基于所述第四轨迹数据剔除异常轨迹数据得到第二轨迹数据;
所述基于所述第四轨迹数据剔除异常轨迹数据得到第二轨迹数据包括:
基于所述第四轨迹数据按照时间排序确定用户的连续轨迹点;
确定相邻的所述连续轨迹点之间的移动速度,若所述移动速度大于或等于预设速度阈值,则判断出现异常轨迹数据,剔除对应的异常轨迹数据;
所述数据关联模块具体用于:
基于预设匹配指标将所述信令数据和无线MR数据进行关联,确定所述第二测量数据和所述信令数据的关联关系;其中,所述预设匹配指标为五元组:enodbid+eNBS1apid+mmecode+mmegroupid+mmes1apid,所述无线MR数据为第二测量数据;
根据所述关联关系将所述信令数据中的用户信息回填至所述第二测量数据,得到所述第一轨迹数据。
6.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器上存储有可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-4任意一项所述的出行轨迹识别方法。
7.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被执行时,实现如权利要求1-4任意一项所述的出行轨迹识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110896364.2A CN113569978B (zh) | 2021-08-05 | 2021-08-05 | 一种出行轨迹识别方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110896364.2A CN113569978B (zh) | 2021-08-05 | 2021-08-05 | 一种出行轨迹识别方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113569978A CN113569978A (zh) | 2021-10-29 |
CN113569978B true CN113569978B (zh) | 2024-06-21 |
Family
ID=78170482
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110896364.2A Active CN113569978B (zh) | 2021-08-05 | 2021-08-05 | 一种出行轨迹识别方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113569978B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114547228B (zh) * | 2022-04-22 | 2022-07-19 | 阿里云计算有限公司 | 轨迹生成方法、装置、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109495848A (zh) * | 2018-12-18 | 2019-03-19 | 成都方未科技有限公司 | 一种用户空间定位的方法 |
CN112543419A (zh) * | 2019-09-20 | 2021-03-23 | ***通信集团吉林有限公司 | 一种基于密度聚类的用户轨迹预测方法及装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8989775B2 (en) * | 2012-02-29 | 2015-03-24 | RetailNext, Inc. | Method and system for WiFi-based identification of person tracks |
US9642167B1 (en) * | 2015-12-17 | 2017-05-02 | Cisco Technology, Inc. | Location-based VoIP functions in a wireless network |
CN108181607B (zh) * | 2017-12-21 | 2020-03-24 | 重庆玖舆博泓科技有限公司 | 基于指纹库的定位方法、装置及计算机可读存储介质 |
US11985675B2 (en) * | 2018-08-09 | 2024-05-14 | Lg Electronics Inc. | Method for transmitting/receiving a machine type communication physical downlink control channel |
US20210329416A1 (en) * | 2018-08-30 | 2021-10-21 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and Apparatus for Location Services |
CN110442662B (zh) * | 2019-07-08 | 2022-05-20 | 清华大学 | 一种确定用户属性信息的方法以及信息推送方法 |
CN111510859B (zh) * | 2020-05-25 | 2021-12-21 | 北京红山信息科技研究院有限公司 | 一种用户轨迹定位方法、***、服务器和存储介质 |
CN112364907A (zh) * | 2020-11-03 | 2021-02-12 | 北京红山信息科技研究院有限公司 | 待测用户常驻地普查方法、***、服务器和存储介质 |
-
2021
- 2021-08-05 CN CN202110896364.2A patent/CN113569978B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109495848A (zh) * | 2018-12-18 | 2019-03-19 | 成都方未科技有限公司 | 一种用户空间定位的方法 |
CN112543419A (zh) * | 2019-09-20 | 2021-03-23 | ***通信集团吉林有限公司 | 一种基于密度聚类的用户轨迹预测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113569978A (zh) | 2021-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110111575B (zh) | 一种基于复杂网络理论的城市交通流量网络分析方法 | |
CN109996186B (zh) | 一种网络覆盖问题识别方法及装置、可读取存储介质 | |
Caceres et al. | Traffic flow estimation models using cellular phone data | |
KR101385928B1 (ko) | 교통 관리를 위한 방법 및 장치 | |
CN105491532B (zh) | 一种用于路网运行状态分析的手机信令过滤方法和装置 | |
Janecek et al. | Cellular data meet vehicular traffic theory: location area updates and cell transitions for travel time estimation | |
CN109688532B (zh) | 一种划分城市功能区域的方法及装置 | |
Holleczek et al. | Detecting weak public transport connections from cellphone and public transport data | |
CN108243421B (zh) | 伪基站识别方法及*** | |
EP2608181B1 (en) | Method for detecting traffic | |
CN108632746A (zh) | 一种确定区域人流量的方法 | |
US20130166352A1 (en) | Mobile categorization | |
CN108271157B (zh) | 一种伪基站识别方法及装置 | |
WO2015170289A1 (en) | Method and system for vehicular traffic prediction | |
CN105635968A (zh) | 一种基于时间单元的热点区域识别方法、预测方法及装置 | |
CN110460962B (zh) | 轨道交通用户识别方法和装置 | |
CN103906086B (zh) | 一种基于移动网络的人员流向监测方法和装置 | |
Holleczek et al. | Traffic measurement and route recommendation system for mass rapid transit (mrt) | |
CN111757271B (zh) | 基于曲线拟合和网络拓扑结构的联合道路匹配方法及装置 | |
US20120218150A1 (en) | Management server, population information calculation management server, non-populated area management method, and population information calculation method | |
CN110493720A (zh) | 终端的定位方法、装置及存储介质 | |
Habtie et al. | Artificial neural network based real-time urban road traffic state estimation framework | |
CN113569978B (zh) | 一种出行轨迹识别方法、装置、计算机设备及存储介质 | |
CN109495848B (zh) | 一种用户空间定位的方法 | |
CN108235253A (zh) | 用户运动剖析 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |