CN114416900A - 一种轨迹停留点分析的方法和装置 - Google Patents

一种轨迹停留点分析的方法和装置 Download PDF

Info

Publication number
CN114416900A
CN114416900A CN202210002103.6A CN202210002103A CN114416900A CN 114416900 A CN114416900 A CN 114416900A CN 202210002103 A CN202210002103 A CN 202210002103A CN 114416900 A CN114416900 A CN 114416900A
Authority
CN
China
Prior art keywords
data
target
point
longitude
latitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210002103.6A
Other languages
English (en)
Inventor
郭贵凤
齐战胜
***
周新波
孙玉峰
慕荣臻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Meiya Pico Information Co Ltd
Original Assignee
Xiamen Meiya Pico Information Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Meiya Pico Information Co Ltd filed Critical Xiamen Meiya Pico Information Co Ltd
Priority to CN202210002103.6A priority Critical patent/CN114416900A/zh
Publication of CN114416900A publication Critical patent/CN114416900A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24554Unary operations; Data partitioning operations
    • G06F16/24556Aggregation; Duplicate elimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Fuzzy Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Remote Sensing (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本申请提出了一种轨迹停留点分析的方法,该方法包括如下步骤:S1、获取目标时间段内目标用户移动终端标识群的数据信息,根据获取的所述数据信息构建信令轨迹数据集;S2、对所述信令轨迹数据进行预处理;S3、抽象化所述目标用户移动终端标识的轨迹数据为小区域标识序列数据;S4、设置小区域停留时间阈值,筛选出目标小区域标识集合;S5、将相邻的所述目标小区域聚为一族,即对所述目标小区域聚类;S6、基于每一族所述目标小区域内的基站,分别计算各族的地理中心点;S7、将所述地理中心点地址转化为所述目标用户的停留点。本申请通过虚实联动,将虚的、无法隐藏的、形影不离的轨迹,与实的、精细化的、粘合性强的落位地址关联起来,相互验证、相互补充,提供了用户群在给定时间段内鲜活的、精准的停留点信息。

Description

一种轨迹停留点分析的方法和装置
技术领域
本申请属于定位服务的技术领域,具体涉及一种轨迹停留点分析的方法和装置。
背景技术
目前,判断用户的停留点方法主要集中在以行进速度、方向变化、轨迹密度等单一时空特征设置阀值进行分析,逻辑算法简单,误差较大;也有的采用查找用户手机访问的多个基站,依据基站经纬度和基站被用户访问的频次,计算加权质心来定位用户的停留点,然而人的停留点是在基站的辐射范围内,但往往不在基站所在地,故将距离加权质心最近的基站位置作为用户的停留点是不准确的。
综上,采用上述方法对用户轨迹进行定位时,无法准确得到用户的停留点位置,难以达到理想的效果。
鉴于此,提出一种轨迹停留点分析的方法和装置是非常有意义的。
申请内容
为了解决现有存在无法对用户轨迹进行准确定位的问题,本申请提供一种轨迹停留点分析的方法和装置,以解决存在的技术缺陷问题。
本申请提出了一种轨迹停留点分析的方法,该方法包括如下步骤:
S1、获取目标时间段内目标用户移动终端标识群的数据信息,根据获取的所述数据信息构建信令轨迹数据集;
S2、对所述信令轨迹数据进行预处理;
S3、抽象化所述目标用户移动终端标识的轨迹数据为小区域标识序列数据;
S4、设置小区域停留时间阈值,筛选出目标小区域标识集合;
S5、将相邻的所述目标小区域聚为一族,即对所述目标小区域聚类;
S6、基于每一族所述目标小区域内的基站,分别计算各族的地理中心点;
S7、将所述地理中心点地址转化为所述目标用户的停留点。
从大数据平台查询并保存目标用户在给定时间段内的信令轨迹数据,对获取的信令数据做过滤、校验、去重、序列化、聚合等处理;将准备好的信令轨迹数据集抽象化为小区域标识序列数据;接着筛选出停留时长较长的小区域标识集,并将它们之间相邻的聚类;然后分别计算各族的地理中心点;最后将地理中心点转化为可读性、实用性强的地址名称,作为停留点。通过虚实联动,将虚的、无法隐藏的、形影不离的轨迹,与实的、精细化的、粘合性强的落位地址关联起来,相互验证、相互补充,提供了用户群在给定时间段内鲜活的、精准的停留点信息。
进一步优选的,在S2中所述预处理包括对所述信令轨迹数据做清洗、时序化、聚合、关联回填处理。
进一步优选的,所述预处理具体包括:
a以业务关键字段不为空进行过滤、业务字段分组去重进行清洗所述信令轨迹数据;
b按所述目标用户移动终端标识分组,并以访问时间组内排序进行时序化所述信令轨迹数据;
c将连续访问同一基站的数据聚合,并标记连续访问的频次,以及首次访问时间和末次访问时间进行归并所述信令轨迹数据;
d基于基站相关知识库,关联回填所述信令轨迹数据中基站的经纬度。
进一步优选的,S3具体包括将目标区域分割成诸多网格,并对每个所述网格做标识,再按所述目标用户移动终端访问基站的时序,以网格标识标记所述网格内的基站点。
进一步优选的,S4中筛选出小区域停留时长大于或等于所述阈值的目标区域标识。此阈值参数可以随省市、城乡基站建设的不同优化调整。
进一步优选的,S5中包括将相邻目标小区域的所述基站点聚为一族。
进一步优选的,S7中所述地理中心点地址化为停留点分为可匹配关联地址以及未匹配上关联地址,具体包括查询所述目标用户移动终端标识关联的地址名称。
第二方面,本申请公开了一种轨迹停留点分析的装置,其特征在于,该装置包括:
数据查询且可另存模块:用于设置查询参数以获取目标数据,并允许将结果另存到库里;
数据处理模块:用于实现对获取的目标数据进行校验、过滤、格转操作;
数据治理模块:用于实现对获取的目标数据进行去重、序列化、聚合、关联回填操作;
经纬度点数据编码标识模块:用于对给定经的纬度点数据依据一定的规则编码,并以编码字符串标识标记该经纬度点;
标识的邻域计算模块:用于计算给定小区域编码标识的相邻小区域标识;
数据碰撞模块:用于依据用户输入的数据以及设置的碰撞方式,进行运算并输出碰撞后结果;
地理中心点计算模块:用于将用户输入的经纬度点集合数据先转化为三维坐标值,再寻找3D坐标系中的中心点,最后将中心点坐标解码为对应的经纬度点并输出;
可关联地址查询模块:用于实现对输入身份要素的其他身份信息落查,以及展示身份汇总要素关联到的地址名称集合信息,包含地址对应的经纬度信息;
球面距离计算模块:用于计算两经纬度点之间的距离。
第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序;一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
与现有技术相比,本申请的有益成果在于:
(1)通过虚实联动,将虚的、无法隐藏的、形影不离的轨迹,与实的、精细化的、粘合性强的落位地址关联起来,相互验证、相互补充,提供了用户群在给定时间段内鲜活的、精准的停留点信息。
(2)具有对专用定位终端、个人移动终端等多种类型的设备输出的轨迹数据进行处理,处理过程只对数据做单循环遍历,极大提高了运算效率。
附图说明
包括附图以提供对实施例的进一步理解并且附图被并入本说明书中并且构成本说明书的一部分。附图图示了实施例并且与描述一起用于解释本申请的原理。将容易认识到其它实施例和实施例的很多预期优点,因为通过引用以下详细描述,它们变得被更好地理解。附图的元件不一定是相互按照比例的。同样的附图标记指代对应的类似部件。
图1是本申请的一个实施例可以应用于其中的示例性装置架构图;
图2为本申请的实施例轨迹停留点分析的方法的流程示意图;
图3为本申请的实施例轨迹停留点分析的方法的具体流程结构示意图;
图4为本申请的实施例轨迹停留点分析的装置的流程示意图;
图5是适于用来实现本申请实施例的电子设备的计算机装置的结构示意图。
具体实施方式
在以下详细描述中,参考附图,该附图形成详细描述的一部分,并且通过其中可实践本申请的说明性具体实施例来示出。对此,参考描述的图的取向使用方向术语,例如“顶”、“底”、“左”、“右”、“上”、“下”等。因为实施例的部件可被定位于若干不同取向中,为了图示的目的使用方向术语并且方向术语绝非限制。应当理解的是,可以利用其他实施例或可以做出逻辑改变,而不背离本申请的范围。因此以下详细描述不应当在限制的意义上被采用,并且本申请的范围由所附权利要求来限定。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图1示出了可以应用本申请实施例的用于处理信息的方法或用于处理信息的装置的示例性***架构100。
如图1所示,***架构100可以包括终端设备101、102、103,网络104 和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有通信功能的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、 103发送的校验请求信息进行处理的后台信息处理服务器。后台信息处理服务器可以对接收到的校验请求信息进行分析等处理,并得到处理结果(例如用于表征校验请求为合法请求的校验成功信息)。
需要说明的是,本申请实施例所提供的用于处理信息的方法一般由服务器105执行,相应地,用于处理信息的装置一般设置于服务器105中。另外,本申请实施例所提供的用于发送信息的方法一般由终端设备101、102、 103执行,相应地,用于发送信息的装置一般设置于终端设备101、102、 103中。
需要说明的是,服务器可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或多个软件模块。在此不做具体限定。
图2示出了本申请的实施例公开了一种轨迹停留点分析的方法的流程示意图,图3示出了本申请的实施例轨迹停留点分析的方法的具体流程结构示意图,参照图2和图3所示,该方法包括如下步骤:
S1、获取目标时间段内目标用户移动终端标识群的数据信息,根据获取的所述数据信息构建信令轨迹数据集;
在具体实施例中,根据目标时间段和目标用户移动终端标识群查询目标用户群在该段时间内的历史信令轨迹数据,选取必要字段信息构建数据集并存储。
S2、对所述信令轨迹数据进行预处理;
在具体实施例中,预处理包括对所述信令轨迹数据做清洗、时序化、聚合、关联回填处理。
具体的预处理信令轨迹数据包括:
a以业务关键字段不为空进行过滤、业务字段分组去重进行清洗所述信令轨迹数据;
b按目标用户移动终端标识分组,并以访问时间组内排序进行时序化信令轨迹数据;
c将连续访问同一基站的数据聚合,并标记连续访问的频次,以及首次访问时间和末次访问时间进行归并所述信令轨迹数据;
d基于基站相关知识库,关联回填所述信令轨迹数据中基站的经纬度。
S3、抽象化所述目标用户移动终端标识的轨迹数据为小区域标识序列数据;
具体的,将目标区域分割成诸多网格,并对每个所述网格做标识,再按所述目标用户移动终端访问基站的时序,以网格标识标记所述网格内的基站点。
在本实施例中,将目标区域比如北京市,依据一定规则分割成诸多小区域,并用编码字符串标识每个小区域;将轨迹数据中的基站经纬度集,比如一组呆在北京的特殊用户的移动终端访问的基站经纬度集,依据同样的规则编码;显然当基站的经纬度点在某个小区域时,该基站的编码标识与对应小区域的编码标识相同;用小区域编码标识代替或标记区域内基站经纬度点,即可将轨迹数据抽象化为小区域标识序列数据。
S4、设置小区域停留时间阈值,筛选出目标小区域标识集合;
具体实施例中,以目标用户移动终端标识、轨迹的小区域标识分组统计在各个小区域的停留时长,进一步筛选出小区域停留时长大于或等于所述阈值的目标区域标识。此阈值参数可以随省市、城乡基站建设的不同优化调整。
S5、将相邻的所述目标小区域聚为一族,即对所述目标小区域聚类;
具体的,包括计算每个目标小区域标识X的相邻小区域标识,形成对应的X-相邻小区域标识集合;将各个X-相邻小区域标识集合与轨迹中的编码标识集合进行交碰撞,彼此相邻的归为一族,得多个相邻小区域标识族类;计算在各个标识族呆的时长、起始时间和结束时间。
S6、基于每一族所述目标小区域内的基站,分别计算各族的地理中心点;
计算每族类的地理中心点包括:关联获取每个相邻小区域标识族的基站点,包含经纬度数据,从而获得各个族类对应的基站经纬度点列表;计算各个族类对应的基站经纬度点列表的地理中心点;进一步形成用户移动终端标识、族类标识、族的地理中心点、在族区域停留时长、起始时间、结束时间等信息的中间数据集。
S7、将所述地理中心点地址转化为所述目标用户的停留点。
在具体实施例中,地理中心点地址化为停留点分为可匹配关联地址以及未匹配上关联地址,具体包括查询目标用户移动终端标识关联的地址名称,比如物流、外卖等地址;
地址扩充,依据目标用户移动终端标识进行身份落查,获得目标用户的其他身份信息,然后以新获得的其他身份信息查询关联的地址名称,比如网吧、房产、酒店等地址;需要指出的是,以上地址名称均携带对应的经纬度信息;
将地理中心点与目标用户的关联地址匹配,通过计算地理中心点与关联地址之间的球面距离判定地理中心点匹配的地址名称;当能匹配到地址名称时,将地址名称与地理中心点关联,作为目标用户的停留点;当不能匹配到地址名称时,将距离地理中心点最近的地址名称,比如小区名称,与地理中心点关联,作为停留点。
此申请公开的方案可适用于落查用户的多个停留点,并且可进一步推荐最近的停留位置。该方法具体可以由大数据平台***和轨迹停留点分析装置来执行。
本发明实施例中,首先准备目标用户群的信令轨迹数据集,具体的,从大数据平台查询并保存目标用户在给定时间段内的信令轨迹数据,对获取的信令数据做过滤、校验、去重、序列化、聚合等处理;将准备好的信令轨迹数据集抽象化为小区域标识序列数据;接着筛选出停留时长较长的小区域标识集,并将它们之间相邻的聚类;然后计算各类族的地理中心点;最后将地理中心点转化为可读性、实用性强的地址名称,作为停留点。
通过虚实联动,将虚的、无法隐藏的、形影不离的轨迹,与实的、精细化的、粘合性强的落位地址关联起来,相互验证、相互补充,提供了用户群在给定时间段内鲜活的、精准的停留点信息。其具有对专用定位终端、个人移动终端等多种类型的设备输出的轨迹数据进行处理,处理过程只对数据做单循环遍历,极大提高了运算效率。
本发明实施例也可用于手机定位服务软件够不着的地方,比如特殊人员的停留点定位。
图4示出了本申请的实施例轨迹停留点分析的装置的流程示意图,如图4所示。
第二方面,本申请的实施例公开了一种轨迹停留点分析的装置,该装置包括:
数据查询且可另存模块:用于设置查询参数以获取目标数据,并允许将结果另存到库里;
数据处理模块:用于实现对获取的目标数据进行校验、过滤、格转操作;
数据治理模块:用于实现对获取的目标数据进行去重、序列化、聚合、关联回填操作;
经纬度点数据编码标识模块:用于对给定经纬度点数据,依据一定的规则编码,并以编码字符串标识标记该经纬度点;
标识的邻域计算模块:用于计算给定小区域编码标识的相邻小区域标识;
数据碰撞模块:用于依据用户输入的数据以及设置的碰撞方式,进行运算并输出碰撞后结果;
地理中心点计算模块:用于将用户输入的经纬度点集合数据先转化为三维坐标值,再寻找3D坐标系中的中心点,最后将中心点坐标解码为对应的经纬度点并输出;
可关联地址查询模块:用于实现对输入身份要素的其他身份信息落查,以及展示身份汇总要素关联到的地址名称集合信息,包含地址对应的经纬度信息;
球面距离计算模块:配置用于计算两经纬度点之间的距离。
下面参考图5,其示出了适于用来实现本申请实施例的电子设备(例如图1所示的服务器或终端设备)的计算机装置600的结构示意图。图5示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图5所示,计算机装置600包括中央处理单元(CPU)601和图形处理器(GPU)602,其可以根据存储在只读存储器(ROM)603中的程序或者从存储部分609加载到随机访问存储器(RAM)606中的程序而执行各种适当的动作和处理。在RAM 604中,还存储有装置600操作所需的各种程序和数据。CPU 601、GPU602、ROM 603以及RAM 604通过总线605彼此相连。输入/输出(I/O)接口606也连接至总线605。
以下部件连接至I/O接口606:包括键盘、鼠标等的输入部分607;包括诸如、液晶显示器(LCD)等以及扬声器等的输出部分608;包括硬盘等的存储部分609;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分610。通信部分610经由诸如因特网的网络执行通信处理。驱动器 611也可以根据需要连接至I/O接口606。可拆卸介质612,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器611上,以便于从其上读出的计算机程序根据需要被安装入存储部分609。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分610从网络上被下载和安装,和/或从可拆卸介质612被安装。在该计算机程序被中央处理单元(CPU)601和图形处理器(GPU)602执行时,执行本申请的方法中限定的上述功能。
需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读介质或者是上述两者的任意组合。计算机可读介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的装置、装置或器件,或者任意以上的组合。计算机可读介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器 (EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行装置、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行装置、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的装置来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备执行轨迹停留点分析的方法。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种轨迹停留点分析的方法,其特征在于,该方法包括如下步骤:
S1、获取目标时间段内目标用户移动终端标识群的数据信息,根据获取的所述数据信息构建信令轨迹数据集;
S2、对所述信令轨迹数据进行预处理;
S3、抽象化所述目标用户移动终端标识的轨迹数据为小区域标识序列数据;
S4、设置小区域停留时间阈值,筛选出目标小区域标识集合;
S5、将相邻的所述目标小区域聚为一族,即对所述目标小区域聚类;
S6、基于每一族所述目标小区域内的基站,分别计算各族的地理中心点;
S7、将所述地理中心点地址转化为所述目标用户的停留点。
2.根据权利要求1所述的轨迹停留点分析的方法,其特征在于,在S2中所述预处理包括对所述信令轨迹数据做清洗、时序化、聚合、关联回填处理。
3.根据权利要求2所述的轨迹停留点分析的方法,其特征在于,所述预处理具体包括:
a以业务关键字段不为空进行过滤、业务字段分组去重进行清洗所述信令轨迹数据;
b按所述目标用户移动终端标识分组,并以访问时间组内排序进行时序化所述信令轨迹数据;
c将连续访问同一基站的数据聚合,并标记连续访问的频次,以及首次访问时间和末次访问时间进行归并所述信令轨迹数据;
d基于基站相关知识库,关联回填所述信令轨迹数据中基站的经纬度。
4.根据权利要求3所述的轨迹停留点分析的方法,其特征在于,S3具体包括将目标区域分割成诸多网格,并对每个所述网格做标识,再按所述目标用户移动终端访问基站的时序,以网格标识标记所述网格内的基站点。
5.根据权利要求4所述的轨迹停留点分析的方法,其特征在于,S4中筛选出小区域停留时长大于或等于所述阈值的目标区域标识。
6.根据权利要求5所述的轨迹停留点分析的方法,其特征在于,S5中包括将相邻目标小区域的所述基站点聚为一族。
7.根据权利要求6所述的轨迹停留点分析的方法,其特征在于,S7中所述地理中心点地址化为停留点分为可匹配关联地址以及未匹配上关联地址,具体包括查询所述目标用户移动终端标识关联的地址名称。
8.一种轨迹停留点分析的装置,其特征在于,该装置包括:
数据查询且可另存模块:用于设置查询参数以获取目标数据,并允许将结果另存到库里;
数据处理模块:用于实现对获取的目标数据进行校验、过滤、格转操作;
数据治理模块:用于实现对获取的目标数据进行去重、序列化、聚合、关联回填操作;
经纬度点数据编码标识模块:用于对给定的经纬度点数据依据一定的规则编码,并以编码字符串标识标记该经纬度点;
标识的邻域计算模块:用于计算给定小区域编码标识的相邻小区域标识;
数据碰撞模块:用于依据用户输入的数据以及设置的碰撞方式,进行运算并输出碰撞后结果;
地理中心点计算模块:用于将用户输入的经纬度点集合数据先转化为三维坐标值,再寻找3D坐标系中的中心点,最后将中心点坐标解码为对应的经纬度点并输出;
可关联地址查询模块:用于实现对输入身份要素的其他身份信息落查,以及展示身份汇总要素关联到的地址名称集合信息,包含地址对应的经纬度信息;
球面距离计算模块:用于计算两经纬度点之间的距离。
9.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
CN202210002103.6A 2022-01-04 2022-01-04 一种轨迹停留点分析的方法和装置 Pending CN114416900A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210002103.6A CN114416900A (zh) 2022-01-04 2022-01-04 一种轨迹停留点分析的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210002103.6A CN114416900A (zh) 2022-01-04 2022-01-04 一种轨迹停留点分析的方法和装置

Publications (1)

Publication Number Publication Date
CN114416900A true CN114416900A (zh) 2022-04-29

Family

ID=81271772

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210002103.6A Pending CN114416900A (zh) 2022-01-04 2022-01-04 一种轨迹停留点分析的方法和装置

Country Status (1)

Country Link
CN (1) CN114416900A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115422480A (zh) * 2022-10-31 2022-12-02 荣耀终端有限公司 事件发生地区域的确定方法、设备及存储介质
CN115423841A (zh) * 2022-08-08 2022-12-02 华东师范大学 一种面向大宗物流的运输终点校准方法及***
CN116095601A (zh) * 2022-05-30 2023-05-09 荣耀终端有限公司 基站小区cell特征库更新方法及相关装置
CN116744237A (zh) * 2023-08-15 2023-09-12 中移(苏州)软件技术有限公司 数据确定方法、装置、设备及介质
CN117119387A (zh) * 2023-10-25 2023-11-24 北京市智慧交通发展中心(北京市机动车调控管理事务中心) 基于手机信令数据的用户出行链的构建方法和装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116095601A (zh) * 2022-05-30 2023-05-09 荣耀终端有限公司 基站小区cell特征库更新方法及相关装置
CN116095601B (zh) * 2022-05-30 2023-10-20 荣耀终端有限公司 基站小区cell特征库更新方法及相关装置
CN115423841A (zh) * 2022-08-08 2022-12-02 华东师范大学 一种面向大宗物流的运输终点校准方法及***
CN115422480A (zh) * 2022-10-31 2022-12-02 荣耀终端有限公司 事件发生地区域的确定方法、设备及存储介质
CN116744237A (zh) * 2023-08-15 2023-09-12 中移(苏州)软件技术有限公司 数据确定方法、装置、设备及介质
CN116744237B (zh) * 2023-08-15 2023-10-10 中移(苏州)软件技术有限公司 数据确定方法、装置、设备及介质
CN117119387A (zh) * 2023-10-25 2023-11-24 北京市智慧交通发展中心(北京市机动车调控管理事务中心) 基于手机信令数据的用户出行链的构建方法和装置
CN117119387B (zh) * 2023-10-25 2024-01-23 北京市智慧交通发展中心(北京市机动车调控管理事务中心) 基于手机信令数据的用户出行链的构建方法和装置

Similar Documents

Publication Publication Date Title
CN114416900A (zh) 一种轨迹停留点分析的方法和装置
Zhang et al. The Traj2Vec model to quantify residents’ spatial trajectories and estimate the proportions of urban land-use types
CN112148987B (zh) 基于目标对象活跃度的消息推送方法及相关设备
Shu et al. L-function of geographical flows
CN112861972B (zh) 一种展业区域的选址方法、装置、计算机设备和介质
US20170235726A1 (en) Information identification and extraction
CN114372133A (zh) 查询信息问答方法、相关装置及计算机程序产品
CN110895591A (zh) 一种定位自提点的方法和装置
CN113704373B (zh) 基于移动轨迹数据的用户识别方法、装置及存储介质
Wei et al. A parallel algorithm for coverage optimization on multi-core architectures
CN113011911B (zh) 基于人工智能的数据预测方法、装置、介质及电子设备
CN110020150B (zh) 信息推荐方法及装置
CN110619090B (zh) 一种区域吸引力评估方法及设备
CN110737820B (zh) 用于生成事件信息的方法和装置
CN112162859A (zh) 数据处理方法、装置、计算机可读介质及电子设备
CN115169466A (zh) 一种地块画像方法、装置、电子设备及计算机可读介质
CN112235723B (zh) 定位方法、装置、电子设备及计算机可读存储介质
CN110674843B (zh) 一种停车场实体的生成方法及***
CN114883012A (zh) 基于时空轨迹的传染病溯源方法、装置、介质及设备
CN110580270B (zh) 地址输出方法及***、计算机***和计算机可读存储介质
CN111523034A (zh) 一种应用程序的处理方法、装置、设备及介质
CN111339446A (zh) 一种兴趣点挖掘方法、装置、电子设备和存储介质
CN114144776A (zh) 实时地理智能聚合引擎
EP4318375A1 (en) Graph data processing method and apparatus, computer device, storage medium and computer program product
CN105163270B (zh) 智能终端位置状态的识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination