CN111797181B - 用户职住地的定位方法、装置、控制设备及存储介质 - Google Patents

用户职住地的定位方法、装置、控制设备及存储介质 Download PDF

Info

Publication number
CN111797181B
CN111797181B CN202010456537.4A CN202010456537A CN111797181B CN 111797181 B CN111797181 B CN 111797181B CN 202010456537 A CN202010456537 A CN 202010456537A CN 111797181 B CN111797181 B CN 111797181B
Authority
CN
China
Prior art keywords
user
point
aggregation
positioning data
effective
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010456537.4A
Other languages
English (en)
Other versions
CN111797181A (zh
Inventor
鲁旭
茅明睿
廖曙光
王辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing City Quadrant Technology Co ltd
Original Assignee
Beijing City Quadrant Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing City Quadrant Technology Co ltd filed Critical Beijing City Quadrant Technology Co ltd
Priority to CN202010456537.4A priority Critical patent/CN111797181B/zh
Publication of CN111797181A publication Critical patent/CN111797181A/zh
Application granted granted Critical
Publication of CN111797181B publication Critical patent/CN111797181B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • G06F16/244Grouping and aggregation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24554Unary operations; Data partitioning operations
    • G06F16/24556Aggregation; Duplicate elimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Remote Sensing (AREA)
  • Navigation (AREA)

Abstract

本发明提供的用户职住地的定位方法、装置、控制设备及存储介质,通过获取预设时长内用户的定位数据,所述定位数据用于指示所述用户在不同时间所处的位置;对所述用户的定位数据进行空间聚合处理,生成聚合点,所述聚合点具有聚合点出现时间;确定所述聚合点出现时间符合预设时间条件的聚合点为有效聚合点;根据所述有效聚合点,定位并输出用户职住地信息;即本发明从空间和时间两个维度上对用户的定位数据的进行分析,从而定位出更精确的用户职住地。

Description

用户职住地的定位方法、装置、控制设备及存储介质
技术领域
本发明涉及信息处理技术,尤其涉及一种用户职住地的定位方法、装置、控制设备及存储介质。
背景技术
有效获取城市居民的职住地分布情况,对城市和交通规划具有重要的参考价值。
现有技术中,大都通过传统聚类算法,例如基于密度的带有噪声的空间聚类(Density-Based Spatial Clustering of Applications with Noise,简称DBACAN)算法对获取的用户定位数据进行空间聚类分析,进而获取用户职住地的分布情况。
然而现有技术中,传统聚类算法忽略了用户定位数据的时间特性,导致最终获取的用户职住地可能存在偏差,进而所定位出的用户职住地与实际的用户职住地之间误差较大,定位精度较差。
发明内容
针对上述问题,本发明提供了一种用户职住地的定位方法、装置、控制设备及存储介质。
第一方面,本发明提供了一种用户职住地的定位方法,包括:获取预设时长内用户的定位数据,所述定位数据用于指示所述用户在不同时间所处的位置;对所述用户的定位数据进行空间聚合处理,生成聚合点,所述聚合点具有聚合点出现时间;确定所述聚合点出现时间符合预设时间条件的聚合点,为有效聚合点;根据所述有效聚合点,定位并输出用户职住地信息。
在其他可选的实施方式中,所述预设时长包括多个相同的时间段;所述确定所述聚合点出现时间符合预设时间条件的聚合点,为有效聚合点,包括:若确定所述时间段内所述聚合点出现时间大于第一阈值,则确定所述时间段为有效时间段;若确定有效时间段出现的次数大于第二阈值,且所述有效时间段的时间跨度大于第三阈值,则确定对应的聚合点为有效聚合点。
在其他可选的实施方式中,所述获取预设时长内用户的定位数据,包括:获取预设时长内用户终端上应用程序的日志数据;根据所述日志数据确定用户的定位数据。
在其他可选的实施方式中,所述对所述用户的定位数据进行空间聚合处理,包括:对所述用户的定位数据,进行预设时间粒度的抽稀处理;对抽稀处理后的用户的定位数据,进行空间聚合处理。
在其他可选的实施方式中,所述用户的定位数据包括用户在不同时间的位置点集合;所述对所述用户的定位数据进行空间聚合处理,包括:对所述位置点集合进行预设距离的空间聚合处理,生成聚合点;相应的,所述根据所述有效聚合点,定位并输出用户职住地信息,包括:根据所述预设距离还原所述有效聚合点对应的位置点集合;确定所述有效聚合点对应的位置点集合中出现次数最多的位置点,为用户职住地信息。
在其他可选的实施方式中,所述获取预设时长内用户的定位数据之后,还包括:将所述用户的定位数据分割为日间定位数据和夜间定位数据;所述对所述用户的定位数据进行空间聚合处理,生成聚合点,所述聚合点具有聚合点出现时间,包括:对用户的日间定位数据进行空间聚合处理,生成日间聚合点,所述日间聚合点具有日间聚合点出现时间;对用户的夜间定位数据进行空间聚合处理,生成夜间聚合点,所述夜间聚合点具有夜间聚合点出现时间;所述确定所述聚合点出现时间符合预设时间条件的聚合点,为有效聚合点,包括:确定所述日间聚合点出现时间符合预设时间条件的日间聚合点。为有效日间聚合点;确定所述夜间聚合点出现时间符合预设时间条件的夜间聚合点,为有效夜间聚合点;所述根据所述有效聚合点,定位并输出用户职住地信息,包括:根据所述有效日间聚合点,定位并输出用户工作地信息;根据所述有效夜间聚合点,定位并输出用户居住地信息。
在其他可选的实施方式中,若获取多个用户的定位数据,所述方法还包括:采用分布式计算模型对所述多个用户的定位数据进行处理以获取多个用户职住地信息。
第二方面,本发明提供一种用户职住地的定位装置,包括:获取模块,用于获取预设时长内用户的定位数据,所述定位数据用于指示所述用户在不同时间所处的位置;聚合模块,用于对所述用户的定位数据进行空间聚合处理,生成聚合点,所述聚合点具有聚合点出现时间;确定模块,用于确定所述聚合点出现时间符合预设时间条件的聚合点,为有效聚合点;输出模块,用于根据所述有效聚合点,定位并输出用户职住地信息。
第三方面,本发明提供一种控制设备,包括:至少一个处理器和存储器;所述存储器存储计算机执行指令;所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如前任一项所述的用户职住地的定位方法。
第四方面,本发明提供一种可读存储介质,所述可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如前任一项所述的用户职住地的定位方法。
本发明提供的用户职住地的定位方法、装置、控制设备及存储介质,通过获取预设时长内用户的定位数据,所述定位数据用于指示所述用户在不同时间所处的位置;对所述用户的定位数据进行空间聚合处理,生成聚合点,所述聚合点具有聚合点出现时间;确定所述聚合点出现时间符合预设时间条件的聚合点,为有效聚合点;根据所述有效聚合点,定位并输出用户职住地信息;即本发明从空间和时间两个维度上对用户的定位数据的进行分析,从而定位出更精确的用户职住地的分布情况。
附图说明
图1为本发明所基于的一种网络架构的示意图;
图2为本发明提供的一种用户职住地的定位方法的流程示意图;
图3为本发明提供的另一种用户职住地的定位方法的流程示意图;
图4为本发明提供的再一种用户职住地的定位方法的流程示意图;
图5为本发明提供的一种用户职住地的定位方法流程框图;
图6为本发明提供的一种用户职住地的定位装置的结构示意图;
图7为本发明提供的一种控制设备的硬件结构示意图。
具体实施方式
为使本发明示例的目的、技术方案和优点更加清楚,下面将结合本发明示例中的附图,对本发明示例中的技术方案进行清楚、完整地描述。
有效获取城市居民的职住地分布情况,对城市和交通规划具有重要的参考价值。
现有技术中,大都采用传统聚类算法,例如基于密度的带有噪声的空间聚类(Density-Based Spatial Clustering of Applications with Noise,简称DBACAN)算法对获取的用户定位数据进行空间聚类分析,进而获取用户的职住地分布情况。但是,用户定位数据具有独特的时空特性,而传统聚类算法忽略了用户定位数据的时间特性,导致最终获取的用户职住地信息可能存在偏差,进而所定位出的用户职住地与实际的用户职住地之间误差较大,定位精度较差。
针对上述问题,本发明的技术构思在于,从空间和时间两个维度对用户的定位数据进行分析,获取到同时满足空间上密度高和时间上频次高条件的聚合点,进而定位出更精确的用户的职住地信息。
图1为本发明所基于的一种网络架构的示意图,如图1所示,本发明基于的其中一种网络架构可包括若干个终端1和服务端2,其中,若干个终端1上报定位数据至服务端2,服务端2接收到定位数据后,执行下述各实施方式中所述的方法,以获取用户的职住地的分布情况。
需要说明的是,终端1可以为手机、平板电脑、车载终端等具有定位功能的终端。
第一方面,本发明示例提供了一种用户职住地的定位方法,图2为本发明提供的一种用户职住地的定位方法的流程示意图。
如图2所示,该用户职住地的定位方法包括:
步骤101、获取预设时长内用户的定位数据。
其中,所述定位数据用于指示所述用户在不同时间所处的位置。
具体来说,可以获取预设时长的手机信令数据、手机应用程序数据等,然后根据手机信令数据、手机应用程序数据等确定用户的定位数据。其中,为了保证定位数据的有效性,可选的,预设时长可以为以当前时间为起点向前的预设时长,例如一个月、一个季度或者一年等;用户的数量可以为多个,本实施例对此不作限定。
可选的,用户的定位数据可以包括多条数据记录,每条数据记录包括:用户标识、时间和位置,其中,用户标识、时间和位置一一对应,描述了用户在不同时间所处的位置。用户标识用于唯一区分不同的用户,本实施例对于用户标识的实现方式不做限定,例如,用户标识可以为用户的身份证号码,或者是姓名加上身份证号码等。
步骤102、对所述用户的定位数据进行空间聚合处理,生成聚合点,所述聚合点具有聚合点出现时间。
具体来说,可以利用聚类算法对用户的定位数据进行空间聚合处理,从而生成多个聚合点,并获取每个聚合点对应的出现时间。需要说明的是,本实施例对聚类算法的类型不作限定,可选的,聚类算法可以为DBSCAN算法。
步骤103、确定所述聚合点出现时间符合预设时间条件的聚合点,为有效聚合点。
具体来说,每个用户可能有多个聚合点,只有符合预设时间条件的聚合点才能作为有效聚合点。
可选的,所述预设时长包括多个相同的时间段,步骤103中确定所述聚合点出现时间符合预设时间条件的聚合点为有效聚合点,包括:若确定所述时间段内所述聚合点出现时间大于第一阈值,则确定所述时间段为有效时间段;若确定有效时间段出现的次数大于第二阈值,且所述有效时间段的时间跨度大于第三阈值,则确定对应的聚合点为有效聚合点。
具体来说,根据大部分用户的作息习惯,可知用户在工作地和居住地出现的时间频次高且相对稳定,但也不排除用户可能存在出差等特殊情况,为了减小用户出差等特殊情况对定位用户职住地的干扰,在本示例中,对聚合点在时间频次上进行限定,以获取到有效的聚合点。
举例来说,假设获取用户的90天的定位数据,首先可以根据DBSCAN算法获取该用户的多个聚合点,并记录这多个聚合点对应的聚合点出现时间,然后将这90天的时间可以平均划分为90个时间段,即以一天的时间为一个时间段,然后确定每个聚合点在当天出现次数所覆盖的时间(小时数)是否大于第一阈值(如3小时),若大于第一阈值,则视为一个有效天,然后判断有效天出现的天数是否大于第二阈值(如7天),并且判断有效天的时间跨度是否大于第三阈值(如15天),若是,则确定该聚合点为一个有效聚合点。
假设用户到外地出差2天,在利用本实施例方法中,首先通过空间聚合处理可以获取到对应出差地的聚合点,但出差地不是用户的职住地,所以需要将该出差地对应的聚合点筛选出来,此时可以通过预设时间条件进行筛选,判断用户在出差地的一天的停留时长是否大于第一阈值,若是,则可以确定为一个有效天,然后可以确定对应出差地的聚合点出现有效天为2天,显然是小于第二阈值(如7天)的,因不满足预设时间条件,则可以确定该聚合点无效,不能作为用户职住地的分析依据。
又假设用户到外地连续出差10天,则可以确定有效天的天数为10天,但这些有效天的时间跨度为10天,小于第三阈值(15天),因不满足预设时间条件,则可以确定该聚合点无效,不能作为用户职住地的分析依据。
另外,用户可能有多个工作地和多个居住地。优选的,可以分别统计符合预设时间条件的聚合点出现的有效天的天数,并且进行降序排列。若在白天时间段,排序第一的聚合点对应用户的第一工作地点,排序第二的聚合点对应用户的第二工作地点,依次类推等;同样的,在夜晚时间段,排序第一的聚合点对应用户的第一居住地,排序第二的聚合点对应用户的第二居住地,依次类推等。
步骤104、根据所述有效聚合点,定位并输出用户职住地信息。
具体来说,有效聚合点对应的位置,可以定位为用户的职住地,并输出用户的职住地,优选的,还可将用户职住地的分布情况可视化显示在地图上,便于工作人员直观了解用户职住地分布情况,进而对城市和交通规划做出合理规划。
作为可选示例,所述用户的定位数据包括用户在不同时间的位置点集合;步骤102中对所述用户的定位数据进行空间聚合处理,包括:对所述位置点集合进行预设距离的空间聚合处理,生成聚合点;相应的,步骤104中根据所述有效聚合点,定位并输出用户职住地信息,包括:根据所述预设距离还原所述有效聚合点对应的位置点集合;确定所述有效聚合点对应的位置点集合中出现次数最多的位置点,为用户职住地信息。
具体来说,用户的定位数据可以表示为用户在不同时间的位置点集合,例[ID,time,location]表示,其中,ID表示用户标识,time表示时间,location表示位置点,可以为地理坐标等。将位置点集合中各位置点按照预设距离L进行空间聚合,即将在预设距离L范围之内的各位置点聚合到同一地点,称为聚合点,其中,考虑到用户在居住地或工作地周围正常的活动范围,可以对预设距离L设置一个合适的数值,如100米等,在进行空间聚合处理后,每个用户都可能对应有若干个聚合点,可以根据预设时间条件筛选出有效聚合点,并由步骤102的空间聚合处理过程可知,聚合点并非是用户真正的职住地,因此,为了提高所获取的用户职住地的精确性,在步骤104中,需要根据步骤102中的空间聚合的处理过程还原出位置点集合,并将对应该有效聚合点的位置点集合中,出现次数最多的位置点作为用户职住地。
本发明实施例提供的用户职住地的定位方法,通过获取预设时长内用户的定位数据,所述定位数据用于指示所述用户在不同时间所处的位置;对所述用户的定位数据进行空间聚合处理,生成聚合点,所述聚合点具有聚合点出现时间;确定所述聚合点出现时间符合预设时间条件的聚合点,为有效聚合点;根据所述有效聚合点,定位并输出用户职住地信息;即本发明实施例从空间和时间两个维度上对用户的定位数据进行分析,获取到同时满足空间上密度高和时间上频次高条件的聚合点,进而定位出用户的职住地信息,提高了所获取用户职住地的精确性。
结合前述的各实现方式,图3为本发明提供的另一种用户职住地的定位方法的流程示意图,如图3所示,该用户职住地的定位方法包括:
步骤201、获取预设时长内用户终端上应用程序的日志数据。
步骤202、根据所述日志数据确定用户的定位数据。
其中,所述定位数据用于指示所述用户在不同时间所处的位置。
步骤203、对所述用户的定位数据进行空间聚合处理,生成聚合点,所述聚合点具有聚合点出现时间。
步骤204、确定所述聚合点出现时间符合预设时间条件的聚合点,为有效聚合点。
步骤205、根据所述有效聚合点,定位并输出用户职住地信息。
本实施方式中的步骤203、步骤204以及步骤205分别与前述实施方式中的步骤102、步骤103以及步骤104的实现方式类似,在此不进行赘述。
与前述实施方式不同的是,为了获取更精确的用户职住地分布情况,在本实施例中,获取预设时长内用户终端上应用程序(Application,简称App)的日志数据;根据所述日志数据确定用户的定位数据。
通常来说,定位数据的来源有很多种方式,比如手机信令数据、手机应用程序数据等,但手机信令数据的定位依赖于电信运营商的基站的密度,定位误差通常在几十米至几千米不等,误差较大,导致最终获取的用户职住地的精确性不高。因此,为了获取更精确的用户职住地信息,本实施例中限定了通过获取用户终端上所安装的应用程序App的日志数据,根据日志数据确定用户的定位数据。
具体来说,在用户所持的移动终端上安装了多个App,这多个App可以根据移动终端开启的全球定位***(Global Positioning System,简称GPS)定位和无线局域网(Wireless Fidelity,简称WiFi)定位,获取到移动终端所处的位置信息,并记录在App的日志数据中,从而可以根据日志数据确定用户的定位数据。需要说明的是,通过GPS定位和WiFi定位出的位置误差较小,仅在几米至几十米,也就是说,通过手机App数据可以获取到更精确的定位数据,进而可以定位到更精确的用户职住地信息。
另外,日志数据中通常包含用户的隐私数据,因此,为了提高用户的隐私安全,优选的,对日志数据进行脱敏处理。
可选的,步骤203中对所述用户的定位数据进行空间聚合处理,包括:对所述用户的定位数据,进行预设时间粒度的抽稀处理;对抽稀处理后的用户的定位数据,进行空间聚合处理。
具体来说,并不是在每个时间段都可以获取到App的定位数据,例如用户在上班前或下班后,会打开地图导航App,在其他时间可能并不会运行地图导航App,也就是说,获取的App定位数据在时间上的分布并不是均匀的,分布不均匀就有可能导致最终获得的用户职住地存在偏差,因此,为了减小偏差,在本实施例中,对定位数据在时间上的密度上做了统一处理,即在预设粒度时间(如分钟级别)上进行了抽稀处理,使定位数据在时间上的密度差别在一定范围内,如每分钟内单个用户终端的定位次数不大于一次。然后对抽稀处理后的定位数据进行空间聚合、预设时间条件判断等处理,最终定位出更精确的用户职住地。
在前述示例的基础上,通过对所述用户的定位数据,进行预设时间粒度的抽稀处理;对抽稀处理后的用户的定位数据进行空间聚合处理,即通过对定位数据的抽稀处理,降低了定位数据在时间上分布均匀造成的结果偏差,提高了定位用户职住地信息的精确性。
结合前述的各实现方式,图4为本发明提供的再一种用户职住地的定位方法的流程示意图,如图4所示,该用户职住地的定位方法包括:
步骤301、获取预设时长内用户的定位数据。
其中,所述定位数据用于指示所述用户在不同时间所处的位置。
步骤302、将所述用户的定位数据分割为日间定位数据和夜间定位数据。
针对日间定位数据,执行步骤303-305;针对夜间定位数据,执行步骤306-308。
步骤303、对用户的日间定位数据进行空间聚合处理,生成日间聚合点,所述日间聚合点具有日间聚合点出现时间。
步骤304、确定所述日间聚合点出现时间符合预设时间条件的日间聚合点,为有效日间聚合点。
步骤305、根据所述有效日间聚合点,定位并输出用户工作地信息。结束。
步骤306、对用户的夜间定位数据进行空间聚合处理,生成夜间聚合点,所述夜间聚合点具有夜间聚合点出现时间。
步骤307、确定所述夜间聚合点出现时间符合预设时间条件的夜间聚合点,为有效夜间聚合点。
步骤308、根据所述有效夜间聚合点,定位并输出用户居住地信息。结束。
本实施方式中的步骤301与前述实施方式中的步骤201的实现方式类似,在此不进行赘述。
与前述实施方式不同的是,本实施方式限定了如何获取用户工作地和居住地的具体实现方式。在本实施方式中,通过将所述用户的定位数据分割为日间定位数据和夜间定位数据;针对日间定位数据,对用户的日间定位数据进行空间聚合处理,生成日间聚合点,所述日间聚合点具有日间聚合点出现时间;确定所述日间聚合点出现时间符合预设时间条件的日间聚合点为有效日间聚合点;根据所述有效日间聚合点,定位并输出用户工作地信息;针对夜间定位数据,对用户的夜间定位数据进行空间聚合处理,生成夜间聚合点,所述夜间聚合点具有夜间聚合点出现时间;确定所述夜间聚合点出现时间符合预设时间条件的夜间聚合点为有效夜间聚合点;根据所述有效夜间聚合点,定位并输出用户居住地信息。
具体来说,获取到预设时长的用户定位数据后,需要将用户定位数据划分为日间定位数据和夜间定位数据。例如,可以按照日间时间段(例如早上9点至下午5点)和夜间时间段(如晚上22点至次日早上7点)分别提取定位数据,得到日间定位数据和夜间定位数据。
下面以日间定位数据的处理为例进行说明:
首先,根据聚类算法对日间定位数据进行空间聚合处理,获取多个日间聚合点,日间聚合点具有对应的日间聚合点出现时间。
然后,判断每个日间聚合点的出现时间是否满足预设时间条件,具体来说,统计每个日间聚合点在一天出现的次数所覆盖的时间长度是否大于第一阈值(如3小时),若大于,确定为有效天,再判断有效天的天数是否大于第二阈值(如7天),且有效天的时间跨度是否大于第三阈值(如15天),若是,则确定该日间聚合点为有效日间聚合点。
最后,根据有效日间聚合点,定位并输出用户工作地信息。具体地,根据绝大部分的用户作息习惯,可知用户白天所在地为用户的工作地。
针对夜间定位数据,其处理过程与日间定位数据的处理过程类似,此处不再赘述。
作为可选的实施方式,若获取多个用户的定位数据,所述方法还包括:采用分布式计算模型对所述多个用户的定位数据进行处理以获取用户职住地信息。
具体来说,当需要获知大量用户的职住地分布情况时,需要获取大量用户的定位数据,定位数据量较大,通常在TB级别,数据记录的规模上千亿条,当面对上千亿条记录的数据量的处理时,单个计算机或者单个服务器的计算能力是远远不够的,因此,在单机上运行的算法也是无法适用的。因此,在本实施例中,采用分布式计算模型对用户的定位数据进行处理。具体地,可以基于分布式架构Hadoop或Spark的集群计算架构,可以将分组的定位数据发送到集群中的各个节点上,进行分布式计算,另外可以灵活增加计算节点,显著提升计算效率。
图5为本发明提供的一种用户职住地的定位方法流程框图,如图5所示,首先获取手机App定位数据;然后对App定位数据进行抽稀处理;然后按照用户标识将定位数据进行分组,例如分成n组;然后调用基于Spark框架下的分组算法,将分组后的定位数据发送到各个节点上,在每个节点上,对每组定位数据筛选出夜间定位数据和日间定位数据;然后对定位数据进行空间聚合,获取聚合点;然后对定位数据进行时间维度上的处理,筛选出有效聚合点;然后从有效聚合点中还原出原始定位点,最后汇聚各个节点的计算结果,将定位出的职住地保存到数据库中。其中,数据库中包括用户ID、第一工作地、第二工作地、第一居住地、第二居住地等字段。
在前述示例的基础上,通过将所述用户的定位数据分割为日间定位数据和夜间定位数据;对用户的日间定位数据进行空间聚合处理,生成日间聚合点,所述日间聚合点具有日间聚合点出现时间;对用户的夜间定位数据进行空间聚合处理,生成夜间聚合点,所述夜间聚合点具有夜间聚合点出现时间;确定所述日间聚合点出现时间符合预设时间条件的日间聚合点,为有效日间聚合点;确定所述夜间聚合点出现时间符合预设时间条件的夜间聚合点,为有效夜间聚合点;根据所述有效日间聚合点,定位并输出用户工作地信息;根据所述有效夜间聚合点,定位并输出用户居住地信息;即本发明实施例分别从空间和时间两个维度上对用户的日间定位数据和夜间定位数据进行分析,获取到同时满足空间上密度高和时间上频次高条件的日间聚合点和夜间聚合点,进而定位出更精确的用户的工作地和居住地信息。
第二方面,本发明示例提供了一种用户职住地的定位装置,图6为本发明提供的一种用户职住地的定位装置的结构示意图,如图6所示,该用户职住地的定位装置包括:
获取模块10,用于获取预设时长内用户的定位数据,所述定位数据用于指示所述用户在不同时间所处的位置;聚合模块20,用于对所述用户的定位数据进行空间聚合处理,生成聚合点,所述聚合点具有聚合点出现时间;确定模块30,用于确定所述聚合点出现时间符合预设时间条件的聚合点,为有效聚合点;输出模块40,用于根据所述有效聚合点,定位并输出用户职住地信息。
在其他可选的实施方式中,所述预设时长包括多个相同的时间段;所述确定模块30具体用于:若确定所述时间段内所述聚合点出现时间大于第一阈值,则确定所述时间段为有效时间段;若确定有效时间段出现的次数大于第二阈值,且所述有效时间段的时间跨度大于第三阈值,则确定对应的聚合点为有效聚合点。
在其他可选的实施方式中,所述获取模块10,具体用于:获取预设时长内用户终端上应用程序的日志数据;根据所述日志数据确定用户的定位数据。
在其他可选的实施方式中,所述聚合模块20具体用于:对所述用户的定位数据,进行预设时间粒度的抽稀处理;对抽稀处理后的用户的定位数据,进行空间聚合处理。
在其他可选的实施方式中,所述用户的定位数据包括用户在不同时间的位置点集合;所述聚合模块20具体用于:对所述位置点集合进行预设距离的空间聚合处理,生成聚合点;相应的,所述输出模块40具体用于:根据所述预设距离还原所述有效聚合点对应的位置点集合;确定所述有效聚合点对应的位置点集合中出现次数最多的位置点,为用户职住地信息。
在其他可选的实施方式中,所述装置还包括分组模块50,具体用于:将所述用户的定位数据分割为日间定位数据和夜间定位数据;所述聚合模块20,具体用于:对用户的日间定位数据进行空间聚合处理,生成日间聚合点,所述日间聚合点具有日间聚合点出现时间;或者对用户的夜间定位数据进行空间聚合处理,生成夜间聚合点,所述夜间聚合点具有夜间聚合点出现时间;所述确定模块30具体用于:确定所述日间聚合点出现时间符合预设时间条件的日间聚合点,为有效日间聚合点;确定所述夜间聚合点出现时间符合预设时间条件的夜间聚合点,为有效夜间聚合点;所述输出模块40具体用于:根据所述有效日间聚合点,定位并输出用户工作地信息;根据所述有效夜间聚合点,定位并输出用户居住地信息。
在其他可选的实施方式中,若获取多个用户的定位数据,所述分组模块50还用于:采用分布式计算模型对所述多个用户的定位数据进行处理以获取多个用户职住地信息。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的用户职住地的定位装置的具体工作过程以及相应的有益效果,可以参考前述方法示例中的对应过程,在此不再赘述。
本发明实施例提供的用户职住地的定位装置,通过获取模块获取预设时长内用户的定位数据,所述定位数据用于指示所述用户在不同时间所处的位置;聚合模块对所述用户的定位数据进行空间聚合处理,生成聚合点,所述聚合点具有聚合点出现时间;确定模块确定所述聚合点出现时间符合预设时间条件的聚合点为有效聚合点;输出模块根据所述有效聚合点,定位并输出用户职住地信息;即本发明示例从空间和时间两个维度上对用户的定位数据进行分析,获取到同时满足空间上密度高和时间上频次高条件的聚合点,进而确定用户的职住地信息,提高了获取用户职住地的精确性。
第三方面,本发明示例提供了一种控制设备,图7为本发明提供的一种控制设备的硬件结构示意图,如图7所示,包括:
至少一个处理器701和存储器702。
在具体实现过程中,至少一个处理器701执行所述存储器702存储的计算机执行指令,使得至少一个处理器701执行如上的用户职住地的定位方法,其中,处理器701、存储器702通过总线703连接。
处理器701的具体实现过程可参见上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
在上述的图7所示的实施例中,应理解,处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component Interconnect,PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
第四方面,本发明还提供了一种可读存储介质,所述可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上用户职住地的定位方法。
上述的可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。可读存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(Application Specific IntegratedCircuits,简称:ASIC)中。当然,处理器和可读存储介质也可以作为分立组件存在于设备中。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (9)

1.一种用户职住地的定位方法,其特征在于,包括:
获取预设时长内用户的定位数据,所述定位数据用于指示所述用户在不同时间所处的位置;
对所述用户的定位数据进行空间聚合处理,生成聚合点,所述聚合点具有聚合点出现时间;
确定所述聚合点出现时间符合预设时间条件的聚合点,为有效聚合点;
根据所述有效聚合点,定位并输出用户职住地信息;
所述预设时长包括多个相同的时间段;所述确定所述聚合点出现时间符合预设时间条件的聚合点,为有效聚合点,包括:
若确定所述时间段内所述聚合点出现时间大于第一阈值,则确定所述时间段为有效时间段;
若确定有效时间段出现的次数大于第二阈值,且所述有效时间段的时间跨度大于第三阈值,则确定对应的聚合点为有效聚合点。
2.根据权利要求1所述的方法,其特征在于,所述获取预设时长内用户的定位数据,包括:
获取预设时长内用户终端上应用程序的日志数据;
根据所述日志数据确定用户的定位数据。
3.根据权利要求2所述的方法,其特征在于,所述对所述用户的定位数据进行空间聚合处理,包括:
对所述用户的定位数据,进行预设时间粒度的抽稀处理;
对抽稀处理后的用户的定位数据,进行空间聚合处理。
4.根据权利要求1所述的方法,其特征在于,所述用户的定位数据包括用户在不同时间的位置点集合;所述对所述用户的定位数据进行空间聚合处理,包括:
对所述位置点集合进行预设距离的空间聚合处理,生成聚合点;
相应的,所述根据所述有效聚合点,定位并输出用户职住地信息,包括:
根据所述预设距离还原所述有效聚合点对应的位置点集合;
确定所述有效聚合点对应的位置点集合中出现次数最多的位置点,为用户职住地信息。
5.根据权利要求1所述的方法,其特征在于,所述获取预设时长内用户的定位数据之后,还包括:
将所述用户的定位数据分割为日间定位数据和夜间定位数据;
所述对所述用户的定位数据进行空间聚合处理,生成聚合点,所述聚合点具有聚合点出现时间,包括:
对用户的日间定位数据进行空间聚合处理,生成日间聚合点,所述日间聚合点具有日间聚合点出现时间;对用户的夜间定位数据进行空间聚合处理,生成夜间聚合点,所述夜间聚合点具有夜间聚合点出现时间;
所述确定所述聚合点出现时间符合预设时间条件的聚合点,为有效聚合点,包括:
确定所述日间聚合点出现时间符合预设时间条件的日间聚合点,为有效日间聚合点;确定所述夜间聚合点出现时间符合预设时间条件的夜间聚合点,为有效夜间聚合点;
所述根据所述有效聚合点,定位并输出用户职住地信息,包括:
根据所述有效日间聚合点,定位并输出用户工作地信息;根据所述有效夜间聚合点,定位并输出用户居住地信息。
6.根据权利要求1所述的方法,其特征在于,若获取多个用户的定位数据,所述方法还包括:
采用分布式计算模型对所述多个用户的定位数据进行处理以获取多个用户职住地信息。
7.一种用户职住地的定位装置,其特征在于,包括:
获取模块,用于获取预设时长内用户的定位数据,所述定位数据用于指示所述用户在不同时间所处的位置;
聚合模块,用于对所述用户的定位数据进行空间聚合处理,生成聚合点,所述聚合点具有聚合点出现时间;
确定模块,用于确定所述聚合点出现时间符合预设时间条件的聚合点,为有效聚合点;
输出模块,用于根据所述有效聚合点,定位并输出用户职住地信息;
所述预设时长包括多个相同的时间段;所述确定模块,具体用于若确定所述时间段内所述聚合点出现时间大于第一阈值,则确定所述时间段为有效时间段;若确定有效时间段出现的次数大于第二阈值,且所述有效时间段的时间跨度大于第三阈值,则确定对应的聚合点为有效聚合点。
8.一种控制设备,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1至6任一项所述的用户职住地的定位方法。
9.一种可读存储介质,其特征在于,所述可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1至6任一项所述的用户职住地的定位方法。
CN202010456537.4A 2020-05-26 2020-05-26 用户职住地的定位方法、装置、控制设备及存储介质 Active CN111797181B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010456537.4A CN111797181B (zh) 2020-05-26 2020-05-26 用户职住地的定位方法、装置、控制设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010456537.4A CN111797181B (zh) 2020-05-26 2020-05-26 用户职住地的定位方法、装置、控制设备及存储介质

Publications (2)

Publication Number Publication Date
CN111797181A CN111797181A (zh) 2020-10-20
CN111797181B true CN111797181B (zh) 2023-09-05

Family

ID=72805998

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010456537.4A Active CN111797181B (zh) 2020-05-26 2020-05-26 用户职住地的定位方法、装置、控制设备及存储介质

Country Status (1)

Country Link
CN (1) CN111797181B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112685659B (zh) * 2021-03-19 2021-06-18 上海钐昆网络科技有限公司 目标地点确定方法、装置、电子设备及计算机存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016033901A1 (zh) * 2014-09-02 2016-03-10 百度在线网络技术(北京)有限公司 一种确定移动用户的常驻点信息的方法和装置
WO2017119997A1 (en) * 2016-01-08 2017-07-13 Intuit Inc. Method and system for adjusting analytics model characteristics to reduce uncertainty in determining users' preferences for user experience options, to support providing personalized user experiences to users with a software system
CN107133318A (zh) * 2017-05-03 2017-09-05 北京市交通信息中心 一种基于手机信令数据的人口识别方法
CN107547633A (zh) * 2017-07-27 2018-01-05 腾讯科技(深圳)有限公司 一种用户常驻点的处理方法、装置和存储介质
CN110020221A (zh) * 2017-12-11 2019-07-16 腾讯科技(深圳)有限公司 职住分布确认方法、装置、服务器及计算机可读存储介质
WO2020052152A1 (zh) * 2018-09-13 2020-03-19 深圳壹账通智能科技有限公司 用户常驻地判断方法、装置、设备及计算机可读存储介质
CN111127065A (zh) * 2018-11-01 2020-05-08 百度在线网络技术(北京)有限公司 用户职住地的获取方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016033901A1 (zh) * 2014-09-02 2016-03-10 百度在线网络技术(北京)有限公司 一种确定移动用户的常驻点信息的方法和装置
WO2017119997A1 (en) * 2016-01-08 2017-07-13 Intuit Inc. Method and system for adjusting analytics model characteristics to reduce uncertainty in determining users' preferences for user experience options, to support providing personalized user experiences to users with a software system
CN107133318A (zh) * 2017-05-03 2017-09-05 北京市交通信息中心 一种基于手机信令数据的人口识别方法
CN107547633A (zh) * 2017-07-27 2018-01-05 腾讯科技(深圳)有限公司 一种用户常驻点的处理方法、装置和存储介质
CN110020221A (zh) * 2017-12-11 2019-07-16 腾讯科技(深圳)有限公司 职住分布确认方法、装置、服务器及计算机可读存储介质
WO2020052152A1 (zh) * 2018-09-13 2020-03-19 深圳壹账通智能科技有限公司 用户常驻地判断方法、装置、设备及计算机可读存储介质
CN111127065A (zh) * 2018-11-01 2020-05-08 百度在线网络技术(北京)有限公司 用户职住地的获取方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
人迹地图:数据增强设计的支持平台;茅明睿;储妍;张鹏英;沈忱;;上海城市规划(第03期);全文 *

Also Published As

Publication number Publication date
CN111797181A (zh) 2020-10-20

Similar Documents

Publication Publication Date Title
CN107844851B (zh) 查勘网格优化方法、电子设备及计算机可读存储介质
CN111212383B (zh) 区域常住人口数量的确定方法、装置、服务器和介质
CN103986782A (zh) 一种位置服务器和签到处理方法
CN111881243B (zh) 一种出租车轨迹热点区域分析方法及***
CN111311193B (zh) 公共服务资源的配置方法和装置
CN112364907A (zh) 待测用户常驻地普查方法、***、服务器和存储介质
CN111797181B (zh) 用户职住地的定位方法、装置、控制设备及存储介质
CN113704378A (zh) 一种伴随信息的确定方法、装置、设备及存储介质
CN114780556A (zh) 用于地图的更新频率确定方法及装置
CN108647735B (zh) 用户出行规律分析方法、装置、设备及存储介质
CN111800807A (zh) 一种基站用户数量告警的方法及装置
CN112488648A (zh) 一种管辖企业统计方法及相关组件
CN117056620A (zh) 一种基于职业信息处理业务的方法、装置、设备及介质
CN113076451B (zh) 异常行为识别和风险模型库的建立方法、装置及电子设备
CN116132283A (zh) 一种分布式数据采集方法、***、设备及存储介质
CN111242723B (zh) 用户子女情况判断方法、服务器及计算机可读存储介质
CN111611337B (zh) 终端数据处理***
CN111131393B (zh) 用户活跃度数据统计方法、电子装置及存储介质
CN113919873A (zh) 市场容量的确定方法、装置、设备及存储介质
CN112118592A (zh) 一种区域生成方法、装置、电子设备及存储介质
CN108074301B (zh) 一种交通卡的实名制方法及装置
CN111127065A (zh) 用户职住地的获取方法和装置
CN114936113B (zh) 一种任务雪崩恢复方法、装置、电子设备及存储介质
CN111275594A (zh) 一种区域安全等级的确定方法及装置
CN113347574B (zh) 一种确定常驻地的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant