CN106462627B - 根据多个位置数据报告分析语义地点和相关数据 - Google Patents

根据多个位置数据报告分析语义地点和相关数据 Download PDF

Info

Publication number
CN106462627B
CN106462627B CN201580031888.8A CN201580031888A CN106462627B CN 106462627 B CN106462627 B CN 106462627B CN 201580031888 A CN201580031888 A CN 201580031888A CN 106462627 B CN106462627 B CN 106462627B
Authority
CN
China
Prior art keywords
location
data
semantic
local
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580031888.8A
Other languages
English (en)
Other versions
CN106462627A (zh
Inventor
亚历山大·法布里坎特
阿米拉利·阿卜杜拉
埃里克·内森·韦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN106462627A publication Critical patent/CN106462627A/zh
Application granted granted Critical
Publication of CN106462627B publication Critical patent/CN106462627B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation
    • G06Q30/0205Location or geographical consideration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/025Services making use of location information using location based information parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/025Services making use of location information using location based information parameters
    • H04W4/026Services making use of location information using location based information parameters using orientation information, e.g. compass
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/025Services making use of location information using location based information parameters
    • H04W4/027Services making use of location information using location based information parameters using movement velocity, acceleration information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/80Services using short range communication, e.g. near-field communication [NFC], radio-frequency identification [RFID] or low energy communication

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Navigation (AREA)

Abstract

确定语义地点数据的计算机实施方法和***包括:从多个移动装置接收多个位置数据报告;将多个位置数据报告划分成局部片段;以及估计用于每个片段的地理区域桶。对于识别为满足潜在地理重叠特性描述的局部片段的聚类冠层计算重叠得分,该重叠得分与通过生成在这个给定聚类冠层中的局部片段的移动装置的运动所覆盖的实际地理区域之中的重叠相关。根据所确定的重叠得分生成提供在每个地理区域桶中的局部片段的层级聚类配置的数据结构。此外提供用于数据结构中的节点的附加语义数据。

Description

根据多个位置数据报告分析语义地点和相关数据
相关申请的交叉引用
本申请要求于2014年12月29日提交的名为“Determining Semantic PlaceBoundaries and Related Data from a Plurality of Location Reports”的美国临时专利申请No.62/097,423的优先权权益,出于一切目的通过引用将其全部内容合并于此。
技术领域
本公开一般涉及确定与有关于装置的地理位置的各种信号相关联的语义地点数据,尤其涉及根据多个位置数据报告分析语义地点和相关数据。
背景技术
当被授权识别移动装置用户的位置时,可以采用包括智能技术特征的移动装置。考虑到尊重用户隐私的愿望,通常只有用户对此给予同意时才确定移动装置位置。用户位置数据的任何授权共享都是安全和私密的,并且只有在给予额外同意的情况下才会共享。出于许多目的,以匿名方式配置与移动装置的位置相关联的用户身份,从而提供与特定位置相关的用户帮助和信息,而不需要用户特定信息。
当使用移动装置确定用户位置时,一些已知***首先利用来自移动装置的位置传感器(诸如全球定位***(GPS)输出、无线扫描输出、以及加速度计输出)来获得对用户物理位置的最佳已知估计(例如特定地理坐标)。然后可将这些地理坐标与已知地点(例如本地商家)的数据库进行比较,以推断用户最可能的语义位置(例如场所、家庭或商家的名称)。这些技术的准确性通常受位置传感器的质量和精度以及语义地点元数据的可用性和质量的限制。
发明内容
本公开的实施例的多个方面和优点将在以下描述中部分地阐述,或者可以从描述中获知,或者可以通过实施例的实践来获知。
本公开的一个示例方面旨在一种确定语义地点数据的计算机实施方法。该方法可包括通过一个或多个计算装置检查历史位置数据报告的多个时间序列以确定它们的重叠水平。该方法还可包括通过所述一个或多个计算装置将被确定为充分重叠的历史位置数据报告的所选择的时间序列聚组。该方法还可包括通过所述一个或多个计算装置分配位置分类器,所述位置分类器基于被确定为充分重叠的历史位置数据报告的所选择的时间序列的聚组来区分一个或多个位置实体。该方法还可包括通过所述一个或多个计算装置利用所分配的位置分类器来确定用于当前或历史位置数据报告的一个或多个时间序列的语义位置数据。
本公开的另一个示例方面旨在一种确定语义地点数据的计算机实施方法。该方法可包括通过一个或多个计算装置从多个移动装置接收多个位置数据报告。该方法还可包括通过所述一个或多个计算装置将所述多个位置数据报告划分成位置数据报告的局部片段。该方法还可包括通过所述一个或多个计算装置估计用于每个局部片段的地理区域桶。该方法还可包括通过所述一个或多个计算装置在每个地理区域桶内识别一个或多个聚类冠层,所述聚类冠层是满足潜在地理重叠特性描述的局部片段的群组。该方法还可包括通过所述一个或多个计算装置确定用于共享至少一个聚类冠层的每对局部片段的重叠得分。所述重叠得分可以与通过生成在这个给定对中的所述局部片段的移动装置的运动所覆盖的实际地理地区之中的重叠相关。该方法还可包括通过所述一个或多个计算装置生成提供在每个地理区域桶中的所述局部片段的聚类配置的数据结构。所述数据结构可以至少部分地根据所确定的重叠得分生成。该方法还可包括通过所述一个或多个计算装置至少部分地基于所生成的数据结构的聚类配置来确定用于一个或多个局部片段的语义地点数据。
本公开的其他示例方面旨在用于确定语义位置边界和其他相关数据的***、设备、有形、非暂时性计算机可读介质、用户接口、存储器装置和电子装置。
参考以下描述和所附权利要求,各种实施例的这些和其它特征、方面以及优点将变得更好理解。结合在本说明书中并构成其一部分的附图示出本公开的实施例,并与说明书一起用于解释相关原理。
附图说明
参照附图在说明书给出面向本领域普通技术人员的实施例的详细讨论,其中:
图1描绘根据本公开的示例方面,根据多个位置传感器时间序列确定的语义地点数据的示例方面的地理模型;
图2提供根据本公开的示例方面确定语义地点数据的示例方法的流程图;
图3描绘根据本公开的示例方面,根据从多个移动装置收集的位置数据报告的所估计的装置位置的图形表示;
图4描绘根据本公开的示例方面,估计用于不同局部片段的地理区域桶的图形表示;
图5提供根据本公开的示例方面,对于地理区域桶中的多对局部片段确定重叠得分的示例方法的流程图;
图6描绘根据本公开的示例方面,在给定地理区域桶内的多个局部片段的图形表示;
图7描绘根据本公开的示例方面,对于来自图6的局部片段的集合所生成的示例数据结构的图形表示;
图8提供至少部分地基于聚类分析来确定用于每个地理区域桶中的一个或多个局部片段的语义地点数据的示例方法的流程图;
图9提供根据本公开的示例方面,按照图6和图7的示例的示例语义地点标记和分类器训练的图形表示;
图10提供根据本公开的示例方面,与图6、图7和图9的示例一致的用于新的局部片段的查询模型分析的图形表示;
图11提供根据本公开的示例方面确定语义地点数据的示例方法的流程图;
图12提供根据本公开的示例方面确定语义地点数据的另一个示例方法的流程图;以及
图13提供根据本公开的示例方面,用于实施语义地点边界检测应用的***组件的示例概述。
具体实施方式
下面详细参考实施例,附图中示出它的一个或多个示例。通过实施例的说明来提供每个示例,不限制本公开。实际上,对于本领域技术人员而言显然,在不脱离本公开范围或精神的情况下,可以对实施例进行各种修改和变化。例如,作为一个实施例的一部分示出或描述的特征可以与另一个实施例一起使用,以产生又一个实施例。因此,希望本公开的方案涵盖这些修改和变化。
本公开的示例方面旨在用于根据位置数据报告分析语义地点和相关数据的***和方法。用于将语义地点信息与移动装置位置信号相关联的已知方法的准确性可能有限。在有些情况下,限制基于位置传感器的质量或资源消耗而出现。例如,与电池、天线尺寸以及移动硬件和操作***的架构相关的移动装置约束使得在很多情况下难以可靠地以足够高的精度计算用户的物理位置,从而精确定位语义地点。这种方法的准确性也可受语义地点元数据的可用性和质量的限制。例如,即使对用户的物理位置进行非常精确和一致的确定,语义地点识别***也需要关于物理世界中任何地方的语义地点的确切边界的完整、详细、一致的当前数据集。这种类型的综合数据库可能难以建立和一致维护。
所公开的根据本公开方案的实施例可以提供位置感知技术特征,其生成与用户的位置相关联的有用且更准确的语义地点数据(例如,用户所在场所的名称;单个场所的相干子集或者在单次访问中一个人经常穿过的多个场所的集合;用户是处在多样化的移动人口所生活的空间中,还是处在与人的少数固定集合共享的私有空间中)。基于新的位置数据报告信息,更准确的语义地点数据(包括响应于查询数据的语义地点模型和/或语义地点分类器模型)可以导致对语义地点元数据的改进生成以及对用户的语义地点位置的更准确地预测。通过提供确定这种基于位置的信息的更强健的***和方法,并通过提高这种信息的准确性,可以对基于位置的技术(诸如受场境影响的服务、广告投放、以及广告效果跟踪)进行对应的改进。这些改进可用于各种技术实体,包括移动平台设计者和制造商、位置感知移动应用的创建者和电信提供商。
示例实施例可包括确定语义地点数据的计算机实施***和方法,包括作为对语义地点关联的自动和动态学习的一部分采用的聚类技术。可以按照位置数据报告的大型语料库的形式(例如位置传感器报告时间序列)从大量不同的移动装置提供对于该计算机实施技术的示例输入。该位置数据报告信息可以选择性地包括各种特定数据,包括但不限于:用户和/或移动装置标识符(ID);时间戳;原始位置传感器读数,其通常允许对到零的距离或者其近似位置已知的更多“信标”的距离的估计;物理位置估计;和/或物理位置误差模型。信标可包括Wi-Fi接入点、GPS卫星、小区塔和/或蓝牙发射机。在位置数据报告对应于Wi-Fi扫描的大型集的示例中,原始位置传感器读数可包括用于装置观察的接入点的标识符和/或Wi-Fi信号强度读数和/或接入点频率以及信道数据。物理位置估计可以来自GPS、小区塔三角测量、基于Wi-Fi的地理定位、加速度计或基于陀螺仪的航位推算、气压计读数和/或其他基于位置的输入数据。
在一些实施例中,为了获得本文所述技术的好处,可以要求用户允许收集和分析与用户或装置相关联的位置信息。例如在一些实施例中,可以向用户提供机会,以控制程序或特征是否收集这样的信息。如果用户不允许收集和使用这样的信号,则用户可能不会收到本文所述技术的好处。此外,可以向用户提供工具,以撤消或修改同意。另外,在存储或使用某些信息或数据之前,可通过一种或多种方式来处理它们,从而移除个人可识别信息。例如可将所公开技术的实施例配置为通过移除移动装置或用户的标识符来加强用户隐私。在有些情况下,可以用有损装置指示符替换装置和/或用户标识符,该有损装置指示符可将大量装置或用户合并为单个标识符。
根据从不同移动装置接收的位置数据报告的集,可通过将位置数据报告划分为不同的时间序列片段来创建位置数据报告的局部片段,在该时间序列片段期间移动装置停留在给定的局部地区内。然后可将局部片段表征为属于一个或多个地理区域桶。这些地理区域桶可以对应于以有意义的分布方式划分地球表面的球体、矩形、或其他多边形。例如可将城市的地理界限分类为地理区域桶的矩形网格。然后可将每个局部片段估计为属于这些地理区域桶中的一个或多个。在一些示例中,该估计涉及确定在每个局部片段的时隙内的用户的中值估计物理位置,并将该中值位置舍入到预定地理区域桶中的一个或多个。在有些情况下,可将用户或移动装置的给定局部片段估计为属于一个以上地理区域桶。
一旦将所有局部片段估计到相应地理区域桶中,就为每个区域桶实施各种处理特征。最初,在每个地理区域桶中,可以识别一个或多个聚类冠层(canopy),其中聚类冠层构成满足潜在地理重叠特性描述的给定区域桶中的局部片段的群组。在一个示例中,为在地理区域桶中观察到的不同的单个信标标识符(诸如Wi-Fi接入点BSSID)定义聚类冠层。在一些实施方式中,这种聚类冠层将包含所有局部片段,所述局部片段至少包含阈值数量的位置数据报告或者阈值部分的位置数据报告,所述位置数据报告指示给定信标标识符被观察到,或者被观察到在阈值信号强度以上或者在一定距离估计以内。
在给定的地理区域桶中,共享至少一个聚类冠层的多对局部片段然后有资格进行重叠评分。重叠得分与由在给定对或聚组的局部片段中生成局部片段的移动装置的运动所覆盖的实际地理区域之中的重叠相关。可将由移动装置的运动覆盖的区域定义为以下区域中的一个或组合:装置位置的凸包、排除离群者位置的装置位置的凸包、在装置位置处内核(kernel)函数的总和。然后,将所得的用于适格的多对局部片段的重叠得分的集合用于生成提供每个地理区域桶中的局部片段的层级聚类的数据结构。在一些示例中,所生成的数据结构是森林数据结构,其树叶对应于局部片段。在一些示例中,采用一个或多个处理算法(诸如冠层层级凝聚聚类(HAC)算法)来生成数据结构。在一些示例中,HAC算法使用链接融合启发法(linkage merging heuristic)。在一些示例中,所使用的链接融合启发法是平均链接融合。
一旦将聚类技术用于在数据结构中将不同局部片段关联在一起,所公开的技术的附加方案涉及语义地点数据到所选择的相关片段的对应确定。在所生成的数据结构中,可将用于每个地理区域桶中的一个或多个局部片段的各种类型的语义地点数据与层次聚类配置中的一个或多个节点相关联。在一个示例中,可将与语义地点数据相关联的一个或多个局部片段用于至少部分地基于数据结构将数据结构中的其他节点与一个或多个给定片段的语义地点数据相关联。在一些示例中,语义地点数据可以是场所的标识符。在其他示例中,语义地点数据可以是与估计的可能性或得分配对的可能场所的一个或多个标识符。在另外的示例中,语义地点数据可包括与语义地点相关联的用户人口统计数据、地点的受欢迎度水平、与关联位置实体相关的用户或其他实体、与关联位置实体相关的预测用户信息、或者与关联位置实体相关的其他有用信息。
在一些示例中,响应于包含位置数据报告、一个或多个位置数据报告的群组、或者来自给定装置的局部片段的查询,可将数据结构及其相关联的语义地点标签用于生成对给定装置在其收集查询数据时的语义地点数据的预测。在一个示例中,查询可包含查询装置的当前位置数据报告。在另一个示例中,查询可包含两个或以上最近记录的位置数据报告或当前局部片段。在另外的示例中,查询可包含装置在过去记录的多个位置报告或局部片段。
在其他示例中,可以利用森林数据结构中的最大尺寸或稀疏度的一个或多个边或图形切割以根据出现在边或图形切割两侧的位置数据报告的统计特性来限定语义地点边,来创建地理模型界。在一些示例中,可将由边或图形切割分离的报告群组的估计物理位置用于生成各种语义地点位置的估计的感测地理边界。
本公开的另外的应用可以为了不同的目的使用局部片段聚类结果。
根据示例实施例,移动装置用户提供关于其位置的历史或当前信息,包括具有以下一个或多个的一个或多个位置数据报告:时间戳、估计的物理位置、以及语义地点标签。这些位置数据报告以及关于对应于来自用户的位置数据报告的邻近位置的语义地点元数据的可选信息与所公开的语义地点边界检测技术结合使用,以生成聚类数据结构以及提供更高精度的不同地理地区中语义位置关联的相关模型。然后可将所得到的数据结构和相关模型用于将来的基于位置的应用。例如,下一次移动装置用户生成具有特定坐标的位置数据报告时,可以以更高置信度将与这些坐标或其他相关语义位置数据相关联的预测语义地点位置呈现给用户,或者可将其用于生成具有更高水平的适当场境的相关的基于位置的信息。
所公开的技术的一些方案涉及可以有助于地图或其他基于位置的技术的对位置信息的估计、确定和生成。为此,图1和本文其它附图示出所公开的技术相对于地图界面的方案。应当理解,所公开的实施例不限于地图应用,并且可以扩展到诸如受场境影响的服务、广告投放、以及有效性跟踪等等应用。
更具体地参考图1,示例地理模型100包括电子生成的图形地图界面102的截取部分。图1和本文其它附图的图形地图界面102可以仅图示出所公开的技术的实施例可访问的全局地图界面的整体的一部分。图形地图界面102可以提供在选择的时间段内从多个移动装置接收的多个用户位置中包含的或从中推断的近似物理位置的图形描绘。例如,一个或多个路线(例如,分别为路线104-132)对应于多个移动装置用户在选择的时间段(例如,2014年4月1日至2014年6月30日)期间穿过的地理位置。可将多个用户采取的路线104-132覆盖在示出用户所穿过的对应地理地区的地图上。一些用户在选择的时间段期间穿过更大的距离,例如与路线104、112、114、以及132相关联的用户。其他用户在选择的时间段期间更加静止或穿过更短的距离。
在其他示例中,地理地图界面102可以以点或其他图标的形式图示出在位置数据报告中包含的或从位置数据报告中推断的近似物理位置,所述点或其他图标表示在时间上周期性地获得的用户位置的特定快照,而不是分别利用路线104-132所示的连续时间位置跟踪在所接收的位置数据报告之间内插。例如,不是显示每个移动装置用户位置的连续路线,而是可以图示出单个图标或标记,例如以每隔预定秒数或分钟数的间隔示出用户位置。不管在地图上图示出位置数据报告的不同方式,位置数据报告通常可以提供时间以及关于装置位置的信息。例如,包括在每个位置数据报告中的位置可包括对装置坐标(例如纬度、经度和/或海拔)的估计、对装置坐标中的误差的估计或模型、指示一个或多个信标装置(诸如Wi-Fi接入点、GPS卫星、小区塔、或蓝牙发射机)的身份以及到一个或多个信标装置的估计距离的原始信号、IP地址信息、地理代码、或者识别特定位置或者与特定位置相关联的其它信息。
仍然参考图1,根据所公开的实施例进行的分析有助于将位置数据报告聚组成局部片段。如下文更详细描述的,可将聚类算法用于生成用于基于局部片段的每个地理区域桶的数据结构,并且可用于创建分类器,用于语义地点之间有意义的边界或聚组。一个示例实施例利用由聚类算法从一个或多个输入局部片段产生的数据结构以及用于一个或多个输入局部片段的语义地点数据,将输入局部片段大致分离成从访问给定语义地点的装置接收的那些片段以及从不访问给定语义地点的装置接收的那些片段。这种分类连同局部片段的位置数据报告的估计物理位置可用于生成语义地点的预测边界。
例如,考虑图1中的路线106、108和110的集群,如果知道已经从名为“LusciousLattes(香甜拿铁)”的咖啡店接收路线中的一个或多个,则通过所公开的实施例创建的聚类数据结构可以允许我们将所有这样的路线标记为从Luscious Lattes接收,并将所有其他路线标记为并非从Luscious Lattes接收。咖啡店140的确切边界可能不知道。但是,所公开的实施例可以生成用于Luscious Lattes的地理边界估计142以及响应于新的位置数据报告或局部片段而产生该新的位置数据报告或局部片段是从Luscious Lattes接收的概率的分类器。随着时间并考虑越来越多的位置数据报告,可以预期边界估计142在精度和覆盖范围方面增加,使得边界估计142最终接近由Luscious Lattes的访客穿过的物理空间的实际边界140包围的相同地区。
图1中的另一示例相对于具有实际边界146的室外地标——中央公园而示出。相对于路线113、116、118、120、122、124、126、128和130,根据所公开技术的分析可以生成示例边界估计144,示例边界估计144可以用作中央公园的边界的近似。在另一个示例中,可以独立地考虑所生成的边界估计144或者用于新的位置数据报告或局部片段的对应分类器模型,以定义用户在单次访问中频繁穿过的语义地点。例如,这可以对应于公园的可公共访问的子集,或者对应于特定受欢迎地区,或者最适合于匹配一个或多个人口统计或消费心态学特性的用户的公园的子集(诸如狗狗公园)。然后,所公开的实施例可以与对应于边界估计144的模型一起使用,以响应于一个或多个位置数据报告或者从给定用户接收的局部片段来建立给定用户是否事实上是狗的主人。
因为各种原因,如图1的示例所示并且相对于一些公开的实施例所讨论的边界估计的生成可以是有帮助的。即使在知道给定语义地点(例如Luscious Lattes)的一般地址或地理坐标时,可能也不知道建筑物外部、建筑物内部、或者容纳商家的建筑物内部、住宅、地标或其他位置的子集的范围。即使知道场所的轮廓,用户可以在其中操作其移动装置的内部边界也可以与场所的外部或内部界限显著不同。对于室外位置,诸如图1所示的中央公园,定义产权地区的调查边界146可能与用户通常操作移动装置的实际可导航地区完全不同。这可能是由于封锁的地区、由于水特征而不可导航的地形、岩石作物、围栏或者其他自然或人为的障碍物。
此外,通过所公开的实施例推断的语义边界可能不对应于定义明确的POI边界,而是对应于用户行为模式,诸如狗狗公园与运动场之间的分离、或者大型商店的两个部门之间的分离。表征移动装置的用户频繁穿过的地点的语义地点边界的几何边界估计和/或原始信号分类器有益于进行关于与当前、未来或过去的位置数据报告和/或局部片段相关联的语义位置的未来预测,并用于得出关于报告装置用户的行为或人口统计或消费心态学特性的其他语义推断。
图2提供根据本公开的示例方面确定语义地点数据的示例方法200的流程图。从多个移动装置接收多个位置数据报告(202)。在一些示例中,可通过分析来自移动装置的更大集的更大数量的位置数据报告(例如通过在更大的时间跨度上收集位置数据报告)来进行更全面的分析。位置数据报告通常可以对应于提供与在移动装置用户的固定时间和位置处建立移动装置用户的位置相关的信息的数据。特定位置数据报告可包括以下中的一个或多个:移动装置标识符;用户标识符;时间戳;估计的物理位置;物理位置的可能误差的模型;一个或多个原始位置传感器读数,针对一个或多个信标装置(诸如Wi-Fi接入点、GPS卫星、小区塔、或蓝牙发射机)中的每个装置指示信标的身份以及允许估计信标与移动装置之间的距离的度量;其他原始传感器读数(诸如加速度计、陀螺仪、气压计、磁力计);关于装置的语义位置的信息(如果已知);和/或语义位置的置信度的测度。
在一些示例中,所使用的信标是Wi-Fi接入点,其具有用于估计到接入点的距离的Wi-Fi接收信号强度指示符(RSSI)。然后可以获得位置数据报告,作为从地理区域桶收集的Wi-Fi扫描时间序列的大型集。例如,在这种时间序列报告的集中的每个条目可以包括对于每个移动装置可见的无线接入点的一个或多个接入点标识符。特定标识符可包括Wi-Fi接入点基本服务集标识符(BSSID),其对应于该无线接入点的媒体接入控制(MAC)地址。对于每个报告的BSSID,报告还可包括对应的信号强度读数,例如接收信号强度指示符(RSSI)值,时间戳,以及选择性地,由其生成报告的装置或用户的标识符。
再参考图2,然后将多个接收的位置数据报告划分成多个局部片段(204)。每个局部片段通常可以对应于特定移动装置保持大致静止的时间序列。在一些示例中,开始时间和结束时间可以与每个局部片段相关联。例如,每个局部片段的开始时间可以是与包括在这种片段中的任何位置数据报告相关联的最早时间。同样,每个局部片段的结束时间可以是与包括在这种片段中的任何位置数据报告相关联的最晚时间。在一些示例中,如果片段的结束时间减去片段的开始时间不大于阈值(例如十分钟),则可以丢弃或者忽略这种片段。在一些示例中,当用户的位置传感器读数指示用户比步行明显更快地行进时,可通过时间来界定片段,使得例如从用户正在驾驶时的位置数据报告将局部片段定界,并且该位置数据报告自己不作为用于确定语义地点数据的所公开的***和方法的一部分而被分析。在一些示例中,可通过用户离开地区并且在一定时间量内不返回的时间来界定片段。在一些示例中,当用户的装置在某个数量的连续Wi-Fi扫描内没有观察到某个BSSID或其他无线接入点的任何信号时,可通过时间来界定片段。
在(204)可以使用任何数量的已知位置时间序列分割算法来实施划分。图3中描绘了划分(204)的示例,其提供从多个移动装置收集的位置数据报告信息的示例性图形表示400。具体而言,图形表示400描绘分别对应于由多个位置数据报告表示的多个位置的多个标记(例如标记404)。因此,每个标记对应于从与用户相关联的装置接收的位置数据报告中包括的物理位置估计。虽然图3和其他附图仅指示用于每个位置数据报告的单个点位置,但是要将其理解为不限制通过所公开的实施例接收的位置数据报告中可包含的信息的种类。
仍参考图3,可将多个标记分割成多个局部片段,诸如例如局部片段406、408、412和414。每个片段可包括多个位置数据报告中的一个或多个。作为示例,局部片段408包括多个位置数据报告,从附图可以看出,其对应于在公园410中行走的用户。应当理解,划分(204)可将位置数据报告组合成单个片段,即使并非所有位置数据报告都具有相同的估计物理位置。部分地基于以下中的一个或多个,可通过划分或分割算法将片段408中包括的位置数据报告聚组在一起:对于每个报告与站立或行走而不是驾驶相对应的用户活动或速度的识别、缺乏从一个位置到另一个位置的总体连续进展、指示估计的物理位置落入大的相邻语义地点内或附近的语义地点数据库、和/或指示该地点负责用于行走的语义地点(诸如通过分类为公园)。
再参考图2,然后可将地理定位算法应用于在(204)划分的每个局部片段,以便估计用于这个片段的地理区域桶(206)。地理区域桶可对应于一般地理标识符或者每个片段的“粗略”位置估计。在一些示例中,可通过将地球表面的地图、网格或其他表示划分为多个形状(例如正方形、矩形、圆形、多边形或其他图形)来定义地理区域桶。例如,可将城市的地理界限分类为地理区域桶的矩形网格。然后将每个局部片段估计为与这些地理区域桶中的一个或多个相关联。在一些示例中,该估计涉及确定在每个局部片段的时隙内的用户的中值估计物理位置,并将该中值位置舍入到预定地理区域桶中的一个或多个。在有些情况下,至少部分地基于以下中的一个或多个,可将用户或移动装置的给定局部片段估计为属于一个以上地理区域桶:位置数据报告中的估计物理位置的变化、和/或位置数据报告中的物理位置估计的估计不准确性。在一些示例中,地理区域桶可以足够大,使得移动装置地理定位算法中的潜在误差不可能将局部片段分配给错误的区域桶。地理区域桶的总数和实际大小和形状可以在不同的示例性实施例之中变化。
图4中描绘估计(206)的示例,图4提供估计用于不同局部片段的一般地理区域的图形表示。考虑图形表示400,将包围地区划分为四个地理区域桶:区域A、区域B、区域C、以及区域D。基于与每个局部片段相关联的位置信息以及为这个非限制性示例建立的四个区域的划分网格,可将局部片段406估计为属于区域A,而可将局部片段408和412估计为属于区域C。可将局部片段414估计为属于两个地理区域桶,即区域C和区域D。因此,应用于区域C和区域D的后续算法都将在其分析中考虑局部片段414。
再参考图2,对于在(206)估计为包含一个或多个局部片段的每个地理区域桶,实施方法(200)的后续方面(208)、(210)、(212)和(214)。第一方面涉及在每个地理区域桶内识别(208)一个或多个聚类冠层,例如满足潜在地理重叠特性描述的局部片段的群组。一般而言,将共享在(208)识别的至少一个聚类冠层的任何对局部片段确定为有资格进行在(210)确定的后续重叠评分。在(208)的示例中,对于在地理区域桶中观察到的不同的单个信标标识符(诸如Wi-Fi接入点BSSID)定义聚类冠层。在一些实施方式中,这种聚类冠层将包含所有局部片段,所述局部片段至少包含片段的阈值数量的位置数据报告或者阈值部分的位置数据报告,所述位置数据报告指示给定信标标识符被观察到,或者被观察到在阈值信号强度以上或者在信标与移动装置的一定估计距离以内。在另一示例中,对于地理区域桶中的网格点或其他点的集合定义聚类冠层,并且局部片段属于其点落入片段的至少某些阈值数量的位置数据报告或者阈值部分的位置数据报告的估计的物理位置的阈值距离以内的每个聚类冠层。
对于在(208)识别为有资格进行重叠评分的所有对局部片段,在(210)确定重叠得分。在一些示例中,重叠评分可以涉及利用启发式算法来计算在被识别为有资格进行重叠评分的每对的两个局部片段期间,与通过移动装置的实际运动覆盖的地理地区之间重叠的可能性和/或量相关的度量。在一些示例中,该算法涉及聚合函数,例如平均值、修整的平均值、中值、对于来自两个局部片段的多对位置数据报告的全部或样本所计算的每报告相似度函数的固定分位数。每报告相似度函数可以是Jaccard距离、余弦距离、Tanimoto距离等等。在一些示例中,基于是通过相同的装置或用户来创建该对或该组片段,还是如上所述通过相同的隐私取向的有损装置指示符来表征该对或该组片段,或者通过共享人口统计和/或消费心态学共性的一对用户来创建该对或该组片段,在(210)的初始确定之后可以修改重叠得分。这个确定后修改可以帮助反映当装置/用户访问同一地点两次而不是在两个不同的场合访问两个附近地点时接收到来自相同用户或来自相似用户的两个附近片段的较高可能性。
在图5的方法(300)中描绘确定(210)的更具体示例。图5的示例方法(300)在这样的背景下给出,该背景最初接收了一对局部片段,每个片段包括传感器信标观察集合的时间序列。传感器信标观察集合可包括一个或多个信标观察的列表。信标观察可包括信标标识符以及与从传感器到信标的距离相关的度量。在一个示例中,每个传感器信标观察集合是Wi-Fi扫描;即,每个信标观察包含Wi-Fi接入点标识符以及相应Wi-Fi接入点的RSSI。传感器信标观察集合的时间序列都被视为从相同的已知地理区域桶中收集。在这样的示例中,方法(300)可以首先涉及指定(302)适格信标集合,该适格信标集合包括通过一对局部片段跟踪的移动装置所观察的信标,其中观察模式满足预定条件。在一个示例中,预定条件可以选择作为在至少一个片段中以至少一定出现频率和/或信号强度出现的适格Wi-Fi接入点BSSID,并且在(302)将添加任何这种BSSID,作为属于适格信标集合。
仍参考图5,然后在(304)确定用于适格信标集合中每个信标的信标重叠得分。信标重叠得分可以指示利用关于这个信标的数据测量的两个局部片段之间的重叠水平。特别地,重叠得分与提供两个间隔不重叠的更强证据的每个特定信标反向相关。在一些示例中,重叠得分基于选择性地从一个片段的信标度量(RSSI)分布去除离群者(例如通过采取四分位数间距),并测量落入该间距内的其他片段的扫描的一部分。然后可以对跳过的片段采用相同的处理,之后将两个确定的值取平均。在其他示例中,可以利用其他函数来聚合两个确定的值,诸如但不限于最大值(max)、最小值(min)或α*max+(1-α)*min,而不是对两个确定的值取平均。在其他示例中,可以利用其他分析技术来生成信标重叠得分,诸如但不限于应用于选择性的内核化样本分布的分布距离度量(诸如,Earthmover距离、变化距离、Kullback-Leibler散度、Jaccard相似性等等),或者应用于拟合到经验分布的参数或非参数分布的统计拟合优度测试。
对于有资格进行重叠评分的一对局部片段,然后可以在(306)将在(304)确定的适格信标的所得信标重叠得分的集组合,以生成用于所考虑的每对局部片段的总体重叠得分。在一些示例中,可通过在没有替换的情况下对于固定数量的适格信标或者固定部分的适格信标的随机样本进行重复采样,获取k个每信标得分的最小值,以及对于跨越多个随机样本的结果取平均来进行(306)的组合。对于短于k的适格信标列表,可以使用总体最小信标重叠得分。在其他示例中,可通过利用不同的函数来进行(306)的组合,诸如但不限于最大值、固定百分位数或者具有分配给不同分位数的不同权重的加权和。在其他示例中,可以利用对统计模型的优化来进行(306)的组合,该统计模型可以利用以下中的一个或多个:关于信标位置的可能不确定的信息、度量值的每信标分布、和/移动装置的属性。
再参考图2,可以提供通过在(210)确定的重叠得分表示的重叠度量值的所得集合作为生成(212)提供每个地理区域桶中的局部片段的聚类配置的数据结构的聚类算法的输入。在一些示例中,层级聚类用于在(212)生成数据结构。在一些示例中,利用冠层层级凝聚聚类算法来在(212)生成数据结构。在其他示例中,可通过另一种已知的聚类技术来替代层级凝聚聚类,该技术利用重叠启发法来生成由几乎不交叉空间分隔彼此分离的集群。在一些示例中,在(212)生成的数据结构是森林数据结构或树形数据结构,其树叶对应于个别局部片段。在一些示例中,聚类算法使用平均链融合或者单个链接融合,具有用于终止融合的选择性定义的得分阈值。在其他示例中,链接融合聚类可通过更直接地比较两个聚类森林节点的不同融合启发法来替代。在另外的示例中,可以采用不同的链接融合程序,其使用两个候选森林节点的子树中的多对树叶之间的成对重叠度量值中的一部分或全部。
生成数据结构(212)的示例方面在图6和图7中描绘。图6提供分别在给定地理区域桶518内识别的多个局部片段502-514的图形表示500。每个局部片段502-514表示在特定时间段期间地理区域桶518内的不同用户轨迹。在现实世界中,当不同的移动装置用户穿过三个不同的本地商家(即Ron的餐厅520、Brenda的酒吧522、以及Gary的杂货店524)内的地区时,局部片段502-514跟踪不同的移动装置用户。在典型实施方式中,每个商家520/522/524周围所示的虚线对于***而言是未知的或者不完全知道的。在一些示例中,聚类算法可以接收期望在地理区域桶中找到的确切或近似数量的语义地点作为输入。在其他示例中,地理区域桶518内实际存在的商家的身份和/或数量可能是未知的。
图7提供利用应用于来自图6的局部片段的层级聚类所生成的示例数据结构540的图形表示。将示例数据结构540构建为聚类森林,其树叶节点对应于不同局部片段。数据结构540的总体框架(包括将不同片段识别为数据结构内的树叶和/或非树叶节点)部分地根据对于有资格进行重叠评分的每对片段生成的重叠得分来确定。一对片段之间的重叠得分通常与对应于两个片段的两个用户轨迹之间的重叠或“纠缠”量相关。在图6和图7的具体示例中,具有平均链接融合的冠层层级凝聚聚类算法如下进行。第一“融合”操作将片段502与片段504的树叶节点联接到新的父节点546。然后,将片段506与片段508的树叶节点融合,以形成新的父节点548。然后,将节点548与片段510的树叶节点融合,以形成新的父节点550。然后,将对应于片段512和514的叶节点融合,以形成新的父节点552。然后,将节点550与节点552融合,以形成新的父节点554。节点554和节点546的融合得分不满足融合阈值,因此算法终止,使得554和546作为其树的无父“根节点”。
对于图6和图7中的每个适格对的片段所生成的重叠得分确定融合操作的顺序。换言之,它们说明为什么将某些节点联接到特定节点而不是其他节点。例如,就在创建546之后,将片段506与片段508联接,以形成节点548。因为它们是树叶节点,所以它们的融合得分是它们的重叠得分:MergeScore(506,508)=OverlapScore(506,508)。因为该操作代替506与546联接而发生,所以我们知道OverlapScore(506,508)>OverlapScore(506,546),后者由平均联接融合启发法来定义:OverlapScore(506,546)=Average(OverlapScore(506,502),OverlapScore(506,504))。类似地,例如,OverlapScore(506,508)>OverlapScore(506,510)——否则,510将与506融合。对于没有资格进行重叠评分的片段X,Y,将OverlapScore(X,Y)定义为零。应当理解,类似于森林数据结构540的数据结构可包括许多更多的片段以及按照各种特定格式配置的节点。
基于在(212)生成的层级聚类配置和所得数据结构,最后可以在(214)为每个地理区域桶中的一个或多个局部片段确定语义地点数据。在(214)确定的语义地点数据可以采取各种形式,一部分形式由图8的示例方法(310)表示。方法310涉及可以单独实施或者按照选择的组合实施的方面(312)、(314)和(316)。在一些示例中,可以提供以下中的一个或多个作为按照文本、图形、视频、音频或其他形式在(316)给用户的输出:在(212)生成的数据结构、在(314)生成的语义地点模型、或者通过响应于后续用户查询在(314)生成的语义地点模型生成的语义地点标签,。
在一个示例中,在(214)确定语义地点数据包括首先实现预处理训练子例程,该预处理训练子例程将语义数据标签关联到响应于在(202)接收具有语义数据标签的一个或多个局部片段而在(212)生成的数据结构的某些部分。然后,可以至少部分地基于来自(212)的聚类配置识别用于所接收的一个或多个语义数据标签的分类器。然后在线子例程利用通过训练子例程识别的分类器,将语义数据与所接收的片段相关联。当为了位置数据报告的初始集中的局部片段中的一个局部片段或者仅仅一个子集接收语义数据时,这个示例是有用的。与在(212)生成的聚类关联耦合的这个有限信息最后可以按照有用的方式,扩展可用于特定局部片段的各种聚组的语义位置数据的量。
在一个示例中,所生成的数据结构可用于将语义地点标签关联到某些局部片段(312)。通常多个局部片段将与每个语义地点标签相关联,但并非总是如此。语义地点标签通常可以对应于位置实体的语义标识符,其中位置实体表示与地理位置相关联的任何特征、地标、兴趣点(POI)或其他对象或事件。例如,位置实体可包括商家、餐馆、教堂、住宅、零售店、咖啡馆、酒吧、音乐场所、景点、博物馆、主题公园、竞技场、体育场、节日、组织、区域、邻居、或其他合适的兴趣点;或者另一个位置实体的子集;或者在单次访问中频繁访问的多个邻近位置实体的组合。语义地点标签是位置实体在区域里的唯一标识符,其可以与基于坐标或基于位置的标识符区分开。但是除了名称之外,通过所公开的实施例与特定位置实体相关联的语义地点数据还可包括关于位置实体的元数据,例如其类别;关于场所的物理位置和几何形状的部分、不确定、和/或完整的信息;以及访问该位置实体的用户的行为、人口统计、或消费心态学的分布的一个或多个特性描述。
用于识别局部片段的语义地点标签的源例如可包括将位置实体链接到地理位置的实体信息的数据库(例如地理信息***数据库)。用于指定最适当的语义地点标签的因素可包括以下中的一个或多个:距离特征,表示位置实体与关联于为其识别位置实体的局部片段的片段位置之间的距离;受欢迎度特征,描述位置实体的受欢迎度(例如,社交媒体提及的数量、签到的数量、对路线指引的请求的数量、和/或全球受欢迎度排名);营业时间重叠特征,描述营业时间的集合是否关联于与用于为其识别位置实体的局部片段的时间片段重叠的位置实体;以及一个或多个个性化特征,描述从其接收局部片段的用户与对应于这个片段的位置实体之间的先前交互。示例个性化特征可包括:用户针对位置实体进行地图点击的多个实例;用户请求到位置实体的路线指引的多个实例;用户已经签到位置实体的多个实例;用户已经与位置实体交易的多个实例,如通过从移动支付***或虚拟钱包获得的数据证明的;和/或用户已经针对位置实体进行web搜索查询的多个实例。
当来自许多语义地点的高置信度传感器读数几乎没有或没有时,所公开的技术还可用于提供语义地点标签以及语义地点数据与位置数据报告的其他有意义的相关。这通过利用原始传感器读数时间序列的大的未标记语料库来进行,以发现用户很少穿越的“边界”,并选择性地用语义地点标签的集合补充否则可能非常稀疏和/或低置信度的所得的边界模型。
在语义地点标签的示例中,所公开技术的方面可以与在(204)中识别的多个局部片段中的一个或多个片段的语义地点标签组合。并非所有的局部片段都会接收训练标签,并且通常多个片段将与特定训练标签相关联。在一些示例中,训练标签是单个已知语义地点(例如营业地点)的语义标识符,并且接收该训练标签指示从移动装置接收到局部片段,所述移动装置被确信为在用于这个片段的对应时间段期间已经在物理上存在于单个已知的语义地点。在一些示例中,训练标签可包括多个n个可能的商家(B1,B2,...,Bn),每个商家与数值权重相关联,其中Bi的权重指示在所考虑的片段期间装置处于Bi处的估计可能性。对于每个不同的训练标签,可将分层级的聚类数据结构用于生成这个标签的二元分类器,从而优化分类质量度量。在一个示例中,用于语义地点标签的每个分类器都是森林的单个节点;然后,通过与最近的祖先节点相关联的标签将与数据结构的节点相关联的片段分类(作为与森林树叶相关联的输入片段,或者经由下面描述的增量过程),或者如果没有祖先节点是分类器,则通过“无语义地点标签”将与数据结构的节点相关联的片段分类。然后可将数据结构节点和语义地点标签之间的这种相关性用于帮助生成用于将来位置数据报告和/或局部片段的语义地点标识符。
在语义标识符的其他示例或者在(312)训练与局部片段相关联的标签的其他示例中,可将标签配置为包括关于用户的附加信息,诸如关于用户的人口统计或消费心态学的信息,或者关于与通过局部片段来指示其位置的用户相关联的具体可测量行为的记录。作为示例,可以观察到一些局部片段来自搜索奢侈消费品品牌的用户。在另一个示例中,可以观察到一些局部片段来自点击某个广告或某个类别的广告的用户。然后可以利用本文公开的技术,将根据模型得到的推断用于预测用户动作、人口统计、和/或消费心态学。
在另一示例中,可以在(314)生成模型,其指示语义地点数据、用于在预测先前或当前用户位置中使用或者用于响应查询的概率。例如,一旦在(212)生成的数据结构就位,就可以提供包括局部片段或者一个或多个位置数据报告的查询作为增量聚类算法的输入,该增量聚类算法提供输出,该输出分别将每个片段输入注入到数据结构中,并将该片段与这样一个现有节点相关联:如果该片段本来就存在于该聚类的原始输入中,则该片段就会在该现有节点处被融合。在一些示例中,包括新位置数据报告或局部片段的查询将返回与查询片段所***的集群相关联的特定语义地点标签。在其他示例中,可以返回一个或多个语义地点标签,作为查询连同与这个集群内的位置实体相关联的概率或置信度一起输出。在另外的示例中,例如可以基于森林中最近的N个节点中的哪个部分至少具有与给定语义地点相关联的置信度的阈值水平,生成森林模型中用于新片段的邻居的同质性的测度。在另外的示例中,语义地点边界估计的图形表示(诸如通过图1中的边界估计142和144所描绘的图形表示)可以根据在(212)生成的数据结构来生成。
在(314)生成的模型的另外的示例不包括语义地点标签的多个方面。在一个示例中,可以生成在(212)生成的数据结构的给定部分中的用户/装置标识符的多样性的测度。例如,可以生成识别周围空间是“公开”程度的估计,从而帮助作出对位置实体是私人住宅还是公共设施(可能就在楼下或隔壁)的确定。考虑在长时间段(例如一年)内的位置数据报告的大语料库,更可能的是,在长时间段内跟踪到相同用户/装置子集的片段可能对应于私人家庭或商家,而不断变化的用户/装置可以指示更加公共的设施。其他示例可以利用将已知位置数据报告与特定用户标准相关联的建模信息,帮助预测用于将来位置数据报告的这样的标准。例如,如果已知位置数据报告和/或局部片段的集合属于具有特定人口统计或消费心态学属性的用户,就可以使用模型来预测关于生成将来位置数据报告或局部片段的用户的这种属性。
确定语义地点数据(214)的示例在图9和图10中描绘。图9和图10的示例在参照图6和7所示和讨论的示例上建立。图9图示出将语义地点标签关联(312)到某些局部片段的示例,而图10描绘利用在(314)生成的模型来生成新片段的查询结果。更具体地参考图9,示例可包括关于片段502-514中的一些片段的一些知识。例如,局部片段502-514中的一些片段可以具有与它们相关联的具有较高置信度水平的语义地点。高置信度标签可以是用户确认他们在特定时间访问特定地点的结果,或者是***确定用户的位置很可能对应于特定位置实体的结果。例如,在图9的示例中考虑,片段502与Ron的餐厅确信地相关联,片段506和片段510确信地与Brenda的酒吧相关联,而片段512确信地与Gary的杂货店相关联。
图9所描绘的另一个节点标记特征涉及分类器训练。在分类器训练中,将森林数据结构中的至少一个节点识别为用于全部或者一些可用语义地点标签的分类器节点。可以选择这些节点以将分类器质量度量得分(例如F1得分)最优化。换言之,用于给定语义地点标签的分类器节点对应于这样的节点:该节点基于所提供的与节点相关联的训练语义标签的集合,将分类器质量度量得分最大化。图9中的分类器节点用星星标记。与片段502相对应的树叶节点556是用于Ron的餐厅的分类器节点,节点550被选择为用于Brenda的酒吧的分类器节点,而与片段512相对应的树叶节点558是用于Gary的杂货店的分类器节点。可以在后续的***应用中使用这些分类器节点,以基于所生成的语义地点边界模型来表征新的位置数据报告和局部片段。
图10描绘可以怎样将分类器节点模型(诸如图9中生成的模型)用于分析对于新的局部片段的查询的示例。在图10中,假定接收到四个查询,每个查询包含新的局部片段或者一个或多个位置数据报告。利用本文所述技术,可将每个查询与数据结构中的一个或多个节点相关联。假设所接收的查询与节点560-566相关联。在一些示例中,利用最近的祖先分类器节点的标签,可以基于诸如图9中生成的模型来标记每个查询,如上所述。在图10的示例中,因此将对应于节点560的片段分类为在Brenda的酒吧,因为用于Brenda的酒吧的分类器节点550是其祖先。类似地,对应于节点562的片段可以接收与Gary的杂货店相关联的分类(以及对应的语义地点标签),因为节点562被标记为在Gary的杂货店,与分类器节点558相同。另一方面,节点564没有分类器祖先,并且因此被模型标记为“无语义地点”。对应于节点566的片段根本没有通过增量聚类融合到数据结构中,并且因此也没有分类器祖先,并且因此也接收“无语义地点”标签。
下面参考图11,在示例性方法(320)中讨论用于确定语义地点边界和相关数据以及从这样的确定产生的应用的所公开的技术的多个方面。方法(320)意欲获取在用户操作的示例移动客户端装置上或者在用户选择上传一个或多个位置数据报告的服务器上实施的所公开的技术的多个方面。移动客户端装置首先在(322)接收语义位置模型(诸如上述的一个或多个模型),该语义位置模型提供关于语义地点位置的聚类信息以及与一个或多个地理区域桶相关联的相关数据。在一些示例中,至少部分地根据对于得自于先前的位置数据报告的数据进行的层级聚类算法来生成语义位置模型,所述先前的位置数据报告从在一个或多个地理区域桶中操作的多个移动装置收集。然后可以提供(324)指示用户的当前位置或过去位置的一个或多个新的位置数据报告或局部片段。在(326),然后可通过利用在(322)接收的语义位置模型处理新的位置数据报告来生成对与来自(324)的新的位置数据报告相关联的语义地点的预测。在(326)生成的预测可包括上面相对于在(314)生成的模型所讨论的一个或多个查询结果。例如,用于新的位置数据报告的预测数据可包括语义地点标签,具有匹配的对应概率的多个可能语义地点标签,示出新位置数据报告在***现有模型(诸如在(322)接收的)时将在哪里拟合的信息,地点的公共/私人性质的测度,周围地区的同质性的测度等等。
下面参考图12,在示例方法(330)中讨论用于确定语义地点数据以及从这样的确定产生的应用的所公开的技术的多个方面。方法(330)意欲获取根据所公开的技术用于确定语义地点数据的示例的另一变型。在(332)检查历史位置数据报告的多个时间序列以便确定其相对重叠量。在(332)检查的历史位置数据报告的时间序列可包括本文所述位置数据报告的任何变型,包括但不限于图1、图3、以及图4中的一个或多个中所示的路线和/或被描述为在(202)从多个移动装置接收的位置数据报告。在一些示例中,在(332)确定重叠水平涉及确定用于历史位置数据报告的所选择时间序列的重叠得分。在一些示例中,在(332)确定重叠水平包括确定历史位置数据报告的所选择的对的时间序列之间的成对重叠的度量值。(332)中使用的特定重叠得分或其他计算的成对相似性度量可以类似于本文所述的其他重叠得分或度量或者量化一对位置数据报告时间序列之间的重叠水平的其他特定得分。
仍然参考图12,如果确定在(332)检查的历史位置数据报告的所选择的时间序列充分重叠,则在(334)将它们聚组在一起。在一些示例中,可以利用一个或多个聚类技术,包括但不限于本文公开的各种聚类算法,来实现历史位置数据报告的充分重叠的时间序列的聚组。基于在(334)被确定为充分重叠的历史位置数据报告的所选择的时间序列的聚组,可以在(336)分配位置分类器,其区分一个或多个位置实体。然后,可以利用该分类器在(338)确定用于一个或多个其他时间序列或位置数据报告的语义数据。语义数据可以包括各种信息,包括但不限于用于位置实体的语义地点标签、与位置实体相关联的类别或者其他元数据、关于与位置实体相关联的场所位置或者几何形状的信息、以及访问位置实体的用户的行为、人口统计或消费心态学的分布的一个或多个特性描述。
图13描绘根据本公开的示例实施例,可用于实施用于确定语义地点边界和相关数据的方法和***的计算***600。***600可以利用包括服务器602以及一个或多个客户端622的客户端-服务器架构来实现。服务器602例如可以对应于托管地理信息***的web服务器。客户端622例如可以对应于个人通信装置,诸如但不限于智能电话、导航***、膝上型计算机、移动装置、平板计算机、可穿戴计算装置等等。
每个服务器602和客户端622可包括至少一个计算装置,诸如通过服务器计算装置604和客户端计算装置624描绘的。虽然在图8中仅图示出一个服务器计算装置604和一个客户端计算装置624,但是可以在一个或多个位置选择性地提供多个计算装置,用于按顺序或并行配置操作,以实施所公开的确定语义地点边界的方法和***。在其他示例中,***600可以利用其他合适的架构来实施,诸如单个计算装置。***600中的每个计算装置604、624可以是任何合适类型的计算装置,诸如通用计算机、专用计算机、导航***(例如汽车导航***)、膝上型计算机、台式计算机、移动装置、智能电话、平板计算机、可穿戴计算装置、具有一个或多个处理器的显示器、或者其它合适的计算装置。
计算装置604和/或624可分别包括一个或多个处理器606、626以及一个或多个存储器装置608、628。一个或多个处理器606、626可包括任何合适的处理装置,诸如微处理器、微控制器、集成电路、逻辑装置、一个或多个中央处理单元(CPU)、专用于有效呈现图像或进行其他专门计算的图形处理单元(GPU)、和/或其他处理装置。一个或多个存储器装置608、628可包括一个或多个计算机可读介质,包括但不限于非暂时性计算机可读介质、RAM、ROM、硬盘驱动器、闪存驱动器、或其他存储器装置。在一些示例中,存储器装置608、628可对应于分立在多个位置上的协同数据库。
一个或多个存储器装置608、628存储可通过一个或多个处理器606、626访问的信息,包括可通过一个或多个处理器606、626执行的指令。例如,服务器存储器装置608可以存储用于实施被配置为进行本文公开的不同功能的语义地点确定算法的指令。客户端存储器装置628可以存储用于实施允许用户从服务器602请求信息的浏览器或模块的指令,包括为过去、当前、或将来的客户端位置的所确定的语义地点数据、标签、预测和/或模型。
一个或多个存储器装置608、628还可包括数据612、632,数据612、632可通过一个或多个处理器606、626检索、操纵、创建或存储。在服务器602存储的数据612例如可包括在方法(200)中分析的位置数据报告的集,已知语义地点标识符的数据库,以及根据所公开的技术确定的所得森林/树形数据结构和聚类输出。在客户端622存储的数据632可包括当前位置数据报告和语义地点标识符预测或可能性的概率。
计算装置604和624可通过网络640相互通信。在这种情况下,服务器602和一个或多个客户端622还可以分别包括用于通过网络640相互通信的网络接口。网络接口可包括用于与一个或多个网络接口的任何合适组件,例如包括发射机、接收机、端口、控制器、天线、或其他合适的组件。网络640可以是任何类型的通信网络,诸如局域网(例如内联网)、广域网(例如因特网)、蜂窝网络、或它们的一些组合。此外,网络640可包括服务器计算装置604与客户端计算装置624之间的直接连接。一般而言,服务器计算装置604与客户端计算装置624之间的通信可以利用任何类型的有线和/或无线连接、利用各种通信协议(例如TCP/IP、HTTP、SMTP、FTP)、编码或格式(例如HTML、XML)、和/或保护方案(例如VPN、安全HTTP、SSL)经由网络接口来进行。
客户端622可包括用于向/从用户提供和接收信息的各种输入/输出装置。例如,输入装置660可包括诸如触摸屏、触摸板、数据输入键、和/或适合于语音识别的麦克风这样的装置。用户可以采用输入装置660来识别特定位置数据报告或时间序列,以根据所公开的实施例分析或请求显示根据所公开的实施例生成的不同模型。输出装置662可包括音频或视觉输出,诸如扬声器或显示器,用于指示语义地点标识符或其他数据,和/或放置模型输出,包括语义地点边界估计、层级聚类数据结构、相关地图等等。此外,可以在输出装置662提供音频和/或视觉警报,其向用户提供指示用户到达某些预定语义地点(例如方向目的地、喜欢的位置等等)的信号。
应当理解,术语“模块”表示用于提供期望功能的计算机逻辑。因此,可以在控制通用处理器的硬件、专用电路、固件、和/或软件中实施模块。在一个实施例中,模块是存储在存储装置上、载入一个或多个存储器装置中、并通过一个或多个处理器执行的程序代码文件,或者可以从计算机程序产品(例如计算机可执行指令)提供,所述计算机程序产品存储在有形计算机可读存储介质,诸如RAM、闪存驱动器、硬盘或光学或磁性介质中。当使用软件时,可以使用任何合适的编程语言或平台来实施模块。
本文讨论的技术参考服务器、数据库、软件应用、以及其他基于计算机的***、以及所采取的动作以及发送到这些***和从这些***发送的信息。本领域普通技术人员将认识到,基于计算机的***的固有灵活性允许各种组件之间的任务和功能的大量可能配置、组合和划分。例如,本文所讨论的服务器进程可以利用单个服务器或组合工作的多个服务器来实施。数据库和应用可以在单个***上实施或者跨越多个***分布。分布式组件可以顺序或并行操作。
虽然已经针对本主题的具体示例实施例详细描述了本主题,但是应当理解,本领域技术人员在获得对前述的理解时可以容易地产生对这些实施例的改型、变型和等同物。因此,本公开的范围是通过示例而不是限制的方式,并且本公开不排除包括如对于本领域技术人员而言显而易见的对本主题的这种修改、变型和/或添加。

Claims (24)

1.一种确定语义地点数据的计算机实施方法,所述语义地点数据包括一个或多个位置的名称,所述方法包括:
通过一个或多个计算装置检查从多个移动设备接收的历史位置数据报告的多个时间序列以确定它们的重叠;
通过所述一个或多个计算装置将被确定为充分重叠的位置数据报告的所选择的时间序列聚组;
通过所述一个或多个计算装置基于分类器质量度量得分来分配位置分类器,所述位置分类器基于被确定为充分重叠的历史位置数据报告的所选择的时间序列的聚组来区分一个或多个位置实体;以及
通过所述一个或多个计算装置利用所分配的位置分类器来确定用于当前或历史位置数据报告的一个或多个时间序列的语义地点数据。
2.根据权利要求1所述的计算机实施方法,其中所述语义地点数据包括以下中的一个或多个:用于位置实体的语义地点标签、与位置实体相关联的类别或者其他元数据、关于与位置实体相关联的场所位置或者几何形状的信息、以及访问位置实体的用户的行为、人口统计或消费心态学的分布的一个或多个特性描述。
3.根据权利要求1所述的计算机实施方法,其中检查历史位置数据报告的多个时间序列以确定它们的重叠包括:确定用于多对时间序列的重叠得分,所述重叠得分与通过生成所述多对时间序列的移动装置的运动所覆盖的地理地区之间的重叠相关。
4.根据权利要求3所述的计算机实施方法,其中将被确定为充分重叠的历史位置数据报告的所选择的时间序列聚组包括:使用历史位置数据报告的时间序列的重叠得分作为聚类度量,将历史位置数据报告的所述时间序列聚类在一起。
5.一种用于生成语义地点数据的计算***,包括:
一个或多个处理器;以及
一个或多个存储器装置,所述一个或多个存储器装置存储计算机可读指令,所述计算机可读指令在通过所述一个或多个处理器执行时使得所述一个或多个处理器进行操作,所述操作包括:
接收提供关于在一个或多个地理区域桶内的语义地点的信息的语义位置模型,其中所述语义位置模型至少部分地根据对于得自于先前位置数据报告的数据进行的层级聚类算法生成,所述先前位置数据报告从在所述一个或多个地理区域桶中操作的多个移动装置被收集;
提供指示用户的当前或过去地理位置的一个或多个新的位置数据报告;以及
通过利用所述语义位置模型处理所述一个或多个新的位置数据报告来生成与所提供的一个或多个新的位置数据报告相关联的语义地点数据,其中,所述语义地点数据包括一个或多个位置的名称。
6.根据权利要求5所述的计算***,其中接收语义位置模型的操作包括:从每个地理区域桶接收所述位置数据报告的层级聚类配置,其中所述层级聚类配置包括森林数据结构,所述森林数据结构的树叶对应于历史局部片段。
7.根据权利要求5所述的计算***,其中所生成的语义地点数据包括以下中的一个或多个:用于位置实体的语义地点标签、与位置实体相关联的类别或者其他元数据、关于与位置实体相关联的场所位置或者几何形状的信息、以及访问位置实体的用户的行为、人口统计或消费心态学的分布的一个或多个特性描述。
8.根据权利要求5所述的计算***,其中接收语义位置模型的操作包括接收通过以下操作生成的模型:
识别满足潜在地理重叠特性描述的局部片段的一个或多个聚类冠层;
确定用于共同具有至少一个聚类冠层的每对局部片段的重叠得分,其中所述重叠得分与通过生成在该对局部片段中的所述局部片段的移动装置的运动所覆盖的实际地理地区之中的重叠相关;以及
生成提供在每个地理区域桶中的所述局部片段的聚类配置的数据结构,其中所述数据结构至少部分地根据所确定的重叠得分生成。
9.一种确定语义地点数据的计算机实施方法,所述语义地点数据包括一个或多个位置的名称,所述方法包括:
通过一个或多个计算装置从多个移动装置接收多个位置数据报告;
通过所述一个或多个计算装置将所述多个位置数据报告划分成局部片段;
通过所述一个或多个计算装置估计用于每个局部片段的地理区域桶;
通过所述一个或多个计算装置在每个地理区域桶内识别满足潜在地理重叠特性描述的局部片段的一个或多个聚类冠层;
通过所述一个或多个计算装置确定用于共同具有至少一个聚类冠层的每对局部片段的重叠得分,其中所述重叠得分与通过生成在该对局部片段中的所述局部片段的所述移动装置的运动所覆盖的实际地理地区之中的重叠相关;
通过所述一个或多个计算装置生成提供在每个地理区域桶中的所述局部片段的聚类配置的数据结构,其中所述数据结构至少部分地根据所确定的重叠得分生成;以及
通过所述一个或多个计算装置至少部分地基于所生成的数据结构的聚类配置来确定用于一个或多个局部片段的语义地点数据,
其中至少部分地基于所述聚类配置来确定用于一个或多个局部片段的语义地点数据包括使用预处理训练子例程,所述预处理训练子例程响应于接收具有语义数据标签的一个或多个局部片段,通过所述一个或多个计算装置将语义数据标签关联到所述数据结构的某些部分。
10.根据权利要求9所述的计算机实施方法,其中所述多个位置数据报告分别包括以下中的一个或多个:时间戳;估计的物理位置;所述物理位置中的误差的模型;关于一个或多个信标的传感器观察,所述信标包含信标标识符和与到所述信标的距离相关的度量;地理代码;以及移动装置标识符。
11.根据权利要求10所述的计算机实施方法,其中所述多个位置数据报告包括关于一个或多个信标的传感器观察,其中关于信标的每个传感器观察包括作为信标标识符提供的Wi-Fi接入点BSSID以及作为信标距离度量提供的接收信号强度指示符(RSSI)。
12.根据权利要求9所述的计算机实施方法,其中每个局部片段对应于给定移动装置停留在给定局部地理区域内的期间的时间序列。
13.根据权利要求9所述的计算机实施方法,其中聚类冠层通过信标标识符来表征,并且聚类冠层包括其中所述信标标识符出现在至少固定数量的所述位置数据报告中或者固定部分的所述位置数据报告中的所有局部片段。
14.根据权利要求9所述的计算机实施方法,其中来自所述多个移动装置的所述多个位置数据报告分别包括一个或多个传感器信标观察,并且其中通过所述一个或多个计算装置确定用于共同具有至少一个聚类冠层的在每个地理区域桶中的每对局部片段的重叠得分包括:
通过所述一个或多个计算装置指定适格信标集合,所述适格信标集合包括通过在每对局部片段中跟踪的移动装置观察的信标,其中所述信标观察满足预定信标阈值水平;
通过所述一个或多个计算装置确定用于所述适格信标集合中的每个信标的信标重叠得分;以及
通过所述一个或多个计算装置,通过组合用于该对局部片段的所述适格信标集合中的所有信标的信标重叠得分,生成用于所考虑的每对局部片段的总体重叠得分。
15.根据权利要求14所述的计算机实施方法,其中用于给定对的局部片段的较低信标重叠得分指示来自该信标的信号给出该给定对的局部片段不重叠的更强证据。
16.根据权利要求14所述的计算机实施方法,其中所述预定信标阈值水平是根据以下中的一个或多个来限定:信标距离度量值、在所述局部片段期间观察所述信标的频率、以及在所述局部片段期间观察所述信标的次数。
17.根据权利要求9所述的计算机实施方法,其中通过所述一个或多个计算装置生成提供在每个地理区域桶中的所述局部片段的聚类配置的数据结构包括生成森林数据结构,所述森林数据结构的树叶对应于所述局部片段。
18.根据权利要求9所述的计算机实施方法,其中至少部分地基于所述聚类配置来确定用于一个或多个局部片段的语义地点数据包括:至少部分地基于所述聚类配置,识别用于所接收的所述语义数据标签中的一个或多个的分类器,以及响应于一个或多个局部片段,利用通过所述预处理训练子例程识别的所述分类器,通过所述一个或多个计算装置将语义数据与所接收的片段相关联的在线子例程。
19.根据权利要求9所述的计算机实施方法,其中至少部分地基于所述聚类配置来确定用于在每个地理区域桶中的一个或多个局部片段的语义地点数据包括:通过所述一个或多个计算装置确定语义位置概率值,所述语义位置概率值表示当所述装置处于给定语义位置时获得构成所述局部片段的多个位置数据报告的可能性,其中确定所述语义位置概率值至少部分地基于所述聚类配置。
20.根据权利要求9所述的计算机实施方法,其中至少部分地基于所述聚类配置来确定用于在每个地理区域桶中的一个或多个局部片段的语义地点数据包括:至少部分地基于所述聚类配置,通过所述一个或多个计算装置生成对新的局部片段或者一个或多个新的位置数据报告的所述语义地点位置的预测。
21.一种用于确定语义地点数据的计算***,包括:
一个或多个处理器;以及
一个或多个存储器装置,所述一个或多个存储器装置存储计算机可读指令,所述计算机可读指令在通过所述一个或多个处理器执行时使得所述一个或多个处理器进行操作,所述操作包括:
从多个移动装置接收多个位置数据报告;
将所述多个位置数据报告划分成局部片段;
估计用于每个局部片段的地理区域桶;
在每个地理区域桶内识别满足潜在地理重叠特性描述的局部片段的一个或多个聚类冠层;
确定用于共同具有至少一个聚类冠层的每对局部片段的重叠得分,其中所述重叠得分与通过生成在该对局部片段中的局部片段的所述移动装置的运动所覆盖的实际地理地区之中的重叠相关;
生成提供在每个地理区域桶中的所述局部片段的聚类配置的数据结构,其中所述数据结构至少部分地根据所确定的重叠得分生成;以及
至少部分地基于所生成的数据结构的聚类配置来确定用于一个或多个局部片段的语义地点数据,
其中所述语义地点数据包括一个或多个位置的名称,并且其中至少部分地基于所述聚类配置来确定用于一个或多个局部片段的语义地点数据包括使用预处理训练子例程,所述预处理训练子例程响应于接收具有语义数据标签的一个或多个局部片段,将语义数据标签关联到所述数据结构的某些部分。
22.根据权利要求21所述的计算***,其中聚类冠层通过信标标识符来表征,并且聚类冠层包括其中所述信标标识符出现在至少固定数量的所述位置数据报告中或者固定部分的所述位置数据报告中的所有局部片段。
23.根据权利要求21所述的计算***,其中至少部分地基于所述聚类配置来确定用于在每个地理区域桶中的一个或多个局部片段的语义地点数据包括:至少部分地基于所述聚类配置,通过一个或多个计算装置生成对新的局部片段或者一个或多个新的位置数据报告的所述语义地点位置的预测。
24.根据权利要求21所述的计算***,其中所述语义地点数据包括以下中的一个或多个:用于位置实体的语义地点标签、与位置实体相关联的类别或者其他元数据、关于与位置实体相关联的场所位置或者几何形状的信息、以及访问位置实体的用户的行为、人口统计或消费心态学的分布的一个或多个特性描述。
CN201580031888.8A 2014-12-29 2015-10-02 根据多个位置数据报告分析语义地点和相关数据 Active CN106462627B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201462097423P 2014-12-29 2014-12-29
US62/097,423 2014-12-29
US14/595,256 2015-01-13
US14/595,256 US9904932B2 (en) 2014-12-29 2015-01-13 Analyzing semantic places and related data from a plurality of location data reports
PCT/US2015/053741 WO2016108977A1 (en) 2014-12-29 2015-10-02 Analyzing semantic places and related data from a plurality of location data reports

Publications (2)

Publication Number Publication Date
CN106462627A CN106462627A (zh) 2017-02-22
CN106462627B true CN106462627B (zh) 2021-03-12

Family

ID=56164694

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580031888.8A Active CN106462627B (zh) 2014-12-29 2015-10-02 根据多个位置数据报告分析语义地点和相关数据

Country Status (5)

Country Link
US (1) US9904932B2 (zh)
EP (1) EP3241370B1 (zh)
CN (1) CN106462627B (zh)
DE (1) DE202015009183U1 (zh)
WO (1) WO2016108977A1 (zh)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10592690B2 (en) * 2015-03-16 2020-03-17 Nokia Technologies Oy Method and apparatus for discovering social ties based on cloaked trajectories
US20170039258A1 (en) * 2015-08-05 2017-02-09 Microsoft Technology Licensing, Llc Efficient Location-Based Entity Record Conflation
US9565521B1 (en) * 2015-08-14 2017-02-07 Samsung Electronics Co., Ltd. Automatic semantic labeling based on activity recognition
US10331710B2 (en) * 2015-10-01 2019-06-25 Microsoft Technology Licensing, Llc Partitioning of geographic data
EP3165877B1 (en) * 2015-11-04 2020-03-25 Tata Consultancy Services Limited Systems and methods for fusing inertial and bluetooth low energy sensor data for localization
US20170132648A1 (en) * 2015-11-11 2017-05-11 International Business Machines Corporation Anonymous reporting of multiple venue location data
US9749783B2 (en) * 2016-01-04 2017-08-29 The Boeing Company System and method for estimating wireless device positions
US10650621B1 (en) 2016-09-13 2020-05-12 Iocurrents, Inc. Interfacing with a vehicular controller area network
CN106931974B (zh) * 2017-03-29 2020-04-03 清华大学 基于移动终端gps定位数据记录计算个人通勤距离的方法
CN107194412A (zh) * 2017-04-20 2017-09-22 百度在线网络技术(北京)有限公司 一种处理数据的方法、装置、设备和计算机存储介质
US10521784B2 (en) 2017-04-24 2019-12-31 Square, Inc. Analyzing layouts using sensor data
CN109003107B (zh) * 2017-06-06 2020-12-04 北京嘀嘀无限科技发展有限公司 区域划分方法及装置
CN107248277B (zh) * 2017-07-27 2019-11-08 安徽正熹标王新能源有限公司 一种共享单车空车预测提醒***
US10234291B1 (en) * 2017-10-06 2019-03-19 Cisco Technology, Inc. Collaborative localization between phone and infrastructure
CN108011987B (zh) * 2017-10-11 2020-09-04 北京三快在线科技有限公司 Ip地址定位方法及装置,电子设备及存储介质
WO2019093993A1 (en) * 2017-11-07 2019-05-16 Google Llc Semantic state based sensor tracking and updating
CN108280685B (zh) * 2018-01-19 2019-07-23 百度在线网络技术(北京)有限公司 信息获取方法和装置
SE541634C2 (en) * 2018-03-06 2019-11-19 Scania Cv Ab Method and control arrangement for identification of parking areas
WO2019171132A1 (en) * 2018-03-06 2019-09-12 Pratik Sharma Geographic coordinates locator service
US11023495B2 (en) * 2018-03-19 2021-06-01 Adobe Inc. Automatically generating meaningful user segments
US10977605B2 (en) * 2018-06-05 2021-04-13 Signal Ocean Ltd Carrier path prediction based on dynamic input data
JP6929260B2 (ja) * 2018-11-01 2021-09-01 株式会社東芝 時系列特徴抽出装置、時系列特徴抽出方法及びプログラム
US10963917B2 (en) 2018-12-26 2021-03-30 Yandex Europe Ag Method and system for determining fact of visit of user to point of interest
US11520759B2 (en) * 2019-04-26 2022-12-06 Salesforce.Com, Inc. Processing time series metrics data
US11995115B2 (en) * 2019-06-14 2024-05-28 Nippon Telegraph And Telephone Corporation Information extracting device, information extracting method, and information extracting program
CN110198519A (zh) * 2019-06-26 2019-09-03 阿里巴巴集团控股有限公司 网络接入点的位置估计方法与装置
US11461792B1 (en) * 2019-09-18 2022-10-04 BlueOwl, LLC Method and system for tracking local businesses visited by a user
US11372876B1 (en) 2019-09-18 2022-06-28 BlueOwl, LLC Method and system for providing recommendations and search results to visitors with a focus on local businesses
US11719541B2 (en) * 2019-11-13 2023-08-08 Aclima Inc. Hyper-local mapping of environmental conditions
CN111194005A (zh) * 2019-12-05 2020-05-22 中国科学院地理科学与资源研究所 一种室内行人语义位置提取方法及预测方法
US11167207B2 (en) * 2019-12-13 2021-11-09 Niantic, Inc. Region division with cell merging using spanning tree
US11451671B2 (en) * 2020-04-29 2022-09-20 EXFO Solutions SAS Identification of 5G Non-Standalone Architecture traffic on the S1 interface
CN111782748B (zh) * 2020-06-28 2024-01-12 北京百度网讯科技有限公司 地图检索方法、信息点poi语义向量的计算方法和装置
US11599667B1 (en) * 2020-08-11 2023-03-07 Amazon Technologies, Inc. Efficient statistical techniques for detecting sensitive data
US11449523B2 (en) * 2020-11-05 2022-09-20 Adobe Inc. Generating overlap estimations between high-volume digital data sets based on multiple sketch vector similarity estimators
CN113392652B (zh) * 2021-03-30 2023-07-25 中国人民解放军战略支援部队信息工程大学 基于语义聚类的签到热点功能特征识别方法
US20230108980A1 (en) * 2021-09-28 2023-04-06 Chris Shughrue Depletion modeling for estimating survey completeness by region

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1939797A1 (en) * 2006-12-23 2008-07-02 NTT DoCoMo, Inc. Method and apparatus for automatically determining a semantic classification of context data
CN102509170A (zh) * 2011-10-10 2012-06-20 浙江鸿程计算机***有限公司 一种基于历史轨迹数据挖掘的位置预测***及方法
CN103841516A (zh) * 2014-02-28 2014-06-04 华中科技大学 一种基于移动电话数据识别城市特定区域的方法
CN104199936A (zh) * 2014-09-09 2014-12-10 联想(北京)有限公司 一种信息的处理方法和装置
CN104239556A (zh) * 2014-09-25 2014-12-24 西安理工大学 基于密度聚类的自适应轨迹预测方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7720652B2 (en) * 2004-10-19 2010-05-18 Microsoft Corporation Modeling location histories
US8229458B2 (en) * 2007-04-08 2012-07-24 Enhanced Geographic Llc Systems and methods to determine the name of a location visited by a user of a wireless device
CN106910090A (zh) * 2009-12-15 2017-06-30 英特尔公司 上下文信息使用***、装置和方法
WO2012106075A1 (en) * 2011-02-05 2012-08-09 Wifislam, Inc. Method and apparatus for mobile location determination
US8639640B1 (en) 2011-06-10 2014-01-28 Google Inc. Prediction of indoor location using decision trees
CN102607553B (zh) * 2012-03-06 2014-08-13 北京建筑工程学院 一种基于出行轨迹数据的行程识别方法
US8886649B2 (en) 2012-03-19 2014-11-11 Microsoft Corporation Multi-center canopy clustering
EP2883368B1 (en) * 2012-06-22 2019-06-05 Google LLC Labeling visited locations based on contact information
WO2013192583A1 (en) * 2012-06-22 2013-12-27 Google Inc Providing information about relevant elements from maps history based on location
EP2877935A4 (en) * 2012-07-25 2016-01-20 Aro Inc USE OF MOBILE DEVICE DATA TO CREATE A CANEVAS, MODEL THE HABITS AND PERSONALITY OF USERS AND CREATE CUSTOMIZED RECOMMENDATION AGENTS
CN103593349B (zh) * 2012-08-14 2016-12-21 中国科学院沈阳自动化研究所 感应网络环境下移动位置分析方法
US9740773B2 (en) 2012-11-02 2017-08-22 Qualcomm Incorporated Context labels for data clusters
US10191945B2 (en) 2013-02-20 2019-01-29 The Florida International University Board Of Trustees Geolocating social media
US20150147997A1 (en) * 2013-11-26 2015-05-28 At&T Intellectual Property I, L.P. Event based location-based service

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1939797A1 (en) * 2006-12-23 2008-07-02 NTT DoCoMo, Inc. Method and apparatus for automatically determining a semantic classification of context data
CN102509170A (zh) * 2011-10-10 2012-06-20 浙江鸿程计算机***有限公司 一种基于历史轨迹数据挖掘的位置预测***及方法
CN103841516A (zh) * 2014-02-28 2014-06-04 华中科技大学 一种基于移动电话数据识别城市特定区域的方法
CN104199936A (zh) * 2014-09-09 2014-12-10 联想(北京)有限公司 一种信息的处理方法和装置
CN104239556A (zh) * 2014-09-25 2014-12-24 西安理工大学 基于密度聚类的自适应轨迹预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Efficient clustering of high-dimensional data sets with application to reference matching;Andrew McCallum等;《KDD "00: Proceedings of the sixth ACM SIGKDD international conference on Knowledge discovery and data mining》;20000831;第169–178页 *

Also Published As

Publication number Publication date
EP3241370A1 (en) 2017-11-08
WO2016108977A1 (en) 2016-07-07
EP3241370B1 (en) 2019-10-02
US9904932B2 (en) 2018-02-27
CN106462627A (zh) 2017-02-22
DE202015009183U1 (de) 2016-11-10
US20160189186A1 (en) 2016-06-30

Similar Documents

Publication Publication Date Title
CN106462627B (zh) 根据多个位置数据报告分析语义地点和相关数据
US11762818B2 (en) Apparatus, systems, and methods for analyzing movements of target entities
CN108875007B (zh) 兴趣点的确定方法和装置、存储介质、电子装置
Chen et al. Measuring place-based accessibility under travel time uncertainty
Mohamed et al. Accurate real-time map matching for challenging environments
Hu et al. A graph-based approach to detecting tourist movement patterns using social media data
Siła-Nowicka et al. Analysis of human mobility patterns from GPS trajectories and contextual information
US8612134B2 (en) Mining correlation between locations using location history
KR101365993B1 (ko) 데이터처리방법, 데이터처리장치, 데이터수집방법, 및 정보제공방법
CN107679558A (zh) 一种基于度量学习的用户轨迹相似性度量方法
CN111212383B (zh) 区域常住人口数量的确定方法、装置、服务器和介质
Servizi et al. Mining User Behaviour from Smartphone data: a literature review
US9785993B2 (en) Method for analyzing and ranking venues
CN110674208B (zh) 用于确定用户的职住地信息的方法和装置
Alhazzani et al. Urban Attractors: Discovering patterns in regions of attraction in cities
GB2570853A (en) Identifying sites visited by a user device
Gutowski et al. Improving bandit-based recommendations with spatial context reasoning: An online evaluation
Kumrai et al. Automated construction of Wi-Fi-based indoor logical location predictor using crowd-sourced photos with Wi-Fi signals
Koh et al. Clustering and analysis of gps trajectory data using distance-based features
Gubiani et al. From trajectory modeling to social habits and behaviors analysis
Tiwari et al. User category based estimation of location popularity using the road GPS trajectory databases
JP2019128611A (ja) 生成装置、生成方法及び生成プログラム
US20170169025A1 (en) Estimating Geographic Entity Capacity
Gwinn et al. Comparison of Traditional and Constrained Recursive Clustering Approaches for Generating Optimal Census Block Group Clusters
Zhang et al. Reconstruction of human movement from large-scale mobile phone data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: American California

Applicant after: Google limited liability company

Address before: American California

Applicant before: Google Inc.

GR01 Patent grant
GR01 Patent grant