DE202015009183U1 - Das Analysieren semantischer Orte und verwandter Daten aus einer Vielzahl von Standortdatenberichten - Google Patents

Das Analysieren semantischer Orte und verwandter Daten aus einer Vielzahl von Standortdatenberichten Download PDF

Info

Publication number
DE202015009183U1
DE202015009183U1 DE202015009183.0U DE202015009183U DE202015009183U1 DE 202015009183 U1 DE202015009183 U1 DE 202015009183U1 DE 202015009183 U DE202015009183 U DE 202015009183U DE 202015009183 U1 DE202015009183 U1 DE 202015009183U1
Authority
DE
Germany
Prior art keywords
location
semantic
localized
location data
segments
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE202015009183.0U
Other languages
English (en)
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of DE202015009183U1 publication Critical patent/DE202015009183U1/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation
    • G06Q30/0205Location or geographical consideration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/025Services making use of location information using location based information parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/025Services making use of location information using location based information parameters
    • H04W4/026Services making use of location information using location based information parameters using orientation information, e.g. compass
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/025Services making use of location information using location based information parameters
    • H04W4/027Services making use of location information using location based information parameters using movement velocity, acceleration information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/80Services using short range communication, e.g. near-field communication [NFC], radio-frequency identification [RFID] or low energy communication

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Navigation (AREA)

Abstract

Ein computerimplementiertes System für das Ermitteln semantischer Ortsdaten, das dazu eingerichtet ist, das Folgende zu umfassen: das Prüfen einer Vielzahl von Zeitreihen historischer Standortdatenberichte mittels einer oder mehrerer Rechenvorrichtungen, um deren Überlappungsgrad zu ermitteln; das Gruppieren ausgewählter Zeitreihen an Standortdatenberichten mittels einer oder mehrerer Rechenvorrichtungen, die als hinreichend überlappend ermittelt werden; das Zuweisen von Standortklassifikatoren mittels einer oder mehrerer Rechenvorrichtungen, die eine oder mehrere Standortentitäten voneinander unterscheiden, basierend auf den Gruppierungen der ausgewählten Zeitreihen historischer Standortberichte, die als hinreichend überlappend ermittelt werden; und das Ermitteln semantischer Standortdaten für eine oder mehrere Zeitreihen der gegenwärtigen oder historischen Standortberichte unter Verwendung der zugeordneten Standortklassifikatoren, das mittels einer oder mehrerer Rechenvorrichtungen durchgeführt wird.

Description

  • PRIORITÄTSANSPRUCH
  • Die vorliegende Anwendung beansprucht den Vorteil der Priorität der vorläufigen US-Patentanmeldung mit der Seriennummer 62/097,423 mit dem Titel „Determining Semantic Place Boundaries and Related Data from a Plurality of Location Reports” eingereicht am 29. Dezember 2014, die durch Verweis für alle Zwecke hierin einbezogen wurde.
  • Unter Schutz gestellt werden und Gegenstand des Gebrauchsmusters sind dabei, entsprechend den Vorschriften des Gebrauchsmustergesetzes, lediglich Vorrichtungen wie in den beigefügten Schutzansprüchen definiert, jedoch keine Verfahren. Soweit nachfolgend in der Beschreibung gegebenenfalls auf Verfahren Bezug genommen wird, dienen diese Bezugnahmen lediglich der beispielhaften Erläuterung der in den beigefügten Schutzansprüchen unter Schutz gestellten Vorrichtung oder Vorrichtungen.
  • TECHNISCHES GEBIET
  • Die vorliegende Offenbarung betrifft im Allgemeinen das Ermitteln semantischer Ortsdaten, die mit verschiedenen Signalen in Verbindung gebracht werden, die einem geographischen Standort des Gerätes und vor allem dem Analysieren semantischer Orte und verwandter Daten aus einer Vielzahl von Standortdatenberichten angehören.
  • HINTERGRUND
  • Mobile Geräte, die intelligente Technologiefunktionen beinhalten, können eingesetzt werden, wenn sie zum Identifizieren des Standorts der Benutzer mobiler Geräte autorisiert werden. Angesichts des Wunsches, die Daten des Benutzers zu schützen, wird der Standort eines mobilen Geräts nur dann ermittelt, wenn der Benutzer dem zustimmt. Jede autorisierte Freigabe von Benutzer-Standortdaten erfolgt auf sichere und vertrauliche Weise. Die Daten werden nur freigegeben, wenn eine weitere Einwilligung bereitgestellt wird. Aus vielerlei Gründen ist die mit dem Standort eines mobilen Geräts verknüpfte Benutzeridentität derart in anonymer Form konfiguriert, dass die Benutzerhilfe und die Informationen bezüglich eines bestimmten Standorts ohne benutzerspezifische Informationen bereitgestellt werden.
  • Beim Verwenden eines mobilen Geräts, um den Standort eines Nutzers zu ermitteln, verwenden einige bekannte Systeme zuerst Standortsensoren eines mobilen Geräts, wie etwa Global Positioning System-(GPS)-Ausgaben, Funkabtastausgaben, Beschleunigungsmessgerätausgaben, um einen bestbekannten Schätzwert des physikalischen Standorts eines Benutzers einzuholen (z. B. spezifische geographische Koordinaten) Diese geographischen Koordinaten können dann mit einer Datenbank bekannter Plätze (z. B. örtliche Unternehmen) verglichen werden, um somit den wahrscheinlichsten semantischen Standort des Benutzers zu erschließen (. B. Name des Veranstaltungsorts, des Hauses, oder des Unternehmens). Die Genauigkeit dieser Methoden wird oft sowohl durch die Qualität und Genauigkeit der Standardsensoren als auch durch die Verfügbarkeit und Qualität der Metadaten semantischer Plätze eingeschränkt.
  • KURZDARSTELLUNG
  • Aspekte und Vorteile von Ausführungsformen der vorliegenden Erfindung werden teilweise in der folgenden Beschreibung dargelegt werden oder können aus der Beschreibung erlernt werden oder können durch die Praxis der Ausführungsformen erlernt werden.
  • Ein exemplarischer Aspekt der vorliegenden Offenbarung richtet sich ein computerimplementiertes Verfahren zum Ermitteln semantischer Ortsdaten. Das Verfahren kann das Prüfen einer Vielzahl von Zeitreihen historischer Standortdatenberichte mittels einer oder mehrerer Rechenvorrichtungen beinhalten, um deren Überlappungsgrad zu ermitteln. Das Verfahren kann ferner das Gruppieren ausgewählter Zeitreihen historischer Standortdatenberichte mittels einer oder mehrerer Rechenvorrichtungen beinhalten, die als hinreichend überlappend ermittelt werden. Das Verfahren kann ferner das Zuweisen von Standortklassifikatoren mittels einer oder mehrerer Rechenvorrichtungen beinhalten, die eine oder mehrere Standortentitäten voneinander unterscheiden, basierend auf der Gruppierung der ausgewählten Zeitreihen historischer Standortberichte, die als hinreichend überlappend ermittelt werden. Das Verfahren kann noch weiter das Ermitteln semantischer Standortdaten für eine oder mehrere Zeitreihen der gegenwärtigen oder historischen Standortberichte unter Verwendung der zugeordneten Standortklassifikatoren beinhalten, das mittels einer oder mehrerer Rechenvorrichtungen durchgeführt wird.
  • Ein anderer exemplarischer Aspekt der vorliegenden Offenbarung richtet sich ein computerimplementiertes Verfahren zum Ermitteln semantischer Ortsdaten. Das Verfahren kann das Empfangen einer Vielzahl von Standortdatenberichten von einer Vielzahl von mobilen Geräten beinhalten, welches mittels einer oder mehrerer Rechenvorrichtungen durchgeführt wird. Das Verfahren kann des Weiteren das Aufteilen der Vielzahl von Standortdatenberichten in lokalisierte Segmente von Standortdatenberichten beinhalten, welches mittels einer oder mehrerer Rechenvorrichtungen durchgeführt wird. Das Verfahren kann des Weiteren das Abschätzen eines Originalspeicherbereichs der geographischen Region für jedes lokalisierte Segment mittels einer oder mehrerer Rechenvorrichtungen beinhalten. Das Verfahren kann des Weiteren das Identifizieren einer oder mehrerer Clustering-Canopies mittels einer oder mehrerer Rechenvorrichtungen innerhalb jedes Originalspeicherbereichs der geometrischen Region beinhalten, bei denen es sich um Gruppen lokalisierter Segmente handelt, die einer potenziellen geographischen Überlappungscharakterisierung gerecht werden. Das Verfahren kann des Weiteren das Ermitteln der Überlappungsbewertung für jedes Paar des lokalisierten Segments mittels einer oder mehrerer Rechenvorrichtungen beinhalten, die mindestens ein Clustering-Canopy gemeinsam haben. Die Überlappungsbewertung kann mit dem Überlappen im Rahmen der tatsächlichen geographischen Gebiete korrelieren, welche durch die Bewegung der mobilen Geräte abgedeckt wird, welche die lokalisierten Segmente dieses gegebenen Paares generieren. Das Verfahren kann des Weiteren das Generieren einer Struktur mittels einer oder mehrerer Vorrichtungen beinhalten, die eine Clustering-Konfiguration der lokalisierten Segmente im jeweiligen Originalspeicherbereich der entsprechenden geographischen Region bereitstellt. Die Datenstruktur kann zumindest teilweise in Beziehung zur ermittelten Überlappungsbewertung generiert werden. Das Verfahren kann des Weiteren das Ermitteln der semantischen Ortsdaten für einen oder mehrere lokalisierte Segmente mittels einer oder mehrerer Rechenvorrichtungen beinhalten, basierend zumindest teilweise auf die Clustering-Konfiguration der generierten Datenstruktur.
  • Andere exemplarische Aspekte der vorliegenden Offenbarung richten sich an Systeme, Vorrichtungen, greifbare, nicht-transitorische computerlesbare Medien, Benutzeroberflächen, Speichervorrichtungen und elektronische Vorrichtungen für das Ermitteln semantischer Standortgrenzen und sonstiger damit Beziehung stehender Daten.
  • Diese und andere Merkmale, Aspekte und Vorteile verschiedener Ausführungsformen werden besser in Bezug auf die folgende Beschreibung und angefügten Ansprüche verstanden werden. Die beigefügten Zeichnungen, die in diese Beschreibung einbezogen sind und einen Teil dieser darstellen, illustrieren Ausführungsformen der vorliegenden Offenbarung und dienen zusammen mit der Beschreibung dazu, die damit verbundenen Prinzipien zu erklären.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Eine ausführliche Erörterung der Ausführungsformen, die auf Fachleute auf dem Gebiet gerichtet sind, wird in der Beschreibung dargelegt, die Bezug auf die beigefügten Figuren nimmt, in denen:
  • 1 bildet ein geographisches Modell eines exemplarischen Aspekts semantischer Ortsdaten, die aus einer Vielzahl von Ortssensorzeitreihen in Übereinstimmung mit den exemplarischen Aspekten der vorliegenden Offenbarung ermittelt werden;
  • 2 stellt ein Flussdiagramm eines exemplarischen Verfahrens für das Ermitteln semantischer Ortsdaten in Übereinstimmung mit den exemplarischen Aspekten der vorliegenden Offenbarung;
  • 3 bildet eine grafische Repräsentation abgeschätzter Gerätestandorte von Standortdatenberichten, die aus einer Vielzahl von mobilen Geräten gemäß exemplarischen Aspekten der vorliegenden Offenbarung eingesammelt werden;
  • 4 bildet eine grafische Repräsentation abgeschätzter Originalspeicherbereiche der geographischen Region für verschiedene lokalisierte Segmente gemäß exemplarischen Aspekten der vorliegenden Offenbarung;
  • 5 stellt ein Flussdiagramm eines exemplarischen Verfahrens für das Ermitteln einer Überlappungsbewertung für Paare lokalisierter der Segmente in einem Originalspeicherbereich der geographischen Region in Übereinstimmung mit den exemplarischen Aspekten der vorliegenden Offenbarung;
  • 6 bildet eine grafische Repräsentation einer Vielzahl von lokalisierten Segmenten innerhalb eines gegebenen Originalspeicherbereichs der geographischen Region gemäß exemplarischen Aspekten der vorliegenden Offenbarung ab;
  • 7 bildet eine grafische Repräsentation einer exemplarischen Datenstruktur, die für das Einsammeln lokalisierter Segmente aus 6 gemäß exemplarischen Aspekten der vorliegenden Offenbarung generiert werden;
  • 8 stellt ein Flussdiagramm eines exemplarischen Verfahrens für das Ermitteln semantischer Ortsdaten für ein oder mehrere lokalisierte Segmente in jedem Originalspeicherbereich der geographischen Region, basierend zumindest teilweise auf einer Clustering-Analyse;
  • 9 stellt eine grafische Repräsentation exemplarischer Kennzeichnungen semantischer Ortsdaten und Klassifizierer-Training, um bei den Beispielen aus 6 und 7 gemäß exemplarischen Aspekten der vorliegenden Offenbarung zu bleiben;
  • 10 stellt eine grafische Repräsentation einer Abfragemodellanalyse für neue lokalisierte Segmente um bei den Beispielen aus 6, 7 und 9 gemäß den exemplarischen Aspekten der vorliegenden Offenbarung zu bleiben;
  • 11 stellt ein Flussdiagramm eines exemplarischen Verfahrens für das Ermitteln semantischer Ortsdaten in Übereinstimmung mit den exemplarischen Aspekten der vorliegenden Offenbarung;
  • 12 stellt ein Flussdiagramm eines anderen exemplarischen Verfahrens für das Ermitteln semantischer Ortsdaten in Übereinstimmung mit den exemplarischen Aspekten der vorliegenden Offenbarung; und
  • 13 stellt eine exemplarische Übersicht über Systemkomponenten für das Implementieren einer semantischen Ortgrenzerfassungsanwendung gemäß exemplarischen Aspekten der vorliegenden Offenbarung.
  • DETAILLIERTE BESCHREIBUNG
  • Bezug wird nun im Detail auf Ausführungsformen genommen werden, von denen ein oder mehrere Beispiele in den Zeichnungen dargestellt sind. Jedes Beispiel wird zur Erläuterung der Ausführungsformen bereitgestellt, nicht zur Beschränkung der vorliegenden Offenbarung. Tatsächlich ist für Fachleute ersichtlich, dass diverse Modifikationen und Variationen an den Ausführungsformen durchgeführt werden können, ohne vom Umfang oder Geist der vorliegenden Offenbarung abzuweichen. Zum Beispiel können Merkmale, die als Teil einer Ausführungsform veranschaulicht oder beschrieben werden, mit einer anderen Ausführungsform verwendet werden, um eine noch weitere Ausführungsform zu erreichen. Deshalb ist beabsichtigt, dass Aspekte der vorliegenden Offenbarung solche Modifikationen und Variationen abdecken.
  • Exemplarische Aspekte der vorliegenden Offenbarung sind auf Systeme und Verfahren für das Analysieren semantischer Orte und verwandter Daten von Standortdatenberichten gerichtet. Die Genauigkeit bekannter Ansätze zum Assoziieren semantischer Ortsdaten mit Standortsignalen mobiler Geräte kann eingeschränkt sein. In einigen Fällen ergeben sich Einschränkungen basierend auf der Qualität oder den Ressourcenverbrauch der Standortsensoren. Einschränkungen mobiler Geräte im Zusammenhang mit der Batterie, der Antennengröße, und der Architektur der mobilen Hardware und der Betriebssysteme erschweren das zuverlässige Berechnen des physischen Standorts eines Benutzers mit genügender Präzision, um einen semantischen Ort unter vielen Umständen genau orten zu können. Die Genauigkeit dieses Ansatzes kann auch durch die Verfügbarkeit und Qualität semantischer Ortsmetadaten eingeschränkt werden. Selbst mit diesen außerordentlich präzisen und durchgängig gleichbleibenden Festsetzungen des physischen Standortes eines Benutzers würde ein System zur Identifizierung eines semantischen Ortes einen vollständigen, detaillierten, durchgängig gleichbleibend aktuellen Datensatz zu den genauen Grenzen der semantischen Orte an jedem Ort der physischen Welt erfordern. Dieser Typ einer umfassenden Datenbank lässt sich nur schwer verwirklichen und durchgängig aufrechterhalten.
  • Die offenbarten Ausführungsformen gemäß Aspekten der vorliegenden Offenbarung können standortbewusste technologische Merkmale bereitstellen, die nützliche und präzisere semantische Standortdaten generieren, die mit dem Standort eines Benutzers in Verbindung gebracht werden (z. B. der Name des Standorts, an dem ein Benutzer sich befindet; eine zusammenhängende Teilmenge eines einzelnen Standorts oder eines Satzes mehrerer Standorte, die von einer Person bei einem einzelnen Besuch durchquert werden; ob der Nutzer sich an einem Ort befindet, der von einer vielfältigen und sich in Bewegung befindlichen Population an Menschen bevölkert ist, oder sich an einem privaten Ort befindet, der von einer kleinen sich nicht verändernden Menschenmenge geteilt wird). Genauere semantische Ortsdaten, einschließlich semantischer Ortsmodelle und/oder Modellantworten semantischer Ortklassifizierungen auf Abfragedaten können zu einer verbesserten Generierung semantischer Ortsmetadaten und präziseren Prognosen für den semantischen Standort eines Benutzers, basierend auf neuen Berichtsinformationen zu Standortdaten führen. Durch das Bereitstellen robuster Systeme und Verfahren zum Ermitteln dieser standardbasierten Informationen und durch das Verbessern der Genauigkeit derartiger Informationen können entsprechende Verbesserungen an standortbasierten Technologien vorgenommen werden, wie zum Beispiel kontextuell beeinflusste Dienstleistungen, Ausrichtung der Werbung, das Nachverfolgen der Effektivität der Werbung. Diese Verbesserungen können sich für eine Vielzahl von technologischen Einheiten, einschließlich mobiler Plattformdesigner und Hersteller, Entwickler standortbewusster mobiler Anwendungen und Telekommunikationsanbieter als nützlich erweisen.
  • Exemplarische Ausführungsformen können computerimplementierte Systeme und Verfahren zum Ermitteln semantischer Ortsdaten, einschließlich Clustering-Verfahren beinhalten, die als Teil des automatischen und dynamischen Lernens von semantischen Ortassoziationen eingesetzt werden. Exemplarische Eingaben dieser computerimplementierten Technologie können in Form eines großen Korpus an Standortdatenberichten wie zum Beispiel Zeitreihen von Ortssensorberichten einer großen Anzahl von unterschiedlichen mobilen Geräten bereitgestellt werden. Diese Standortdatenberichtsinformationen können optional eine Vielzahl an spezifischen Daten beinhalten, zu denen unter anderem auch die im Folgenden aufgeführten gehören: Benutzer und/oder mobile Geräteidentifikatoren (IDs); Zeitstempel; unbearbeitete Lesungen der Standortsensoren, die in der Regel das Abschätzen einer Entfernung zu null oder mehreren „Signalanlagen” ermöglichen, deren approximativer Standort bekannt ist; physische Standortabschätzungen; und/oder physische Standortfehlermodelle. Signalanlagen können Wi-Fi-Zugriffspunkte, GPS-Satelliten, Funktürme, und/oder Bluetooth-Transmitter beinhalten. In Beispielen, in denen die Standortdatenberichte einer großen Sammlung an WiFi Scans entsprechen, können die unbearbeiteten Lesungen der Standortsensoren Identifikatoren und/oder Lesungen der WiFi Signalstärken und/oder Zugangspunktfrequenzen und Kanaldaten für diejenigen, die vom Gerät beobachtet wurden. Physische Standortabschätzungen sind auf GPS, Mobilfunkmast-Triangulationen, Wi-Fi-basierte Geopositionen, Beschleunigungsmessgeräte oder kreiselgestützte Koppelortungen, Barometerlesungen, und/oder sonstige standortbasierte Eingabedaten zurückzuführen.
  • Um die Vorteile der hierin beschriebenen Verfahren zu erhalten, kann der Benutzer in einigen Ausführungsformen dazu aufgefordert werden, die Sammlung und Analyse der Standardinformationen, die mit einem Benutzer oder einem Gerät in Verbindung stehen, zuzulassen. So haben Benutzer bei einigen Ausführungsformen die Möglichkeit zur Steuerung, ob Programme oder Funktionen derartige Informationen erfassen dürfen. Wenn der Benutzer die Erfassung und Nutzung solcher Signale nicht erlaubt, kann der Benutzer auch nicht in den Genuss der hier beschriebenen Vorteile kommen. Dem Benutzer können auch Werkzeuge bereitgestellt werden, mit denen er seine Zustimmung widerrufen oder modifizieren kann. Zusätzlich können gewisse Informationen oder Daten auf eine oder mehrere Wege behandelt werden, bevor sie gespeichert oder verwendet werden, sodass personenbezogene Informationen entfernt werden. Die Ausführungsformen der offenbarten Technologie können beispielsweise konfiguriert werden, um die Privatsphäre von Benutzern durch das Entfernen der Identifikatoren für mobile Geräte oder Benutzer zu verbessern. In einigen Instanzen können das Gerät und/oder die Benutzeridentifikatoren gegen einen verlustbehafteten Geräteindikator ausgetauscht werden, der eine große Anzahl an Geräten oder Benutzern in einen einzigen Identifikator zusammenfasst.
  • Aus der Sammlung der Standortdatenberichte, die von unterschiedlichen mobilen Geräten empfangen werden, können lokalisierte Segmente von Standortdatenberichten erstellt werden, indem die Standortdatenberichte in unterschiedliche Zeitreihensegmente aufgeteilt werden können, während denen ein mobiles Gerät innerhalb eines gegebenen lokalisierten Bereichs verbleibt. Lokalisierte Segmente können dann als zu einem oder mehreren Originalspeicherbereichen geographischer Regionen gehörend charakterisiert werden. Diese Originalspeicherbereiche geographischer Regionen können Kugeln, Rechtecken, oder sonstigen Vielecken entsprechen, die die Oberfläche der Erde auf eine sinnvolle Weise aufteilen. Die geographischen Grenzen einer Stadt lassen sich in einem rechteckigen Gitternetz aus Originalspeicherbereichen einer geographischen Region aufteilen. Jedes lokalisierte Segment gehört dann Schätzungen zufolge zu einem oder mehreren dieser Originalspeicherbereiche der geographischen Region. In einigen Beispielen umfasst diese Abschätzung das Ermitteln des mittleren abgeschätzten physischen Standorts eines Benutzers innerhalb des Zeitfensters jedes lokalisierten Segments und das Aufrunden desjenigen mittleren Standorts auf einen oder mehrere zuvor festgelegte Originalspeicherbereiche der geographischen Region. In einigen Instanzen kann ein gegebenes lokalisiertes Segment für einen Benutzer oder ein mobiles Gerät zu mehr als einem Originalspeicherbereich der geographischen Region gehörend, abgeschätzt werden.
  • Sobald alle lokalisierten Segmente in entsprechende Originalspeicherbereiche geographischer Regionen abgeschätzt worden sind, werden verschiedene Abwicklungsmerkmale für jeden Originalspeicherbereich der geographischen Region umgesetzt. Anfänglich können in jedem Originalspeicherbereich der geographischen Region eine oder mehrere Clustering Canopies identifiziert werden, bei denen ein Clustering Canopy eine Gruppe lokalisierter Segmente im gegebenen Originalspeicherbereich der Region darstellt, die eine potentielle geographische Überlappungscharakterisierung erfüllt. In einem Beispiel wird ein Clustering Canopy als bestimmter einzelner Signalanlagen-Identifikator, wie etwa ein Wi-Fi-Zugangspunkt der BSSID, der im Originalspeicherbereich der geographischen Region beobachtet wird, definiert. In einigen Implementierungen enthält ein derartiges Clustering Canopy alle lokalisierten Segmente, die mindestens eine Schwellenanzahl oder einen Bruchteil an Standortdatenberichten enthalten, die angeben, dass der gegebene Signalanlagenidentifikator beobachtet wurde, bzw. oberhalb einer Schwellensignalstärke oder innerhalb einer bestimmten Entfernungsabschätzung beobachtet wurde.
  • In einem gegebenen Originalspeicherbereich einer geographischen Region sind Paare lokalisierter Segmente, die mindestens ein Clustering Canopies teilen, für die Bewertung von Überlappungen auswählbar. Überlappungsbewertungen können mit dem Überlappen im Rahmen des tatsächlichen geographischen Gebiets korrelieren, welches durch die Bewegung der mobilen Geräte abgedeckt wird, welche die lokalisierten Segmente dieses gegebenen Paares oder der Gruppe lokalisierter Segmente generieren. Die Region, die durch die Bewegung eines mobilen Geräts abgedeckt wird, kann als eine oder eine Kombination der folgenden Regionen definiert werden: die konvexe Hülle der Standorte des Geräts, die konvexe Hülle der Standorte des Geräts mit vorenthaltenen Ausreißerstandorten, die Summe der Kernelfunktionen am Standort des Geräts. Der resultierende Satz an Überlappungsbewertungen für die in Betracht zu ziehenden Paare der lokalisierten Segmente wird dann verwendet, um eine Datenstruktur zu generieren, die ein hierarchisches Clustering der lokalisierten Segmente in jedem Originalspeicherbereich der geographischen Region bereitstellt. In einigen Beispielen handelt es sich bei der generierten Datenstruktur um eine Walddatenstruktur deren Blätter den lokalisierten Segmenten entsprechen. In einigen Beispielen werden ein oder mehrere zur Verarbeitung verwendete Algorithmen wie etwa ein hierarchischer agglomerativer Clustering (HAC) Algorithmus des Canopy eingesetzt, um die Datenstruktur zu generieren. In einigen Beispielen verwendet der HAC Algorithmus eine verflechtungszusammenführende Heuristik. In einigen Beispielen ist die verwendete verflechtungszusammenführende Heuristik eine durchschnittliche Verflechtungszusammenführung.
  • Sobald die Clustering-Verfahren verwendet werden, um unterschiedliche lokalisierte Segmente zusammen in einer Datenstruktur zu assoziieren, betreffen zusätzliche Aspekte der offenbarten Technologie ein entsprechendes Ermitteln der semantischen Ortsdaten zu ausgewählten korrelierenden Segmenten. In der generierten Datenstruktur können verschiedene Arten semantischer Ortsdaten für einen oder mehrere lokalisierte Segmente in jedem Originalspeicherbereich der geographischen Region mit einem oder mehreren Knoten in der hierarchischen Clustering-Konfiguration in Verbindung gebracht werden. In einem Beispiel können ein oder mehrere lokalisierte Segmente, die mit semantischen Ortsdaten in Verbindung gebracht werden, dazu verwendet werden, um andere Knoten in der Datenstruktur mit den semantischen Ortsdaten einer oder mehrerer gegebener Segmente in Verbindung zu bringen, basierend zumindest teilweise auf der Datenstruktur. In einigen Beispielen können die semantischen Ortsdaten der Identifikator eines Standorts sein. In anderen Beispielen können die semantischen Ortsdaten ein oder mehrere Identifikatoren möglicher Standorte sein, die mit den geschätzten Wahrscheinlichkeiten oder Bewertungen gepaart werden. In noch weiteren Beispielen können die semantischen Ortsdaten demographische Daten des Benutzers beinhalten, die mit einem semantischen Ort, Beliebtheitsgraden für Orte, Benutzer oder sonstige Entitäten in Verbindung stehen, die mit den assoziierten Standortentitäten in Verbindung stehen, prädiktive Benutzerinformationen, die mit den assoziierten Standardentitäten in Verbindung stehen, oder sonstige nützliche Informationen, die mit den assoziierten Standardentitäten in Verbindung stehen.
  • In einigen Beispielen, die auf eine Abfrage Bezug nehmen, die einen Standortdatenbericht, eine Gruppe eines oder mehrerer Standortdatenberichte oder ein lokalisiertes Segment eines gegebenen Geräts, enthält, kann die Datenstruktur und ihre damit in Verbindung stehenden semantischen Ortskennzeichnungen dazu verwendet werden, um eine Prognose der semantischen Ortsdaten für die gegebene Vorrichtung zum Zeitpunkt zu generieren, an dem es die Abfragedaten einsammelte. In einem Beispiel kann die Abfrage das Abfragen des gegenwärtigen Standortdatenberichts des Gerätes beinhalten. In einem anderen Beispiel kann die Abfrage zwei oder mehr zuletzt aufgezeichnete Standortdatenberichte oder aktuelle lokalisierte Segmente beinhalten. In einem bei weiterem Beispiel kann die Abfrage eine Vielzahl an Standortberichten oder lokalisierten Segmenten beinhalten, die vom Gerät in der Vergangenheit aufgezeichnet worden sind.
  • In anderen Beispielen können geographische Modelle unter Verwendung einer oder mehrerer Kanten oder Graph-Cuts der maximalen Größe oder der Spärlichkeit in der Walddatenstruktur erstellt werden, um die semantischen Ortsgrenzen hinsichtlich der statistischen Eigenschaften der Standortdatenberichte zu definieren, die auf den zwei Seiten der Kante oder des Graph-Cuts erscheinen. In weiteren Beispielen können die abgeschätzten physischen Standorte der Gruppen von Berichten, die von der Kante oder dem Graph-Cut getrennt werden, dazu verwendet werden, um abgeschätzte erfasste geographische Grenzen für verschiedene semantische Standorte zu generieren.
  • Noch weitere Anwendungen der vorliegenden Offenbarung können lokalisierte Segment-Clustering-Ergebnisse für unterschiedliche Zwecke verwenden.
  • Gemäß einer exemplarischen Ausführungsform bieten Mobilgerätenutzer historische oder aktuelle Informationen über ihren Standort an, einschließlich eines oder mehrerer Standortdatenberichte, mit einem oder mehreren der im Folgenden aufgeführten: einem Zeitstempel, einem abgeschätzten physischen Standort und einer semantischen Ortskennzeichnung. Sowohl diese Standortdatenberichte als auch optionale Informationen hinsichtlich semantischer Ortsmetadaten, die nahegelegenen Standorten aus den Standortdatenberichten der Nutzer entsprechen, werden in Verbindung mit den offenbarten semantischen Ortsgrenzenerfassungsverfahren verwendet, um Clustering-Datenstrukturen und verwandte Modelle zu generieren, die eine erhöhte Genauigkeit der semantischen Standortsassoziationen unterschiedlicher geographischer Gebiete bereitstellen. Die sich ergebenden Datenstrukturen und verwandten Modelle können dann für zukünftige standortbasierte Anwendungen verwendet werden. Das nächste Mal, wenn ein Benutzer eines mobilen Geräts beispielsweise einen Standortdatenbericht generiert, der über bestimmte Koordinaten verfügt, kann ein prognostizierter semantischer Standort, der mit diesen Koordinaten oder sonstigen verwandten semantischen Standortdaten in Verbindung gebracht wird, einem Benutzer mit höherer Konfidenz präsentiert werden oder kann verwendet werden, um verwandte standardbasierte Informationen zu generieren, die über einen erhöhten Grad des entsprechenden Kontexts verfügen.
  • Einige Aspekte der offenbarten Technologie beziehen sich auf die Abschätzung, Ermittlung und Generierung von Standortinformationen, die bei Karten oder sonstigen standardbasierten Technologien behilflich sein können. Aus diesem Grund zeigen 1 und sonstige Figuren hierin, Aspekte der offenbarten Technologie relativ zu Kartenschnittstellen. Es versteht sich von selbst, dass die offenbarten Ausführungsformen nicht auf Kartenanwendungen beschränkt sind, und auf Anwendungen, wie kontextuell beeinflusste Dienstleistungen, die Ausrichtung von Werbung, das Nachverfolgen der Effektivität und Sonstige, erweitert werden können.
  • Unter genauerer Bezugnahme auf 1 beinhaltet ein exemplarisches geographisches Modell 100 einen herausgeschnittenen Abschnitt einer elektronisch erzeugten grafischen Kartenschnittstelle 102. Die grafische Kartenschnittstelle 102 aus 1 und sonstige hierin dargestellte Figuren, können nur einen Abschnitt der Gesamtheit der Schnittstelle einer globalen Karte veranschaulichen, auf die über die Ausführungsformen der offenbarten Technologie zurückgegriffen werden kann. Die grafische Kartenschnittstelle 102 kann eine grafische Abbildung der ungefähren darin enthaltenen physischen bzw. der sich aus einer Vielzahl von Benutzerstandorten erschließbaren Standorte bereitstellen, die von einer Vielzahl von mobilen Vorrichtungen innerhalb eines ausgewählten Zeitraums empfangen werden. Ein oder mehrere Strecken (z. B. jeweilige Strecken 104132) entsprechend der geographischen Standorte, die von einer Vielzahl an Benutzern mobiler Geräte während eines ausgewählten Zeitraums (z. B. 1. April 2014 bis 30. Juni 2014) durchquert werden. Die Strecken 104132, die von einer Vielzahl von Benutzern verwendet werden, können über eine Karte, die ein entsprechendes geographisches Gebiet zeigt, das von den Benutzern durchquert wird, überlagert werden. Einige Benutzer durchquerten größere Entfernungen während des ausgewählten Zeitraums, zum Beispiel Benutzer, die mit den Strecken 104, 112, 114 und 132 in Verbindung gebracht wurden. Andere Benutzer waren etwas stationärer oder durchquerten kürzere Entfernungen während des ausgewählten Zeitraums.
  • In anderen Beispielen könnte die Schnittstelle einer geographischen Karte 102 die darin enthaltenen ungefähren physischen Standorte bzw. die aus Standortdatenberichten in Form von Punkten oder sonstigen Symbolen erschließbaren physischen Standorte veranschaulichen, die repräsentativ sind für periodisch eingeholte spezifische Momentaufnahmen der Benutzerstandorte in Echtzeit, im Gegensatz zum dementsprechenden Interpolieren zwischen empfangenen Standortdatenberichten unter Verwendung der von den Strecken 104132 dementsprechend aufgezeigten kontinuierlichen Echtzeit-Ortung. Anstatt eine kontinuierliche Strecke für jeden Benutzerstandort eines mobilen Geräts anzuzeigen, könnte ein einzelnes Symbol oder eine einzelne Markierung beispielsweise veranschaulicht werden, um den Benutzerstandort in Intervallen anzuzeigen, zum Beispiel jede zuvor festgelegte Anzahl von Sekunden oder Minuten. Trotz der unterschiedlichen Arten, um Standortdatenberichte auf einer Karte zu veranschaulichen, können Standortdatenberichte im Allgemeinen Zeit und Informationen über den Standort des Gerätes bereitstellen. Der in jedem Standortdatenbericht enthaltene Standort kann beispielsweise eine Abschätzung der Koordinaten des Gerätes (z. B. Breitengrad, Längengrad, und/oder Höhe), einen Schätzwert oder ein Modell des Fehlers der Koordinaten des Geräts, der unbearbeiteten Signale, die das Identifizieren und den abgeschätzten Abstand zu einer oder mehreren Signalanlagevorrichtungen, wie etwa einem WiFi-Zugangspunkt, GPS-Satellit, Funkmast, oder Bluetooth-Transmitter), IP-Adressen Informationen, Geocodes, und sonstige Informationen, die einen bestimmten Standort identifizieren oder damit in Verbindung gebracht werden.
  • Weiterhin mit Bezug auf 1, die Analyse, die in Übereinstimmung mit den offenbarten Ausführungsformen durchgeführt wird, erleichtert eine Gruppierung von Standortdatenberichten in lokalisierte Segmente. Wie an späterer Stelle noch ausführlicher beschrieben, können Clustering-Algorithmen verwendet werden, um eine Datenstruktur für jeden Originalspeicherbereich der geographischen Regionen zu generieren, die auf lokalisierte Segmente basiert und verwendet werden kann, um Klassifizierer für sinnvolle Grenzen oder Gruppierungen zwischen semantischen Orten zu erstellen. Eine als Beispiel gewählte Ausführungsform verwendet die Datenstruktur, die von einem Clustering-Algorithmus für ein oder mehrere lokalisierte Eingabesegmente entwickelt wurde, und semantische Ortsdaten für ein oder mehrere lokalisierte Eingabesegmente, um lokalisierte Eingabesegmente approximativ in diejenigen, die von Geräten, die einen gegebenen semantischen Ort besuchen von denjenigen, die von Geräten empfangen werden, die diesen nicht besuchen, zu trennen. Diese Klassifizierung kann zusammen mit abgeschätzten Standorten der lokalisierten Standortdatenberichte der Segmente dazu verwendet werden, um prognostizierte Grenzen für einen semantischen Ort zu generieren.
  • Sofern beispielsweise unter Berücksichtigung des Clusters der Strecken 106, 108 und 110 in 1 ein oder mehrere davon bekannterweise von einem Café namens „Luscious Lattes” empfangen wurden, kann die Clustering-Datenstruktur, die von den offenbarten Ausführungsformen erstellt wurde, es uns ermöglichen, alle derartigen Strecken als von Luscious Lattes empfangen, zu kennzeichnen und alle anderen Strecken als nicht von Luscious Lattes empfangen, zu kennzeichnen. Die exakten Grenzen des Cafés 140 sind möglicherweise nicht bekannt. Die offenbarten Ausführungsformen können jedoch sowohl eine geographische Grenzschätzung 142 für Luscious Lattes als auch einen Klassifizierer erhalten, der bezugnehmend auf einen neuen Standortdatenbericht oder ein lokalisiertes Segment die Wahrscheinlichkeit erhöht, dass dieser von Luscious Lattes empfangen worden ist. Im Laufe der Zeit und unter Berücksichtigung einer zunehmend großen Anzahl an Standortdatenberichten könnte die Grenzabschätzung 142 erwartungsgemäß mit Präzision und Abdeckung anwachsen, so dass die Grenzabschätzung 142 sich letzten Endes demselben Gebiet annähert als das, welches von den tatsächlichen Grenzen 140 des physischen Raumes umfasst wird, das von Besuchern von Luscious Lattes durchquert wird.
  • Ein weiteres Beispiel wird in 1 relativ zu einem im Freien gelegenen Orientierungspunkt angezeigt, wobei Central Park über eine tatsächliche Grenze 146 verfügt. Die Analyse in Übereinstimmung mit dem offenbarten Verfahren relativ zu den Strecken 113, 116, 118, 120, 122, 124, 126, 128 und 130 könnte eine exemplarische Grenzabschätzung 144 generieren, die als Näherungswert für die Grenze des Central Park verwendet werden kann. In einem anderen Beispiel können die generierte Grenzabschätzung 144 oder das entsprechende Klassifizierungsmodell für neue Standortdatenberichte oder lokalisierte Segmente als unabhängig betrachtet werden, um einen semantischen Ort, der von Benutzern während eines einzigen Besuchs oft durchquert wird, zu definieren. Dies kann beispielsweise der öffentlich zugänglichen Teilmenge des Parks oder einem besonders beliebten Bereich oder einer Teilmenge des Parks entsprechen, der am besten für Benutzer geeignet ist, die mit einer oder mehreren demographischen oder psychografischen Eigenschaften, wie dies etwa bei einem Hundepark der Fall ist, übereinstimmen. Die offenbarten Ausführungsformen können dann mit dem Modell, das der Grenzabschätzung 144 entspricht, als Antwort auf ein oder mehrere Standortdatenberichte oder lokalisierten Segmenten verwendet werden, die von einem gegebenen Benutzer empfangen werden, der ermittelt, ob es sich bei dem gegebenen Benutzer tatsächlich um einen Hundebesitzer handelt.
  • Das Generieren von Grenzabschätzungen wie im Beispiel aus 1 gezeigt und die relativ zu einigen offenbarten Ausführungsformen besprochen werden, können aus einer Vielzahl von Gründen hilfreich sein. Selbst wenn eine allgemeine Adresse oder geographische Koordinaten für einen gegebenen semantischen Ort (z. B. Luscious Lattes) bekannt sind, können die Grenzen eines Gebäudeexterieurs, Gebäudeinterieurs oder einer Teilmenge des Gebäudeinneren, in dem sich ein Unternehmen, eine Wohnstätte, ein Referenzpunkt, oder ein sonstiger Standort befindet, nicht bekannt sein. Selbst wenn die Umrisse des Standorts bekannt sind, können die inneren Grenzen innerhalb denen Benutzer ihre mobilen Geräte betreiben, von den äußeren oder den inneren Umrissen des Standorts variieren. Für sich im Freien befindliche Standorte, wie etwa im Falle des Central Park, der in 1 dargestellt wird, können die erfassten Grenzen 146, die den Flächenbereich definieren, sich grundsätzlich von dem tatsächlichen navigierbaren Bereich unterscheiden, innerhalb dessen, ein Benutzer in der Regel ein mobiles Gerät betreibt. Dies könnte auf versperrte Gebiete, nicht navigierbares Gelände aufgrund von Gewässern, Felsformationen, Zäunen, oder sonstigen natürlichen und künstlichen Hindernissen zurückzuführen sein.
  • Semantische Grenzen, denen die offenbarten Ausführungsformen zu Grunde liegen, entsprechen möglicherweise wohl definierten POI Grenzen ebenfalls nicht, sondern eher Verhaltensmustern von Benutzern, wie etwa der Trennung zwischen einem Hundepark und einem Spielplatz oder zwischen zwei Abteilungen eines großen Geschäfts. Die Abschätzung einer geometrischen Grenze und/oder ein unbearbeiteter Signalklassifizierer, der eine semantische Ortsgrenze eines Platzes charakterisiert, der von Nutzern von mobilen Geräten oft durchquert wird, ist für die Erstellung von zukünftigen Prognosen über den semantischen Standort, der mit aktuellen, künftigen oder vergangenen Standortdatenberichten und/oder lokalisierten Segmenten in Verbindung gebracht wird und für Zeichnungen anderer semantischer Interferenzen hinsichtlich des Berichterstattens des Verhaltens des Benutzers des Geräts oder demographische oder psychografische Eigenschaften, von Vorteil.
  • 2 stellt ein Flussdiagramm eines exemplarischen Verfahrens 200 für das Ermitteln semantischer Ortsdaten in Übereinstimmung mit den Aspekten der vorliegenden Offenbarung. Eine Vielzahl von Standortdatenberichten wird von einer Vielzahl an mobilen Geräten empfangen (202). In einigen Beispielen kann eine umfassendere Analyse durchgeführt werden, indem eine größere Anzahl an Standortdatenberichten von einer größeren Sammlung an mobilen Geräten (z. B. durch das Einsammeln von Standortdatenberichten über einen längeren Zeitraum) durchgeführt wird. Standortdatenberichte können im Allgemeinen Daten entsprechen, die Informationen bereitstellen, die für das Etablieren des Standorts des Benutzers eines mobilen Geräts zu einem bestimmten Zeitpunkt und an einem bestimmten Standort des Benutzers des mobilen Geräts, relevant sind. Spezifische Standortdatenberichte können ein oder mehrere der Folgenden beinhalten: einen Identifikator des mobilen Geräts; einen Benutzeridentifikator; einen Zeitstempel; einen abgeschätzten physischen Standort; ein Modell des wahrscheinlichen Fehlers im physischen Standort; ein oder mehrere unbearbeitete Lesungen der Standortsensoren, die für jeden, der einen oder mehreren Signalanlagenvorrichtungen (wie etwa einen WiFi-Zugangspunkt, einen GPS-Satellit, einen Funkmast, oder einen Bluetooth-Transmitter) die Identität der Signalanlage und eine Messgröße angeben, die eine Abschätzung der Entfernung zwischen der Signalanlage und dem mobilen Gerät ermöglicht; sonstige unbearbeitete Sensorlesungen (wie etwa einen Beschleunigungsmesser, einen Gyroskop, einen Barometer, einen Magnetometer); Informationen über den semantischen Standort der Vorrichtung, sofern dieser bekannt ist; und/oder ein Konfidenzmaß im semantischen Standort.
  • In einigen Beispielen handelt es sich bei den verwendeten Signalanlagen um Wi-Fi-Zugangspunkte mit einem Wi-Fi Empfangssignalstärkeindikator (RSSI), der verwendet wird, um die Entfernung zu den Zugangspunkten abzuschätzen. Die Standortdatenberichte können dann als eine große Sammlung an Wi-Fi Scan Zeitserien eingeholt werden, die von einem Originalspeicherbereich der geographischen Region eingesammelt werden. Jede Eingabe in eine derartige Sammlung an Zeitreihenberichten kann beispielsweise einen oder mehrere Zugangspunktidentifikatoren für drahtlose Zugangspunkte beinhalten, die für jedes mobile Gerät sichtbar sind. Spezifische Identifikatoren können eine Basisdienstmengenkennung (BSSID – Basic Service Set Identifier), die der Medien-Zugangssteuerungsarchitektur (Media Access Control (MAC)) Adresse für diesen drahtlosen Zugangspunkt entspricht, beinhalten. Für jede berichtete BSSID kann der Bericht auch eine entsprechende Signalstärkelesung, z. B. einen Empfangssignalstärkeindikator-(RSSI)-Wert, einen Zeitstempel, und optionalen Identifikator des Gerätes oder des Benutzers von dem der Bericht generiert wurde, beinhalten.
  • Wiederum bezugnehmend auf 2 die Vielzahl der empfangenen Standortdatenberichte werden dann in eine Vielzahl an lokalisierten Segmenten aufgeteilt (204). Jedes lokalisierte Segment kann im Allgemeinen einer Zeitreihe entsprechen, während der ein bestimmtes mobiles Gerät mehr oder weniger stationär geblieben ist. In einigen Beispielen kann eine Startzeit und eine Endzeit mit jedem lokalisierten Segment in Verbindung gebracht werden. Die Startzeit für jedes lokalisierte Segment kann zum Beispiel die früheste Zeit sein, die mit einem Standortdatenbericht jeglicher Art, der in einem derartigen Segment beinhaltet ist, in Verbindung gebracht wird. Gleichermaßen kann die Startzeit für jedes lokalisierte Segment zum Beispiel die früheste Zeit sein, die mit einem Standortdatenbericht jeglicher Art, der in einem derartigen Segment beinhaltet ist, in Verbindung gebracht wird. Falls die Endzeit eines Segments minus die Startzeit des Segments in einigen Beispielen nicht größer als ein Schwellenwert (z. B. zehn Minuten) ist, dann kann ein derartiges Segment eliminiert oder auf sonstige Weise ignoriert werden. In einigen Beispielen können Segmente an diejenigen Zeiten gebunden werden, zu denen die Standortsensorlesungen des Benutzers angeben, dass der Benutzer sich deutlich schneller als zu Fuß fortbewegt, so dass die Standortdatenberichte der Zeiten, in denen sich ein Benutzer fahrend fortbewegt, lokalisierte Segmente entschränken und nicht als Teil der offengelegten Systeme und Verfahren für das Bestimmen der semantischen Platzdaten analysiert werden. In einigen Beispielen kann ein Segment über die Zeiten gebunden werden, während denen ein Benutzer einen Bereich verlässt und eine bestimmte Zeit lang nicht zurückkehrt. In einigen Beispielen kann ein Segment durch die Zeiten gebunden werden, während denen das Gerät eines Benutzers kein Signal einer bestimmten BSSID oder sonstigen drahtlosen Zugangspunkten für eine bestimmte Anzahl an aufeinanderfolgenden WiFi-Scans beobachtet.
  • Jede Anzahl an Segmentationsalgorithmen bekannter Standortzeitserien können verwendet werden, um die Aufteilung bei (204) umzusetzen. Ein Beispiel der Aufteilung (204) wird in 3, die eine exemplarische grafische Repräsentation 400 der Standortdatenberichtsinformationen, die von einer Vielzahl von mobilen Geräten eingesammelt wurden, bereitstellt. Insbesondere bildet die grafische Repräsentation 400 eine Vielzahl von Markierungen (z. B. Markierung 404) ab, die entsprechenderweise einer Vielzahl von Standorten, die von einer Vielzahl an Standortdatenberichten repräsentiert werden, entsprechen. Demnach entspricht jede Markierung der physischen Standardabschätzung, die in einem Standortdatenbericht beinhaltet wird, der von einem mit einem Benutzer in Verbindung stehenden Gerät empfangen wurde. Während 3 und sonstige Figuren geben nur eine Einzelpunktposition für jeden Standortdatenbericht an, wobei es sich von selbst versteht, dass dies nicht die Arten von Informationen einschränken kann, die sich in Standortdatenberichten befinden, die von den offenbarten Ausführungsformen empfangen werden.
  • Weiterhin mit Bezug auf 3, die Vielzahl von Markierungen lässt sich in eine Vielzahl von lokalisierten Segmenten, wie zum Beispiel die lokalisierte Segmente 406, 408, 412 und 414 unterteilen. Jedes Segment kann eine oder mehrere der Vielzahl von Standortdatenberichten beinhalten. Als ein Beispiel beinhaltet das lokalisierte Segment 408 eine Vielzahl von Standortdatenberichten, bei denen aus der Figur entnommen werden kann, dass sie dem in einem Park 410 spazierengehenden Benutzer entsprechen. Es versteht sich von selbst, dass das Aufteilen (204) dazu führen kann, dass Standortdatenberichte in ein einzelnes Segment kombiniert werden, selbst wenn nicht alle Standortdatenberichte über identische abgeschätzte physische Standorte verfügen. Die Standortdatenberichte, die in Segment 408 beinhaltet sind, können durch einen Aufteilungs- oder Segment-Algorithmus zusammen gruppiert werden, basierend teilweise auf ein oder mehrere der Folgenden: das Identifizieren einer Benutzeraktivität oder Geschwindigkeit, die dem Stehen oder dem Gehen im Gegensatz zum Fahren für jeden der Berichte entspricht, ein Mangel an allgemeinem kontinuierlichem Fortschritt von einem Standort zu einem anderen, semantische Ortsdatenbank, angibt, dass die abgeschätzten physischen Standorte sich innerhalb oder in der Nähe eines großen benachbarten semantischen Ortes befinden, und/oder der semantische Ort gibt an, dass dieser Ort zum Gehen geeignet ist (beispielsweise indem dieser als ein Park klassifiziert wird).
  • Wiederum bezugnehmend auf 2, die Geolokalisierungsalgorithmen können dann für jedes lokalisierte Segment, das bei (204) aufgeteilt ist, angewendet werden, um einen Originalspeicherbereich einer geographischen Region für dieses Segment abzuschätzen (206). Ein Originalspeicherbereich der geographischen Regionen kann einem allgemeinen geographischen Identifikator entsprechen oder eine „ungefähre” Standortabschätzung für jedes Segment darstellen. In einigen Beispielen können Originalspeicherbereiche der geographischen Region durch das Unterteilen einer Karte, eines Rasters oder einer sonstigen Repräsentation der Erdoberfläche mittels einer Vielzahl von Formen definiert werden (z. B. Rechteecke, Quadrate, Kreise, Vielecke oder sonstige Figuren). Die geographischen Grenzen einer Stadt lassen sich in einem rechteckigen Gitternetz aus Originalspeicherbereichen einer geographischen Region aufteilen. Jedes lokalisierte Segment wird dann als mit einer oder mehrerer dieser Originalspeicherbereiche der geographischen Region in Verbindung gebracht abgeschätzt. In einigen Beispielen umfasst diese Abschätzung das Ermitteln des mittleren abgeschätzten physischen Standorts eines Benutzers innerhalb des Zeitfensters jedes lokalisierten Segments und das Aufrunden desjenigen mittleren Standorts auf einen oder mehrere zuvor festgelegte Originalspeicherbereiche der geographischen Region. In einigen Instanzen kann ein gegebenes lokalisiertes Segment für einen Benutzer oder ein mobiles Gerät als zu mehr als einem Originalspeicherbereich der geographischen Region zugehörend, abgeschätzt werden, basierend zumindest teilweise auf ein oder mehrere der Folgenden: eine Variation der abgeschätzten physischen Standorte in Standortdatenberichten, und/oder die abgeschätzte Ungenauigkeit der Abschätzung des physischen Standorts in Standortdatenberichten. In einigen Beispielen können Originalspeicherbereiche der geographischen Region groß genug sein, so dass es unwahrscheinlich erscheint, dass potentielle Fehler der Geolokalisierungsalgorithmen des mobilen Geräts dem falschen Originalspeicherbereich der Region ein lokalisiertes Segment zuordnen. Die Gesamtanzahl und die tatsächliche Größe und Form der Originalspeicherbereiche der geographischen Regionen können unter unterschiedlichen exemplarischen Ausführungsformen variieren.
  • Ein Beispiel der Abschätzung (206) wird in 4 abgebildet, die eine grafische Repräsentation der Abschätzung der allgemeinen geographischen Regionen für verschiedene lokalisierte Segmente bereitstellt. Unter Berücksichtigung der grafischen Repräsentation 400 wird der Bereich in 4 geographische Originalspeicherbereich der geographischen Regionen unterteilt: Region A, Region B, Region C und Region D. Auf Basis der Standardinformationen, die mit jedem lokalisierten Segment und dem unterteilten Raster der vier Regionen in Verbindung gebracht werden, die für dieses nicht einschränkende Beispiel festgelegt wurden, kann das lokalisierte Segment 406 als zu Region A zugehörig abgeschätzt werden, während die lokalisierten Segmente 408 und 412 als zu Region C zugehörig abgeschätzt werden können. Das lokalisierte Segment 414 kann als zwei Originalspeicherbereiche der geographischen Region zugehörig abgeschätzt werden, nämlich Region C und Region D. Als solche würden danach folgende Algorithmen, die auf die Regionen C und D angewendet werden, beide lokalisierten Segmente 414 in ihrer Analyse berücksichtigen.
  • Wiederum bezugnehmend auf 2 nachfolgende Aspekte (208), (210), (212) und (214) des Verfahrens (200) werden für sämtliche der Originalspeicherbereiche der geographischen Region, die bei (206) als ein oder mehrere lokalisierte Segmente enthaltend abgeschätzt werden, umgesetzt. Ein erster Aspekt betrifft das Identifizieren (208) innerhalb jedes Originalspeicherbereichs der geographischen Regionen, eines oder mehrerer Clustering-Canopies z. B. Gruppen lokalisierter Segmente, die einer potentiellen geographischen Überlappungscharakterisierung gerecht werden. Im Allgemeinen wird jedes Paar lokalisierter Segmente, das mindestens ein Clustering-Canopy, das bei (208) identifiziert wird, teilt, als für nachfolgende Bewertungen von Überlappungen, die bei (210) ermittelt werden, als in Betracht zu ziehen ermittelt. In einem Beispiel von (208) wird ein Clustering Canopy für einen bestimmten einzelnen Signalanlagenidentifikator, wie etwa ein BSSID-Wi-Fi-Zugangspunkt, definiert, der im Originalspeicherbereich der geographischen Region beobachtet wird. In einigen Implementierungen enthält ein derartiges Clustering Canopy alle lokalisierten Segmente, die mindestens eine Schwellenzahl oder einen Bruchteil der Standortdatenberichte des Segments enthalten, die angeben, dass ein gegebener Signalanlagenidentifikator beobachtet wurde, oder oberhalb der Schwellensignalstärke oder innerhalb einer bestimmten abgeschätzten Entfernung zwischen der Signalanlage und dem mobilen Gerät beobachtet wurde. In einem anderen Beispiel wird ein Clustering Canopy als ein Satz an Rasterpunkten oder sonstigen Punkten im Originalspeicherbereich der geographischen Region definiert, und ein lokalisiertes Segment gehört jedem Clustering Canopy an, dessen Punkt sich innerhalb einer Schwellenentfernung von dem abgeschätzten physischen Standort befindet, der mindestens einer Schwellenanzahl oder einen Bruchteil der Standortdatenberichte des Segments entspricht.
  • Für alle Paare der lokalisierten Segmente, die bei (208) als in Betracht zu ziehend für die Überlappungsbewertung identifiziert werden, wird eine Überlappungsbewertung bei (210) ermittelt. In einigen Beispielen kann das Bewerten von Überlappungen das Verwenden eines heuristischen Algorithmus umfassen, um eine Messgröße auszurechnen, die mit der Wahrscheinlichkeit einer und/oder einer Menge an Überlappungen zwischen den geometrischen Gebieten korreliert, die durch die tatsächliche Bewegung der mobilen Geräte während jedem Paar an zwei lokalisierten Segmenten abgedeckt ist, die für die Bewertung von Überlappungen als in Betracht zu ziehen identifiziert werden. In einigen Beispielen umfasst dieser Algorithmus eine Aggregatfunktion, wie etwa einen Durchschnitt, einen getrimmten Durchschnitt, einen Mittelwert, ein feststehendes Quantil einer vorberichtlichen Ähnlichkeitsfunktion, die über alle oder eine Probe an Standortdatenberichten der zwei lokalisierten Segmente berechnet wird. Bei der vorberichtlichen Ähnlichkeitsfunktion kann es sich um die Jaccard-Entfernung, die Cosine-Entfernung, die Tanimoto-Entfernung oder Ähnliches handeln. In einigen Beispielen können Überlappungsbewertungen nach ihrer anfänglichen Ermittlung bei (210) modifiziert werden, basierend darauf, ob das Paar oder die Gruppe an Segmenten vom selben Gerät, oder Nutzer erstellt wurden, oder vom selben Privatsphären orientierten verlustbehafteten Geräteindikator, wie oben beschrieben, charakterisiert wurden, oder durch ein Paar von Benutzern, die demographische und/oder psychografische Gemeinsamkeiten teilen, erstellt wurde. Die Nachermittlungsmodifikation könnte dabei helfen, eine höhere Wahrscheinlichkeit widerzuspiegeln, gemäß der zwei naheliegende Segmente vom selben Benutzer oder ähnlichen Benutzern empfangen wurden, als das Gerät (die Geräte)/der Benutzer (die Benutzer) denselben Ort zweimal besuchte und nicht als er zwei naheliegende Plätze zu zwei unterschiedlichen Anlässen besuchte.
  • Ein spezifischeres Beispiel der Ermittlung (210) wird im Verfahren (300) der FIG. abgebildet. 5. Das exemplarische Verfahren (300) der 5 wird im Zusammenhang mit dem anfänglichen Empfangen eines Paares lokalisierter Segmente dargelegt, wobei jedes dieser Segmente eine Zeitreihe von Beobachtungssätzen der Sensoren-Signalanlage umfasst. Der Beobachtungssatz der Saisonsignalanlage kann eine Liste einer oder mehrerer Signalanlagenbeobachtungen beinhalten. Eine Signalanlagenbeobachtung kann einen Signalanlagenidentifikator und eine Messgröße beinhalten, die mit der Entfernung von Sensor zur Signalanlage korreliert. In einem Beispiel ist jeder Beobachtungssatz der Sensoren-Signalanlage ein Wi-Fi Scan; das bedeutet, dass jede Signalanlagenbeobachtung einen Wi-Fi-Zugangspunkt-Identifikator und den RSSI des entsprechenden Wi-Fi-Zugangspunkts beinhaltet. Bei beiden Zeitreihen des Beobachtungssatzes der Sensoren-Signalanlage geht man davon aus, dass sie vom selben bekannten Originalspeicherbereich der geographischen Region eingesammelt wurden. Bei einem derartigen Beispiel beinhaltet das Verfahren (300) zunächst das Bezeichnen (302) eines in Betracht zu ziehenden Signalanlagensatzes, der die von den mobilen Geräten beobachteten Signalanlagen beinhaltet, die von einem Paar an lokalisierten Segmenten mit Beobachtungsmustern nachverfolgt werden, und eine zuvor festgelegte Bedingung erfüllen. In einem Beispiel kann die zuvor festgelegte Bedingung BSSID als im Betracht zu ziehende Wi-Fi-Zugangspunkte auswählen, die mit mindestens einer bestimmten Erscheinungsfrequenz und/oder einer Signalstärke in mindestens eines der Segmente erscheinen, und jede solche BSSID wird (302) als zum im Betracht zu ziehenden Signalanlagensatz zugehörig, hinzugefügt.
  • Weiterhin mit Bezug auf 5, eine Signalanlagenüberlappungsbewertung wird dann für jede Signalanlage im in Betracht zu ziehenden Signalanlagensatz bei (304) ermittelt. Die Signalanlagen-Überlappungsbewertung kann unter Verwendung von Daten über Signalanlagen ein Überlappungsniveau zwischen zwei lokalisierten Segmenten als gemessen angeben. Insbesondere korreliert die Überlappungsbewertung auf umgekehrte Weise mit jeder bestimmten Signalanlage, und stellt dabei ein stärkeres Beweismittel bereit, gemäß dem die zwei Intervalle sich nicht überlappen. In einigen Beispielen basiert die Überlappungsbewertung optional auf das Entfernen von Ausreißern von Signalanlagenmessgrößen (RSSI) der Verteilung des Segments (z. B. durch das Verwenden der Inter-Quatril-Reichweite) und das Messen des Bruchteils eines anderen Scans des Segments, das in diese Reichweite hineinfällt. Dasselbe Verfahren kann mit vertauschten Segmenten eingesetzt werden, die danach den Mittelwert der zwei ermittelten Werte bilden. Anstatt den Mittelwert der zwei ermittelten Werte zu bilden, können in anderen Beispielen andere Funktionen verwendet werden, um die zwei ermittelten Werte zusammenzufassen, wie etwa aber nicht beschränkt auf das Maximum (Max), Minimum (Min), oder α·max + (1 – α)·min. In anderen Beispielen kann die Überlappungsbewertung der Signalanlage unter Verwendung anderer Analyseverfahren generiert werden, wie etwa aber nicht beschränkt auf eine verteilende Distanzmetrik, wie etwa ein Erdbewegungsabstand, Variationsabstand, eine Kullback-Leibler-Divergenz, eine Jaccard-Ähnlichkeit, oder Ähnliches, die auf eine optionale kernelisierte Probeverteilung angewendet werden, oder ein statistischer Anpassungstest, der auf eine parametrische oder nicht parametrische Verteilung, die an die empirischen Verteilungen angepasst ist, angewandt wird.
  • Für ein paar lokalisierter Segmente, die zur Bewertung von Überlappungen in Betracht zu ziehen sind, kann sich die ergebende Sammlung an Überlappungsbewertungen der Signalanlage für die in Betracht zu ziehenden Signalanlagen, die bei (304) ermittelt werden, dann bei (306) kombiniert werden, um eine allgemeine Überlappungsbewertung für jedes Paar lokalisierter Segmente, die in Erwägung gezogen werden, zu generieren. In einigen Beispielen kann das Kombinieren bei (306) erfolgen, indem wiederholt eine zufällige Probe einer feststehenden Anzahl oder eines Bruchteils in Betracht zu ziehender Signalanlagen ohne Austausch erfolgen kann, wobei der geringste der k Per-Signalanlagenwerte hergenommen wird, und der Mittelwert des Ergebnisses über mehrere zufällige Proben gebildet wird. Für im Betracht zu ziehenden Signalanlagenlisten, die kürzer als k, ausfallen, kann ein gesamter minimaler Überlappungswert der Signalanlage verwendet werden. In anderen Beispielen kann das Kombinieren bei (306) durch Verwendung einer unterschiedlichen Funktion erfolgen, wie etwa aber nicht beschränkt auf ein Maximum, ein feststehendes Prozentil oder eine gewichtete Summe mit unterschiedlichen Gewichten, die unterschiedlichen Quantilen zugeordnet werden. In wieder anderen Beispielen kann das Kombinieren bei (306) unter Verwendung einer Optimierung über ein statistisches Modell erfolgen, welches eine oder mehrere der Folgenden verwenden kann: möglicherweise ungewisse Informationen über den Standard der Signalanlage der Per-Signalanlagenverteilung der metrischen Werte, und/oder den Eigenschaften des mobilen Geräts.
  • Wiederum bezugnehmend auf 2, der resultierende Satz an sich überlappenden metrischen Werten, die von Überlappungsbewertungen, die bei (210) ermittelt werden, können als Eingabe in einen Clustering-Algorithmus bereitgestellt werden, der eine Datenstruktur generiert (212), die eine Clustering-Konfiguration der lokalisierten Segmente in jedem Originalspeicherbereich der geographischen Region bereitstellt. In einigen Beispielen wird das hierarchische Clustering verwendet, um die Datenstruktur bei (212) zu generieren. In einigen Beispielen wird ein Canopy eines hierarchischen agglomerativen Clustering-Algorithmus verwendet, um die Datenstruktur bei (212) zu generieren. In anderen Beispielen kann das hierarchische agglomerative Clustering durch ein anderes bekanntes Clustering-Verfahren ersetzt werden, das Überlappungsheuristiken, verwendet, um Cluster zu generieren, die voneinander durch selten überkreuzte Raumunterteilungen getrennt werden. In einigen Beispielen ist die bei (212) generierte Datenstruktur eine Walddatenstruktur, oder eine Baumdatenstruktur, die über Blätter verfügt, die den individuellen lokalisierten Segmenten entsprechen. In einigen Beispielen verwendet der Clustering-Algorithmus das durchschnittliche Zusammenführen der Verbindungen oder Einzelverlinkungsverschmelzungen, mit einem optional definierten Schwellenwert zur Beendigung der Zusammenführung. In anderen Beispielen kann das Clustering der zusammengeführten Verbindungen durch eine unterschiedliche Verbindung richtig ausgetauscht werden, welche die zwei Waldknoten direkt miteinander vergleicht. In noch weiteren Beispielen kann ein unterschiedliches Verfahren zum Zusammenführen der Verbindungen eingesetzt werden, das einen Teil oder alle paarweisen überlappenden Metrikwerte zwischen Blätterpaaren in Unterbäumen der zwei Kandidaten der Waldknoten verwendet.
  • Exemplarische Aspekte des Generierens einer Datenstruktur (212) werden in den 6 und 7 abgebildet. 6 stellt jeweils eine grafische Repräsentation 500 einer Vielzahl von lokalisierten Segmenten 502514 bereit, die innerhalb eines gegebenen Originalspeicherbereichs der geographischen Region 518 identifiziert werden. Jedes lokalisierte Segment 502514 repräsentiert eine unterschiedliche Benutzerstrecke innerhalb des Originalspeicherbereichs der geographischen Region 518 während eines bestimmten Zeitraums. In der realen Welt verfolgen die lokalisierten Segmente 502514 die unterschiedlichen Benutzer von mobilen Geräten, während sie Bereiche innerhalb drei unterschiedlicher örtlicher Geschäfte durchqueren, nämlich Ron's Restaurant 520, Brenda's Bar 522 und Gary's Groceries 524. Die um jedes Geschäft herum 520/522/524 dargestellten gestrichelten Linien werden in typischen Implementierungen gezeigt, die dem System nicht bekannt oder nicht vollständig bekannt sind. In einigen Beispielen kann der Clustering-Algorithmus die exakte oder approximative Anzahl an semantischen Ortsdaten empfangen, die im Originalspeicherbereich der geographischen Region erwartungsgemäß zu finden ist. In anderen Beispielen ist die Identität und/oder Anzahl an Geschäften, die sich tatsächlich innerhalb eines Originalspeicherbereichs 518 der geographischen Region befinden, möglicherweise unbekannt.
  • 7 stellt eine grafische Repräsentation einer exemplarischen Datenstruktur 540 bereit, die unter Verwendung eines hierarchischen Clustering generiert wird, der auf die lokalisierten Segmente aus FIG. angewendet wird. 6. Die exemplarische Datenstruktur 540 ist als ein Clustering-Wald mit Blattknoten gebaut, die unterschiedlichen lokalisierten Segmenten entsprechen. Die allgemeinen Rahmenbedingungen der Datenstruktur 540, einschließlich der Identifikation verschiedener Segmente als Blatt- und/oder Nicht.-Blattknoten innerhalb der Datenstruktur wird teilweise von den Überlappungsbewertungen ermittelt, die für jedes Paar an Segmenten generiert werden, die für die Bewertung von Überlappungen infrage kommen. Die Überlappungsbewertung zwischen einem Segmentpaar korreliert im Allgemeinen mit der Menge an Überlappungen oder an „Verstrickungen” zwischen zwei Benutzerspuren, die den zwei Segmenten entsprechen. Im spezifischen Beispiel der 6 und 7 fährt der hierarchische agglomerative Clustering-Algorithmus des Canopy mit durchschnittlichem Zusammenführen der Verbindungen wie folgt fort. Die erste Zusammenschlussoperation schließt die Blattknoten der Segmente 502 und 504 an einen neuen Elternknoten 546 an. Die Blattknoten für die Segmente 506 und 508 werden dann zusammengeschlossen, um einen neuen Elternknoten 548 auszubilden. Knoten 548 wird dann mit dem Blattknoten für Segment 510 zusammengeführt, um einen neuen Elternknoten 550 auszubilden. Die den Segmenten 512 und 514 entsprechenden Blattknoten werden dann zusammengeführt, um einen neuen Elternknoten 552 auszubilden. Knoten 550 und 552 werden dann zusammengeführt, um einen neuen Elternknoten 554 auszubilden. Die Zusammenführungsbewertung der Knoten 554 und 546 erfüllt keine Zusammenführungsschwelle weswegen der Algorithmus beendet wird, während er 554 und 546 als elternlose „Wurzelknoten” ihrer Bäume zurücklässt.
  • Die Überlappungsbewertungen, die für jedes in Betracht zu ziehende Segmentpaar generiert werden, das in den 6 und 7 die Reihenfolge der Zusammenführungsoperationen ermittelt. Sie erklären mit anderen Worten ausgedrückt, warum bestimmte Knoten mit spezifischen Knoten und nicht anderen Knoten verbunden sind. Die Segmente 506 und 508 werden beispielsweise miteinander verbunden, um Knoten 548 gleich nachdem 546 erstellt worden ist, auszubilden. Da es sich hierbei um Blattknoten handelt, handelt es sich bei ihrer Zusammenführungsbewertung um ihre Überlappungsbewertung: Zusammenführungsbewertung (506, 508) = Überlappungsbewertung (506, 508). Da diese Operation statt dem Zusammenführen von 506 mit 546, stattfindet, wissen wir, dass Überlappungsbewertung (506, 508) > Überlappungsbewertung (506, 546) wobei das Letztere durch eine durchschnittliche verflechtungszusammenführende Heuristik definiert ist: Überlappungsbewertung (506, 546) = Durchschnitt (Überlappungsbewertung (506, 502), Überlappungsbewertung (506, 504)). Auf ähnliche Weise würde Überlappungsbewertung (506, 508) > Überlappungsbewertung (506, 510) andernfalls, 510 mit 506 zusammengeführt worden sein. Überlappungsbewertung (X, Y) für Segmente X, Y, die nicht für die Bewertung von Überlappungen in Betracht zu ziehen ist, wird als Null definiert. Es versteht sich von selbst, dass Datenstrukturen, die der Walddatenstruktur 540 ähneln, viele weitere Segmente und Knoten beinhalten können, die in einer Vielfalt spezifischer Formate konfiguriert sind.
  • Semantische Ortsdaten können letztendlich an (214) für ein oder mehrere lokalisierte Segmente in jedem Originalspeicherbereich der geographischen Region ermittelt werden, basierend auf die hierarchische Clustering-Konfiguration und die bei (212) generierte sich daraus ergebende Datenstruktur. Die semantischen Ortsdaten, die bei (214) ermittelt werden, können eine Vielzahl von Formen annehmen, von denen einige vom exemplarischen Verfahren (310) der 8 repräsentiert werden. Verfahren 310 beinhaltet derartige Aspekte (312), (314) und (316), die individuell oder in ausgewählten Kombinationen implementiert werden können. In einigen Beispielen können eine oder mehrere der Datenstrukturen, die bei (212) generiert werden, die semantischen Ortsmodelle, die bei (314) generiert werden, oder die semantischen Ortskennzeichen, die von den semantischen Ortsmodellen generiert werden, die bei (314) als Antwort auf die sich daran anschließenden Benutzerabfragen generiert werden, können als Ausgabe an einen Benutzer bei (316) in textueller, grafischer, Video-, Audio- oder sonstiger Form bereitgestellt werden.
  • In einem Beispiel beinhaltet das Ermitteln der semantischen Ortsdaten bei (214) das erste Umsetzen einer vorverarbeitenden Trainingsunterroutine, die eine semantische Datenkennzeichnung mit bestimmten Teilen der Datenstruktur, die bei (212) generiert werden in Verbindung bringt, und auf das Empfangen bei (202) eines oder mehrerer lokalisierter Segmente mit semantischen Datenkennzeichnungen Bezug nimmt. Ein Klassifizierer kann dann zumindest teilweise auf der Clustering-Konfiguration von (212) basierend, für ein oder mehrere empfangene semantische Datenkennzeichnungen, identifiziert werden. Eine Online-Unter-Routine assoziiert dann semantische Daten mit den empfangenen Segmenten unter Verwendung des von der Training-Subroutine identifizierten Klassifizierers.
  • Dieses Beispiel kann sich als nützlich erweisen, wenn semantische Daten für eine oder nur eine Teilmenge der lokalisierten Segmente in der anfänglichen Sammlung der Standortdatenberichte empfangen werden. Diese eingeschränkten Informationen, die mit den bei (212) generierten Clustering-Assoziationen gekoppelt sind, können letztendlich die Menge an semantischen Standortdaten, die für unterschiedliche Gruppierungen bestimmter lokalisierter Segmente zur Verfügung stehen, auf eine nützliche Art und Weise erweitern.
  • In einem Beispiel kann die generierte Datenstruktur verwendet werden, um eine semantische Ortskennzeichnung mit bestimmten lokalisierten Segmenten in Verbindung zu bringen (312). In der Regel aber nicht immer werden mehrere lokalisierte Segmente mit jedem semantischen Ortskennzeichen in Verbindung gebracht. Die semantischen Ortskennzeichen können im Allgemeinen einem semantischen Identifikator für eine Standortentität entsprechen, wobei Standardentitäten sich auf jedes Merkmal, jeden Ort von Interesse (POI) oder sonstiges Objekt oder Ereignis beziehen, die mit einem geographischen Standort in Verbindung gebracht werden. Eine Standortentität kann beispielsweise ein Geschäft, ein Restaurant, eine Kirche, eine Wohnstätte ein Einzelhandelsgeschäft, ein Café, eine Bar, einen Musikveranstaltungsort, eine Attraktion, ein Museum, einen Freizeitpark, eine Arena, ein Stadium, ein Festival, eine Organisation, eine Region, einen Stadtviertel, oder sonstige geeignete Punkte von Interesse, oder Teilmengen einer anderen Standortentität; oder eine Kombination multipler angrenzender Standortentitäten, die oft während eines einzelnen Besuchs besucht werden, beinhalten. Die semantische Ortskennzeichnung ist ein regionalbezogener eindeutiger Identifikator der Standortentität, die sich von einem koordinatenbasierten oder standortbasierten Identifikator unterscheidet. Indes können die semantischen Ortsdaten, die durch die offenbarten Ausführungsformen mit einer bestimmten Standortentität verknüpft sind, neben einem Namen noch Metadaten über die Standortentität beinhalten. Dazu gehören u. a. Daten wie deren Kategorie, partielle, unsichere und/oder umfassende Informationen zu dem physischen Standort und der Geometrie eines Veranstaltungsorts und eine oder mehrere Beschreibungen von Verteilungen von Verhaltensweisen, Demografien oder Psychografien der Benutzer, die diese Standortentität besuchen.
  • Quellen zum Identifizieren der semantischen Ortskennzeichnungen für ein lokalisiertes Segment können beispielsweise eine Datenbank an Entitätsinformationen beinhalten, die Standortentitäten mit geographischen Standorten verbinden (z. B. eine Systemdatenbank geographischer Informationen). Faktoren zum Bezeichnen der entsprechendsten semantischen Ortskennzeichnung können ein oder mehrere der im Folgenden aufgeführten beinhalten: ein Entfernungsmerkmal, das einen Abstand zwischen der Standortentität und einem Segmentstandort repräsentiert, der mit dem lokalisierten Segment, für den die Standortentität identifiziert wurde, in Verbindung gebracht wird; ein Popularitätsmerkmal, das eine Popularität der Standortentität beschreibt (z. B. eine Anzahl von Erwähnungen in den sozialen Medien, eine Anzahl von Check-Ins, eine Anzahl von Wegbeschreibung Anfragen, und/oder eine globale Popularitätsrangfolge); ein Geschäftszeiten-Überlappungsmerkmal, das beschreibt, ob ein Satz an Geschäftszeiten, der mit der Standortentität in Verbindung gebracht wird, mit einem Zeitsegment für lokalisierte Segmente überlappt, für die, die Standortentität identifiziert wurde; und ein oder mehrere Personalisierungsmerkmale, die vorhergehende Interaktionen zwischen dem Benutzer, bei dem ein lokalisiertes Segment empfangen wurde und der Standortentität, die diesem Segment entspricht, beschreiben. Exemplarische Personalisierungsmerkmale können die im Folgenden aufgeführten beinhalten: eine Anzahl an Instanzen, in denen der Benutzer einen Kartenklick in Bezug auf die Standortentität durchführt; eine Anzahl an Instanzen, in denen der Benutzer eine Wegbeschreibung zur Standortentität angefragt hat; eine Anzahl von Instanzen, in denen der Benutzer in die Standortentität eingecheckt hat; eine Anzahl von Instanzen, in denen der Benutzer eine Zahlung an der Standortentität vorgenommen hat, gemäß den Daten, die von einem mobilen Zahlungssystem oder einer virtuellen Brieftasche belegt werden; und/oder eine Anzahl von Instanzen, in denen der Benutzer eine Web-Suchanfrage in Bezug auf die Standortentität durchgeführt hat.
  • Die offenbarten Verfahren können auch verwendet werden, um eine semantische Ortkennzeichnung und sonstige sinnvolle Korrelationen der semantischen Ortsdaten an Standortdatenberichten bereitzustellen, wenn es sehr wenige oder keine Sensorlesungen hoher Konfidenz für viele semantische Orte gibt. Dies wird durch das Verwenden eines großen ungekennzeichneten Korpus einer Zeitreihe unbearbeiteter Sensorlesungen durchgeführt, um „Grenzen” zu entdecken, die selten von Benutzern überquert werden und wahlweise das sich daraus ergebende Modell an Grenzen mit einem Satz an semantischen Ortskennzeichnungen ergänzt, die sonst in sehr geringem Ausmaß und/oder bei einer sehr geringen Konfidenz vorliegen.
  • In einem Beispiel semantischer Ortskennzeichnungen können Aspekte der offenbarten Technologie semantische Ortskennzeichnungen für ein oder mehrere der Segmente, unter der Vielzahl der lokalisierten Segmente, die in (204) identifiziert werden, kombiniert werden. Nicht alle lokalisierten Segmente werden eine Trainingskennzeichnung empfangen und oft werden mehrere Segmente mit einer spezifischen Trainingskennzeichnung in Verbindung gebracht. In einigen Beispielen ist eine Trainingskennzeichnung der semantische Identifikator für einen einzelnen bekannten semantischen Ort (z. B. einen Geschäftsort) und das Empfangen dieser Trainingskennzeichnung gibt an, dass ein lokalisiertes Segment von einem mobilen Gerät empfangen worden ist, bei dem man mit Sicherheit davon ausgeht, dass er am einzelnen bekannten semantischen Ort während des entsprechenden Zeitintervalls für dieses Segment physisch anwesend ist. In einigen Beispielen kann die Trainingskennzeichnung aus einer Vielzahl von n möglichen Geschäften (B1, B2, ... Bn) bestehen, die je mit einem numerischen Gewicht in Verbindung gebracht werden, bei dem das Gewicht von Bi die abgeschätzte Wahrscheinlichkeit angibt, dass ein Gerät sich während des betreffenden Segments bei Bi befand. Für jede bestimmte Trainingskennzeichnung kann die hierarchisch gruppierte Datenstruktur verwendet werden, um einen binären Klassifizierer dieser Kennzeichnung so zu generieren, um die Qualitätsmetrik einer Klassifizierung zu optimieren. In einem Beispiel ist jeder Klassifizierer für eine semantische Ortskennzeichnung ein einzelner Knoten des Waldes; dann werden Segmente, die mit einem Knoten der Datenstruktur (entweder als Eingabesegmente, die mit Waldblättern oder über das unten-beschriebene inkrementelle Verfahren) in Verbindung gebracht werden, mit dem Kennzeichen klassifiziert, das mit dem nächstliegenden Verwandtenknoten in Verbindung gebracht wird oder mit „keinem semantischen Ortskennzeichen” sofern es sich bei dem Vorfahrenknoten nicht um Klassifizierer handelt. Diese Wechselbeziehung zwischen den Datenstrukturknoten und semantischen Platzkennzeichen können dann verwendet werden, um dabei zu helfen, semantische Platzidentifizierer für zukünftige Standortdatenberichte und/oder lokalisierte Segmente zu generieren.
  • In weiteren Beispielen der semantischen Identifizierer oder Trainingskennzeichen, die mit den lokalisierten Segmenten bei (312) in Verbindung gebracht werden, können die Kennzeichen konfiguriert sein, um zusätzliche Informationen über einen Benutzer zu beinhalten, wie etwa Informationen über demographische oder psychografische Charakteristiken eines Benutzers oder Aufzeichnungen über konkrete messbare Verhaltensweisen, die mit dem Benutzer, dessen Position von lokalisierten Segment angegeben wird, in Verbindung gebracht werden. Als ein Beispiel kann beobachtet werden, dass einige lokalisierte Segmente von Benutzern stammen, die nach Luxus-Konsumgütermarken suchen. In einem anderen Beispiel kann beobachtet werden, dass manche lokalisierten Segmente vom Benutzern kommen, die auf bestimmte Werbungen oder Kategorien von Werbungen klicken. Interferenzen, die sich aus einem Modell ergeben, können dann verwendet werden, um die Handlungen des Benutzers, Demografiken, und/oder Physiografiken, unter Verwendung der hierin offenbarten Verfahren, zu prognostizieren.
  • In einem anderen Beispiel kann ein Modell bei (314) generiert werden, während semantische Ortsdaten, Wahrscheinlichkeiten zur Verwendung bei der Prognose vorhergehender oder gegenwärtiger Benutzerstandorte oder, um auf Abfragen zu antworten, angegeben werden. Sobald die bei (212) generierte Datenstruktur sich einmal an Ort und Stelle befindet, kann eine Abfrage einschließlich eines lokalisierten Segments oder eines oder mehrerer Standortdatenberichte als Eingabe in einen Clustering-Algorithmus bereitgestellt werden, der eine Ausgabe bereitstellt, die jede der Segmenteingaben getrennt in die Datenstruktur hineinführt, und diese dabei mit einem existierenden Knoten in Verbindung bringt, an dem das Segment hätte zusammengeführt werden müssen, sofern es in die Originaleingabe des Clustering hineingeführt worden wäre. In einigen Beispielen schickt eine Abfrage einschließlich eines neuen Standortdatenberichts oder eines lokalisierten Segments eine spezifische semantische Ortskennzeichnung, die mit dem Cluster in Verbindung steht, in den das Abfragesegment eingesetzt wurde, wieder zurück. In anderen Beispielen können ein oder mehrere semantische Ortskennzeichnungen als Abfrageausgabe entlang mit Wahrscheinlichkeiten oder Kompetenzen zurückgeschickt werden, die mit den sich innerhalb dieses Clusters befindlichen Standortentitäten in Verbindung stehen. In noch weiteren Beispielen kann ein Maß einer Homogenität für das Viertel eines neuen Segments im Waldmodell generiert werden, beispielsweise basierend auf denjenigen Bruchteil, des nächst gelegenen N Knotens im Wald, der über den geringsten Schwellenwertpegel an Konfidenz verfügt, die mit einem gegebenen semantischen Ort in Verbindung gebracht wird. In noch weiteren Beispielen können geographische Repräsentationen der semantischen Ortsgrenzabschätzungen, wie etwa diejenigen, die von den Grenzabschätzungen 142 und 144 in 1 abgebildet werden, aus der bei (212) generierten Datenstruktur generiert werden.
  • Noch weitere Beispiele der bei (314) generierten Modelle beinhalten Aspekte der semantischen Ortskennzeichnungen. In einem Beispiel kann ein Maß der Vielfalt der Identifikatoren des Benutzers/Geräts in einem gegebenen Teil der Datenstruktur bei (212) generiert werden. Es kann beispielsweise eine Abschätzung generiert werden, die identifiziert, wie „öffentlich” das umgebende Gebiet ist, und dabei hilft zu bestimmen, ob eine Standardentität eine private Wohnstätte oder eine öffentliche Einrichtung ist, die sich möglicherweise ein Stock tiefer oder daran angrenzend befindet. Unter Berücksichtigung eines großen Korpus an Standortdatenberichten über einen langen Zeitraum (z. B. ein Jahr) ist es wahrscheinlicher, dass Segmente, die zur selben Teilmenge an Benutzern/Geräten über einen langen Zeitraum nachverfolgt werden, einen privaten Heim oder Geschäft entsprechen, während sich permanent ändernde Benutzer/Geräte auf eine etwas öffentlichere Einrichtung hindeuten. Andere Beispiele können Modellinformationen verwenden, die bekannte Standortdatenberichte mit spezifischen Benutzerkriterien in Verbindung bringen, um dabei zu helfen, derartige Kriterien für zukünftige Standortdatenberichte zu prognostizieren. Falls ein Satz an Standortdatenberichten und/oder lokalisierten Segmenten beispielsweise bekanntermaßen mit Benutzern im Zusammenhang stehen, die einer bestimmten demografischen oder eines psychografischen Eigentums angehören, dann kann das Modell verwendet werden, um dieses Eigentum über den Benutzer dazu zu verwenden, um einen zukünftigen Standortdatenbericht oder ein lokalisiertes Segment zu generieren.
  • Beispiele der Ermittlung semantischer Ortsdaten (214) werden in den 9 und 10 abgebildet. Die Beispiele aus den 9 und 10 basieren auf dem in den FIGS. veranschaulichte Beispiel, das mit Bezug darauf erörtert wird. 6 und 7 abgebildet. 9 veranschaulicht ein Beispiel des Assoziierens (312) eines semantischen Ortskennzeichens mit bestimmten lokalisierten Segmenten, während 10 das Verwenden eines Modells, das bei (314) generiert wird, abbildet, um Abfrageergebnisse für ein neues Segment zu generieren. Unter genauerer Bezugnahme auf 9 kann das Beispiel ein bestimmtes Wissen über einige der Segmente 502514 beinhalten. Einige der lokalisierten Segmente 502514 können beispielsweise über einen semantischen Ort verfügen, mit dem sie mit einem relativ hohen Vertrauenspegel in Verbindung gebracht werden. Hohe Konfidenzkennzeichnungen können das Ergebnis der Bestätigung eines Benutzers sein, den dieser an einem bestimmten Ort und zu einer bestimmten Zeit besucht, oder das Ergebnis einer Systemfeststellung sein, gemäß der, der Standort eines Benutzers mit hoher Wahrscheinlichkeit einer bestimmten Standortentität entspricht. Es wird beispielsweise im Beispiel aus 9 in Betracht gezogen, dass Segment 502 zuversichtlich mit Ron's Restaurant in Verbindung gebracht wird, wobei Segmente 506 und 510 zuversichtlich Brenda's Bar in Verbindung gebracht werden, und Segment 512 zuversichtlich mit Gary's Groceries in Verbindung gebracht wird.
  • Ein weiteres Knotenkennzeichnungsmerkmal, das in 9 abgebildet ist, beinhaltet ein Klassifizierer-Training. Im Klassifizierer-Training wird mindestens ein Knoten in der Walddatenstruktur als ein Klassifiziererknoten für alle oder einige der verfügbaren semantischen Ortskennzeichnungen identifiziert. Diese Knoten können ausgewählt sein, um eine Qualitätsmetrikbewertung des Klassifizierers zu optimieren (z. B. F1 Bewertung). Mit anderen Worten entspricht ein Klassifiziererknoten für einen gegebenen semantischen Ort dem Knoten, der die Qualitätsmetrikbewertung des Klassifizierers maximiert, basierend auf den bereitgestellten Satz der semantischen Kennzeichnungen des Trainings, die mit Knoten in Verbindung gebracht werden. Klassifiziererknoten in 9 werden mit Sternen gekennzeichnet. Der Blattknoten 556, der Segment 502 entspricht, ist der Klassifiziererknoten für Ron's Restaurant, Knoten 550 wird als Klassifiziererknoten für Brenda's Bar ausgewählt und Blattknoten 558, der Segment 512 entspricht, ist der Klassifiziererknoten für Gary's Groceries. Diese Klassifiziererknoten können in nachfolgenden Systemanwendungen verwendet werden, um neue Standortdatenberichte und lokalisierte Segmente zu charakterisieren, basierend auf dem generierten Grenzmodell des semantischen Ortes.
  • 10 bildet ein Beispiel dessen ab, wie ein Klassifizierer-Knotenmodell, wie etwa das in 9 generierte verwendet werden kann, um eine Abfrage für ein neues lokalisiertes Segment zu analysieren. In 10, es kann davon ausgegangen werden, dass vier Abfragen, die je ein neues lokalisiertes Segment oder ein oder mehrere Standortdatenberichte umfassen, empfangen werden. Jede Abfrage kann mit einem oder mehreren Knoten in der Datenstruktur unter Verwendung des hierin beschriebenen Verfahrens in Verbindung gebracht werden. Annahme, dass die empfangenen Abfragen mit Knoten 560566 in Verbindung gebracht werden. In einigen Beispielen kann jede Abfrage, basierend auf ein Modell, wie etwa das in 9 generierte, gekennzeichnet werden, wobei das Kennzeichen des wie zuvor beschriebenen nächstliegenden Vorfahren-Klassifiziererknotens verwendet wird. Im Beispiel von 10 generierte, wobei ein Segment das Knoten 560 entspricht, demnach als Brenda's Bar klassifiziert wird, da der Klassifiziererknoten 550 für Brenda's Bar sein Vorfahre ist. Auf ähnliche Weise könnte ein Segment, das Knoten 562 entspricht, eine Klassifikation (und entsprechende semantische Ortskennzeichnungen) als mit Gary's Groceries in Verbindung stehend empfangen, da Knoten 562 als sich bei Gary befindlich gekennzeichnet wird, wobei er identisch zum Klassifizierer-Knoten 558 ist. Auf der anderen Seite verfügt Knoten 564 über keinen Klassifizierer-Vorfahren und wird daher vom Modell als „kein semantischer Ort” gekennzeichnet. Das dem Knoten 566 entsprechende Segment wurde vom in inkrementellen Clustering überhaupt nicht in die Datenstruktur eingefügt, weswegen sie auch nicht über eine Klassifizierer-Vorfahren verfügt und daher auch das Kennzeichen „kein semantischer Ort” empfängt.
  • Jetzt wird auf 11, Aspekte der offenbarten Verfahren für das Ermitteln der semantischen Ortsgrenzen und der verwandten Daten, sowie der Anwendungen, die sich aus derartigen Ermittlungen ergeben, werden im exemplarischen Verfahren (320) besprochen. Verfahren (320) soll Aspekte der offenbarten Technologie erfassen, die an der exemplarischen mobilen Client-Einrichtung, die von einem Benutzer oder auf einen Server betrieben wird, auf den der Benutzer sich dazu entscheidet ein oder mehrere Standortdatenberichte hochzuladen. Das mobile Clientgerät empfängt zuerst ein semantisches Standortmodell an (322), wie etwa ein oder mehrere der oben beschriebenen Modelle, die Clustering-Informationen über die semantischen Standorte und verwandten Daten bereitstellen, die mit einem oder mehreren Originalspeicherbereichen der geographischen Region in Verbindung gebracht werden. In einigen Beispielen wird das semantische Standortmodell zumindest teilweise aus hierarchischen Clustering-Algorithmen generiert, die an Daten durchgeführt werden, die von vorhergehenden Standortdatenberichten abgeleitet werden, die aus einer Vielzahl von mobilen Geräten eingesammelt werden, die in oder mehreren Originalspeicherbereichen der geographischen Region betrieben werden. Ein oder mehrere neue Standortdatenberichte oder ein lokalisiertes Segment können dann bereitgestellt werden (324) und dabei den aktuellen Standort oder einen vergangenen Standort des Benutzers anzeigen. Bei (326) kann eine Prognose des semantischen Ortes, der mit dem neuen Standortbericht aus (324) in Verbindung gebracht wird, dann durch die Verarbeitung des neuen Standortdatenberichts unter Verwendung des semantischen Standardmodells generiert werden, das bei (322) empfangen wird. Die bei (326) generierte Prognose könnte ein oder mehrere der besprochenen Abfrageergebnisse relativ zu den bei (314) generierten Modellen beinhalten. Die prognostizierten Daten für einen neuen Standortdatenbericht können beispielsweise eine semantische Ortskennzeichnung, eine Vielzahl von möglichen semantischen Ortskennzeichnungen mit entsprechenden Wahrscheinlichkeiten einer Übereinstimmung, Informationen, die veranschaulichen, wo der neue Standortdatenbericht hineinpassen würde, wenn er in ein existierendes mit Modell wie etwa das bei (322) empfangene eingeführt werden würde, eine Messung der öffentlichen/privaten Charakteristik eines Ortes, eine Messung der Homogenität im umgebenden Gebiet, usw. beinhalten.
  • Jetzt wird auf 12, Aspekte der offenbarten Verfahren für das Ermitteln der semantischen Ortsdaten, sowie der Anwendungen, die sich aus derartigen Ermittlungen ergeben, werden in einem exemplarischen Verfahren (330) besprochen. Verfahren (330) soll eine andere Variation eines Beispiels zum Ermitteln der semantischen Ortsdaten in Übereinstimmung mit der Offenbarung erfassen. Eine Vielzahl von Zeitreihen historischer Standortdatenberichte werden bei (332) überprüft, um ihre relative Überlappungsmenge ermitteln. Die Zeitreihen der historischen Standortdatenberichte, die bei (332) überprüft werden, können alle der hier beschriebenen Variationen von Standortdatenberichten beinhalten, einschließlich aber beschränkt auf Strecken, die in einer oder mehreren der 1, 3 und 4 veranschaulicht werden und/oder die Standortdatenberichte, die aus von einer Vielzahl an mobilen Geräten bei (202) empfangen werden, beschrieben werden. In einigen Beispielen beinhaltet das Ermitteln des Überlappungsgrades am (332) das Ermitteln des Überlappungsgrades für die ausgewählten zeitreihenhistorischen Standortberichte. In einigen Beispielen beinhaltet das Ermitteln des Überlappungsgrades an (332) das Ermitteln eines metrischen Wertes des paarweisen Überlappens zwischen ausgewählten Paaren an ausgewählten Zeitreihen historischer Standortberichte. Spezifische Überlappungsbewertungen oder sonstige berechneten paarweisen Ähnlichkeitsmetriken, die in (332) verwendet werden, können anderen Überlappungsbewertungen oder Metriken ähneln, die hierin beschrieben werden oder sonstige spezifische Bewertungen, aufweisen, die einen Grad der Überlappung zwischen einem Paar an Zeitreihen der Standortdatenberichte quantifizieren.
  • Weiterhin mit Bezug auf 12, ausgewählte Zeitreihen der historischen Standortdatenberichte, die bei (332) ermittelt werden, werden bei (334) zusammen gruppiert, wenn sie als ausreichend überlappend ermittelt werden. In einigen Beispielen können Gruppierungen ausreichend überlappender Zeitreihen der historischen Standortdatenberichte unter Verwendung eines oder mehrerer Clustering-Verfahren implementiert werden, einschließlich aber nicht beschränkt auf verschiedene hierin offenbarte Clustering-Algorithmen. Standortklassifikationen können bei (336), das ein oder mehrere Standortentitäten voneinander unterscheidet, basierend auf der Gruppierung der ausgewählten Zeitreihen historischer Standortberichte zugeordnet werden, die bei (334) als hinreichend überlappend ermittelt werden. Die Klassifizierer können dann verwendet werden, um bei (338) semantische Daten für ein oder mehrere andere Zeitreihen oder Standortdatenberichte zu ermitteln. Semantische Daten können eine Vielzahl von Informationen beinhalten, einschließlich aber nicht beschränkt auf eine semantische Ortskennzeichnung für eine Standortentität, Kategorien oder sonstige Metadaten, die mit einer Standortentität in Verbindung gebracht werden, Informationen über einen Veranstaltungsstandort oder eine Geometrie, die mit einer Standortentität in Verbindung gebracht wird, und ein oder mehrere Charakterisierungen der Verteilungen der Verhaltensweisen, Demografiken, oder Psychografiken von Benutzern, die eine Standortentität besuchen.
  • 13 bildet ein Computersystem 600 ab, das verwendet werden kann, um Verfahren und Systeme zum Ermitteln der semantischen Ortsgrenzen der verwandten Daten gemäß den exemplarischen Ausführungsformen der vorliegenden Offenbarung, zu implementieren. Das System 600 kann unter Verwendung einer Client-Server-Architektur, die einen Server 602 und einen oder mehrere Clients 622 beinhaltet, implementiert werden. Server 602 kann beispielsweise einem Webserver-Hosting eines geographischen Informationssystems entsprechen. Client 622 kann beispielsweise einer persönlichen Kommunikationseinrichtung entsprechen, wie etwa aber nicht beschränkt auf ein Smartphone, Navigationssystem, Laptop, mobiles Gerät, Tablet, tragbare Recheneinrichtungen, oder dergleichen.
  • Jeder Server 602 und Client 622 kann mindestens ein Computergerät enthalten, so wie vom Server-Computergerät 604 und Client-Computergerät 624 abgebildet. Obwohl in 8 nur ein Server-Computergerät 604 und ein Client-Computergerät 624 abgebildet sind, bei 8 können mehrere Rechenvorrichtungen bei einem oder mehreren Standorten zur Bedienung in sequenziellen oder parallelen Konfigurationen bereitgestellt werden, um die offenbarten Verfahren und Systeme für das Ermitteln der semantischen Ortsgrenzen umzusetzen. In anderen Beispielen kann das System 600 unter Verwendung anderer geeigneter Architekturen implementiert werden, so wie eines einzigen Computergeräts. Jedes der Computergeräte 604, 624 im System 600 kann jede geeignete Art von Computergerät sein, so wie Allzweck-Computer, Sonderzweck-Computer, Navigationssystem (z. B. ein Navigationssystem fürs Auto), Laptop, Desktop-PC, mobiles Gerät, Smartphone, Tablet, tragbares Computergerät, Display mit einem oder mehreren Prozessoren oder andere geeignete Computergeräte.
  • Die Computergeräte 604 und/oder 624 können jeweils einen oder mehrere Prozessoren 606, 626 sowie ein oder mehrere Speichergeräte 608, 628 beinhalten. Der eine oder die mehreren Prozessoren 606, 626 können jedwedes geeignete Verarbeitungsgerät enthalten, so wie Mikroprozessor, Mikrocontroller, integrierten Schaltkreise, Logikbaustein, eine oder mehrere CPUs, Grafikverarbeitungseinheiten (GPUs), die dazu dienen Bilder effizient zu rendern oder andere spezialisierte Operationen durchzuführen, und/oder andere Verarbeitungsgeräte. Das eine oder die mehreren Speichergeräte 608, 628 können ein oder mehrere computerlesbare Medien beinhalten, zu denen unter anderem auch transitorische computerlesbare Datenträger, RAM, ROM, Festplatten, Flash-Laufwerke, oder sonstige Speichervorrichtungen gehören. In einigen Beispielen können die Speichergeräte 608, 628 koordinierten Datenbanken entsprechen, die auf verschiedene Standorte verteilt sind.
  • Das eine oder die mehreren Speichergeräte 608, 628 speichern Information, auf die der eine oder die mehreren Prozessoren 606, 626 zugreifen können, inklusive Instruktionen, die von dem einen oder den mehreren Prozessoren 606, 626 ausgeführt werden können. Die Speichereinrichtung des Servers 608 kann beispielsweise Anweisungen für das Umsetzen eines Ermittlungsalgorithmus für den semantischen Ort speichern, der konfiguriert ist, um verschiedene hierin offenbarte Funktionen durchzuführen. Die Client-Speichereinrichtung 628 kann Anweisungen für das Umsetzen eines Browsers oder Moduls speichern, die es einem Benutzer ermöglichen, Informationen vom Server 602 anzufordern, einschließlich erfassten semantischen Ortsdaten, Kennzeichnungen, Prognosen, und/oder Modelle für vergangene, gegenwärtige oder zukünftige Kleinstandorte.
  • Das eine oder die mehreren Speichereinrichtungen 608, 628 können auch Daten 612, 632 beinhalten, die von einem oder mehreren Prozessoren 606, 626 abgerufen, manipuliert, erstellt, oder gespeichert werden können. Die auf dem Server 602 gespeicherten Daten 612 können beispielsweise die Sammlung an Standortdatenberichten, die in Verfahren (200) analysiert werden, Datenbanken von bekannten semantischen Ortsidentifikatoren, und resultierende Wald-/Baumdatenstrukturen und Clustering-Ausgaben, die gemäß den offenbarten Verfahren ermittelt werden, beinhalten. Die Daten 632, die an Client 622 gespeichert werden, können aktuelle Standortdatenberichte und semantische Ortsidentifikatorprognosen oder Wahrscheinlichkeiten eines Eintretens beinhalten.
  • Computergeräte 604 und 624 können über ein Netzwerk 640 miteinander kommunizieren. In diesen Fällen können der Server 602 und einer oder mehrere Clients 622 jeweils eine Netzwerk-Schnittstelle enthalten, die genutzt wird, um über das Netzwerk 640 miteinander zu kommunizieren. Die Netzwerkschnittstelle(n) kann bzw. können jede geeignete Komponente zur Kopplung mit einem oder mehreren Netzwerken beinhalten, einschließlich z. B. Transmitter, Empfänger, Ports, Controller, Antennen oder anderer geeigneter Komponenten. Das Netzwerk 640 kann jedweder Typ von Kommunikations-Netzwerk sein, so wie ein LAN-Netzwerk (z. B. Intranet), ein Weitverkehrsnetzwerk (z. B. Internet), ein Mobilfunknetz oder eine Kombination dieser Möglichkeiten. Das Netzwerk 640 kann auch eine direkte Verbindung zwischen dem Server-Computergerät 604 und dem Client-Computergerät 624 enthalten. Im Allgemeinen kann die Kommunikation zwischen dem Server-Computergerät 604 und dem Client-Computergerät 624 über eine Netzwerkschnittstelle abgewickelt werden, unter der Nutzung jedweden Typs von drahtloser oder Kabel-Verbindung und unter der Nutzung einer Vielzahl von Kommunikationsprotokollen (z. B. TCP/IP, HTTP, SMTP, FTP), von Verschlüsselungen und Formaten (z. B. HTML, XML) und/oder Sicherungssystemen (z. B. VPN, sicheres HTTP, SSL).
  • Der Client 622 kann verschiedene Input- und Output-Geräte beinhalten, um Information von einem Benutzer zu erhalten oder sie diesem zur Verfügung zu stellen. Ein Eingabegerät 660 kann beispielsweise Geräte wie ein Touchscreen, Touchpad, Dateneingabetasten und/oder ein Mikrofon beinhalten, das sich zur Stimmenerkennung eignet. Das Eingabegerät 660 kann von einem Benutzer eingesetzt werden, um spezifische Standortdatenberichte zu identifizieren oder Zeitreihen gemäß den offenbarten Ausführungsformen zu analysieren, oder die Anzeige unterschiedlicher Modelle anzufordern, die gemäß den offenbarten Ausführungsformen generiert worden sind. Ein Ausgabegerät 662 kann tonbezogene oder visuelle Ausgaben, wie etwa Lautsprecher oder Displays für das Angeben semantischer Ortsidentifikatoren oder sonstiger Daten und/oder Platz-Modellausgaben, einschließlich semantischen Ortsgrenzenabschätzungen, hierarchischen Clustering-Datenstrukturen, verwandten Karten und dergleichen, beinhalten. Tonbezogene und/oder visuelle Alarme können auch am Ausgabegerät 662 bereitgestellt werden, um einem Benutzer Signale bereitzustellen, die die Ankunft eines Benutzers bei bestimmten zuvor festgelegten semantischen Orten angeben (z. B. Ankunftsziele, Lieblingsorte oder sonstige.)
  • Es versteht sich von selbst, dass der Begriff „Modul” sich auf eine Computerlogik bezieht, die verwendet wird, um die erwünschte Funktionalität bereitzustellen. Somit kann ein Modul in Hardware, anwendungsspezifischen Schaltungen, Firmware und/oder Software implementiert werden, mittels der denen ein Allzweckprozessor gesteuert wird. In einer Ausführungsform sind die Module Programmcode-Dateien, die im Speichergerät gespeichert und in einem oder mehreren Speichergeräten geladen sind sowie von einem oder mehreren Prozessoren ausgeführt werden oder die von Computerprogramm-Produkten bereitgestellt werden können, wie z. B. vom Computer ausführbare Anweisungen, die in einem körperlichen, computerlesbaren Speichermedium wie einem RAM, einem Flash-Laufwerk, einer Festplatte oder einem optischen oder magnetischen Datenträger gespeichert sind. Wenn Software verwendet wird, kann eine beliebige geeignete Programmiersprache oder Plattform verwendet werden, um das Modul zu implementieren.
  • Die hier besprochene Technologie nimmt Bezug auf Server, Datenbanken, Softwareanwendungen, und sonstige computergestützte Systeme, sowie auch unternommene Handlungen und die an und von derartigen Systemen und gesendeten Informationen. Der Durchschnittsfachmann auf diesem Gebiet wird erkennen, dass die naturgemäße Flexibilität computergestützter Systeme eine große Vielfalt an möglichen Konfigurationen, Kombinationen und der Aufteilung von Aufgaben und Funktionalitäten zwischen und unter den Komponenten ermöglicht. Die hierin diskutierten Serverprozesse können beispielsweise unter Verwendung eines einzelnen Servers oder mehrerer in Kombination betriebener Server umgesetzt werden. Datenbanken und Anwendungen können auf einem einzigen System oder auf mehrere Systeme verteilt, implementiert werden. Verteilte Komponenten können sequenziell oder parallel betrieben werden.
  • Während der vorliegende Gegenstand im Detail unter Bezugnahme auf spezifische Ausführungsbeispiele beschrieben wurde, versteht es sich, dass Fachleute auf dem Gebiet nach Erlangen eines Verständnisses des Vorstehenden leicht Veränderungen an, Variationen von und Äquivalente zu solchen Ausführungsformen anfertigen können. Demgemäß ist der Umfang der vorliegenden Offenlegung nur exemplarisch und nicht begrenzend, und die betroffene Offenbarung schließt die Einbeziehung solcher Modifizierungen, Varianten und/oder Hinzufügungen des vorliegenden Gegenstands nicht aus, die für Fachleute problemlos offensichtlich sind.

Claims (24)

  1. Ein computerimplementiertes System für das Ermitteln semantischer Ortsdaten, das dazu eingerichtet ist, das Folgende zu umfassen: das Prüfen einer Vielzahl von Zeitreihen historischer Standortdatenberichte mittels einer oder mehrerer Rechenvorrichtungen, um deren Überlappungsgrad zu ermitteln; das Gruppieren ausgewählter Zeitreihen an Standortdatenberichten mittels einer oder mehrerer Rechenvorrichtungen, die als hinreichend überlappend ermittelt werden; das Zuweisen von Standortklassifikatoren mittels einer oder mehrerer Rechenvorrichtungen, die eine oder mehrere Standortentitäten voneinander unterscheiden, basierend auf den Gruppierungen der ausgewählten Zeitreihen historischer Standortberichte, die als hinreichend überlappend ermittelt werden; und das Ermitteln semantischer Standortdaten für eine oder mehrere Zeitreihen der gegenwärtigen oder historischen Standortberichte unter Verwendung der zugeordneten Standortklassifikatoren, das mittels einer oder mehrerer Rechenvorrichtungen durchgeführt wird.
  2. Computerimplementiertes System nach Anspruch 1, worin semantische Ortsdaten ein oder mehrere semantische Ortskennzeichnungen für eine Standortentität, Kategorien oder sonstige Metadaten, die mit einer Standortentität in Verbindung gebracht werden, Informationen über einen Veranstaltungsstandort oder eine Geometrie, die mit einer Standortentität in Verbindung gebracht wird, und ein oder mehrere Charakterisierungen der Verteilungen der Verhaltensweisen, Demografiken, oder Psychografiken von Benutzern, die eine Standortentität besuchen, beinhalten.
  3. Computerimplementiertes System nach Anspruch 1, worin das Überprüfen der Vielzahl von Zeitreihen der historischen Standortdatenberichte, um ihre Überlappung zu bestimmen das Ermitteln einer Überlappungsbewertung für Paare von Zeitserien umfassen, die mit der Überlappung der geographischen Bereiche korrelieren, die von der Bewegung mobiler Geräte abgedeckt werden, die die Zeitreihenpaare generieren.
  4. Computerimplementiertes System nach Anspruch 3, worin das Gruppieren ausgewählter Zeitreihen historischer Standortberichte, die als hinreichend überlappend ermittelt werden, das Clustering der Zeitreihen historischer Standortdatenberichte umfasst, die ihre Überlappungsberichte als eine Clustering Metrik verwenden.
  5. Computersystem, das Folgendes umfasst: einen oder mehrere Prozessor(en); und ein oder mehrere Speichergeräte, die computerlesbare Anweisungen speichern, die, wenn sie von dem einen oder den mehreren Prozessoren ausgeführt werden, den einen oder die mehreren Prozessoren dazu veranlassen, Vorgänge auszuführen, die Vorgänge umfassend: das Empfangen eines semantischen Standortmodells, das Informationen über semantische Orte innerhalb eines oder mehrerer Originalspeicherbereiche der geographischen Regionen bereitstellt, worin das semantische Standortmodell zumindest teilweise aus hierarchischen Clustering-Algorithmen generiert wird, die an Daten ausgeführt werden, die von vorhergehenden Standortdatenberichten stammen, die von einer Vielzahl von mobilen Geräten eingesammelt werden, die in ein oder mehreren Originalspeicherbereichen der geographischen Region betrieben werden; das Bereitstellen eines oder mehrerer neuer Standortdatenberichte, die auf den gegenwärtigen oder vergangenen geographischen Standort des Benutzers schließen lassen; und das Generieren semantischer Ortsdaten, die mit den bereitgestellten ein oder mehreren neuen Standortdatenberichten, mittels der Verarbeitung eines oder mehrerer neuer Standortdatenberichte unter Verwendung des semantischen Standardmodells in Verbindung gebracht werden.
  6. Computersystem nach Anspruch 5, worin der Betrieb des Empfangens eines semantischen Standardmodells den Empfang einer hierarchischen Clustering-Konfiguration der Standortdatenberichte von jedem Originalspeicherbereich der geographischen Region umfasst, worin die hierarchische Clustering-Konfiguration eine Walddatenstruktur umfasst, deren Blätter den historischen lokalisierten Segmenten entspricht.
  7. Computersystem nach Anspruch 5, worin die generierten semantischen Ortsdaten ein oder mehrere semantische Ortskennzeichnungen für eine Standortentität, Kategorien oder sonstigen Metadaten umfassen, die mit einer Standortentität, Informationen über einen Veranstaltungsstandort oder die mit einer Standortentität in Verbindung gebrachten Geometrie und ein oder mehrere Charakterisierungen der Verteilung der Verhaltensweisen, Demografiken oder Psychografiken von Benutzern, die eine Standortentität besuchen, in Verbindung gebracht wird.
  8. Computersystem nach Anspruch 5, worin der Betrieb des Empfangens eines semantischen Standardmodells das Empfangen eines Modells umfasst, das durch den Betrieb der im Folgenden Aufgeführten generiert wird: das Identifizieren eines oder mehrerer Clustering-Canopies der lokalisierten Segmente, die eine geographische Überlappungscharakterisierung erfüllen; das Ermitteln einer Überlappungsbewertung für jedes Paar lokalisierter Segmente, die mindestens ein Clustering-Canopy gemeinsam haben, worin die Überlappungsbewertung mit dem Überlappen unter den tatsächlichen geographischen Bereichen korreliert, die durch die Bewegung des mobilen Geräts abgedeckt werden, dass die lokalisierten Segmente im gegebenen Paar generiert; und das Generieren einer Datenstruktur, die eine Clustering-Konfiguration des lokalisierten Segments in jedem Originalspeicherbereich der geographischen Region bereitstellt, worin die Datenstruktur zumindest teilweise aus ermittelten Überlappungsbewertungen generiert wird.
  9. Computerimplementierte System zum Ermitteln semantischer Ortsdaten, das eingerichtet ist, Folgendes zu umfassen: das Empfangen einer Vielzahl von Standortdatenberichten von einer Vielzahl von mobilen Geräten, das mittels einer oder mehrerer Rechenvorrichtungen durchgeführt wird; das von einer oder mehreren Rechenvorrichtungen durchgeführte Aufteilen der Vielzahl von Standortdatenberichten in lokalisierten Segmenten; das Abschätzen eines Originalspeicherbereichs der geographischen Region für jedes lokalisierte Segment mittels einer oder mehrerer Rechenvorrichtungen; das Identifizieren einer oder mehrerer Clustering-Canopies lokalisierter Segmente mittels einer oder mehrerer Rechenvorrichtungen innerhalb jedes Originalspeicherbereichs der geometrischen Region, die einer potenziellen geographischen Überlappungscharakterisierung gerecht werden; das von einem oder mehreren Rechenvorrichtungen durchgeführte Ermitteln einer Überlappungsbewertung für jedes Paar lokalisierter Segmente, die mindestens ein Clustering-Canopy gemeinsam haben, worin die Überlappungsbewertung mit der Überlappung unter den tatsächlichen geographischen Gebieten korreliert, die von der Bewegung der mobilen Geräte abgedeckt werden, die die lokalisierten Segmente in diesem gegebenen Paar generieren; das von einem oder mehreren Rechenvorrichtungen durchgeführte Generieren einer Datenstruktur, die eine Clustering-Konfiguration der lokalisierten Segmente in jedem Originalspeicherbereich der geographischen Region bereitstellt, worin die Datenstruktur zumindest teilweise von den ermittelten Überlappungsbewertungen generiert wird; und Das von einem oder mehreren Rechenvorrichtungen durchgeführte Ermitteln semantischer Ortsdaten für ein oder mehrere lokalisierte Segmente, basierend zumindest teilweise auf Clustering-Konfiguration der generierten Datenstruktur.
  10. Computerimplementiertes System nach Anspruch 9, worin die Vielzahl der Standortdatenberichte entsprechender Weise ein oder mehrere aus einem Zeitstempel, einen abgeschätzten physischen Standort, ein Modell des Fehlers im physischen Standort, Sensorbeobachtungen über ein oder mehrere Signalanlagen, die einen Signalanlagenidentifikator, und eine Metrik umfassen, die mit der Entfernung zur Signalanlage, einem Geocode und einem Identifikator des mobilen Geräts umfassen.
  11. Computerimplementiertes System nach Anspruch 10, worin die Vielzahl der Standortdatenberichte Sensorbeobachtungen über ein oder mehrere Signalanlagen umfassen, worin jede Sensorbeobachtung über eine Signalanlage einen BSSID-WiFi-Zugangspunkt umfasst, der als ein Signalanlagenidentifikator bereitgestellt wird und einen empfangenen Signalstärkenindikator (RSSI), der als eine Signalanlagenentfernungsmetrik bereitgestellt wird.
  12. Computerimplementiertes System nach Anspruch 9, worin jedes lokalisierte Segment einer Zeitreihe entspricht, während der ein gegebenes Mobilgerät sich innerhalb eines gegebenen lokalisierten geographischen Gebiets befindet.
  13. Computerimplementiertes System nach Anspruch 9, worin ein Clustering-Canopy von einem Signalanlagenidentifizierer charakterisiert wird und alle lokalisierten Segmente, an denen der Signalanlagenidentifizierer bei mindestens einer feststehenden Anzahl oder einem Bruchteil der Standortdatenberichte erscheint.
  14. Computerimplementiertes System nach Anspruch 9, worin die Vielzahl der Standortdatenberichte von der Vielzahl der mobilen Geräte entsprechender Weise ein oder mehrere Signalanlagenbeobachtungen umfassen, und worin das durch einen oder mehrere Rechenvorrichtungen durchgeführte Ermitteln eine Überlappungsbewertung für jedes Paar der lokalisierten Segmente in jedem Originalspeicherbereich der geographischen Region das mindestens ein Clustering Canopies gemeinsam hat, umfasst: das von einem oder mehreren Recheneinrichtungen durchgeführte Bezeichnen eines im Betracht zu ziehenden Signalanlagensatzes, der die Signalanlagen beinhaltet, die von mobilen Geräten, die in jedem Paar lokalisierter Segmente beobachtet werden, bei denen die Signalanlagen-Beobachtungen einen zuvor festgelegten Signalanlagen-Schwellenwertpegel erfüllen; die von einem oder mehreren Recheneinrichtungen durchgeführte Überlappungsbewertung der Signalanlage für jede Signalanlage des in Betracht zu ziehenden Signalanlagensatzes; und das von einem oder mehreren Computergeräten durchgeführte Generieren einer allgemeinen Überlappungsbewertung für jedes Paar in Betracht zu ziehender lokalisierter Segmente durch das Kombinieren der Überlappungsbewertungen der Signalanlage für alle Signalanlagen im in Betracht zu ziehenden Signalanlagensatz für dieses Paar der lokalisierten Segmente.
  15. Computerimplementierte System nach Anspruch 14, worin niedrigere Überlappungsbewertungen in der Signalanlage für ein gegebenes Paar lokalisierter Segmente angibt, dass Signale von dieser Signalanlage stichhaltigere Beweise dafür erbringen, dass das gegebene Paar lokalisierter Segmente sich nicht überlappt.
  16. Computerimplementiertes System des Anspruchs 14, worin der zuvor festgelegte Schwellenwertpegel der Signalanlage in Bezug auf ein oder mehrere Distanzmetrikwerte der Signalanlage, der Frequenz, mit der die Signalanlage während des lokalisierten Segments beobachtet wird, und wie oft die Signalanlage während des lokalisierten Segments beobachtet wird, definiert wird.
  17. Computerimplementiertes System des Anspruchs 9, worin das von einem oder mehreren Recheneinrichtungen durchgeführte Generieren einer Datenstruktur, die eine Clustering-Konfiguration der lokalisierten Segmente in jedem Originalspeicherbereich der geographischen Region bereitstellt, die das Generieren einer Walddatenstruktur umfasst, deren Blätter den lokalisierten Segmenten entsprechen.
  18. Computerimplementiertes System des Anspruchs 9, worin das Ermitteln der semantischen Ortsdaten für ein oder mehrere lokalisierte Segmente, die zumindest teilweise auf eine Clustering-Konfiguration basieren, eine vorverarbeitungsbezogene Training-Subroutine umfasst, die über ein oder mehrere Recheneinrichtungen eine semantische Datenkennzeichnung mit bestimmten Teilen der Datenstruktur in Verbindung bringt, die auf den Empfang eines oder mehrerer lokalisierter Segmente mit semantischen Datenkennzeichnungen reagiert und basierend zumindest teilweise auf der Clustering-Konfiguration, einen Klassifizierer für ein oder mehrere semantische Daten, die empfangen wurden, kennzeichnet und eine Online-Subroutine, die auf ein oder mehrere lokalisierte Segmente reagiert, assoziiert semantische Daten mittels einer oder mehrerer Recheneinrichtungen mit den empfangenen Segmenten unter Verwendung der von der vorverarbeitungsbezogenen Training-Subroutine identifizierten Klassifizierer.
  19. Computerimplementiertes System nach Anspruch 9, worin das Ermitteln der semantischen Ortsdaten für ein oder mehrere lokalisierte Segmente in jedem Originalspeicherbereich der geographischen Region basierend zumindest teilweise auf der Clustering-Konfiguration, die das von einem oder mehreren Recheneinrichtungen durchgeführte Ermitteln eines semantischen Standortwahrscheinlichkeitswerts umfasst, der eine Wahrscheinlichkeit repräsentiert, dass die Vielzahl an Standortdatenberichten, die das lokalisierte Segment ausmachen, eingeholt wurden während das Gerät sich an einem gegebenen semantischen Standort befand, worin das Ermitteln des semantischen Standortwahrscheinlichkeitswerts zumindest teilweise auf der Clustering-Konfiguration basiert.
  20. Computerimplementiertes System nach Anspruch 9, worin das Ermitteln der semantischen Standortdaten für ein oder mehrere lokalisierte Segmente in jedem Originalspeicherbereich der geographischen Region, das zumindest teilweise auf der Clustering-Konfiguration basiert, das von einer oder mehreren Recheneinrichtungen durchgeführte Generieren einer Prognose des semantischen Standorts für ein neues lokalisierte Segment oder ein oder mehrere neue Standortdatenberichte, die zumindest teilweise auf der Clustering-Konfiguration basieren, beinhaltet.
  21. Computersystem, das Folgendes umfasst: einen oder mehrere Prozessor(en); und ein oder mehrere Speichergeräte, die computerlesbare Anweisungen speichern, die, wenn sie von dem einen oder den mehreren Prozessoren ausgeführt werden, den einen oder die mehreren Prozessoren dazu veranlassen, Vorgänge auszuführen, die Vorgänge umfassend: das Erhalten einer Vielzahl von Standortdatenberichten von einer Vielzahl an mobilen Geräten; das Aufteilen der Vielzahl von Standortdatenberichten in lokalisierte Segmente; das Abschätzen eines Originalspeicherbereichs einer geographischen Region für jedes lokalisierte Segment; das Identifizieren eines oder mehrerer Clustering-Canopies der lokalisierten Segmente innerhalb jedes Originalspeicherbereichs der geographischen Region, das eine potentielle geographische Überlappungscharakterisierung erfüllt; das Ermitteln einer Überlappungsbewertung für jedes Paar lokalisierter Segmente, die mindestens ein Clustering-Canopy gemeinsam haben, worin die Überlappungsbewertung mit dem Überlappen der tatsächlichen geographischen Bereiche korreliert, die von der Bewegung der mobilen Geräte, die die lokalisierten Segmente in jedem gegebenen Paar generieren, abgedeckt werden; das Generieren einer Datenstruktur, die eine Clustering-Konfiguration des lokalisierten Segments in jedem Originalspeicherbereich der geographischen Region bereitstellt, worin die Datenstruktur zumindest teilweise aus ermittelten Überlappungsbewertungen generiert wird; und das Ermitteln der semantischen Ortsdaten für einen oder mehrere lokalisierte Segmente mittels einer oder mehrerer Rechenvorrichtungen, basierend zumindest teilweise auf die Clustering-Konfiguration der generierten Datenstruktur.
  22. Computersystem nach Anspruch 21, worin ein Clustering-Canopy von einem Signalanlagenidentifizierer charakterisiert wird und alle lokalisierten Segmente, an denen der Signalanlagenidentifizierer bei mindestens einer feststehenden Anzahl oder einem Bruchteil der Standortdatenberichte erscheint.
  23. Computersystem nach Anspruch 21, worin das Ermitteln der semantischen Ortsdaten für ein oder mehrere lokalisierte Segmente in jedem Originalspeicherbereich der geographischen Regionen zumindest teilweise auf die Clustering-Konfiguration basiert, die das mittels einer oder mehreren Rechenvorrichtungen durchgeführte Generieren einer Prognose des semantischen Standorts für ein neues lokalisiertes Segment oder ein oder mehrere Standortdatenberichte umfasst, die zumindest teilweise auf der Clustering-Konfiguration basieren.
  24. Computersystem nach Anspruch 21, worin die semantischen Ortsdaten ein oder mehrere semantische Ortskennzeichnungen für eine Standortentität, Kategorien oder sonstigen Metadaten umfassen, die mit einer Standortentität, Informationen über einen Veranstaltungsstandort oder die mit einer Standortentität in Verbindung gebrachten Geometrie und ein oder mehrere Charakterisierungen der Verteilung der Verhaltensweisen, Demografiken oder Psychografiken von Benutzern, die eine Standortentität besuchen, in Verbindung gebracht wird.
DE202015009183.0U 2014-12-29 2015-10-02 Das Analysieren semantischer Orte und verwandter Daten aus einer Vielzahl von Standortdatenberichten Active DE202015009183U1 (de)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201462097423P 2014-12-29 2014-12-29
US62/097,423 2014-12-29
US14/595,256 2015-01-13
US14/595,256 US9904932B2 (en) 2014-12-29 2015-01-13 Analyzing semantic places and related data from a plurality of location data reports

Publications (1)

Publication Number Publication Date
DE202015009183U1 true DE202015009183U1 (de) 2016-11-10

Family

ID=56164694

Family Applications (1)

Application Number Title Priority Date Filing Date
DE202015009183.0U Active DE202015009183U1 (de) 2014-12-29 2015-10-02 Das Analysieren semantischer Orte und verwandter Daten aus einer Vielzahl von Standortdatenberichten

Country Status (5)

Country Link
US (1) US9904932B2 (de)
EP (1) EP3241370B1 (de)
CN (1) CN106462627B (de)
DE (1) DE202015009183U1 (de)
WO (1) WO2016108977A1 (de)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3272137A4 (de) * 2015-03-16 2018-11-07 Nokia Technologies Oy Verfahren und vorrichtung zur entdeckung sozialer beziehungen basierend auf verhüllten trajektorien
US20170039258A1 (en) * 2015-08-05 2017-02-09 Microsoft Technology Licensing, Llc Efficient Location-Based Entity Record Conflation
US9565521B1 (en) * 2015-08-14 2017-02-07 Samsung Electronics Co., Ltd. Automatic semantic labeling based on activity recognition
US10331710B2 (en) * 2015-10-01 2019-06-25 Microsoft Technology Licensing, Llc Partitioning of geographic data
EP3165877B1 (de) * 2015-11-04 2020-03-25 Tata Consultancy Services Limited Lokalisierungssysteme und -verfahren durch kombination von trägheits- und bluetooth-niedrigenergie sensordaten
US20170132648A1 (en) * 2015-11-11 2017-05-11 International Business Machines Corporation Anonymous reporting of multiple venue location data
US9749783B2 (en) * 2016-01-04 2017-08-29 The Boeing Company System and method for estimating wireless device positions
US10650621B1 (en) 2016-09-13 2020-05-12 Iocurrents, Inc. Interfacing with a vehicular controller area network
CN106931974B (zh) * 2017-03-29 2020-04-03 清华大学 基于移动终端gps定位数据记录计算个人通勤距离的方法
CN107194412A (zh) * 2017-04-20 2017-09-22 百度在线网络技术(北京)有限公司 一种处理数据的方法、装置、设备和计算机存储介质
US10521784B2 (en) * 2017-04-24 2019-12-31 Square, Inc. Analyzing layouts using sensor data
CN109003107B (zh) * 2017-06-06 2020-12-04 北京嘀嘀无限科技发展有限公司 区域划分方法及装置
CN107248277B (zh) * 2017-07-27 2019-11-08 安徽正熹标王新能源有限公司 一种共享单车空车预测提醒***
US10234291B1 (en) * 2017-10-06 2019-03-19 Cisco Technology, Inc. Collaborative localization between phone and infrastructure
CN108011987B (zh) * 2017-10-11 2020-09-04 北京三快在线科技有限公司 Ip地址定位方法及装置,电子设备及存储介质
US11521022B2 (en) * 2017-11-07 2022-12-06 Google Llc Semantic state based sensor tracking and updating
CN108280685B (zh) * 2018-01-19 2019-07-23 百度在线网络技术(北京)有限公司 信息获取方法和装置
SE541634C2 (en) 2018-03-06 2019-11-19 Scania Cv Ab Method and control arrangement for identification of parking areas
WO2019171132A1 (en) * 2018-03-06 2019-09-12 Pratik Sharma Geographic coordinates locator service
US11023495B2 (en) * 2018-03-19 2021-06-01 Adobe Inc. Automatically generating meaningful user segments
US10977605B2 (en) * 2018-06-05 2021-04-13 Signal Ocean Ltd Carrier path prediction based on dynamic input data
JP6929260B2 (ja) * 2018-11-01 2021-09-01 株式会社東芝 時系列特徴抽出装置、時系列特徴抽出方法及びプログラム
US10963917B2 (en) 2018-12-26 2021-03-30 Yandex Europe Ag Method and system for determining fact of visit of user to point of interest
US11520759B2 (en) * 2019-04-26 2022-12-06 Salesforce.Com, Inc. Processing time series metrics data
JP7173331B2 (ja) * 2019-06-14 2022-11-16 日本電信電話株式会社 情報抽出装置、情報抽出方法、及び情報抽出プログラム
CN110198519A (zh) * 2019-06-26 2019-09-03 阿里巴巴集团控股有限公司 网络接入点的位置估计方法与装置
US11372876B1 (en) 2019-09-18 2022-06-28 BlueOwl, LLC Method and system for providing recommendations and search results to visitors with a focus on local businesses
US11461792B1 (en) * 2019-09-18 2022-10-04 BlueOwl, LLC Method and system for tracking local businesses visited by a user
US11719541B2 (en) * 2019-11-13 2023-08-08 Aclima Inc. Hyper-local mapping of environmental conditions
CN111194005A (zh) * 2019-12-05 2020-05-22 中国科学院地理科学与资源研究所 一种室内行人语义位置提取方法及预测方法
US11167207B2 (en) 2019-12-13 2021-11-09 Niantic, Inc. Region division with cell merging using spanning tree
US11451671B2 (en) * 2020-04-29 2022-09-20 EXFO Solutions SAS Identification of 5G Non-Standalone Architecture traffic on the S1 interface
CN111782748B (zh) * 2020-06-28 2024-01-12 北京百度网讯科技有限公司 地图检索方法、信息点poi语义向量的计算方法和装置
US11599667B1 (en) * 2020-08-11 2023-03-07 Amazon Technologies, Inc. Efficient statistical techniques for detecting sensitive data
US11449523B2 (en) * 2020-11-05 2022-09-20 Adobe Inc. Generating overlap estimations between high-volume digital data sets based on multiple sketch vector similarity estimators
CN113392652B (zh) * 2021-03-30 2023-07-25 中国人民解放军战略支援部队信息工程大学 基于语义聚类的签到热点功能特征识别方法
US20230108980A1 (en) * 2021-09-28 2023-04-06 Chris Shughrue Depletion modeling for estimating survey completeness by region

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7720652B2 (en) * 2004-10-19 2010-05-18 Microsoft Corporation Modeling location histories
EP1939797A1 (de) 2006-12-23 2008-07-02 NTT DoCoMo, Inc. Verfahren und Vorrichtung zur automatischen Bestimmung einer semantischen Klassifizierung von Kontextdaten
US8229458B2 (en) * 2007-04-08 2012-07-24 Enhanced Geographic Llc Systems and methods to determine the name of a location visited by a user of a wireless device
EP2513858A4 (de) * 2009-12-15 2013-11-20 Intel Corp Systeme, vorrichtung und verfahren für kontextinformationsnutzung
KR101534995B1 (ko) * 2011-02-05 2015-07-07 애플 인크. 모바일 로케이션 결정을 위한 방법 및 장치
US8639640B1 (en) 2011-06-10 2014-01-28 Google Inc. Prediction of indoor location using decision trees
CN102509170A (zh) * 2011-10-10 2012-06-20 浙江鸿程计算机***有限公司 一种基于历史轨迹数据挖掘的位置预测***及方法
CN102607553B (zh) * 2012-03-06 2014-08-13 北京建筑工程学院 一种基于出行轨迹数据的行程识别方法
US8886649B2 (en) 2012-03-19 2014-11-11 Microsoft Corporation Multi-center canopy clustering
KR101614264B1 (ko) * 2012-06-22 2016-04-21 구글 인코포레이티드 연락처 정보에 기초한 방문 위치의 라벨링
CN104380293B (zh) * 2012-06-22 2017-03-22 谷歌公司 基于位置从地图历史提供相关元素信息的方法和计算装置
KR101512278B1 (ko) * 2012-07-25 2015-04-17 아로, 인코포레이티드 스토리라인을 생성하고, 사용자 루틴 및 개성을 모델링하고, 맞춤형 추천 에이전트를 생성하는 모바일 장치 데이터 사용
CN103593349B (zh) * 2012-08-14 2016-12-21 中国科学院沈阳自动化研究所 感应网络环境下移动位置分析方法
US9740773B2 (en) 2012-11-02 2017-08-22 Qualcomm Incorporated Context labels for data clusters
US10191945B2 (en) 2013-02-20 2019-01-29 The Florida International University Board Of Trustees Geolocating social media
US20150147997A1 (en) * 2013-11-26 2015-05-28 At&T Intellectual Property I, L.P. Event based location-based service
CN103841516A (zh) * 2014-02-28 2014-06-04 华中科技大学 一种基于移动电话数据识别城市特定区域的方法
CN104199936B (zh) * 2014-09-09 2018-01-23 联想(北京)有限公司 一种信息的处理方法和装置
CN104239556B (zh) * 2014-09-25 2017-07-28 西安理工大学 基于密度聚类的自适应轨迹预测方法

Also Published As

Publication number Publication date
CN106462627A (zh) 2017-02-22
EP3241370A1 (de) 2017-11-08
WO2016108977A1 (en) 2016-07-07
US20160189186A1 (en) 2016-06-30
US9904932B2 (en) 2018-02-27
CN106462627B (zh) 2021-03-12
EP3241370B1 (de) 2019-10-02

Similar Documents

Publication Publication Date Title
DE202015009183U1 (de) Das Analysieren semantischer Orte und verwandter Daten aus einer Vielzahl von Standortdatenberichten
Chung et al. A trip reconstruction tool for GPS-based personal travel surveys
Zhou et al. Recognizing city identity via attribute analysis of geo-tagged images
Minetto et al. Measuring human and economic activity from satellite imagery to support city-scale decision-making during covid-19 pandemic
Byon et al. Real-time transportation mode detection using smartphones and artificial neural networks: Performance comparisons between smartphones and conventional global positioning system sensors
DE102007045082A1 (de) Vorrichtung und Verfahren zum Aktualisieren von Kartendaten
DE102019205821A1 (de) Einrichtung und verfahren für verkehrsinformationsdienst
CN110990661B (zh) 一种基于路网约束和密度聚类的兴趣区域出入口提取方法
CN114297532B (zh) 一种基于人群移动轨迹的高清城市功能区识别方法及***
Aschwanden et al. Learning to walk: Modeling transportation mode choice distribution through neural networks
Barmpounakis et al. Lane detection and lane-changing identification with high-resolution data from a swarm of drones
Keler et al. Detecting vehicle traffic patterns in urban environments using taxi trajectory intersection points
Jiang et al. Travel time prediction based on historical trajectory data
Comi et al. Private car OD flow estimation based on automated vehicle monitoring data: Theoretical issues and empirical evidence
Dalumpines et al. Making mode detection transferable: extracting activity and travel episodes from GPS data using the multinomial logit model and Python
Wepulanon et al. A real-time bus arrival time information system using crowdsourced smartphone data: a novel framework and simulation experiments
CN111159583A (zh) 用户行为分析方法、装置、设备及存储介质
Correa et al. Urban path travel time estimation using GPS trajectories from high-sampling-rate ridesourcing services
Dadhich et al. Spatial investigation of the temporal urban form to assess impact on transit services and public transportation access
Schoier et al. Individual movements and geographical data mining. Clustering algorithms for highlighting hotspots in personal navigation routes
Chaudhuri et al. Application of web-based Geographical Information System (GIS) in tourism development
Mazzei et al. Spatial multicriteria analysis approach for evaluation of mobility demand in urban areas
Kulkarni et al. Land use land cover change detection through GIS and unsupervised learning technique
WO2015170385A1 (ja) 移動手段判別システム、移動手段判別方法、及び計算機読み取り可能な非一時的な記憶媒体
Barman et al. An approach to GIS-based traffic information system using Spatial Oracle

Legal Events

Date Code Title Description
R207 Utility model specification
R081 Change of applicant/patentee

Owner name: GOOGLE LLC (N.D.GES.D. STAATES DELAWARE), MOUN, US

Free format text: FORMER OWNER: GOOGLE INC., MOUNTAIN VIEW, CALIF., US

R082 Change of representative

Representative=s name: BETTEN & RESCH PATENT- UND RECHTSANWAELTE PART, DE

R081 Change of applicant/patentee

Owner name: GOOGLE LLC (N.D.GES.D. STAATES DELAWARE), MOUN, US

Free format text: FORMER OWNER: GOOGLE LLC (N.D.GES.D. STAATES DELAWARE), MOUNTAIN VIEW, CALIF., US

R082 Change of representative

Representative=s name: BETTEN & RESCH PATENT- UND RECHTSANWAELTE PART, DE

R150 Utility model maintained after payment of first maintenance fee after three years
R151 Utility model maintained after payment of second maintenance fee after six years
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G06F0017300000

Ipc: G06F0016290000

R152 Utility model maintained after payment of third maintenance fee after eight years