CN105674995B - 一种基于用户出行轨迹获取通勤路线的方法及装置 - Google Patents

一种基于用户出行轨迹获取通勤路线的方法及装置 Download PDF

Info

Publication number
CN105674995B
CN105674995B CN201511029772.9A CN201511029772A CN105674995B CN 105674995 B CN105674995 B CN 105674995B CN 201511029772 A CN201511029772 A CN 201511029772A CN 105674995 B CN105674995 B CN 105674995B
Authority
CN
China
Prior art keywords
commuting
section
way
track
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201511029772.9A
Other languages
English (en)
Other versions
CN105674995A (zh
Inventor
王超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201511029772.9A priority Critical patent/CN105674995B/zh
Publication of CN105674995A publication Critical patent/CN105674995A/zh
Application granted granted Critical
Publication of CN105674995B publication Critical patent/CN105674995B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/3407Route searching; Route guidance specially adapted for specific applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0261Targeted advertisements based on user location

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Automation & Control Theory (AREA)
  • Navigation (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于用户出行轨迹获取通勤路线的方法及装置。所述基于用户出行轨迹获取通勤路线的方法包括:获取未知通勤路线用户的历史出行轨迹数据;根据所述历史出行轨迹数据确定所述未知通勤路线用户的住宅位置、公司位置和通勤途经路段;根据所述住宅位置、公司位置、通勤途经路段和所述历史出行轨迹数据确定所述未知通勤路线用户的通勤路线。本发明实施例的技术方案提供了一种与用户实际通勤路线匹配度更高的通勤路线获取的方法。

Description

一种基于用户出行轨迹获取通勤路线的方法及装置
技术领域
本发明涉及智能识别技术领域,尤其涉及一种基于用户出行轨迹获取通勤路线的方法及装置。
背景技术
在各类用车业务中,比如顺风车或拼车等业务中,用户的通勤需求占据很重要的市场份额。向用户推送通勤用车订单前,需要根据订单出行路线和用户实际出行路线的匹配程度来决定是否给用户推送订单。然而,在现有注册程序中,不会让用户提供完整的通勤路线,其中一部分用户会提供住宅地址和公司地址。另一部份用户通常不会提供住宅地址和公司地址。为了更好的满足用户的通勤需求,在推送通勤订单前,需要获取用户上下班的通勤路线。
现有技术并未提供能够自动且准确获取用户上下班通勤路线的方法,使得用户的实际通勤路线和订单推送的通勤路线差异很大,使得推送的通勤订单不能满足用户的实际需要。
发明内容
有鉴于此,本发明实施例提供一种基于用户出行轨迹获取通勤路线的方法及装置,以提高确定用户实际通勤路线的准确性。
第一方面,本发明实施例提供了一种基于用户出行轨迹获取通勤路线的方法,所述方法包括:
获取未知通勤路线用户的历史出行轨迹数据;
根据所述历史出行轨迹数据确定所述未知通勤路线用户的住宅位置、公司位置和通勤途经路段;
根据所述住宅位置、公司位置、通勤途经路段和所述历史出行轨迹数据确定所述未知通勤路线用户的通勤路线。
第二方面,本发明实施例还提供了一种基于用户出行轨迹获取通勤路线的装置,所述装置包括:
数据获取模块,用于获取未知通勤路线用户的历史出行轨迹数据;
关键数据确定模块,用于根据所述历史出行轨迹数据确定所述未知通勤路线用户的住宅位置、公司位置和通勤途经路段;
通勤路线确定模块,用于根据所述住宅位置、公司位置、通勤途经路段和所述历史出行轨迹数据确定所述未知通勤路线用户的通勤路线。
本发明实施例提供的基于用户出行轨迹获取通勤路线的方法及装置,利用用户的历史出行轨迹数据获取用户的通勤路线,使得获取的通勤路线与用户实际的通勤路线吻合度更好、匹配度更高,将获取的通勤路线作为订单路线,提高了用车类应用程序向用户推送订单的成功率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明实施例一提供的一种基于用户出行轨迹获取通勤路线的方法的流程图;
图2为本发明实施例一提供的处理历史出行轨迹数据的方法的流程图;
图3为本发明实施例二提供的一种基于用户出行轨迹获取通勤路线的方法的流程图;
图4为本发明实施例三提供的一种基于用户出行轨迹获取通勤路线的方法的流程图;
图5为本发明实施例四提供的一种基于用户出行轨迹获取通勤路线的方法的流程图;
图6为本发明实施例四提供的未连通轨迹街道连通示意图;
图7为本发明实施例五提供的一种基于用户出行轨迹获取通勤路线的方法的流程图;
图8为本发明实施例六提供的一种基于用户出行轨迹获取通勤路线的装置的结构图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
实施例一
图1为本发明实施例一提供的一种基于用户出行轨迹获取通勤路线的方法的流程图。本实施例可适用于想要获取未知通勤路线用户的通勤路线的情况。通勤路线一般是用户的家和公司之间的路线,或者也可以理解为是用户在某一个时期(数月)所频繁使用的路线。该方法可以由基于用户出行轨迹获取通勤路线的装置来执行,其中该装置可以由软件和/或硬件来实现,该装置通常可配置在服务器中。参考图1,本实施例提供的基于用户出行轨迹获取通勤路线的方法具体可以包括如下:
S110、获取未知通勤路线用户的历史出行轨迹数据。
其中,历史出行轨迹数据为通过互联网或各应用程序客户端采集的用户历史位置信息汇总得到的数据。例如,用户使用购物客户端进行自身定位的位置数据,使用地图客户端进行导航的导航路线等,均可作为历史出行轨迹数据;用户在互联网进行账户注册时填写的位置数据。获取历史出行轨迹数据可以是获取未知通勤路线用户在预设时间间隔内的历史出行轨迹数据或者获取未知通勤路线用户在预设出行次数内的历史出行轨迹数据,具体的预设时间间隔和预设出行次数可以根据实际情况进行限定。
S120、根据所述历史出行轨迹数据确定所述未知通勤路线用户的住宅位置、公司位置和通勤途经路段。
示例性的,住宅位置为通过历史出行轨迹数据直接或间接得到的用户住宅的位置信息,优选为地图中的一个坐标点;公司位置为通过历史出行轨迹数据直接或间接得到的用户公司的位置信息,优选为地图中的一个坐标点。对于用户频繁使用的路线来说,住宅位置和公司位置实际上即为频繁使用路线的两个端点。对于有特定生活规律的用户来说,频繁使用的路线可能不止一条,则住宅位置和公司位置也可以不止一个。通勤途经路段为通过历史出行轨迹数据直接或间接得到的经过通勤路线的一段位置信息,优选为地图中两个路口之间的路段,或者为电子地图中最小的路段矢量单位,每个未知通勤路线用户可以有多个通勤途经路段。
S130、根据所述住宅位置、公司位置、通勤途经路段和所述历史出行轨迹数据确定所述未知通勤路线用户的通勤路线。
示例性的,通勤路线确定方式可以是在历史出行轨迹数据中获取住宅位置和公司位置间的全部连通路径,按照设定策略从连通路径中确定概率大的路线作为通勤路线。
本发明实施例一提供的基于用户出行轨迹获取通勤路线的方法,通过利用未知通勤路线用户的历史出行轨迹数据确定未知通勤路线用户的住宅位置、公司位置以及通勤途经路段,进而确定未知通勤路线用户的通勤路线,将确定的通勤路线作为用车类应用程序的订单路线,使得订单路线与用户的实际通勤路线匹配度高,提高了推送订单的成功率。
在上述技术方案中,根据所述历史出行轨迹数据确定所述未知通勤路线用户的住宅位置、公司位置和通勤途经路段优选执行如下方法,参见图2,包括:
S121、将所述历史出行轨迹数据分成道路轨迹数据和非道路轨迹数据。
具体的,道路轨迹数据为历史出行轨迹数据中在道路上的位置数据集合,可表征未知通勤路线用户出行的轨迹路线。非道路轨迹数据为历史出行轨迹数据中除去道路轨迹外其余的位置数据集合,可表征未知通勤路线用户在建筑物内或露天场所等非道路上的位置信息。所谓道路,即为电子地图中的路段概念。
S122、根据所述道路轨迹数据确定所述未知通勤路线用户的通勤途经路段。
示例性的,通过道路轨迹数据可以确定未知通勤路线用户的各通勤途经路段。确定方式可以是利用通勤途经路段识别器进行识别,其中通勤途经路段识别器为利用机器学习***模型对已知通勤路线用户的通勤途经路段和非通勤途经路段训练得到的。确定方式还可以是根据道路轨迹数据的途经时间,选取在上班时间段和/或下班时间段的途经路段作为通勤途经路段。
S123、根据所述非道路轨迹数据确定所述未知通勤路线用户的住宅位置和公司位置。
示例性的,通过非道路轨迹数据可以确定未知通勤路线用户的住宅位置和公司位置。确定方式可以是获取未知通勤路线用户提供的住宅位置和公司位置。确定方式也可以是利用位置识别器进行识别,其中位置识别器为利用机器学习***模型对已知住宅位置和公司位置用户的住宅位置簇、公司位置簇和无效位置簇进行训练得到的,其中所述住宅位置簇、公司位置簇和无效位置簇是通过对已知住宅位置和公司位置用户的非道路轨迹数据聚类得到。确定方式还可以是获取用户在工作时间段密集出现的区域,将在商业区的最密集位置标记为公司位置,获取用户在非工作时间段密集出现的区域,将在居民区的最密集位置标记为住宅位置。
实施例二
本实施例以上述实施例为基础提供了一种基于用户出行轨迹获取通勤路线的方法。图3为本发明实施例二提供的一种基于用户出行轨迹获取通勤路线的方法的流程图。参考图3,本发明实施例提供的基于用户出行轨迹获取通勤路线的方法可以包括如下:
S210、获取未知通勤路线用户的历史出行轨迹数据。
S220、将所述历史出行轨迹数据分成道路轨迹数据和非道路轨迹数据。
S230、根据所述道路轨迹数据确定所述未知通勤路线用户的通勤途经路段。
S240、对所述非道路轨迹数据进行聚类,得到至少两个点簇。
具体的,可以用聚类算法对所述非道路轨迹数据进行聚类,聚类算法可以为分割方法(如:Kmeans)、基于密度聚类算法(如:dbscan)、基于网格聚类算法(如:wavecluster)等。聚类后可以得到至少两个点簇,每个点簇包含一定数量或一定密度的用户位置数据,且各点簇之间包含的位置数据的数量或密度可以不同。
S250、利用位置识别器对各所述点簇进行识别,以确定住宅位置簇、公司位置簇和无效位置簇,并确定住宅位置和公司位置,所述位置识别器为利用机器学习***模型对已知住宅位置和公司位置用户的住宅位置簇、公司位置簇和无效位置簇进行训练得到的,其中所述住宅位置簇、公司位置簇和无效位置簇是通过对已知住宅位置和公司位置用户的非道路轨迹数据聚类得到。
示例性的,利用位置识别器对各所述点簇进行识别之前,需要确定位置识别器,确定步骤具体包括:获取一定数量的已知住宅位置和公司位置用户的历史出行轨迹数据,将各历史出行轨迹数据按照是否在道路上分为道路轨迹数据和非道路轨迹数据,用聚类算法对各非道路轨迹数据进行聚类,得到多个轨迹点簇,将包含住宅位置的点簇标记为住宅位置(home)簇,将包含公司位置的点簇标记为公司位置(company)簇,其余位置的点簇标记为无效位置(useless)簇。将得到的各簇作为位置识别器的训练数据,利用机器学习***模型按照预设属性对位置识别器进行训练,确认位置识别器。其中预设属性是可以确定用户位置信息的属性,可由人工设定,也可以基于模型训练确定。预设属性可以为用户在各簇中出现天数的比例、用户在各簇中白天和黑夜出现的比例、各簇中各无线局域网(WirelessFidelity,wifi)出现的概率计算出来的wifi熵、用户在一天中各个时段在簇中出现的比例、用户在簇中出现的次数等至少一项。
在确定位置识别器后,利用位置识别器对未知通勤路线用户的各点簇进行识别,确定住宅位置簇、公司位置簇和无效位置簇。将住宅位置簇的中心点坐标记为未知通勤路线用户的住宅位置,将公司位置簇的中心点坐标记为未知通勤路线用户的公司位置。
S260、根据所述住宅位置、公司位置、通勤途经路段和所述历史出行轨迹数据确定所述未知通勤路线用户的通勤路线。
本发明实施例二提供的一种基于用户出行轨迹获取通勤路线的方法,通过将未知通勤路线用户的历史出行轨迹数据分为道路轨迹数据和非道路轨迹数据,根据道路轨迹数据确定通勤途经路段,利用聚类算法和位置识别器对非道路轨迹数据进行聚类和识别,确定用户的住宅位置和公司位置,再根据住宅位置、公司位置和通勤途经路段在历史出行轨迹数据中确定未知通勤路线用户的通勤路线。该方法可以准确地确定未知通勤路线用户的住宅位置和公司位置,进而准确地确定通勤路线,使得确定的通勤路线与用户实际的通勤路线匹配度更高。
实施例三
本实施例以上述实施例为基础提供了一种基于用户出行轨迹获取通勤路线的方法。图4为本发明实施例三提供的一种基于用户出行轨迹获取通勤路线的方法的流程图。参考图4,本发明实施例提供的基于用户出行轨迹获取通勤路线的方法可以包括如下:
S310、获取未知通勤路线用户的历史出行轨迹数据。
S320、将所述历史出行轨迹数据分成道路轨迹数据和非道路轨迹数据。
S330、根据所述道路轨迹数据确定所述未知通勤路线用户的通勤途经路段。
S340、获取所述非道路轨迹数据中由所述未知通勤路线用户提供的住宅位置和公司位置。
示例性的,住宅位置和公司位置可以是在注册时提示未知通勤路线用户提供住宅位置和公司位置,或者是利用有偿奖励的方法激励未知通勤路线用户提供住宅位置和公司位置。未知通勤路线用户提供住宅位置和公司位置后可以直接获取住宅位置和公司位置。
S350、根据所述住宅位置、公司位置、通勤途经路段和所述历史出行轨迹数据确定所述未知通勤路线用户的通勤路线。
本发明实施例三提供的基于用户出行轨迹获取通勤路线的方法,获取未知通勤路线用户提供的住宅位置和公司位置,并根据道路轨迹数据获取通勤途经路段,通过住宅位置、公司位置、通勤途经路段在历史出行轨迹数据中确定未知通勤路线用户的通勤路线。该方法可以直接获取未知通勤路线用户的住宅位置和公司位置,简化通勤路线确定的步骤,同时使得确定的通勤路线与实际的通勤路线匹配度更高,提高用车类应用程序向用户推送通勤订单的成功率。
实施例四
本实施例以上述实施例为基础提供了一种基于用户出行轨迹获取通勤路线的方法。图5为本发明实施例四提供的一种基于用户出行轨迹获取通勤路线的方法的流程图。参考图5,本发明实施例提供的基于用户出行轨迹获取通勤路线的方法可以包括如下:
S410、获取未知通勤路线用户的历史出行轨迹数据。
S420、将所述历史出行轨迹数据分成道路轨迹数据和非道路轨迹数据。
S430、将所述道路轨迹数据以街道为单位进行划分,得到全部的轨迹街道,记为轨迹街道集合。
示例性的,将道路轨迹数据进行划分,可以为以街道为单位进行划分,也可以为以预设长度为单位进行划分,优选为以街道为单位进行划分。所述街道为两个路口之间的一段街道。将道路轨迹数据以街道为单位进行划分后,得到轨迹街道集合。
S440、利用通勤途经路段识别器对所述轨迹街道集合中的各轨迹街道进行识别,得到未知通勤路线用户的通勤途经路段,以及各轨迹街道被识别为通勤途经路段的概率值,所述通勤途经路段识别器为利用机器学习***模型对已知通勤路线用户的通勤途经路段和非通勤途经路段训练得到的。
示例性的,一个通勤途经路段对应一条轨迹街道。利用通勤途经路段识别器对所述轨迹街道集合中的各轨迹街道进行识别之前,先要确定通勤途经路段识别器,确定步骤具体包括:获取一定数量已知通勤路线用户的轨迹街道集合,将通勤路线的各轨迹街道标记为通勤途经路段,其余的轨迹街道标记为非通勤途经路段。将得到的各通勤途经路段和各非通勤途经路段作为通勤途经路段识别器的训练数据,利用机器学习***模型按照预设属性对通勤途经路段识别器进行训练,确认通勤途经路段识别器。其中预设属性是可以确定用户通勤途经路段的属性,可由人工设定,也可以基于模型训练确定。预设属性可以为用户轨迹街道集合出现的天数、出现的天数与该用户轨迹街道集合出现最少天数的比值、在白天和黑夜出现的比例和次数、在白天和黑夜出现次数与该用户的轨迹街道集合在白天和黑夜出现最少次数的比值、在一天中各个时段出现的比例和次数等至少一项。
在确认通勤途经路段识别器后,利用通勤途经路段识别器对未知通勤路线用户的轨迹街道集合进行识别,得到未知通勤路线用户的通勤途经路段,以及各轨迹街道被识别为通勤途经路段的概率值。例如,一条轨迹街道被识别为通勤途经路段的概率值为R,被识别为非通勤途经路段的概率值为r,则R+r=1。优选的,当轨迹街道被识别为通勤途经路段的概率值大于预设值时,将该轨迹街道识别为通勤途经路段,预设值的大小可以根据实际情况进行设定。
S450、根据所述非道路轨迹数据确定所述未知通勤路线用户的住宅位置和公司位置。
S460、根据所述住宅位置、公司位置、通勤途经路段和所述历史出行轨迹数据确定所述未知通勤路线用户的通勤路线。
本发明实施例四提供的基于用户出行轨迹获取通勤路线的方法,通过将未知通勤路线用户的历史出行轨迹数据分为道路轨迹数据和非道路轨迹数据,利用通勤途经路段识别器识别道路轨迹数据中的通勤途经路段,利用非道路轨迹数据确定用户的住宅位置和公司位置,进而确定未知通勤路线用户的通勤路线。该方法可以准确的确定未知通勤路线用户的通勤途经路段,使得最终确定的通勤路线与用户实际的通勤路线匹配度更高,提高用车类应用程序向用户推送通勤订单的成功率。
本发明实施例中的技术方案优选的可以是在根据所述住宅位置、公司位置、通勤途经路段和所述历史出行轨迹数据确定所述未知通勤路线用户的通勤路线之前,还包括:检验所述历史出行轨迹数据连通情况;若有未连通轨迹街道,则将所述未连通轨迹街道与所述历史出行轨迹数据中距离所述未连通轨迹街道最小的轨迹街道相连,相连的路径记为新加入轨迹街道,且新加入轨迹街道的通勤途经路段概率值为相邻两端轨迹街道的通勤途经路段概率值和的一半。
即若历史出行轨迹数据中的轨迹街道有与其他轨迹街道未连通的情况。此时将未连通轨迹街道与跟未连通轨迹街道距离值最小的轨迹街道相连,相连的路径在道路上,被记为新加入轨迹街道路径。图6为本发明实施例四提供的未连通轨迹街道连通示意图。如图6所示,历史出行轨迹数据中的未连通轨迹街道601,距离未连通轨迹街道601最小的轨迹街道602,将未连通轨迹街道601与轨迹街道602相连,记为新加入轨迹街道603。其中,新加入轨迹街道603的通勤途经路段概率值的计算方法,优选为相邻两端轨迹街道,即未连通轨迹街道601和轨迹街道602的通勤途经路段概率值和的一半。
实施例五
本实施例以上述实施例为基础提供了一种基于用户出行轨迹获取通勤路线的方法。图7为本发明实施例五提供的一种基于用户出行轨迹获取通勤路线的方法的流程图。参考图7,本发明实施例提供的基于用户出行轨迹获取通勤路线的方法可以包括如下:
S510、获取未知通勤路线用户的历史出行轨迹数据。
S520、根据所述历史出行轨迹数据确定所述未知通勤路线用户的住宅位置、公司位置和通勤途经路段。
S530、基于所述通勤途经路段,确定所述历史出行轨迹数据中所述住宅位置和所述公司位置之间的连通路径。
示例性的,获取历史出行轨迹数据中住宅位置和公司位置之间的全部连通路径,其中连通路径为至少经过一个通勤途经路段,且在道路上连通的轨迹路径。
优选的,获取所述未知通勤路线用户的所述概率值从高到低的N个通勤途经路段,N至少为2;计算N个所述通勤途经路段对应集合的各子集,每个所述子集包含至少一个所述通勤途经路段;确定各所述子集对应的最短连通路径,所述最短连通路径在所述住宅位置和所述公司位置之间且途经所述子集包含的全部所述通勤途经路段。
示例性的,获取N个概率值最高的通勤途经路段,其中N至少为2,且越大越好。取得的N个通勤途经路段记为通勤途经路段集合,计算通勤途经路段集合对应的各子集,每个子集中包含至少一个通勤途经路段,确定在住宅位置和公司位置之间各子集对应的全部连通路径,每个连通路径包含对应子集中的全部通勤途经路段,优选的,确定各子集全部连通路径中的最短连通路径。例如N取3时,通勤途经路段分别为概率值最高的路段1,路段2和路段3。则通勤途经路段集合(路段1,路段2,路段3)对应的子集为(路段1),(路段2),(路段3),(路段1,路段2),(路段1,路段,3),(路段2,路段3),(路段1,路段2,路段3)。在住宅位置和公司位置之间途经(路段1)的连通路径有5条,取最短距离的连通路径记为最短连通路径1,在住宅位置和公司位置之间途经(路段2)的连通路径有3条,取最短距离的连通路径记为最短连通路径2,依次类推,最后得到最短连通路径1至最短连通路径7。
S540、基于所述通勤途经路段的概率值,计算所述连通路径的通勤路线概率值。
示例性的,确认未知通勤路线用户的各轨迹街道的通勤途经路段的概率值后,可由通勤途经路段概率值计算各连通路径的通勤路线概率值。计算连通路径的通勤路线概率值的方法,优选为获取连通路径中的各轨迹街道为通勤途经路段的概率值,将各概率值相乘作为该连通路径的通勤路线概率值。例如,1条连通路径中包含6条轨迹街道,各轨迹街道的通勤途经路段的概率值分别为0.23、0.51、0.24、0.78、0.65、0.71,将各概率值相乘得到0.01013387544,则该连通路径的通勤路线概率值为0.01013387544。
S550、根据所述通勤路线概率值确定所述未知通勤路线用户的通勤路线。
示例性的,计算各连通路径的通勤路线概率值后,取概率值最大的连通路径作为未知通勤路线用户的通勤路线。若最大概率值对应至少两条连通路径,则取最大概率值对应的连通路径中总路径最短的连通路径作为未知通勤路线用户的通勤路线。例如,计算8条连通路径的概率值分别为0.0145、0.756、0.207、0.0597、0.0147、0.0451、0.0023、0.367,则取0.756对应的连通路径作为未知通勤路线用户的通勤路线。若8条连通路径的概率值分别为0.0145、0.756、0.207、0.0597、0.756、0.0147、0.0023、0.367,有两条连通路径的概率值为0.756,第一条连通路径的总路径为3.4公里,第二条连通路径的总路径为3.1公里,则取第二条连通路径作为未知通勤路线用户的通勤路线。
本发明实施例五提供的基于用户出行轨迹获取通勤路线的方法,通过获取未知通勤路线用户的历史出行轨迹数据确定住宅位置、公司位置和通勤途经路段,根据通勤途经路段及其概率值,确定位于住宅位置和公司位置之间的连通路径及其概率值,进而确定未知通勤路线用户的通勤路线。该方法确定的未知通勤路线用户的通勤路线与实际通勤路线匹配度更高,将获取的通勤路线作为用车类应用程序推送的订单路线,可以提高推送订单的成功率。
实施例六
图8为本发明实施例六提供的一种基于用户出行轨迹获取通勤路线的装置的结构图。本实施例可适用于想要获取未知通勤路线用户的通勤路线的情况。参考图8,本实施例提供的基于用户出行轨迹获取通勤路线的装置具体可以包括如下:
数据获取模块801,用于获取未知通勤路线用户的历史出行轨迹数据;
关键数据确定模块802,用于根据所述历史出行轨迹数据确定所述未知通勤路线用户的住宅位置、公司位置和通勤途经路段;
通勤路线确定模块803,用于根据所述住宅位置、公司位置、通勤途经路段和所述历史出行轨迹数据确定所述未知通勤路线用户的通勤路线。
进一步的,所述关键数据确定模块802可以包括:
数据划分子模块,用于将所述历史出行轨迹数据分成道路轨迹数据和非道路轨迹数据;
通勤途经路段确定子模块,用于根据所述道路轨迹数据确定所述未知通勤路线用户的通勤途经路段;
位置确定子模块,用于根据所述非道路轨迹数据确定所述未知通勤路线用户的住宅位置和公司位置。
优选的,所述位置确定子模块可以包括:
数据聚类单元,用于对所述非道路轨迹数据进行聚类,得到至少两个点簇;
点簇确定单元,用于利用位置识别器对各所述点簇进行识别,以确定住宅位置簇、公司位置簇和无效位置簇,并确定住宅位置和公司位置,所述位置识别器为利用机器学习***模型对已知住宅位置和公司位置用户的住宅位置簇、公司位置簇和无效位置簇进行训练得到的,其中所述住宅位置簇、公司位置簇和无效位置簇是通过对已知住宅位置和公司位置用户的非道路轨迹数据聚类得到。
优选的,所述位置确定子模块具体可以用于:
获取所述非道路轨迹数据中由所述未知通勤路线用户提供的住宅位置和公司位置。
进一步的,所述通勤途经路段确定子模块可以包括:
轨迹街道确定单元,用于将所述道路轨迹数据以街道为单位进行划分,得到全部的轨迹街道,记为轨迹街道集合;
通勤途经路段确定单元,用于利用通勤途经路段识别器对所述轨迹街道集合中的各轨迹街道进行识别,得到未知通勤路线用户的通勤途经路段,以及各轨迹街道被识别为通勤途经路段的概率值,所述通勤途经路段识别器为利用机器学习***模型对已知通勤路径用户的通勤途经路段和非通勤途经路段训练得到的。
进一步的,所述通勤路线确定模块803可以包括:
连通路径确定子模块,用于基于所述通勤途经路段,确定所述历史出行轨迹数据中所述住宅位置和所述公司位置之间的连通路径;
概率值计算子模块,用于基于所述通勤途经路段的概率值,计算所述连通路径的通勤路线概率值;
通勤路线确定子模块,用于根据所述通勤路线概率值确定所述未知通勤路线用户的通勤路线。
优选的,所述连通路径确定子模块可以包括:
通勤途经路段获取单元,用于获取所述未知通勤路线用户的所述概率值从高到低的N个通勤途经路段,N至少为2;
子集确定单元,用于计算N个所述通勤途经路段对应集合的各子集,每个所述子集包含至少一个所述通勤途经路段;
最短连通路径确定单元,用于确定各所述子集对应的最短连通路径,所述最短连通路径在所述住宅位置和所述公司位置之间且途经所述子集包含的全部所述通勤途经路段。
进一步的,所述装置还可以包括:
检测模块,用于检验所述历史出行轨迹数据连通情况;
相连模块,用于若有未连通轨迹街道时,将所述未连通轨迹街道与所述历史出行轨迹数据中距离所述未连通轨迹街道最小的轨迹街道相连,相连的路径记为新加入轨迹街道,且新加入轨迹街道的通勤途经路段概率值为相邻两端轨迹街道的通勤途经路段概率值和的一半。
本发明实施例六提供的基于用户出行轨迹获取通勤路线的装置,与本发明任意实施例所提供的基于用户出行轨迹获取通勤路线的方法属于同一发明构思,可执行本发明任意实施例所提供的基于用户出行轨迹获取通勤路线的方法,具备执行基于用户出行轨迹获取通勤路线的方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的基于用户出行轨迹获取通勤路线的方法。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (16)

1.一种基于用户出行轨迹获取通勤路线的方法,其特征在于,包括:
获取未知通勤路线用户的历史出行轨迹数据;
根据所述历史出行轨迹数据确定所述未知通勤路线用户的住宅位置、公司位置和通勤途经路段;
根据所述住宅位置、公司位置、通勤途经路段和所述历史出行轨迹数据确定所述未知通勤路线用户的通勤路线;
根据所述历史出行轨迹数据确定所述未知通勤路线用户的住宅位置和公司位置包括:
将所述历史出行轨迹数据分成道路轨迹数据和非道路轨迹数据;
根据所述非道路轨迹数据确定所述未知通勤路线用户的住宅位置和公司位置;
其中,根据所述非道路轨迹数据确定所述未知通勤路线用户的住宅位置和公司位置包括:
对所述非道路轨迹数据进行聚类,得到至少两个点簇;
利用位置识别器对各所述点簇进行识别,以确定住宅位置簇、公司位置簇和无效位置簇,并确定住宅位置和公司位置。
2.根据权利要求1所述的方法,其特征在于,根据所述历史出行轨迹数据确定通勤途经路段包括:
根据所述道路轨迹数据确定所述未知通勤路线用户的通勤途经路段。
3.根据权利要求1所述的方法,其特征在于,所述位置识别器为利用机器学习***模型对已知住宅位置和公司位置用户的住宅位置簇、公司位置簇和无效位置簇进行训练得到的,其中所述住宅位置簇、公司位置簇和无效位置簇是通过对已知住宅位置和公司位置用户的非道路轨迹数据聚类得到。
4.根据权利要求1所述的方法,其特征在于,根据所述非道路轨迹数据确定所述未知通勤路线用户的住宅位置和公司位置包括:
获取所述非道路轨迹数据中由所述未知通勤路线用户提供的住宅位置和公司位置。
5.根据权利要求2所述的方法,其特征在于,根据所述道路轨迹数据确定所述未知通勤路线用户的通勤途经路段包括:
将所述道路轨迹数据以街道为单位进行划分,得到全部的轨迹街道,记为轨迹街道集合;
利用通勤途经路段识别器对所述轨迹街道集合中的各轨迹街道进行识别,得到未知通勤路线用户的通勤途经路段,以及各轨迹街道被识别为通勤途经路段的概率值,所述通勤途经路段识别器为利用机器学习***模型对已知通勤路线用户的通勤途经路段和非通勤途经路段训练得到的。
6.根据权利要求5所述的方法,其特征在于,根据所述住宅位置、公司位置、通勤途经路段和所述历史出行轨迹数据确定所述未知通勤路线用户的通勤路线包括:
基于所述通勤途经路段,确定所述历史出行轨迹数据中所述住宅位置和所述公司位置之间的连通路径;
基于所述通勤途经路段的概率值,计算所述连通路径的通勤路线概率值;
根据所述通勤路线概率值确定所述未知通勤路线用户的通勤路线。
7.根据权利要求6所述的方法,其特征在于,基于所述通勤途经路段,确定所述历史出行轨迹数据中所述住宅位置和所述公司位置之间的连通路径包括:
获取所述未知通勤路线用户的所述概率值从高到低的N个通勤途经路段,N至少为2;
计算N个所述通勤途经路段对应集合的各子集,每个所述子集包含至少一个所述通勤途经路段;
确定各所述子集对应的最短连通路径,所述最短连通路径在所述住宅位置和所述公司位置之间且途经所述子集包含的全部所述通勤途经路段。
8.根据权利要求5所述的方法,其特征在于,根据所述住宅位置、公司位置、通勤途经路段和所述历史出行轨迹数据确定所述未知通勤路线用户的通勤路线之前,还包括:
检验所述历史出行轨迹数据连通情况;
若有未连通轨迹街道,则将所述未连通轨迹街道与所述历史出行轨迹数据中距离所述未连通轨迹街道最小的轨迹街道相连,相连的路径记为新加入轨迹街道,且新加入轨迹街道的通勤途经路段概率值为相邻两端轨迹街道的通勤途经路段概率值和的一半。
9.一种基于用户出行轨迹获取通勤路线的装置,其特征在于,包括:
数据获取模块,用于获取未知通勤路线用户的历史出行轨迹数据;
关键数据确定模块,用于根据所述历史出行轨迹数据确定所述未知通勤路线用户的住宅位置、公司位置和通勤途经路段;
通勤路线确定模块,用于根据所述住宅位置、公司位置、通勤途经路段和所述历史出行轨迹数据确定所述未知通勤路线用户的通勤路线;
所述关键数据确定模块包括:
数据划分子模块,用于将所述历史出行轨迹数据分成道路轨迹数据和非道路轨迹数据;
位置确定子模块,用于根据所述非道路轨迹数据确定所述未知通勤路线用户的住宅位置和公司位置;
其中,所述位置确定子模块包括:
数据聚类单元,用于对所述非道路轨迹数据进行聚类,得到至少两个点簇;
点簇确定单元,用于利用位置识别器对各所述点簇进行识别,以确定住宅位置簇、公司位置簇和无效位置簇,并确定住宅位置和公司位置。
10.根据权利要求9所述的装置,其特征在于,所述关键数据确定模块包括:
通勤途经路段确定子模块,用于根据所述道路轨迹数据确定所述未知通勤路线用户的通勤途经路段。
11.根据权利要求9所述的装置,其特征在于,所述位置识别器为利用机器学习***模型对已知住宅位置和公司位置用户的住宅位置簇、公司位置簇和无效位置簇进行训练得到的,其中所述住宅位置簇、公司位置簇和无效位置簇是通过对已知住宅位置和公司位置用户的非道路轨迹数据聚类得到。
12.根据权利要求10所述的装置,其特征在于,所述位置确定子模块具体用于:
获取所述非道路轨迹数据中由所述未知通勤路线用户提供的住宅位置和公司位置。
13.根据权利要求10所述的装置,其特征在于,所述通勤途经路段确定子模块包括:
轨迹街道确定单元,用于将所述道路轨迹数据以街道为单位进行划分,得到全部的轨迹街道,记为轨迹街道集合;
通勤途经路段确定单元,用于利用通勤途经路段识别器对所述轨迹街道集合中的各轨迹街道进行识别,得到未知通勤路线用户的通勤途经路段,以及各轨迹街道被识别为通勤途经路段的概率值,所述通勤途经路段识别器为利用机器学习***模型对已知通勤路径用户的通勤途经路段和非通勤途经路段训练得到的。
14.根据权利要求13所述的装置,其特征在于,所述通勤路线确定模块包括:
连通路径确定子模块,用于基于所述通勤途经路段,确定所述历史出行轨迹数据中所述住宅位置和所述公司位置之间的连通路径;
概率值计算子模块,用于基于所述通勤途经路段的概率值,计算所述连通路径的通勤路线概率值;
通勤路线确定子模块,用于根据所述通勤路线概率值确定所述未知通勤路线用户的通勤路线。
15.根据权利要求14所述的装置,其特征在于,所述连通路径确定子模块包括:
通勤途经路段获取单元,用于获取所述未知通勤路线用户的所述概率值从高到低的N个通勤途经路段,N至少为2;
子集确定单元,用于计算N个所述通勤途经路段对应集合的各子集,每个所述子集包含至少一个所述通勤途经路段;
最短连通路径确定单元,用于确定各所述子集对应的最短连通路径,所述最短连通路径在所述住宅位置和所述公司位置之间且途经所述子集包含的全部所述通勤途经路段。
16.根据权利要求13所述的装置,其特征在于,还包括:
检验模块,用于检验所述历史出行轨迹数据连通情况;
相连模块,用于若有未连通轨迹街道时,将所述未连通轨迹街道与所述历史出行轨迹数据中距离所述未连通轨迹街道最小的轨迹街道相连,相连的路径记为新加入轨迹街道,且新加入轨迹街道的通勤途经路段概率值为相邻两端轨迹街道的通勤途经路段概率值和的一半。
CN201511029772.9A 2015-12-31 2015-12-31 一种基于用户出行轨迹获取通勤路线的方法及装置 Active CN105674995B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201511029772.9A CN105674995B (zh) 2015-12-31 2015-12-31 一种基于用户出行轨迹获取通勤路线的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511029772.9A CN105674995B (zh) 2015-12-31 2015-12-31 一种基于用户出行轨迹获取通勤路线的方法及装置

Publications (2)

Publication Number Publication Date
CN105674995A CN105674995A (zh) 2016-06-15
CN105674995B true CN105674995B (zh) 2019-03-08

Family

ID=56298342

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511029772.9A Active CN105674995B (zh) 2015-12-31 2015-12-31 一种基于用户出行轨迹获取通勤路线的方法及装置

Country Status (1)

Country Link
CN (1) CN105674995B (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106289291A (zh) * 2016-07-26 2017-01-04 北京奇虎科技有限公司 导航路线的推荐方法和装置
CN107798648A (zh) * 2016-09-07 2018-03-13 北京嘀嘀无限科技发展有限公司 一种班车潜在乘客挖掘处理方法及服务器
US10355788B2 (en) * 2017-01-06 2019-07-16 Uber Technologies, Inc. Method and system for ultrasonic proximity service
CN106931974B (zh) * 2017-03-29 2020-04-03 清华大学 基于移动终端gps定位数据记录计算个人通勤距离的方法
CN107277103A (zh) * 2017-04-27 2017-10-20 华晓燕 一种基于精确推送的通勤服务***及实现方法
CN107038858B (zh) * 2017-05-25 2019-05-28 厦门大学 通勤私家车动态拼车推荐方法
CN108848463B (zh) * 2018-06-29 2019-09-24 百度在线网络技术(北京)有限公司 通勤路线确定方法和装置
CN108960736A (zh) * 2018-07-13 2018-12-07 北京百度网讯科技有限公司 用于发送信息的方法及装置
CN109256029B (zh) * 2018-09-12 2021-09-03 广州小鹏汽车科技有限公司 一种地点属性的自动设置方法及装置
CN110751531A (zh) * 2018-11-13 2020-02-04 北京嘀嘀无限科技发展有限公司 轨迹识别方法、装置及电子设备
CN109495856B (zh) * 2018-12-18 2021-08-10 成都方未科技有限公司 一种基于大数据的手机用户类型标记方法
CN109726874A (zh) * 2019-01-18 2019-05-07 创新奇智(北京)科技有限公司 出行线路规划方法、装置、计算设备及存储介质
CN109919357B (zh) * 2019-01-30 2021-01-22 创新先进技术有限公司 一种数据确定方法、装置、设备及介质
CN111696343B (zh) * 2019-03-12 2022-04-05 北京嘀嘀无限科技发展有限公司 一种轨迹数据处理方法及装置
CN109948070B (zh) * 2019-03-13 2022-08-09 深圳市同行者科技有限公司 一种家和公司位置的分析确定方法、存储介质及终端
CN111721306B (zh) * 2019-03-20 2022-07-05 北京嘀嘀无限科技发展有限公司 道路匹配方法、装置、电子设备及可读存储介质
CN111832788B (zh) * 2019-04-23 2024-03-29 北京嘀嘀无限科技发展有限公司 一种服务信息生成的方法、装置、计算机设备及存储介质
CN110111054A (zh) * 2019-05-09 2019-08-09 上汽安吉物流股份有限公司 拼单网络模型的生成方法及装置、计算机可读介质以及物流***
CN112235778B (zh) * 2019-06-26 2022-06-14 ***通信集团湖南有限公司 集团成员的确定方法和服务器
CN113190769B (zh) * 2021-05-08 2023-09-19 北京百度网讯科技有限公司 通勤特征数据确定方法、装置、电子设备和存储介质
CN113704373B (zh) * 2021-08-19 2023-12-05 国家计算机网络与信息安全管理中心 基于移动轨迹数据的用户识别方法、装置及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103389100A (zh) * 2013-08-02 2013-11-13 上海梦擎信息科技有限公司 自由导航实时路况***
CN103542848A (zh) * 2012-07-17 2014-01-29 株式会社电装 目的地推荐***和目的地推荐方法
CN103697901A (zh) * 2013-12-25 2014-04-02 沈阳美行科技有限公司 一种车载导航自动引导模式解决方法
CN104102719A (zh) * 2014-07-18 2014-10-15 百度在线网络技术(北京)有限公司 一种轨迹信息的推送方法及装置
CN104165634A (zh) * 2014-07-28 2014-11-26 广州视源电子科技股份有限公司 基于用户使用习惯的路径规划方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8892350B2 (en) * 2011-12-16 2014-11-18 Toyoda Jidosha Kabushiki Kaisha Journey learning system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103542848A (zh) * 2012-07-17 2014-01-29 株式会社电装 目的地推荐***和目的地推荐方法
CN103389100A (zh) * 2013-08-02 2013-11-13 上海梦擎信息科技有限公司 自由导航实时路况***
CN103697901A (zh) * 2013-12-25 2014-04-02 沈阳美行科技有限公司 一种车载导航自动引导模式解决方法
CN104102719A (zh) * 2014-07-18 2014-10-15 百度在线网络技术(北京)有限公司 一种轨迹信息的推送方法及装置
CN104165634A (zh) * 2014-07-28 2014-11-26 广州视源电子科技股份有限公司 基于用户使用习惯的路径规划方法

Also Published As

Publication number Publication date
CN105674995A (zh) 2016-06-15

Similar Documents

Publication Publication Date Title
CN105674995B (zh) 一种基于用户出行轨迹获取通勤路线的方法及装置
Hsueh et al. Map matching for low-sampling-rate GPS trajectories by exploring real-time moving directions
CN106197458B (zh) 一种基于手机信令数据和导航路线数据的手机用户出行方式识别方法
Bovy et al. Stochastic route choice set generation: behavioral and probabilistic foundations
CN108170793B (zh) 基于车辆语义轨迹数据的停留点分析方法及其***
EP3327575B1 (en) Information distribution apparatus and method
US10885897B2 (en) Information providing device and information providing system
CN109902899A (zh) 信息生成方法和装置
WO2019205020A1 (zh) 一种路况识别方法、装置及设备
Liu et al. Balanced traffic routing: Design, implementation, and evaluation
JP2013545176A (ja) プローブデータを利用してナビゲーション優先度設定を判定し且つ検証する方法
CN110598917B (zh) 一种基于路径轨迹的目的地预测方法、***及存储介质
CN109523186A (zh) 城市区域划分方法及装置
Guo et al. Transportation mode recognition with deep forest based on GPS data
CN113079463A (zh) 一种基于手机信令数据的旅游景点游客出行活动识别方法
Stenneth et al. Monitoring and mining GPS traces in transit space
CN104121917B (zh) 一种自动发现新建桥梁的方法和装置
Pinelli et al. Robust bus-stop identification and denoising methodology
CN106323318B (zh) 导航路径的通行时间的处理方法及装置
D'Andrea et al. Path clustering based on a novel dissimilarity function for ride-sharing recommenders
Liu et al. Using trajectory data to explore roadway characterization for bikeshare network
Huang et al. Understanding spatio-temporal mobility patterns for seniors, child/student and adult using smart card data
Liu et al. MCT‐TTE: Travel Time Estimation Based on Transformer and Convolution Neural Networks
CN115995151A (zh) 应用于城市管理的网约车异常行为检测方法
US20220207993A1 (en) Method, apparatus, and system for verifying a lane closure using probe data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant