CN111680707A - 基于公交***的刷卡数据分析方法、电子终端及存储装置 - Google Patents

基于公交***的刷卡数据分析方法、电子终端及存储装置 Download PDF

Info

Publication number
CN111680707A
CN111680707A CN201910181158.6A CN201910181158A CN111680707A CN 111680707 A CN111680707 A CN 111680707A CN 201910181158 A CN201910181158 A CN 201910181158A CN 111680707 A CN111680707 A CN 111680707A
Authority
CN
China
Prior art keywords
card swiping
time
card
dense
preset route
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910181158.6A
Other languages
English (en)
Inventor
蓝勇辉
夏利民
梁正平
戴友平
张祥
邹雄伟
王海峰
张海威
莫海涌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Shenzhentong E Commerce Co ltd
Original Assignee
Shenzhen Shenzhentong E Commerce Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Shenzhentong E Commerce Co ltd filed Critical Shenzhen Shenzhentong E Commerce Co ltd
Priority to CN201910181158.6A priority Critical patent/CN111680707A/zh
Publication of CN111680707A publication Critical patent/CN111680707A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Tourism & Hospitality (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了基于公交***的刷卡数据分析方法、电子终端及存储装置,其中分析方法包括获取预设路线的刷卡记录,刷卡记录包括刷卡时间;获取刷卡记录的刷卡时间的密集点;将密集点与预设路线的站点信息进行匹配,以得到密集点与站点信息的对应关系。通过上述方式,本申请能够有效地通过刷卡记录获取到路线的到站时间,提高数据的利用价值。

Description

基于公交***的刷卡数据分析方法、电子终端及存储装置
技术领域
本申请涉及关于公交出行的数据分析技术领域,特别是涉及基于公交***的刷卡数据分析方法、电子终端及存储装置。
背景技术
近10几年来,大部分城市的公共汽车和地铁都已采用NFC技术实现电子钱包支付,并覆盖绝大部分的常住乘车人群。与现金投币和纸质票不同的是,大量的刷卡交易沉淀了大量的数据。对这些数据进行宏观性的统计分析,提供给政府主管部门和公交运输企业,可以帮助他们了解乘客的出行规律,并对交通管理和运输企业提升服务提供辅助决策。然而,乘车刷卡记录的数据价值远不止此。刷卡数据中还包含了海量用户的出行规律,如果能对所有的刷卡记录做大数据分析,将能获得每个持卡人个体的出行规律,为商业化运营提供非常有价值的数据支撑。
对于公共汽车等交通工具来说,车载刷卡设备无法获知汽车运行的位置,因此难以进一步对数据进行分析和利用。
发明内容
本申请主要解决的技术问题是提供基于公交***的刷卡数据分析方法、电子装置及存储装置,能够从刷卡数据中获知每条刷卡记录所对应的站点。
为解决上述技术问题,本申请采用的一个技术方案是:提供一种基于公交***的刷卡数据分析方法,其中包括获取预设路线的刷卡记录,刷卡记录包括刷卡时间;获取刷卡记录的刷卡时间的密集点;将密集点与预设路线的站点信息进行匹配,以得到密集点与站点信息的对应关系。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种电子终端,其中包括第一获取模块,用于获取预设路线的刷卡记录,刷卡记录包括刷卡时间;第二获取模块,用于获取预设路线的刷卡时间的密集点;匹配模块,用于将密集点与预设路线的站点信息进行匹配,以得到密集点与站点信息的对应关系。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种电子终端,其中包括处理器和通信电路,处理器耦接通信电路;处理器用于通过通信电路获取预设路线的刷卡记录,刷卡记录包括刷卡时间;处理器用于获取预设路线的刷卡时间的密集点;处理器用于将密集点与预设路线的站点信息进行匹配,以得到密集点与站点信息的对应关系。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种具有存储功能的装置,其中存储有程序数据,程序数据能够被执行以实现如上述任一项方法。
与现有技术相比,本申请的有益效果是:获取预设路线的刷卡记录,基于刷卡记录的刷卡时间获取刷卡时间的密集点,将密集点与预设路线的站点信息进行匹配,从而将密集点与站点信息对应起来,那么密集点对应的刷卡时间即为相应站点的到站时间,如此方便快捷地分析出乘客的刷卡记录所对应的站点,提高数据资源的利用率,节省数据分析的成本。
附图说明
图1是本申请分析方法一实施例的流程示意图;
图2是本申请分析方法一实施例中某趟公交的刷卡记录的示意图;
图3是本申请分析方法一实施例中用户刷卡时间的分布示意图;
图4是本申请分析方法一实施例中判断密集点与站点数量是否相等的流程示意图;
图5是本申请分析方法一实施例中将密集点与站点建立映射关系的流程示意图;
图6是本申请分析方法另一实施例的流程示意图;
图7是本申请电子终端一实施例的结构示意图;
图8是本申请电子终端另一实施例的结构示意图;
图9是本申请具有存储功能的装置一实施例的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的发明人经过长期的研究发现,乘车刷卡记录的数据中包含着海量用户的出行规律。对于地铁这种方式,进站出站都需要刷卡,而每个站点的刷卡机是固定的,刷卡机上可以预先设置站点名称。因此可以通过用户的刷卡记录知道每个用户的出发站点和到达站点。但对于公共汽车(下称公交车)来说,车载刷卡设备无法获知公交车运行的位置,刷卡设备一般只负责进行扣款,因此刷卡数据中只有刷卡记录,却并不知道每条记录是对应在哪个车站刷的卡,导致难以利用这些刷卡记录进行后续分析从而获得用户的出行轨迹。因此,本申请如下实施例,可以很好解决上述问题。
请参阅图1,图1是本申请分析方法一实施例的流程示意图。本实施例包括以下具体步骤:
S11:获取预设路线的刷卡记录,刷卡记录包括刷卡时间。
在本实施例中,预设路线可以是指已规划好的公交路线,在路线区间内的各个站点都是一定的。预设路线可以只对应一辆车,也可以对应多辆公交车。假设预设路线对应多辆公交车中的一部分是在A-B的路线区间内,是从A站始发的,另一部分是从B站始发的,从A站始发的车的出发时间点可以不同,从B站出发的时间点也可以不同。
在本实施例中,获取预设路线的刷卡记录,可以是获取预设路线中一辆车的刷卡记录,当然也可以分别获取多辆公交的刷卡记录,获取到刷卡记录与相应的公交车进行对应分析。在本实施例中,不将同一路线的不同出发时间的公交车的刷卡记录进行混合分析,当然在其他实施例中,可以进行混合分析。在本实施例中,在一天内,同一辆公交车可以在A-B区间线可以多次反复运行。
基于前述内容,预设路线的公交车要走的路线一般都是固定的。获取预设路线的刷卡记录,即可获得对应路线的公交车的刷卡记录,其中,预设路线包含了该公交车需要停靠的站点信息。刷卡记录中包括了刷卡时间,刷卡时间可以包括详细的时间,例如刷卡日期和刷卡时间点,举例为“2019年2月19日09:47:24”。本实施例中,可通过设定刷卡日期的起始日期和结束日期以确定采样范围从而对刷卡记录进行筛选,如选择获取某日,某月,连续多月或年的刷卡记录。在一些实施例中,预设路线的信息还可以包括对应公交车的发车时间与终点时间。将发车时间与终点时间作为时间轴的两个端点,将获取的刷卡时间按照时间顺序先后导入时间轴中,从而可以将刷卡时间在时间轴上进行时间先后顺序的排列。
S12:获取刷卡记录的刷卡时间的密集点。
通过聚类算法,对刷卡时间进行聚类,从而可以得出刷卡记录的密集点。在本实施例中,密集点也可以是一个密集范围。
将刷卡时间相近的刷卡记录聚集在一起,例如获取到某预设路线的100个刷卡记录,通过对该100个刷卡记录的刷卡时间进行聚类分析,在6:50-7:00的范围内聚集20个刷卡记录,在7:10-7:20的范围内聚集30个刷卡记录,在7:40-7:50的范围内聚集40个刷卡记录,在8:10-8:30的范围内聚集10个刷卡记录。因此可以将6:50-7:00作为一个密集点(密集范围),7:10-7:20作为一个密集点(密集范围),7:40-7:50作为一个密集点(密集范围),8:10-8:30作为一个密集点(密集范围)。
在一些实施例中,可以使用如下聚类算法,该聚类算法可以主要分为四个步骤:数据预处理,为衡量数据点间的相似度定义一个距离函数,聚类或分组,评估输出。
数据预处理,包括选择数量,类型和特征的标度,它依靠特征选择和特征抽取,特征选择选择重要的特征,特征抽取把输入的特征转化为一个新的显著特征,数据预处理还包括将孤立点移出数据,孤立点经常会导致有偏差的聚类结果,因此为了得到正确的聚类,可以将它们剔除。
为衡量数据点间的相似度定义一个距离函数,在本实施例中可以以刷卡时间点之间的相近度作为该距离函数。相似度是定义一个类的基础。
聚类或分组,根据不同的方法将数据对象分到不同的类中。其中方法可以包括划分方法。划分方法一般从初始划分和最优化一个聚类标准开始。划分方法一般包括清晰聚类和模糊聚类两种技术手段:清晰聚类,每一个数据都属于单独的类;模糊聚类:每个数据可能在任何一个类中,划分方法聚类是基于某个标准产生一个嵌套的划分系列,可以度量不同类之间的相似度。在本实施例中,可以运用划分方法将刷卡数据划分到不同的密集点中。
评估输出,用于验证聚类划分方法的正确性。在本实施例中,会对聚类划分的结果进行验证,若验证失败,则重新进行聚类运算,直至获得正确的聚类结果。
通过上述聚类算法,可以对刷卡记录的刷卡时间数据进行处理。参阅图2,图2是实施例中某趟公交的刷卡记录的示意图。如图2所示的路线中,该预设路线上以7:00-7:48作为时间轴,在对该预设路线的刷卡时间进行聚类获得刷卡时间的密集点,分别集中在7:00附近、7:10附近、7:21附近、7:33附近、7:48附近。
S13:将密集点与预设路线的站点信息进行匹配,以得到密集点与站点信息的对应关系。
在具体的应用场景中,对于公交车而言,一般是在到达站点后,才可以允许乘客上车刷卡从而形成刷卡记录,因此通过获取某段时间内的刷卡记录,以刷卡时间进行聚类得到密集点,密集点可以视为是乘客乘车集中刷卡的时间点。
由于预设路线的站点信息是确定的,而且站点数量也是确定的。例如某路线经过“A总站-B公司-C路-D商场-E站”,再得到密集点后将密集点与预设路线的站点信息进行匹配,则可获得密集点与站点信息的对应关系。比如图2所示,通过对刷卡记录进行计算分析得到密集点分别为7:00附近、7:10附近、7:21附近、7:33附近、7:48附近,那么将密集点与站点信息进行匹配,得到7:00附近对应A总站,7:10附近对应B公司,7:21附近对应C路,7:33附近对应D商场,7:48附近对应E站。
即便该辆公交车来回运行多次,经过的站点总数总是固定的,将该反复多次运行的密集点进行匹配,依然能够建立出密集点与站点信息的对应关系。
本实施例通过获取预设路线的刷卡记录,基于刷卡记录的刷卡时间获取刷卡时间的密集点,将密集点与预设路线的站点信息进行匹配,从而将密集点与站点信息对应起来,那么密集点对应的刷卡时间即为相应站点的到站时间,如此有效地能够知道乘客的刷卡时间是对应的站点,提高数据资源的利用率,节省数据分析的成本。
基于本申请分析方法一实施例,S13进一步具体包括:
可选地,S23:判断密集点的数量与站点信息中的站点数量是否相等。
由于预设路线的站点信息中的站点数量是固定的,需要判断密集点的数量。以便于与站点数量进行匹配。请参阅图4,图4是本申请分析方法一实施例中判断密集点与站点数量是否相等的流程示意图。
S231:若相等,则以时间先后顺序将密集点与站点信息中的站点一一进行映射,得到密集点与站点信息的对应关系。
对于预设路线的某公交车而言,而发车时间和终点时间是已知的,从发车时间到终点时间形成时间序列,也即时间轴。对于刷卡记录而言,也是具有时间顺序的。
如果密集点的数量和站点数据相等,那么就依据时间先后顺序将密集点和站点信息进行一一映射,建立密集点与站点信息的对应关系,从而得到每个站点到站的时间点或者时间范围。
为了方便理解,请如图2所示,从图2可以看出密集点与站点信息中的站点一一进行映射的情况。从图中可以直观看出,将密集点与站点一一映射后,可以得到大量用户在各个站点的上车分布情况,哪些站点的上车人数较多,哪些站点的上车人数较少等。
在另一个实施方式中,S232:若密集点的数量与站点信息中的站点数量不相等,可以获取预设路线更多的刷卡记录,再返回执行判断密集点的数量与站点信息中的站点数量是否相等。
在预设路线中,可能存在所选取的某段时间范围的刷卡记录,在某些站点没有刷卡记录。例如有些站点比较偏远,在某段时间内无人刷卡上车,或者刷卡的人数极其少,刷卡时间形不成密集点,得出来的密集点与站点数量无法对应。
在这种情况下,可以获得更多的刷卡记录再进行聚类运算,例如扩大获取刷卡记录的时间跨度范围和/或车辆数量,将原本1天内公交车预设路线的刷卡记录扩大为1周,或将原本1辆公交车预设路线的刷卡记录扩大为5辆公交车等。
在本实施例中,部分站点由于不存在刷卡记录或者刷卡记录过少无法形成密集点,导致密集点的数量与站点数量不相等,可通过扩大时间跨度范围以获取更多刷卡记录,具体包括以下步骤:
S2321:计算得出刷卡时间的时间跨度范围。
车载刷卡设备中的刷卡数据复杂,为了有效挖掘沉淀数据,需要对刷卡记录进行整理,计算得出刷卡时间的时间跨度范围,这里的时间跨度范围可以理解为刷卡记录的日期范围,如将一批刷卡时间进行整理计算,得出该批次刷卡时间中的最早刷卡日期和最晚刷卡日期,从而得出该批次刷卡时间的范围。例如某批次的刷卡记录中最早刷卡日期是1月5号,最晚刷卡时间如3月29号,则得出该批次的刷卡时间都是1月份-3月份。
S2322:判断时间跨度范围是否大于预设时间跨度范围。
预设时间跨度范围可以根据密集点的数量设置,当密集点的数量与站点数量不相等,部分站点由于刷卡记录过少无法形成密集点时,需要适当扩大预设时间的跨度范围,使得数据形成足够的密集点。然后判断所选批次的刷卡时间跨度范围是否大于预设时间跨度范围。例如将预设时间跨度范围设置为1月份-6月份。
S2323:若不大于,则获取预设时间跨度范围内的刷卡记录。
判断上述计算得出的时间跨度范围是否大于预设时间跨度范围,若不大于,则获取预设时间跨度范围内的刷卡记录;若大于,则返回步骤S2321计算另一批次刷卡时间的时间跨度范围。在例子中,该批次的刷卡时间的时间跨度范围是1月份-3月份,预设时间跨度范围是1月份-6月份,该批次刷卡时间的时间跨度范围小于预设时间跨度范围,因此可以获取该批次的刷卡记录。
在上述实施例中,通过设置预设时间跨度范围并调整刷卡数据的样本大小,当样本数量过少无法获得与站点数量相等的密集点数量时,可以适当扩大预设时间的范围,从而获得更多的样本进行聚类运算,获得足够的密集点。
在其他的实施例中,若密集点的数量与站点信息中的站点数量不相等,也可以通过计算预估时间来使得密集点与站点建立映射关系。请参阅图5,图5是实施例中将密集点与站点建立映射关系的流程示意图。具体步骤为:
S51:计算得到预设路线的站点的预估到站时间。
公交车的开车路线是固定的预设路线,因此每个站点的到站时间也是可以预估的。计算得到预设路线的中每个站点的预估到站时间。
S52:将预估到站时间与密集点对应的时间匹配。
将预估到站时间与密集点对应的时间进行匹配,其中密集点的时间可以选取密集点中任一个刷卡记录的时间点。为了使时间更为准确,也可以选取密集点中中心区域的任一刷卡记录的时间点作为密集点的对应时间。
S53:当预估到站时间与密集点对应的时间的差值在预设时间阈值内时,将密集点与站点建立映射关系。
当预估到站时间与密集点对应的时间差值在预设时间阈值内时,将密集点与站点建立映射关系。预设时间阈值可以根据实际情况自行调整,可以设置为3分钟。举个例子,预设路线中一共获得3个密集点,对应的时间分别为7:08,7:32,7:43,预设路线的站点一共有4个,发车时间为7:00,预估到达的4个站点的时间分别为1号站7:10,2号站7:20,3号站7:30,4号站7:40。按照上述映射关系,7:08与1号站的预估到站时间相近,因此第一个密集点和1号站相对应,以此类推,第二个密集点和3号站相对应,第三个密集点和4号站相对应。2号站没有相对应的密集点。
通过上述方式,当密集点的数量与站点信息的站点数量不一致时,通过预估到站时间的方式,也可以将密集点和站点建立映射关系。
上述两个实施例中给出了两种处理密集点数量与站点数量不一致时的映射方法,在一些实施例中,两种方法可以择一使用也可以协同使用。
本申请提出一种基于公交***的刷卡数据的分析方法,不仅可以用于分析预设路线的公交车各个站点的上车人数分布情况,还可以用于分析每位用户的出行习惯。请参阅图2、图3与图6,图6是本申请刷卡数据分析方法的另一实施例的流程示意图,本实施例包括以下具体步骤为:
S61:获取预设卡标识在预设路线的刷卡记录。
预设卡标识,比如是实体卡对应的***、或者虚拟卡(比如应用程序、微信小程序、nfc等形式)的***等标识。
预设卡标识对应的卡在预设路线上的刷卡记录,是指预设卡标识对应的卡在预设路线上的至少部分公交车上的刷卡记录。在本实施例中,可以是获取预设卡标识在预设路线的全部公交车上的刷卡记录。
S62:获取预设卡标识刷卡记录的刷卡时间的密集点(以下称为预设卡标识的密集点)。
对该预设卡标识的刷卡记录的刷卡时间进行聚类分析,从而得到预设卡标识的密集点。
S63:将预设卡标识的密集点与预设路线的刷卡记录的密集点进行对应,从而得到预设卡标识的密集点与站点信息的对应关系。
S61~S63中与S11~S13相类似的步骤在此不再赘述。获取预设卡标识在整条预设路线上的刷卡记录,根据上述分析方法,可以获取该卡标识的刷卡记录的密集点,从而将该卡标识的刷卡记录的密集点,与预设路线的刷卡记录的密集点和车站站点的对应关系进行匹配,即可获得预设卡标识在该预设路线上的刷卡的站点与刷卡时间,也即知道了用户出行的站点及时间。
图3所示是某预设卡标识在预设路线上的刷卡记录的密集点。例如是某预设卡标识对应的用户在某段时间内在预设路线的刷卡记录,比如是半年内的刷卡记录。如图3所示,例如存在三个密集点,分别是07:30附近,18:30附近,21:30附近。因此可以推断出一种可能,即该用户的日常去上班时间为07:30左右,日常下班时间为18:30左右,日常加班下班时间为21:30左右。当然本实施例不限制在此种可能,可以有多种可能,比如该用户是上夜班,或者该用户是去上学等。
结合如图2所示,图2示出了在预设路线上刷卡记录与站点信息的对应关系。在一个具体应用场景中,该预设卡标识的用户是约在早上07:30刷卡,对应在图2中的映射关系中,大致是在B公司刷卡上车,可以推断该用户经常在该时间点和站点上车,则可以该站点是这个目标用户的通勤地点之一。
图2所示出的仅是该预设路线在一个运行方向上的部分运行时间和站点。在本实施例中,该预设路线可以包括多辆公交车,每辆公交车运行每一个单方向的完整行程或者双向多次来回构成的总行程都可以通过本申请实施例的方法得出刷卡记录的密集点与站点信息的对应关系。图3中的该用户在16:30的刷卡时间,例如对应图2中未示出的H路的站点(例如往终点站为A站的方向)。此时,可以认为H路可以视为该卡标识对应用户的另一个通勤地点。
在本实施例中,通勤地点可以是指用户的居住地点、上班地点、上学地点等或者其他经常往返的地点。一般认为早上出行的站点为居住地的站点,晚上出行的站点为上班地点的站点,因此推断目标用户的住址是A总站附近,常规上班乘车时间是07:00;目标用户的工作地点是在E站附近,常规下班乘车时间是18:00。
通过上述方法,就可以从基于预设路线的刷卡记录的密集点与站点信息的对应关系,利用预设卡标识的刷卡记录与上述对应关系进行匹配对应,从而获得每个用户的日常出行轨迹,例如上下班时间,居住地点和上班地点等。此外,还可以将通勤地点相同的卡标识的用户标记为同一类型的用户,再进行后续的数据分析。例如同是居住在某个站点的用户,多数在哪个地方上班;同是在某个站点附近上班的用户,多数是在哪个地方居住等,对用户进行类型划分可以为城市的公交规划提供很好的数据支持。
在其他的实施例中,用户可能存在换乘的情况。预设路线包括第一预设和第二预设路线。其中第一预设路线和第二预设路线至少有一个站点是相同的或者相近的。站点相同是指站点名称完全相同;站点相近是指虽有名称不同,但都位于同一范围的站点,例如“A花园站”和“A花园西站”则可以认为是站点相似。
分别获取第一预设路线和第二预设路线的刷卡记录,刷卡记录包括刷卡时间。
分别获取第一预设路线和第二刷卡记录的刷卡记录对应的刷卡时间的密集点。
将第一预设路线和第二预设路线各自的密集点分别与第一预设路线和第二预设路线的站点信息进行匹配,以分别得到各自密集点与各自站点信息的对应关系。
换言之,就可以得到第一预设路线的站点信息与刷卡时间的密集点的关系,第二预设路线和刷卡时间的密集点的关系。
具体步骤为:
S701:获取预设***在第一预设路线的第一刷卡记录。
S702:获取预设***在第二预设路线的第二刷卡记录。
第一预设路线和第二预设路线至少存在一个站点是相同或相似的。
S703:分别获取所述第一刷卡记录和第二刷卡记录的刷卡时间的密集点。
将第一刷卡记录的刷卡时间的密集点,与第一预设路线的刷卡时间的密集点进行对应,得到第一刷卡记录的刷卡时间的密集点对应的站点,再根据预设卡标识的刷卡记录所在的密集点得出该用户的第一上车站点。将第二刷卡记录的刷卡时间的密集点,与第二预设路线的刷卡时间的密集点进行对应,得到第二刷卡记录的刷卡时间的密集点对应的站点,再根据预设卡标识的刷卡记录所在的密集点得出该用户的第二上车站点。其中,第一上车站点和第二上车站点中相同或相似的站点为换乘地点,第一上车站点和第二上车站点中不相同、不相似的站点为通勤地点。如此可以知道换乘用户的通勤地点和换乘地点等。
在上述实施例中假设了用户换乘的情况,可以更加准确分析出用户的居住地点和上班地点。具体方法是通过对比两条存在预设***刷卡记录的在两条预设路线之间是否存在换乘站点的刷卡记录。若是,则判断存在换乘的情况。在上述实施例中介绍了用户在两条路线的换乘,在其他的实施例中,用户也可以存在三条或者三条路线以上的换乘,具体方式也是比较路线中是否存在相同的站点,详细步骤与上述实施例相类似,在此不再赘述。
请参阅图7,图7是本申请一电子终端实施例的结构示意图。电子终端700包括第一获取模块71,第二获取模块72和匹配模块73。其中第一获取模块71用于获取预设路线的刷卡记录,刷卡记录包括刷卡时间;第二获取模块72用于获取预设路线的刷卡时间的密集点;匹配模块73用于将密集点与预设路线的站点信息进行匹配,以得到密集点与站点信息的对应关系。
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施方式方案的目的。
另外,本实施例各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
本实施例中关于电子终端各模块更多的功能可以参照本申请分析方法一实施例,在此不再赘述。
请参阅图8,图8是本申请另一电子终端实施例的结构示意图。电子终端800包括处理器81和通信电路82,处理器81耦接通信电路82;处理器81用于通过通信电路82获取预设路线的刷卡记录,刷卡记录包括刷卡时间;处理器81用于获取预设路线的刷卡时间的密集点;处理器81用于将密集点与预设路线的站点信息进行匹配,以得到密集点与站点信息的对应关系。
在本实施例中,处理器81还可以称为CPU(Central Processing Unit,中央处理单元)。处理器81可能是一种集成电路芯片,具有信号的处理能力。处理器81还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本实施例中关于电子终端的处理器81的更多执行过程等可以参照上述本申请分析方法一实施例和另一实施例,在此不再赘述。
请参阅图9,图9是本申请具有存储功能的装置一实施例的结构示意图,装置900中存储有程序数据91,程序数据91被处理器执行时实现上述分析方法,其原理和步骤在上述分析方法已详细介绍,这里不再赘述。进一步的,装置还可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、磁带或者光盘等各种可以存储程序代码的介质。
本申请提出了一种基于公交***的刷卡数据的分析方法,通过本申请的方法,可以准确计算出每个用户的出行轨迹、居住地和工作地,这些信息跟其他商业化信息相结合,可以产生非常大的商业价值,同时,将该信息跟持卡用户的其他个人信息相关联再进行分析,也有利于政府掌握每个区域的常住人口的特征,将能有助于政府更好地为市民提供服务,更加合理高效地调配公共资源。
以上所述仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种基于公交***的刷卡数据分析方法,其特征在于,包括:
获取预设路线的刷卡记录,所述刷卡记录包括刷卡时间;
获取所述刷卡记录的刷卡时间的密集点;
将所述密集点与所述预设路线的站点信息进行匹配,以得到所述密集点与所述站点信息的对应关系。
2.根据权利要求1所述的方法,其特征在于:所述将所述密集点与所述预设路线的站点信息进行匹配,以得到所述密集点与所述站点信息的对应关系包括:
判断所述密集点的数量与所述站点信息中的站点数量是否相等;
若相等,则以时间先后顺序将所述密集点与所述站点信息中的站点一一进行映射,得到所述密集点与所述站点信息的对应关系。
3.根据权利要求2所述的方法,其特征在于:若不相等,则获取所述预设路线更多的刷卡记录,返回执行所述判断所述密集点的数量与所述站点信息中的站点数量是否相等。
4.根据权利要求3所述的方法,其特征在于:所述获取所述预设路线更多的刷卡记录包括:
计算所述刷卡时间的时间跨度范围;
判断所述时间跨度范围是否大于预设时间跨度范围;
若不大于,则获取所述预设时间跨度范围内的刷卡记录。
5.根据权利要求2所述的方法,其特征在于:若不相等,计算得到所述预设路线的站点的预估到站时间;
将所述预估到站时间与所述密集点对应的时间匹配;
当所述预估到站时间与所述密集点对应的时间的差值在预设时间阈值内时,将所述密集点与所述站点建立映射关系。
6.根据权利要求1所述的方法,其特征在于,所述获取预设路线的刷卡记录包括:
获取预设卡标识在所述预设路线的刷卡记录;
所述将所述密集点与所述预设路线的站点信息进行匹配,以得到所述密集点与所述站点信息的对应关系之后包括:
将所述密集点对应的站点标记为所述卡标识对应用户的通勤地点。
7.根据权利要求6所述的方法,其特征在于,所述将所述密集点对应的站点标记为所述卡标识对应用户的通勤地点之后:
将所述通勤地点相同的卡标识的用户标记为同一类型的用户。
8.一种电子终端,其特征在于,包括:
第一获取模块,用于获取预设路线的刷卡记录,所述刷卡记录包括刷卡时间;
第二获取模块,用于获取所述预设路线的刷卡时间的密集点;
匹配模块,用于将所述密集点与所述预设路线的站点信息进行匹配,以得到所述密集点与所述站点信息的对应关系。
9.一种电子终端,其特征在于,包括处理器和通信电路,所述处理器耦接所述通信电路;
所述处理器用于通过所述通信电路获取预设路线的刷卡记录,所述刷卡记录包括刷卡时间;
所述处理器用于获取所述预设路线的刷卡时间的密集点;
所述处理器用于将所述密集点与所述预设路线的站点信息进行匹配,以得到所述密集点与所述站点信息的对应关系。
10.一种具有存储功能的装置,其特征在于,存储有程序数据,所述程序数据能够被执行以实现如权利要求1-7任一项所述的方法。
CN201910181158.6A 2019-03-11 2019-03-11 基于公交***的刷卡数据分析方法、电子终端及存储装置 Pending CN111680707A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910181158.6A CN111680707A (zh) 2019-03-11 2019-03-11 基于公交***的刷卡数据分析方法、电子终端及存储装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910181158.6A CN111680707A (zh) 2019-03-11 2019-03-11 基于公交***的刷卡数据分析方法、电子终端及存储装置

Publications (1)

Publication Number Publication Date
CN111680707A true CN111680707A (zh) 2020-09-18

Family

ID=72451282

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910181158.6A Pending CN111680707A (zh) 2019-03-11 2019-03-11 基于公交***的刷卡数据分析方法、电子终端及存储装置

Country Status (1)

Country Link
CN (1) CN111680707A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114035580A (zh) * 2021-11-15 2022-02-11 珠海格力智能装备有限公司 Agv控制方法、装置、存储介质、处理器及agv设备
CN114038225A (zh) * 2021-11-08 2022-02-11 深圳市雪球科技有限公司 一种公交线路的数据处理方法、装置与电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101540098A (zh) * 2009-04-30 2009-09-23 北京工业大学 基于公交ic卡线路的匹配方法
CN101615207A (zh) * 2009-07-10 2009-12-30 重庆大学 一种获取公交ic卡持卡乘客上车站点的方法
CN102156732A (zh) * 2011-04-11 2011-08-17 北京工业大学 基于特征站点的公交ic卡数据站点匹配方法
CN108242146A (zh) * 2016-12-27 2018-07-03 北京亿阳信通科技有限公司 基于公交卡数据分析乘客乘车站点及时间的方法和***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101540098A (zh) * 2009-04-30 2009-09-23 北京工业大学 基于公交ic卡线路的匹配方法
CN101615207A (zh) * 2009-07-10 2009-12-30 重庆大学 一种获取公交ic卡持卡乘客上车站点的方法
CN102156732A (zh) * 2011-04-11 2011-08-17 北京工业大学 基于特征站点的公交ic卡数据站点匹配方法
CN108242146A (zh) * 2016-12-27 2018-07-03 北京亿阳信通科技有限公司 基于公交卡数据分析乘客乘车站点及时间的方法和***

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114038225A (zh) * 2021-11-08 2022-02-11 深圳市雪球科技有限公司 一种公交线路的数据处理方法、装置与电子设备
CN114035580A (zh) * 2021-11-15 2022-02-11 珠海格力智能装备有限公司 Agv控制方法、装置、存储介质、处理器及agv设备
CN114035580B (zh) * 2021-11-15 2024-04-19 珠海格力智能装备有限公司 Agv控制方法、装置、存储介质、处理器及agv设备

Similar Documents

Publication Publication Date Title
CN109035770B (zh) 一种大数据环境下公交载客量实时分析预测方法
Munizaga et al. Validating travel behavior estimated from smartcard data
EP2667333A1 (en) System and method for estimating origins and destinations from identified end-point time-location stamps
CN106529711B (zh) 用户行为预测方法及装置
WO2018058967A1 (zh) 公交路线推荐方法、装置、设备及计算机存储介质
CN109903553B (zh) 多源数据挖掘的公交车上下车站点识别和检验方法
CN109462830B (zh) 基于终端信令的客流统计方法、装置及设备
CN112579718B (zh) 一种城市用地功能的识别方法、装置及终端设备
EP2831545B1 (en) Digital location-based data methods and product
CN110348931A (zh) 信息处理设备、信息处理方法和非暂态存储介质
CN111915200B (zh) 一种基于公交分担率的精细空间尺度的城市公共交通供需状态划分方法
CN108922178A (zh) 基于公交多源数据的公交车辆实时满载率计算方法
CN110853156A (zh) 融合公交gps轨迹与ic卡数据的乘客od识别方法
US20190017832A1 (en) Method and apparatus for providing recorded, anonymized routes
Zhao et al. Isolating high-priority metro and feeder bus transfers using smart card data
CN111680707A (zh) 基于公交***的刷卡数据分析方法、电子终端及存储装置
CN114820264A (zh) 公共交通工具换乘数据处理方法、装置、设备、存储介质
Patlins et al. The new approach for passenger counting in public transport system
CN114841428A (zh) 一种公交线路规划方法及***
Cyril et al. Electronic ticket machine data analytics for public bus transport planning
He et al. Space–time classification of public transit smart card users’ activity locations from smart card data
CN110555473A (zh) 行车线路规划方法、服务器及***
CN113160542A (zh) 基于信息反馈的乘车方法及装置
CN111369790B (zh) 过车记录校正方法、装置、设备及存储介质
CN112699955A (zh) 一种用户分类方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination