CN109558985A - 一种基于bp神经网络的公交客流量预测方法 - Google Patents
一种基于bp神经网络的公交客流量预测方法 Download PDFInfo
- Publication number
- CN109558985A CN109558985A CN201811500492.5A CN201811500492A CN109558985A CN 109558985 A CN109558985 A CN 109558985A CN 201811500492 A CN201811500492 A CN 201811500492A CN 109558985 A CN109558985 A CN 109558985A
- Authority
- CN
- China
- Prior art keywords
- bus
- website
- passenger
- card
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 51
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000008569 process Effects 0.000 claims description 22
- 238000012549 training Methods 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 claims description 2
- 230000008859 change Effects 0.000 claims description 2
- 210000005036 nerve Anatomy 0.000 claims description 2
- 210000004218 nerve net Anatomy 0.000 claims 1
- 238000004458 analytical method Methods 0.000 abstract description 8
- 238000013461 design Methods 0.000 description 11
- 210000002569 neuron Anatomy 0.000 description 6
- 238000011835 investigation Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000001680 brushing effect Effects 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000013499 data model Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000013439 planning Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000005211 surface analysis Methods 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Development Economics (AREA)
- Biophysics (AREA)
- Game Theory and Decision Science (AREA)
- Software Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Computational Linguistics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Primary Health Care (AREA)
- Traffic Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于BP神经网络的公交客流量预测方法,通过对乘客乘车记录建立数据仓库,分析线路的客流量,利用聚类分析对各线路站点乘客上车人数进行统计,特别是在一些站点没有刷卡记录的情况下,如何实现刷卡记录与站点进行精确匹配;利用神经网络对客流量进行预测分析,根据预测结果对公交车辆进行合理调度,这样使得公交的调度水平提高到一个比较理想的高度,提高公交调度管理水平,提高乘客乘车的满意度,满足市民的出行。
Description
技术领域
本发明涉及数据统计领域,具体而言,涉及一种基于BP神经网络的公交客流量预测方法。
背景技术
随着我国城市规模不断扩大,城市交通问题日益严峻,发展公共交通已经得到社会各界的广泛认同。制定既适应城市发展要求又满足城市居民需求的公共交通规划,是当前各大、中城市的重要问题之一。公共交通客流量数据是制定公共交通规划的前提和基础;公共客流量预测是规划是否科学、合理的基本保障。
传统的公交调度方法是按照出行计划固定进行调度,公交车发车间隔时间基本上是固定的。智能调度是指按照公交乘客客流量的变化而展开的调度工作。如在乘客出行高峰期安排车辆需要多点,而在平峰期可以适当地减少车辆。这样才能在公交运力比较紧张的情况下,最大限度地满足乘客乘车需求。对于乘客来说,在高峰上班期间因为客流量大,乘客多,造成乘坐公交舒适性差、甚至会赶不上公交车辆而造成上班迟到,从而造成乘客对公交的满意度降低,所以迫切需要一套公交客流预测***,来解决对于公交客流的预测问题。
国内大多数公交客流调查采用问卷调查的方式进行,例如组织专门人员设计调查表,在大街小巷发放调查表进行客流调查,这种调查方式既费时又费力,需要安排大量的人力物力,而最后的效果也不太理想。
目前国内绝大部分城市的公交建立IC收费管理***,但是这些收费***大部分用来对乘客乘车进行***,没有对消费的记录进行认真分析和研究,更没有对乘车记录进行进一步的挖掘。
发明内容
本发明提供了一种基于BP神经网络的公交客流量预测方法。
本发明是这样实现的:提供了一种基于BP神经网络的公交客流量预测方法,包括:
从公交***数据库获取指定时间间隔内的公交原始数据信息,根据公交原始数据信息,建立对乘客上车站点的估计模型,作为公交客流量的估计模型;
构建BP神经网络,以天气情况、乘车时间是否高峰时段、日期、当天是否为节假日作为BP神经网络的输入,以公交客流量的估计模型作为BP神经网络的训练数据,进行BP神经网络的训练,跟俄经济训练结果对公交客流量进行预测。
进一步地,在本发明较佳的实施例中,公交原始数据信息至少包括:
公交IC卡数据,包括:IC卡刷卡信息、公交站点信息、行车时刻记录、公交线路信息、乘客信息;
刷卡信息,包括:刷卡编号、乘客***、线路号、刷卡日期、刷卡时刻、车辆号、刷卡站点;
乘客信息,包括:客***、姓名、出生年月、职业、卡类型;
乘坐车辆信息,包括:车辆号、发车日期、发车时刻、发车站点、到站日期、到站时刻、到达站点;
线路信息,包括:线路号、线路站点次序编号、公交站点名称。
其中,在根据公交原始数据信息,建立对乘客上车站点的估计模型的步骤中,包括步骤:
对同一公交车上刷卡乘车的乘客的刷卡时间数据进行聚类分析,确定乘客的乘车站点,将同一站点上车的乘客归为一类,不同站点乘车的乘客归为不同类;
根据乘客归类的类型数量,结合公交车在类间时间段内的行驶距离与公交线路站点间的固定距离进行乘客上车站点的估计。
其中,在对同一公交车上刷卡乘车的乘客的刷卡时间数据进行聚类分析,确定乘客的乘车站点的步骤中,包括步骤:
选取线路信息中的一条公交线路的一趟公交车,其行驶的总站点数设定为S,站点序列为s=(1,2,3,…,S);
第i个站点到第i+1站点之间距离设为d(i,i+1),该线路由始发站到终点站的全程距离为D,则有
记T为公交车一次出行的全程行驶时间,则
T=(t1-tn)+ε
其中,t1为第一个乘客的刷卡时间,tn为最后一个乘客的刷卡时间,ε为调整系数;
公交车行驶的平均速度记为V,V=D/T;
依次统计公交线路上相邻两个站点间的距离d(i,i+1),取其中的最小值,标记为Dmin,那么聚类的最小值即为公交车以V的平均速度行驶Dmin所用的时间,记为Tmin;
计算一辆公交车在一次行驶过程中所记录的刷卡时间序列的相邻两次刷卡时间的差值,将得到一个表示时间差的数组序列,将此序列内的每一项依次与最小时间Tmin做比较,当相邻两次刷卡时间的差值大于或等于最小距离Tmin时,则这两次刷卡时间分别在不同的两个站点被记录,对应的两位乘客则分别在不同的两个站点上车,应归为不同的两类;当相邻两次刷卡时间的差值小于最小距离Tmin时,则这两次刷卡时间是在同一个站点被记录,对应的两位乘客则在相同的一个站点上车,归为同一类。
其中,在根据乘客归类的类型数量,结合公交车在类间时间段内的行驶距离与公交线路站点间的固定距离进行乘客上车站点的估计的步骤中,包括步骤:
在相邻的两类中,前一类中最晚刷卡乘车的上车时间和紧邻后一类中最早的上车时间之间的间隔,记为Δt(k-1,k),其中k为第k类;
公交车在相邻两类间的行驶距离为Δd(k-1,k),计算公式如下:
Δd(k-1,k)=Δt(k-1,k)×V×α
其中,考虑到公交车在行驶过程中受到交通信号灯的影响,在时间差的基础上引入系数α进行调整;
将公交始发站归为第一类站点,通过计算公交车在第一类与第二类之间的行驶距离Δd(l,2),以及第一类上车站点与每一个候选站点间的固定距离d(c1,c1+i),再依次计算公交车行驶距离Δd(l,2)与每一个固定距离d(c1,c1+i)之间差的绝对值,绝对值最小的即为第二类的上车站点;
当无乘客上车的站点数减少为零之前,第Ck类所对应的上车站点ck的估计模型设定为:
Ck=Ck-1+i→min(|d(ck-l,ck-1+i)-Δd(k-l,k)|)
Δd(k-1,k)=Δt(k-1,k)×V×α’
i=1,2,3…Δsk-1
其中,α’是用于调整一辆公交车一次出行的全程行驶时间。
其中,公交IC卡所记录的最后一位上车的乘客上车的站点随机变化,设定系数α’时根据不同线路特征进行调整。
其中,BP神经网络的输入样本数据中,乘车时间是否高峰时段通过公交***的数据库获取,天气情况、日期、当天是否为节假日则通过历史数据获得。
其中,利用天气情况、乘车时间是否高峰时段、日期、当天是否为节假日作为输入数据,以公交车站客流量作为训练数据,对公交站点乘客客流量预测模型进行训练。
其中,在训练过程中,利用MATLAB软件对模型进行仿真,利用仿真软件确定BP神经网络层数、输入层参数和输出层参数的、隐含层的节点数量、学习速率、BP人工神经网络传递函数和BP人工神经网络算法,以使得误差最小。
其中,通过对公交客流量预测,合理安排公交车的出行,为乘客创造良好的乘车环境。
区别于现有技术,本发明提供了一种基于BP神经网络的公交客流量预测方法,通过对乘客乘车记录建立数据仓库,分析线路的客流量,利用聚类分析对各线路站点乘客上车人数进行统计,特别是在一些站点没有刷卡记录的情况下,如何实现刷卡记录与站点进行精确匹配;利用神经网络对客流量进行预测分析,根据预测结果对公交车辆进行合理调度,这样使得公交的调度水平提高到一个比较理想的高度,提高公交调度管理水平,提高乘客乘车的满意度,满足市民的出行。
附图说明
为了更清楚地说明本发明实施方式的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明提供的一种基于BP神经网络的公交客流量预测方法的流程示意图。
图2是本发明提供的一种基于BP神经网络的公交客流量预测方法的公交IC数据的流动路径示意图。
图3是本发明提供的一种基于BP神经网络的公交客流量预测方法中包含一个隐含层的BP网络模型的结构示意图。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
参照图1所示,本发明提供了一种基于BP神经网络的公交客流量预测方法,包括:
S110:从公交***数据库获取指定时间间隔内的公交原始数据信息,根据公交原始数据信息,建立对乘客上车站点的估计模型,作为公交客流量的估计模型。
基本的IC卡收费***包括了数据库、资金结算中心、IC卡管理中心、用户交往层及用户与管理接口等部分。用户交往层主要是持卡人购卡、充值、消费等行为,个别时候需要挂失和查询等。***的核心部分是IC卡管理中心、资金结算中心和数据库,它们在***后台运行,进行资金结算、数据读取和保存、IC卡管理等操作根据公交IC卡收费***的特征,可以将公交IC卡收费***看作由三个子***组成的***,包括:充值网点***、消费网点***、中心***。
公交IC数据是在公交乘客上车刷卡的同时被记录。乘客刷卡一次车载读卡器便相应记录一条刷卡数据,存储在车载读卡器的数据存储设备中,数据汇集器负责将车载读卡器中存储的数据汇集到各分公司IC卡管理***,公交IC卡***管理中心从各分公司的IC卡管理中心汇总数据,最终数据被存储在数据库中。公交IC数据在***中的流动路径如图2所示。
本发明所需要的数据挖掘基础数据除公交IC卡数据外,还包括公交行车时刻记录表、公交线路站点信息以及车辆行驶信息。公交行车时刻记录表是:以线路号为单位,根据车辆发车情况所记录的每辆车在运营过程中从起始站点的实际发车时刻。公交线路站点信息包括站点位置、站点编号、站点名称、相邻站距离、站点数。车辆行驶信息是车辆运营过程中的行驶速度等指标。这些信息可以向公交公司索取和做相关的公交调查获取。
在数据仓库设计过程中数据模式的设计至关重要,它是数据仓库设计中的核心部分。数据仓库建立模型的过程实际上是一个从关系型、规范式的数据模型向多维模型转换的过程。在基于IC卡的数据仓库设计过程中,我们采用通用的三层数据建模方式,即概念模型设计、逻辑模型设计和物理模型设计。概念模型设计提供了对IC卡数据分析的一个整体概括性描述;逻辑数据建模层面向IC卡数据仓库界定范围的全局及其应用;物理数据设计使用物理限制,如空间、特性和数据的物理分布,目的是设计实际的物理数据。
建立公交IC卡数据仓库所需的数据应包括:IC卡刷卡信息、公交站点信息、行车时刻记录、公交线路信息、乘客信息。
A、IC卡刷卡信息设定:刷卡编号、乘客***、线路号、刷卡日期、刷卡时刻、车辆号、刷卡站点;
B、乘客信息设定:乘客***、姓名、出生年月、职业、卡类型;
C、线路站点信息设定:站点名称、站点长度、站点坐标;
D、乘坐车辆信息设定:车辆号、发车日期、发车时刻、发车站点、到站日期、到站时刻、到达站点;
E、线路信息:线路号、线路站点次序编号、公交站点名称。
本发明在进行建立对乘客上车站点的估计模型的步骤中,以全线一票式为例进行说明,即无需下车刷卡。
由于公交定线定站的运营特征,以及城市居民的出行特点,决定了公交出行在路线的选择和客流的分布上具有一定的规律性和稳定性。
由于公交车辆沿公交线路的站点序列停车顺序的不可逆性,以及公交IC卡***数据所记录乘客刷卡上车时间的不可逆性,***乘客的上车站点估计方法存在逻辑顺序,即刷卡时间早的乘客先于刷卡时间晚的乘客上车,其上车的站点顺序只有两种状况:
第一,上车站点相同。这种情况下,相邻两位乘客间的刷卡间隔比较短。
第二,刷卡时间早的乘客上车时所在的站点位于刷卡时间晚的之前。这种情况下相邻两个刷卡间隔比较长。
通过对刷卡数据进行分析,使乘客的刷卡上车时间序列与公交线路的站点序列相对应,可建立符合逻辑的乘客上车站点估计模型。除此之外,公交乘客于相同公交站点刷卡上车时,其先后刷卡间隔较短,公交乘客于不同公交站点刷卡上车时,其先后刷卡间隔较长。
为提高估计的准确度,我们选取公交车在相距最短的相邻两个站点间的行驶时间作为聚类的最小距离。以南通公交22路为例,记22路的总站点数为S,站点序列为s=(1,2,3,…,S)。第i个站点到第i+1站点之间距离是d(i,i+1),该线路由始发站到终点站的全程距离为D,该线路全程距离可以累加相邻两个站点的距离d(i,i+1)取得。如下所示
假定公交车在始发站开始发车时,一定有乘客刷卡上车,行驶至终点站时一定没有乘客刷卡上车。公交车行驶至终点站时虽然没有乘客刷卡上车,但是通过给予最后一位乘客刷卡上车时间一个调整系数,即可估计出公交车的全程行驶时间。记T为一辆公交车一次出行的全程行驶时间,全程行驶时间的计算过程如下所示。
T=(t1-tn)+ε
t1为最早一个乘客刷卡时间,tn为最后一个乘客刷卡时间,ε为调整系数。
由公交车的全程行驶距离D和全程行驶时间T,可以计算得到公交车在这一次出行中行驶的平均速度V,计算过程如下所示。
V=D/T
依次统计公交线路上相邻两个站点间的距离d(i,i+1),取其中的最小值,标记为Dmin,那么聚类的最小值即为公交车以V的平均速度行驶Dmin所用的时间,记为Tmin。计算一辆公交车在一次行驶过程中所记录的刷卡时间序列的相邻两次刷卡时间的差值,将得到一个表示时间差的数组序列,将此序列内的每一项依次与最小时间Tmin做比较。当相邻两次刷卡时间的差值大于或等于最小距离Tmin时,则这两次刷卡时间分别在不同的两个站点被记录,对应的两位持卡者则分别在不同的两个站点上车,应归为不同的两类;当相邻两次刷卡时间的差值小于最小距离Tmin时,则这两次刷卡时间是在同一个站点被记录,对应的两位持卡者则在相同的一个站点上车,应归为同一类。依次分析判断后,将会得到一组类序列,记总类数为C类序列为(c1,c2,c3…,C),类序列与公交线路站点序列的匹配将在此基础上完成,以最终实现乘客上车站点的估计。
刷卡时间序列进行聚类分析后,被分为C种不同的类,同一类内所有乘客的上车站点相同,分属于不同类的公交乘客不在同一个公交站点上车,因此完成类序列和车辆所停靠公交站点序列的匹配,即实现了每一个类内所有公交乘客上车时所在的公交站点估计。
为了提高估计的准确度,在计算公交车从一个类时间点行驶到紧邻的下一个类时间点所走的距离时,利用类内平均上车时间将使得计算误差增大,因此利用前一类中最晚刷卡乘车的上车时间和紧邻后一类中最早的上车时间之间的间隔,记为Δt(k-1,k),其中k为第k类。考虑到公交车在行驶过程中受到交通信号灯的影响,所以在此时间差的基础上引入系数α进行调整,记公交车在相邻两类间的行驶距离为Δd(k-1,k),计算公式如下。
Δd(k-1,k)=Δt(k-1,k)×V×α
第一种情况,所得聚类数=公交站点总数-1,即C=S-1。此情况表明无人乘车的公交站点只出现于公交线路的终点站处,此时公交乘客上车时所在的公交站点估计,可依据刷卡时间的先后顺序,将各个类与各个站点依次匹配即可。
第二种情况,所得聚类数<公交站点总数-1,即C<S-1。此情况表明无人乘车的公交站点不仅出现于公交线路的终点站处,而且还出现于其他站点处。在这种情况下,可结合公交车在类间时间段内的行驶距离与公交线路站点间的固定距离进行乘客上车站点的估计。
由实际考察情况可知,一般情况下,公交车在始发站发车时都有乘客刷卡上车,行驶至终点站时没有乘客刷卡上车。因此我们假定公交线路的第一个站点即为第一类的上车站点,公交线路的终点站不计算在待匹配站点内,据此可以从第二类开始估计。当估计第二类的上车站点时,可供匹配的站点序列为{2,,3,4,...,S-1},其中有S-1-C个站点没有乘客上车,记为Δs1,即Δs1=S-1-C,因此第二类的上车站点只能是候选站点序列(2,2+1,2+2,2+Δs1)中的一个站点。在下一步估计第二类的上车站点时,可通过计算公交车在第一类与第二类之间的行驶距离Δd(l,2),以及第一类上车站点与每一个候选站点间的固定距离d(c1,c1+i),再依次计算公交车行驶距离Δd(l,2)与每一个固定距离d(c1,c1+i)之间差的绝对值,绝对值最小的即为第二类的上车站点。完成第二类上车站点的估计后,无乘客上车的站点数会减少,减少量为第二类上车站点与第一类上车站点间隔的站点数。然后再估计第三类的上车站点,依次进行各类的上车站点估计,无乘客上车的站点数量满足如下式的变化规律:
当无乘客上车的站点数减少为零时,表明剩余的待匹配站点都有乘客上车,则令剩余的没有估计站点的类依次与待匹配的站点相匹配。综上可知,当无乘客上车的站点数减少为零之前,第Ck类所对应的上车站点ck的估计模型如下所示。
Ck=Ck-1+i→min(|d(ck-l,ck-I+i)-Δd(k-1,k)|)
Δd(k-l,k)=Δt(k-l,k)×V×a’
i=1,2,3…Δsk-1
在估计乘客的上车站点时,引入了系数α’系数,α’是用于调整一辆公交车一次出行的全程行驶时间,基于的前提是公交线路的终点站没有人上车,而公交IC卡所记录的最后一位上车的乘客可能是在倒数第二或第三站,是一个随机变化的过程,所以系数α的设定需要根据不同线路特征来调整。
S120:构建BP神经网络,以天气情况、乘车时间是否高峰时段、日期、当天是否为节假日作为BP神经网络的输入,以公交客流量的估计模型作为BP神经网络的训练数据,进行BP神经网络的训练,跟俄经济训练结果对公交客流量进行预测。
一般说来,公交的客流量与星期、天气、是否高峰期间、路段、方向等有着密切的关系,很难用一个具休的模型来描述。BP神经网络具有较强的自我学习能力,能够充分挖掘数据之问的关系,最大限度地逼近非线性复杂***,因此,本文采用BP神经网络来映射输出(客流量)和输入(天气、是否高峰时段、星期、节假日)的关系,通过BP神经网络来预测客流量。
BP(back propagation)神经网络是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP算法的思想是,学习过程由信号的正向传播与误差的反向传播两个过程组成。正向传播时,输入样本从输入层传入,经各隐层逐层处理后,传向输出层。若输出层的实际输出与期望的输出不符合,则转入误差的反向传播阶段。误差反传是将输出误差以某种形式通过隐层向输入层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据。这种信号正向传播与误差反向传播的各层权值调整过程,是周而复始地进行的。权值不断调整的过程,也就是网络的学习训练过程。此过程一直进行到网络输出的误差减少到可以接受的程度或进行到预先设定的学习次数为止。
影响公交客流量的因素有很多,通过分析出得到以下影响公交客流量的因素。
乘车时间是否高峰时间段:影响公交客流量的因素有很多中,不同的时刻会对车辆运行产生影响,是否高峰期对客流量影响非常大,所以是否高峰期是一个输入变量。
天气情况:不同的天气会对车辆运行产生明显的影响,例如晴天车辆运行受天气影响最小,乘客在公交站台等候相对比较少,到了雨天公交运行速度慢,在公交站台上聚集的乘客相对就比较多。
日期情况:一周当中每一天,公交客流和道路情况都有所不同,例如,南通市每周一早上上班时间和周五下午下班时间的客流明显要高出平常同一时段的客流。
节假日:重大节日也会对客流造成巨大变化。
BP神经网络需要大量数据作为输入、输出样本,因此在构建BP神经网络前,首先要做的工作就是获取这些数据。利用先进的信息技术,可以获取乘客刷卡乘车数据。天气、星期情况、是否节日这些输入样本则可以在大量的历史数据中获得。输出样本的也就是客流量数据我们可以利用数据挖掘中聚类算法可以获得,同时公交企业采用先进的管理信息技术已经积累了大量的运营数据,这些数据不仅仅作为公交计划、运营指标的统计分析,也为BP神经网络的训练、预测提供了丰富的样本。
BP神经网络模型是由一个输入层,一个输出层以及一个或多个隐含层构成。在同一层中各神经元之间相互独立。输入信号从输入层神经元,依次通过各个隐含层神经元,最后传递到输出层神经元,图3中给出了包含一个隐含层的BP网络模型结构,隐含层神经元个数为m。理论研究表明:具有一个输入层,一个线性输出层以及Sigmoid型激活函数的隐含层的BP网络能够以任意精度逼近任何连续可微函数。
三层感知器中,输入向量为X=(x1,x2…xi…xn)T,图2中x0=-1是为隐层神经元引入阈值而设置的,隐层输入向量为Y=(y1,y2…yj…ym,)T,图中y0=-1是为输出层神经元引入阈值而设置的;输出层输出向量O=(o1,o2,…,ok,ol)T,期望输出向量为d=(d1,d2,…,dk,dl)T,输入层到隐层之间的权值矩阵用V表示,V=(V1,V2,…,Vj,…Vm)T,隐层到输入层之间的权值矩阵用W表示,W=(W1,W2,…,Wk’…Wl)T,下面分析各层信号之间的关系。
对于输入层:
ok=f(netk)k=1,2,…,l,
对于隐层yj=f(netj)j=1,2,…,m,
以上两式中,激活函数都是sigmoid函数;
f(x)具有连续、可导的特点且f’(x)=f(x)[1-f(x)]。
根据以上的公式,我们可以推导出权值调整量Δwjk和Δvjk分别是
为了能够预测公交车站客流量,选用的两层BP神经网络模型作为我们整个项目的模型,在本项目中,每个输入向量共有4个元素,分别是天气、星期、是否高峰时段、线路方向。
输出变量为1个,即该站点公交车流量。
该模型中利用天气、是否高峰时段、星期、线路方向等相关数据作为输入数据,以公交车站客流量作为训练数据,对公交站点乘客客流量预测模型进行训练。在训练过程中,利用MATLAB软件对该模型进行仿真,利用仿真软件确定BP神经网络层数、输入层参数和输出层参数的、隐含层的节点数量、学习速率、BP人工神经网络传递函数和BP人工神经网络算法,以使得误差最小。最后对公交客流量进行预测,通过预测,合理安排公交车的出行,为乘客创造良好的乘车环境。
区别于现有技术,本发明提供了一种基于BP神经网络的公交客流量预测方法,通过对乘客乘车记录建立数据仓库,分析线路的客流量,利用聚类分析对各线路站点乘客上车人数进行统计,特别是在一些站点没有刷卡记录的情况下,如何实现刷卡记录与站点进行精确匹配;利用神经网络对客流量进行预测分析,根据预测结果对公交车辆进行合理调度,这样使得公交的调度水平提高到一个比较理想的高度,提高公交调度管理水平,提高乘客乘车的满意度,满足市民的出行。
以上所述仅为本发明的优选实施方式而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于BP神经网络的公交客流量预测方法,其特征在于,包括:
从公交***数据库获取指定时间间隔内的公交原始数据信息,根据公交原始数据信息,建立对乘客上车站点的估计模型,作为公交客流量的估计模型;
构建BP神经网络,以天气情况、乘车时间是否高峰时段、日期、当天是否为节假日作为BP神经网络的输入,以公交客流量的估计模型作为BP神经网络的训练数据,进行BP神经网络的训练,跟俄经济训练结果对公交客流量进行预测。
2.根据权利要求1所述的基于BP神经网络的公交客流量预测方法,其特征在于,公交原始数据信息至少包括:
公交IC卡数据,包括:IC卡刷卡信息、公交站点信息、行车时刻记录、公交线路信息、乘客信息;
刷卡信息,包括:刷卡编号、乘客***、线路号、刷卡日期、刷卡时刻、车辆号、刷卡站点;
乘客信息,包括:客***、姓名、出生年月、职业、卡类型;
乘坐车辆信息,包括:车辆号、发车日期、发车时刻、发车站点、到站日期、到站时刻、到达站点;
线路信息,包括:线路号、线路站点次序编号、公交站点名称。
3.根据权利要求2所述的基于BP神经网络的公交客流量预测方法,其特征在于,在根据公交原始数据信息,建立对乘客上车站点的估计模型的步骤中,包括步骤:
对同一公交车上刷卡乘车的乘客的刷卡时间数据进行聚类分析,确定乘客的乘车站点,将同一站点上车的乘客归为一类,不同站点乘车的乘客归为不同类;
根据乘客归类的类型数量,结合公交车在类间时间段内的行驶距离与公交线路站点间的固定距离进行乘客上车站点的估计。
4.根据权利要求3所述的基于BP神经网络的公交客流量预测方法,其特征在于,在对同一公交车上刷卡乘车的乘客的刷卡时间数据进行聚类分析,确定乘客的乘车站点的步骤中,包括步骤:
选取线路信息中的一条公交线路的一趟公交车,其行驶的总站点数设定为S,站点序列为s=(1,2,3,…,S);
第i个站点到第i+1站点之间距离设为d(i,i+1),该线路由始发站到终点站的全程距离为D,则有
记T为公交车一次出行的全程行驶时间,则
T=(t1-tn)+ε
其中,t1为第一个乘客的刷卡时间,tn为最后一个乘客的刷卡时间,ε为调整系数;
公交车行驶的平均速度记为V,V=D/T;
依次统计公交线路上相邻两个站点间的距离d(i,i+1),取其中的最小值,标记为Dmin,那么聚类的最小值即为公交车以V的平均速度行驶Dmin所用的时间,记为Tmin;
计算一辆公交车在一次行驶过程中所记录的刷卡时间序列的相邻两次刷卡时间的差值,将得到一个表示时间差的数组序列,将此序列内的每一项依次与最小时间Tmin做比较,当相邻两次刷卡时间的差值大于或等于最小距离Tmin时,则这两次刷卡时间分别在不同的两个站点被记录,对应的两位乘客则分别在不同的两个站点上车,应归为不同的两类;当相邻两次刷卡时间的差值小于最小距离Tmin时,则这两次刷卡时间是在同一个站点被记录,对应的两位乘客则在相同的一个站点上车,归为同一类。
5.根据权利要求4所述的基于BP神经网络的公交客流量预测方法,其特征在于,在根据乘客归类的类型数量,结合公交车在类间时间段内的行驶距离与公交线路站点间的固定距离进行乘客上车站点的估计的步骤中,包括步骤:
在相邻的两类中,前一类中最晚刷卡乘车的上车时间和紧邻后一类中最早的上车时间之间的间隔,记为Δt(k-1,k),其中k为第k类;
公交车在相邻两类间的行驶距离为Δd(k-1,k),计算公式如下:
Δd(k-1,k)=Δt(k-1,k)×V×α
其中,考虑到公交车在行驶过程中受到交通信号灯的影响,在时间差的基础上引入系数α进行调整;
将公交始发站归为第一类站点,通过计算公交车在第一类与第二类之间的行驶距离Δd(l,2),以及第一类上车站点与每一个候选站点间的固定距离d(c1,c1+i),再依次计算公交车行驶距离Δd(l,2)与每一个固定距离d(c1,c1+i)之间差的绝对值,绝对值最小的即为第二类的上车站点;
当无乘客上车的站点数减少为零之前,第Ck类所对应的上车站点ck的估计模型设定为:
Ck=Ck-1+i→min(|d(ck-1,ck-1+i)-Δd(k-1,k)|)
Δd(k-1,k)=Δt(k-1,k)×V×a’
i=1,2,3…Δsk-1
其中,α’是用于调整一辆公交车一次出行的全程行驶时间。
6.根据权利要求5所述的基于BP神经网络的公交客流量预测方法,其特征在于,公交IC卡所记录的最后一位上车的乘客上车的站点随机变化,设定系数α’时根据不同线路特征进行调整。
7.根据权利要求1所述的基于BP神经网络的公交客流量预测方法,其特征在于,BP神经网络的输入样本数据中,乘车时间是否高峰时段通过公交***的数据库获取,天气情况、日期、当天是否为节假日则通过历史数据获得。
8.根据权利要求1所述的基于BP神经网络的公交客流量预测方法,其特征在于,利用天气情况、乘车时间是否高峰时段、日期、当天是否为节假日作为输入数据,以公交车站客流量作为训练数据,对公交站点乘客客流量预测模型进行训练。
9.根据权利要求8所述的基于BP神经网络的公交客流量预测方法,其特征在于,在训练过程中,利用MATLAB软件对模型进行仿真,利用仿真软件确定BP神经网络层数、输入层参数和输出层参数的、隐含层的节点数量、学习速率、BP人工神经网络传递函数和BP人工神经网络算法,以使得误差最小。
10.根据权利要求9所述的基于BP神经网络的公交客流量预测方法,其特征在于,通过对公交客流量预测,合理安排公交车的出行,为乘客创造良好的乘车环境。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811500492.5A CN109558985A (zh) | 2018-12-10 | 2018-12-10 | 一种基于bp神经网络的公交客流量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811500492.5A CN109558985A (zh) | 2018-12-10 | 2018-12-10 | 一种基于bp神经网络的公交客流量预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109558985A true CN109558985A (zh) | 2019-04-02 |
Family
ID=65869575
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811500492.5A Pending CN109558985A (zh) | 2018-12-10 | 2018-12-10 | 一种基于bp神经网络的公交客流量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109558985A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110246329A (zh) * | 2019-04-07 | 2019-09-17 | 武汉理工大学 | 一种出租车载客数量预测方法 |
CN110246330A (zh) * | 2019-05-29 | 2019-09-17 | 佛山市慧城信息科技有限公司 | 一种公交线路客流量预估方法、电子设备和存储介质 |
CN110459050A (zh) * | 2019-05-27 | 2019-11-15 | 华南理工大学 | 一种基于混合决策树的短期公交客流预测方法 |
CN110570656A (zh) * | 2019-09-20 | 2019-12-13 | 深圳市综合交通运行指挥中心 | 定制公共交通线路方法及装置 |
CN110991607A (zh) * | 2019-11-15 | 2020-04-10 | 佳都新太科技股份有限公司 | 一种地铁客流预测方法、装置、电子设备及存储介质 |
CN111126681A (zh) * | 2019-12-12 | 2020-05-08 | 华侨大学 | 一种基于历史客流量的公交线路调整方法 |
CN111191817A (zh) * | 2019-12-12 | 2020-05-22 | 华侨大学 | 一种基于换乘客流量的公交线网拓扑划分方法 |
CN111784165A (zh) * | 2020-07-01 | 2020-10-16 | 宿迁海沁节能科技有限公司 | 一种基于5G NB-IoT的载运工具病毒健康智能预警***与方法 |
CN112417753A (zh) * | 2020-11-04 | 2021-02-26 | 中国科学技术大学 | 一种基于城市公共交通资源联合调度方法 |
CN112465396A (zh) * | 2020-12-15 | 2021-03-09 | 中北大学 | 一种基于沿线站点事件的公交调度方法及*** |
CN115249120A (zh) * | 2022-06-16 | 2022-10-28 | 北京轨道交通路网管理有限公司 | 设备开机计划的确定方法、装置及电子设备 |
CN116542438A (zh) * | 2023-03-28 | 2023-08-04 | 大连海事大学 | 一种基于无基准真相的公交乘客起止点估计修补方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104517159A (zh) * | 2014-12-18 | 2015-04-15 | 上海交通大学 | 一种公交短时客流的预测方法 |
US20150348068A1 (en) * | 2014-05-28 | 2015-12-03 | International Business Machines Corporation | Predicting waiting passenger count and evaluation |
CN105550789A (zh) * | 2016-02-19 | 2016-05-04 | 上海果路交通科技有限公司 | 一种公交出行客流的预测方法 |
-
2018
- 2018-12-10 CN CN201811500492.5A patent/CN109558985A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150348068A1 (en) * | 2014-05-28 | 2015-12-03 | International Business Machines Corporation | Predicting waiting passenger count and evaluation |
CN104517159A (zh) * | 2014-12-18 | 2015-04-15 | 上海交通大学 | 一种公交短时客流的预测方法 |
CN105550789A (zh) * | 2016-02-19 | 2016-05-04 | 上海果路交通科技有限公司 | 一种公交出行客流的预测方法 |
Non-Patent Citations (2)
Title |
---|
刘文芳: "《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》", 15 January 2016 * |
郎茂祥: "《预测理论与方法》", 30 November 2011, 北京:北京交通大学出版社 * |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110246329A (zh) * | 2019-04-07 | 2019-09-17 | 武汉理工大学 | 一种出租车载客数量预测方法 |
CN110459050B (zh) * | 2019-05-27 | 2021-07-20 | 华南理工大学 | 一种基于混合决策树的短期公交客流预测方法 |
CN110459050A (zh) * | 2019-05-27 | 2019-11-15 | 华南理工大学 | 一种基于混合决策树的短期公交客流预测方法 |
CN110246330A (zh) * | 2019-05-29 | 2019-09-17 | 佛山市慧城信息科技有限公司 | 一种公交线路客流量预估方法、电子设备和存储介质 |
CN110570656A (zh) * | 2019-09-20 | 2019-12-13 | 深圳市综合交通运行指挥中心 | 定制公共交通线路方法及装置 |
CN110570656B (zh) * | 2019-09-20 | 2022-03-25 | 深圳市综合交通运行指挥中心 | 定制公共交通线路方法及装置 |
CN110991607A (zh) * | 2019-11-15 | 2020-04-10 | 佳都新太科技股份有限公司 | 一种地铁客流预测方法、装置、电子设备及存储介质 |
CN110991607B (zh) * | 2019-11-15 | 2022-08-02 | 佳都科技集团股份有限公司 | 一种地铁客流预测方法、装置、电子设备及存储介质 |
CN111126681A (zh) * | 2019-12-12 | 2020-05-08 | 华侨大学 | 一种基于历史客流量的公交线路调整方法 |
CN111191817B (zh) * | 2019-12-12 | 2022-05-03 | 华侨大学 | 一种基于换乘客流量的公交线网拓扑划分方法 |
CN111126681B (zh) * | 2019-12-12 | 2022-06-07 | 华侨大学 | 一种基于历史客流量的公交线路调整方法 |
CN111191817A (zh) * | 2019-12-12 | 2020-05-22 | 华侨大学 | 一种基于换乘客流量的公交线网拓扑划分方法 |
CN111784165A (zh) * | 2020-07-01 | 2020-10-16 | 宿迁海沁节能科技有限公司 | 一种基于5G NB-IoT的载运工具病毒健康智能预警***与方法 |
CN112417753A (zh) * | 2020-11-04 | 2021-02-26 | 中国科学技术大学 | 一种基于城市公共交通资源联合调度方法 |
CN112417753B (zh) * | 2020-11-04 | 2024-03-29 | 中国科学技术大学 | 一种基于城市公共交通资源联合调度方法 |
CN112465396A (zh) * | 2020-12-15 | 2021-03-09 | 中北大学 | 一种基于沿线站点事件的公交调度方法及*** |
CN112465396B (zh) * | 2020-12-15 | 2023-04-18 | 中北大学 | 一种基于沿线站点事件的公交调度方法及*** |
CN115249120A (zh) * | 2022-06-16 | 2022-10-28 | 北京轨道交通路网管理有限公司 | 设备开机计划的确定方法、装置及电子设备 |
CN115249120B (zh) * | 2022-06-16 | 2024-03-22 | 北京轨道交通路网管理有限公司 | 设备开机计划的确定方法、装置及电子设备 |
CN116542438A (zh) * | 2023-03-28 | 2023-08-04 | 大连海事大学 | 一种基于无基准真相的公交乘客起止点估计修补方法 |
CN116542438B (zh) * | 2023-03-28 | 2024-01-30 | 大连海事大学 | 一种基于无基准真相的公交乘客起止点估计修补方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109558985A (zh) | 一种基于bp神经网络的公交客流量预测方法 | |
CN109886491A (zh) | 一种海量运行数据驱动的地面公交两阶段优化调度方法 | |
CN102044149B (zh) | 一种基于时变客流的城市公交运营协调方法与装置 | |
CN109886444A (zh) | 一种交通短时客流预测方法、装置、设备和存储介质 | |
CN109508751B (zh) | 高速铁路列车晚点时间预测的深度神经网络模型建模方法 | |
CN110390349A (zh) | 基于XGBoost模型的公交车客流量预测建模方法 | |
CN108805344A (zh) | 一种考虑时变需求的高速铁路网络列车开行方案优化方法 | |
CN110555990A (zh) | 一种基于lstm神经网络的有效停车时空资源预测方法 | |
CN107194491A (zh) | 一种基于公交客流和站间行程时间预测的动态调度方法 | |
CN106910199A (zh) | 面向城市空间信息采集的车联网众包方法 | |
CN107330716A (zh) | 一种考虑***最优的定制公交定价方法 | |
CN111160622A (zh) | 基于混合神经网络模型的景区客流预测方法和装置 | |
CN112700029B (zh) | 一种基于仿真优化框架的定制公交规划方法 | |
CN107392389A (zh) | 基于arima模型的出租车调度处理方法 | |
CN109840639A (zh) | 一种高速铁路列车运行晚点时间预测方法 | |
CN110570656B (zh) | 定制公共交通线路方法及装置 | |
Sadrani et al. | Vehicle dispatching plan for minimizing passenger waiting time in a corridor with buses of different sizes: Model formulation and solution approaches | |
CN106960261A (zh) | 一种基于轨道ic卡和手机信令数据的轨道交通客流预测方法 | |
CN110211379A (zh) | 一种基于机器学习的公共交通调度优化方法 | |
Lin et al. | Intelligent bus operation optimization by integrating cases and data driven based on business chain and enhanced quantum genetic algorithm | |
CN114066503A (zh) | 一种基于构建虚拟服务片区进行出租车需求预测的方法 | |
CN110443422B (zh) | 基于od吸引度的城市轨道交通od客流预测方法 | |
CN109345296A (zh) | 民众出行需求预测方法、装置及计算机终端 | |
Wang et al. | Cross-regional customized bus route planning considering staggered commuting during the COVID-19 | |
Alt et al. | A stochastic multiple area approach for public transport network design |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190402 |
|
RJ01 | Rejection of invention patent application after publication |