CN109558985A

CN109558985A - 一种基于bp神经网络的公交客流量预测方法

Info

Publication number: CN109558985A
Application number: CN201811500492.5A
Authority: CN
Inventors: 杨健兵; 邓荣
Original assignee: Nantong Vocational College Science and Technology
Current assignee: Nantong Vocational College Science and Technology
Priority date: 2018-12-10
Filing date: 2018-12-10
Publication date: 2019-04-02

Abstract

本发明提供了一种基于BP神经网络的公交客流量预测方法，通过对乘客乘车记录建立数据仓库，分析线路的客流量，利用聚类分析对各线路站点乘客上车人数进行统计，特别是在一些站点没有刷卡记录的情况下，如何实现刷卡记录与站点进行精确匹配；利用神经网络对客流量进行预测分析，根据预测结果对公交车辆进行合理调度，这样使得公交的调度水平提高到一个比较理想的高度，提高公交调度管理水平，提高乘客乘车的满意度，满足市民的出行。

Description

一种基于BP神经网络的公交客流量预测方法

技术领域

本发明涉及数据统计领域，具体而言，涉及一种基于BP神经网络的公交客流量预测方法。

背景技术

随着我国城市规模不断扩大，城市交通问题日益严峻，发展公共交通已经得到社会各界的广泛认同。制定既适应城市发展要求又满足城市居民需求的公共交通规划，是当前各大、中城市的重要问题之一。公共交通客流量数据是制定公共交通规划的前提和基础；公共客流量预测是规划是否科学、合理的基本保障。

传统的公交调度方法是按照出行计划固定进行调度，公交车发车间隔时间基本上是固定的。智能调度是指按照公交乘客客流量的变化而展开的调度工作。如在乘客出行高峰期安排车辆需要多点，而在平峰期可以适当地减少车辆。这样才能在公交运力比较紧张的情况下，最大限度地满足乘客乘车需求。对于乘客来说，在高峰上班期间因为客流量大，乘客多，造成乘坐公交舒适性差、甚至会赶不上公交车辆而造成上班迟到，从而造成乘客对公交的满意度降低，所以迫切需要一套公交客流预测***，来解决对于公交客流的预测问题。

国内大多数公交客流调查采用问卷调查的方式进行，例如组织专门人员设计调查表，在大街小巷发放调查表进行客流调查，这种调查方式既费时又费力，需要安排大量的人力物力，而最后的效果也不太理想。

目前国内绝大部分城市的公交建立IC收费管理***，但是这些收费***大部分用来对乘客乘车进行***，没有对消费的记录进行认真分析和研究，更没有对乘车记录进行进一步的挖掘。

发明内容

本发明提供了一种基于BP神经网络的公交客流量预测方法。

本发明是这样实现的：提供了一种基于BP神经网络的公交客流量预测方法，包括：

从公交***数据库获取指定时间间隔内的公交原始数据信息，根据公交原始数据信息，建立对乘客上车站点的估计模型，作为公交客流量的估计模型；

构建BP神经网络，以天气情况、乘车时间是否高峰时段、日期、当天是否为节假日作为BP神经网络的输入，以公交客流量的估计模型作为BP神经网络的训练数据，进行BP神经网络的训练，跟俄经济训练结果对公交客流量进行预测。

进一步地，在本发明较佳的实施例中，公交原始数据信息至少包括：

公交IC卡数据，包括：IC卡刷卡信息、公交站点信息、行车时刻记录、公交线路信息、乘客信息；

刷卡信息，包括：刷卡编号、乘客***、线路号、刷卡日期、刷卡时刻、车辆号、刷卡站点；

乘客信息，包括：客***、姓名、出生年月、职业、卡类型；

乘坐车辆信息，包括：车辆号、发车日期、发车时刻、发车站点、到站日期、到站时刻、到达站点；

线路信息，包括：线路号、线路站点次序编号、公交站点名称。

其中，在根据公交原始数据信息，建立对乘客上车站点的估计模型的步骤中，包括步骤：

对同一公交车上刷卡乘车的乘客的刷卡时间数据进行聚类分析，确定乘客的乘车站点，将同一站点上车的乘客归为一类，不同站点乘车的乘客归为不同类；

根据乘客归类的类型数量，结合公交车在类间时间段内的行驶距离与公交线路站点间的固定距离进行乘客上车站点的估计。

其中，在对同一公交车上刷卡乘车的乘客的刷卡时间数据进行聚类分析，确定乘客的乘车站点的步骤中，包括步骤：

选取线路信息中的一条公交线路的一趟公交车，其行驶的总站点数设定为S，站点序列为s＝(1,2,3,…,S)；

第i个站点到第i+1站点之间距离设为d(i，i+1)，该线路由始发站到终点站的全程距离为D，则有

记T为公交车一次出行的全程行驶时间，则

T＝(t₁-t_n)+ε

其中，t₁为第一个乘客的刷卡时间，t_n为最后一个乘客的刷卡时间，ε为调整系数；

公交车行驶的平均速度记为V，V＝D/T；

依次统计公交线路上相邻两个站点间的距离d(i，i+1)，取其中的最小值，标记为D_min，那么聚类的最小值即为公交车以V的平均速度行驶D_min所用的时间，记为T_min；

计算一辆公交车在一次行驶过程中所记录的刷卡时间序列的相邻两次刷卡时间的差值，将得到一个表示时间差的数组序列，将此序列内的每一项依次与最小时间T_min做比较，当相邻两次刷卡时间的差值大于或等于最小距离T_min时，则这两次刷卡时间分别在不同的两个站点被记录，对应的两位乘客则分别在不同的两个站点上车，应归为不同的两类；当相邻两次刷卡时间的差值小于最小距离T_min时，则这两次刷卡时间是在同一个站点被记录，对应的两位乘客则在相同的一个站点上车，归为同一类。

其中，在根据乘客归类的类型数量，结合公交车在类间时间段内的行驶距离与公交线路站点间的固定距离进行乘客上车站点的估计的步骤中，包括步骤：

在相邻的两类中，前一类中最晚刷卡乘车的上车时间和紧邻后一类中最早的上车时间之间的间隔，记为Δt(k-1，k)，其中k为第k类；

公交车在相邻两类间的行驶距离为Δd(k-1，k)，计算公式如下：

Δd(k-1，k)＝Δt(k-1，k)×V×α

其中，考虑到公交车在行驶过程中受到交通信号灯的影响，在时间差的基础上引入系数α进行调整；

将公交始发站归为第一类站点，通过计算公交车在第一类与第二类之间的行驶距离Δd(l，2)，以及第一类上车站点与每一个候选站点间的固定距离d(c¹，c¹+i)，再依次计算公交车行驶距离Δd(l，2)与每一个固定距离d(c¹，c¹+i)之间差的绝对值，绝对值最小的即为第二类的上车站点；

当无乘客上车的站点数减少为零之前，第C^k类所对应的上车站点c^k的估计模型设定为：

C^k＝C^k-1+i→min(|d(c^k-l，c^k-1+i)-Δd(k-l，k)|)

Δd(k-1，k)＝Δt(k-1，k)×V×α’

i＝1，2，3…Δs_k-1

其中，α’是用于调整一辆公交车一次出行的全程行驶时间。

其中，公交IC卡所记录的最后一位上车的乘客上车的站点随机变化，设定系数α’时根据不同线路特征进行调整。

其中，BP神经网络的输入样本数据中，乘车时间是否高峰时段通过公交***的数据库获取，天气情况、日期、当天是否为节假日则通过历史数据获得。

其中，利用天气情况、乘车时间是否高峰时段、日期、当天是否为节假日作为输入数据，以公交车站客流量作为训练数据，对公交站点乘客客流量预测模型进行训练。

其中，在训练过程中，利用MATLAB软件对模型进行仿真，利用仿真软件确定BP神经网络层数、输入层参数和输出层参数的、隐含层的节点数量、学习速率、BP人工神经网络传递函数和BP人工神经网络算法，以使得误差最小。

其中，通过对公交客流量预测，合理安排公交车的出行，为乘客创造良好的乘车环境。

区别于现有技术，本发明提供了一种基于BP神经网络的公交客流量预测方法，通过对乘客乘车记录建立数据仓库，分析线路的客流量，利用聚类分析对各线路站点乘客上车人数进行统计，特别是在一些站点没有刷卡记录的情况下，如何实现刷卡记录与站点进行精确匹配；利用神经网络对客流量进行预测分析，根据预测结果对公交车辆进行合理调度，这样使得公交的调度水平提高到一个比较理想的高度，提高公交调度管理水平，提高乘客乘车的满意度，满足市民的出行。

附图说明

为了更清楚地说明本发明实施方式的技术方案，下面将对实施方式中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1是本发明提供的一种基于BP神经网络的公交客流量预测方法的流程示意图。

图2是本发明提供的一种基于BP神经网络的公交客流量预测方法的公交IC数据的流动路径示意图。

图3是本发明提供的一种基于BP神经网络的公交客流量预测方法中包含一个隐含层的BP网络模型的结构示意图。

具体实施方式

为使本发明实施方式的目的、技术方案和优点更加清楚，下面将结合本发明实施方式中的附图，对本发明实施方式中的技术方案进行清楚、完整地描述，显然，所描述的实施方式是本发明一部分实施方式，而不是全部的实施方式。基于本发明中的实施方式，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式，都属于本发明保护的范围。因此，以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式，都属于本发明保护的范围。

参照图1所示，本发明提供了一种基于BP神经网络的公交客流量预测方法，包括：

S110：从公交***数据库获取指定时间间隔内的公交原始数据信息，根据公交原始数据信息，建立对乘客上车站点的估计模型，作为公交客流量的估计模型。

基本的IC卡收费***包括了数据库、资金结算中心、IC卡管理中心、用户交往层及用户与管理接口等部分。用户交往层主要是持卡人购卡、充值、消费等行为，个别时候需要挂失和查询等。***的核心部分是IC卡管理中心、资金结算中心和数据库，它们在***后台运行，进行资金结算、数据读取和保存、IC卡管理等操作根据公交IC卡收费***的特征，可以将公交IC卡收费***看作由三个子***组成的***，包括：充值网点***、消费网点***、中心***。

公交IC数据是在公交乘客上车刷卡的同时被记录。乘客刷卡一次车载读卡器便相应记录一条刷卡数据，存储在车载读卡器的数据存储设备中，数据汇集器负责将车载读卡器中存储的数据汇集到各分公司IC卡管理***，公交IC卡***管理中心从各分公司的IC卡管理中心汇总数据，最终数据被存储在数据库中。公交IC数据在***中的流动路径如图2所示。

本发明所需要的数据挖掘基础数据除公交IC卡数据外，还包括公交行车时刻记录表、公交线路站点信息以及车辆行驶信息。公交行车时刻记录表是：以线路号为单位，根据车辆发车情况所记录的每辆车在运营过程中从起始站点的实际发车时刻。公交线路站点信息包括站点位置、站点编号、站点名称、相邻站距离、站点数。车辆行驶信息是车辆运营过程中的行驶速度等指标。这些信息可以向公交公司索取和做相关的公交调查获取。

在数据仓库设计过程中数据模式的设计至关重要，它是数据仓库设计中的核心部分。数据仓库建立模型的过程实际上是一个从关系型、规范式的数据模型向多维模型转换的过程。在基于IC卡的数据仓库设计过程中，我们采用通用的三层数据建模方式，即概念模型设计、逻辑模型设计和物理模型设计。概念模型设计提供了对IC卡数据分析的一个整体概括性描述；逻辑数据建模层面向IC卡数据仓库界定范围的全局及其应用；物理数据设计使用物理限制，如空间、特性和数据的物理分布，目的是设计实际的物理数据。

建立公交IC卡数据仓库所需的数据应包括：IC卡刷卡信息、公交站点信息、行车时刻记录、公交线路信息、乘客信息。

A、IC卡刷卡信息设定：刷卡编号、乘客***、线路号、刷卡日期、刷卡时刻、车辆号、刷卡站点；

B、乘客信息设定：乘客***、姓名、出生年月、职业、卡类型；

C、线路站点信息设定：站点名称、站点长度、站点坐标；

D、乘坐车辆信息设定：车辆号、发车日期、发车时刻、发车站点、到站日期、到站时刻、到达站点；

E、线路信息：线路号、线路站点次序编号、公交站点名称。

本发明在进行建立对乘客上车站点的估计模型的步骤中，以全线一票式为例进行说明，即无需下车刷卡。

由于公交定线定站的运营特征，以及城市居民的出行特点，决定了公交出行在路线的选择和客流的分布上具有一定的规律性和稳定性。

由于公交车辆沿公交线路的站点序列停车顺序的不可逆性，以及公交IC卡***数据所记录乘客刷卡上车时间的不可逆性，***乘客的上车站点估计方法存在逻辑顺序，即刷卡时间早的乘客先于刷卡时间晚的乘客上车，其上车的站点顺序只有两种状况：

第一，上车站点相同。这种情况下，相邻两位乘客间的刷卡间隔比较短。

第二，刷卡时间早的乘客上车时所在的站点位于刷卡时间晚的之前。这种情况下相邻两个刷卡间隔比较长。

通过对刷卡数据进行分析，使乘客的刷卡上车时间序列与公交线路的站点序列相对应，可建立符合逻辑的乘客上车站点估计模型。除此之外，公交乘客于相同公交站点刷卡上车时，其先后刷卡间隔较短，公交乘客于不同公交站点刷卡上车时，其先后刷卡间隔较长。

为提高估计的准确度，我们选取公交车在相距最短的相邻两个站点间的行驶时间作为聚类的最小距离。以南通公交22路为例，记22路的总站点数为S，站点序列为s＝(1,2,3,…,S)。第i个站点到第i+1站点之间距离是d(i，i+1)，该线路由始发站到终点站的全程距离为D，该线路全程距离可以累加相邻两个站点的距离d(i，i+1)取得。如下所示

假定公交车在始发站开始发车时，一定有乘客刷卡上车，行驶至终点站时一定没有乘客刷卡上车。公交车行驶至终点站时虽然没有乘客刷卡上车，但是通过给予最后一位乘客刷卡上车时间一个调整系数，即可估计出公交车的全程行驶时间。记T为一辆公交车一次出行的全程行驶时间，全程行驶时间的计算过程如下所示。

T＝(t₁-t_n)+ε

t₁为最早一个乘客刷卡时间，t_n为最后一个乘客刷卡时间，ε为调整系数。

由公交车的全程行驶距离D和全程行驶时间T，可以计算得到公交车在这一次出行中行驶的平均速度V，计算过程如下所示。

V＝D/T

依次统计公交线路上相邻两个站点间的距离d(i，i+1)，取其中的最小值，标记为D_min，那么聚类的最小值即为公交车以V的平均速度行驶D_min所用的时间，记为T_min。计算一辆公交车在一次行驶过程中所记录的刷卡时间序列的相邻两次刷卡时间的差值，将得到一个表示时间差的数组序列，将此序列内的每一项依次与最小时间T_min做比较。当相邻两次刷卡时间的差值大于或等于最小距离T_min时，则这两次刷卡时间分别在不同的两个站点被记录，对应的两位持卡者则分别在不同的两个站点上车，应归为不同的两类；当相邻两次刷卡时间的差值小于最小距离T_min时，则这两次刷卡时间是在同一个站点被记录，对应的两位持卡者则在相同的一个站点上车，应归为同一类。依次分析判断后，将会得到一组类序列，记总类数为C类序列为(c1,c2,c3…,C)，类序列与公交线路站点序列的匹配将在此基础上完成，以最终实现乘客上车站点的估计。

刷卡时间序列进行聚类分析后，被分为C种不同的类，同一类内所有乘客的上车站点相同，分属于不同类的公交乘客不在同一个公交站点上车，因此完成类序列和车辆所停靠公交站点序列的匹配，即实现了每一个类内所有公交乘客上车时所在的公交站点估计。

为了提高估计的准确度，在计算公交车从一个类时间点行驶到紧邻的下一个类时间点所走的距离时，利用类内平均上车时间将使得计算误差增大，因此利用前一类中最晚刷卡乘车的上车时间和紧邻后一类中最早的上车时间之间的间隔，记为Δt(k-1，k)，其中k为第k类。考虑到公交车在行驶过程中受到交通信号灯的影响，所以在此时间差的基础上引入系数α进行调整，记公交车在相邻两类间的行驶距离为Δd(k-1，k)，计算公式如下。

Δd(k-1，k)＝Δt(k-1，k)×V×α

第一种情况，所得聚类数＝公交站点总数-1，即C＝S-1。此情况表明无人乘车的公交站点只出现于公交线路的终点站处，此时公交乘客上车时所在的公交站点估计，可依据刷卡时间的先后顺序，将各个类与各个站点依次匹配即可。

第二种情况，所得聚类数<公交站点总数-1，即C<S-1。此情况表明无人乘车的公交站点不仅出现于公交线路的终点站处，而且还出现于其他站点处。在这种情况下，可结合公交车在类间时间段内的行驶距离与公交线路站点间的固定距离进行乘客上车站点的估计。

由实际考察情况可知，一般情况下，公交车在始发站发车时都有乘客刷卡上车，行驶至终点站时没有乘客刷卡上车。因此我们假定公交线路的第一个站点即为第一类的上车站点,公交线路的终点站不计算在待匹配站点内，据此可以从第二类开始估计。当估计第二类的上车站点时，可供匹配的站点序列为{2，，3，4，...，S-1}，其中有S-1-C个站点没有乘客上车，记为Δs1，即Δs1＝S-1-C，因此第二类的上车站点只能是候选站点序列(2，2+1，2+2，2+Δs1)中的一个站点。在下一步估计第二类的上车站点时，可通过计算公交车在第一类与第二类之间的行驶距离Δd(l，2)，以及第一类上车站点与每一个候选站点间的固定距离d(c¹，c¹+i)，再依次计算公交车行驶距离Δd(l，2)与每一个固定距离d(c¹，c¹+i)之间差的绝对值，绝对值最小的即为第二类的上车站点。完成第二类上车站点的估计后，无乘客上车的站点数会减少，减少量为第二类上车站点与第一类上车站点间隔的站点数。然后再估计第三类的上车站点，依次进行各类的上车站点估计，无乘客上车的站点数量满足如下式的变化规律：

当无乘客上车的站点数减少为零时，表明剩余的待匹配站点都有乘客上车，则令剩余的没有估计站点的类依次与待匹配的站点相匹配。综上可知，当无乘客上车的站点数减少为零之前，第C^k类所对应的上车站点c^k的估计模型如下所示。

C^k＝C^k-1+i→min(|d(c^k-l，c^k-I+i)-Δd(k-1，k)|)

Δd(k-l，k)＝Δt(k-l，k)×V×a’

i＝1，2，3…Δs_k-1

在估计乘客的上车站点时，引入了系数α’系数，α’是用于调整一辆公交车一次出行的全程行驶时间，基于的前提是公交线路的终点站没有人上车，而公交IC卡所记录的最后一位上车的乘客可能是在倒数第二或第三站，是一个随机变化的过程，所以系数α的设定需要根据不同线路特征来调整。

S120：构建BP神经网络，以天气情况、乘车时间是否高峰时段、日期、当天是否为节假日作为BP神经网络的输入，以公交客流量的估计模型作为BP神经网络的训练数据，进行BP神经网络的训练，跟俄经济训练结果对公交客流量进行预测。

一般说来，公交的客流量与星期、天气、是否高峰期间、路段、方向等有着密切的关系，很难用一个具休的模型来描述。BP神经网络具有较强的自我学习能力，能够充分挖掘数据之问的关系，最大限度地逼近非线性复杂***，因此，本文采用BP神经网络来映射输出(客流量)和输入(天气、是否高峰时段、星期、节假日)的关系，通过BP神经网络来预测客流量。

BP(back propagation)神经网络是一种按误差逆传播算法训练的多层前馈网络，是目前应用最广泛的神经网络模型之一。BP算法的思想是，学习过程由信号的正向传播与误差的反向传播两个过程组成。正向传播时，输入样本从输入层传入，经各隐层逐层处理后，传向输出层。若输出层的实际输出与期望的输出不符合，则转入误差的反向传播阶段。误差反传是将输出误差以某种形式通过隐层向输入层反传，并将误差分摊给各层的所有单元，从而获得各层单元的误差信号，此误差信号即作为修正各单元权值的依据。这种信号正向传播与误差反向传播的各层权值调整过程，是周而复始地进行的。权值不断调整的过程，也就是网络的学习训练过程。此过程一直进行到网络输出的误差减少到可以接受的程度或进行到预先设定的学习次数为止。

影响公交客流量的因素有很多，通过分析出得到以下影响公交客流量的因素。

乘车时间是否高峰时间段：影响公交客流量的因素有很多中，不同的时刻会对车辆运行产生影响，是否高峰期对客流量影响非常大，所以是否高峰期是一个输入变量。

天气情况：不同的天气会对车辆运行产生明显的影响，例如晴天车辆运行受天气影响最小，乘客在公交站台等候相对比较少，到了雨天公交运行速度慢，在公交站台上聚集的乘客相对就比较多。

日期情况：一周当中每一天，公交客流和道路情况都有所不同，例如，南通市每周一早上上班时间和周五下午下班时间的客流明显要高出平常同一时段的客流。

节假日：重大节日也会对客流造成巨大变化。

BP神经网络需要大量数据作为输入、输出样本，因此在构建BP神经网络前，首先要做的工作就是获取这些数据。利用先进的信息技术，可以获取乘客刷卡乘车数据。天气、星期情况、是否节日这些输入样本则可以在大量的历史数据中获得。输出样本的也就是客流量数据我们可以利用数据挖掘中聚类算法可以获得，同时公交企业采用先进的管理信息技术已经积累了大量的运营数据，这些数据不仅仅作为公交计划、运营指标的统计分析，也为BP神经网络的训练、预测提供了丰富的样本。

BP神经网络模型是由一个输入层，一个输出层以及一个或多个隐含层构成。在同一层中各神经元之间相互独立。输入信号从输入层神经元，依次通过各个隐含层神经元，最后传递到输出层神经元，图3中给出了包含一个隐含层的BP网络模型结构，隐含层神经元个数为m。理论研究表明：具有一个输入层，一个线性输出层以及Sigmoid型激活函数的隐含层的BP网络能够以任意精度逼近任何连续可微函数。

三层感知器中，输入向量为X＝(x₁，x₂…x_i…x_n)^T，图2中x₀＝-1是为隐层神经元引入阈值而设置的，隐层输入向量为Y＝(y₁,y₂…y_j…y_m,)^T，图中y₀＝-1是为输出层神经元引入阈值而设置的；输出层输出向量O＝(o₁,o₂,…,o_k,o_l)^T，期望输出向量为d＝(d₁,d₂,…,d_k,d_l)^T，输入层到隐层之间的权值矩阵用V表示，V＝(V₁,V₂,…,V_j,…V_m)^T，隐层到输入层之间的权值矩阵用W表示，W＝(W₁,W₂,…,W_k’…W_l)^T，下面分析各层信号之间的关系。

对于输入层：

o_k＝f(net_k)k＝1,2,…，l，

对于隐层y_j＝f(net_j)j＝1,2,…,m，

以上两式中，激活函数都是sigmoid函数；

f(x)具有连续、可导的特点且f’(x)＝f(x)[1-f(x)]。

根据以上的公式，我们可以推导出权值调整量Δw_jk和Δv_jk分别是

为了能够预测公交车站客流量，选用的两层BP神经网络模型作为我们整个项目的模型，在本项目中，每个输入向量共有4个元素，分别是天气、星期、是否高峰时段、线路方向。

输出变量为1个，即该站点公交车流量。

该模型中利用天气、是否高峰时段、星期、线路方向等相关数据作为输入数据，以公交车站客流量作为训练数据，对公交站点乘客客流量预测模型进行训练。在训练过程中，利用MATLAB软件对该模型进行仿真，利用仿真软件确定BP神经网络层数、输入层参数和输出层参数的、隐含层的节点数量、学习速率、BP人工神经网络传递函数和BP人工神经网络算法，以使得误差最小。最后对公交客流量进行预测，通过预测，合理安排公交车的出行，为乘客创造良好的乘车环境。

以上所述仅为本发明的优选实施方式而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于BP神经网络的公交客流量预测方法，其特征在于，包括：

2.根据权利要求1所述的基于BP神经网络的公交客流量预测方法，其特征在于，公交原始数据信息至少包括：

乘客信息，包括：客***、姓名、出生年月、职业、卡类型；

3.根据权利要求2所述的基于BP神经网络的公交客流量预测方法，其特征在于，在根据公交原始数据信息，建立对乘客上车站点的估计模型的步骤中，包括步骤：

4.根据权利要求3所述的基于BP神经网络的公交客流量预测方法，其特征在于，在对同一公交车上刷卡乘车的乘客的刷卡时间数据进行聚类分析，确定乘客的乘车站点的步骤中，包括步骤：

记T为公交车一次出行的全程行驶时间，则

T＝(t₁-t_n)+ε

公交车行驶的平均速度记为V，V＝D/T；

5.根据权利要求4所述的基于BP神经网络的公交客流量预测方法，其特征在于，在根据乘客归类的类型数量，结合公交车在类间时间段内的行驶距离与公交线路站点间的固定距离进行乘客上车站点的估计的步骤中，包括步骤：

Δd(k-1，k)＝Δt(k-1，k)×V×α

C^k＝C^k-1+i→min(|d(c^k-1，c^k-1+i)-Δd(k-1，k)|)

Δd(k-1，k)＝Δt(k-1，k)×V×a’

i＝1，2，3…Δs_k-1

6.根据权利要求5所述的基于BP神经网络的公交客流量预测方法，其特征在于，公交IC卡所记录的最后一位上车的乘客上车的站点随机变化，设定系数α’时根据不同线路特征进行调整。

7.根据权利要求1所述的基于BP神经网络的公交客流量预测方法，其特征在于，BP神经网络的输入样本数据中，乘车时间是否高峰时段通过公交***的数据库获取，天气情况、日期、当天是否为节假日则通过历史数据获得。

8.根据权利要求1所述的基于BP神经网络的公交客流量预测方法，其特征在于，利用天气情况、乘车时间是否高峰时段、日期、当天是否为节假日作为输入数据，以公交车站客流量作为训练数据，对公交站点乘客客流量预测模型进行训练。

9.根据权利要求8所述的基于BP神经网络的公交客流量预测方法，其特征在于，在训练过程中，利用MATLAB软件对模型进行仿真，利用仿真软件确定BP神经网络层数、输入层参数和输出层参数的、隐含层的节点数量、学习速率、BP人工神经网络传递函数和BP人工神经网络算法，以使得误差最小。

10.根据权利要求9所述的基于BP神经网络的公交客流量预测方法，其特征在于，通过对公交客流量预测，合理安排公交车的出行，为乘客创造良好的乘车环境。