CN109308543B - 基于ls-svm和实时大数据的地铁短期客流预测方法 - Google Patents
基于ls-svm和实时大数据的地铁短期客流预测方法 Download PDFInfo
- Publication number
- CN109308543B CN109308543B CN201810945933.6A CN201810945933A CN109308543B CN 109308543 B CN109308543 B CN 109308543B CN 201810945933 A CN201810945933 A CN 201810945933A CN 109308543 B CN109308543 B CN 109308543B
- Authority
- CN
- China
- Prior art keywords
- passenger
- passenger flow
- station
- svm
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000012546 transfer Methods 0.000 claims abstract description 62
- 238000012549 training Methods 0.000 claims abstract description 21
- 238000005516 engineering process Methods 0.000 claims abstract description 16
- 238000012216 screening Methods 0.000 claims abstract description 14
- 239000011159 matrix material Substances 0.000 claims description 49
- 239000013598 vector Substances 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 12
- 230000000873 masking effect Effects 0.000 claims description 9
- 238000012544 monitoring process Methods 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 6
- 230000003287 optical effect Effects 0.000 claims description 6
- 238000012353 t test Methods 0.000 claims description 6
- 238000000692 Student's t-test Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000012935 Averaging Methods 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 230000009977 dual effect Effects 0.000 claims description 3
- 230000008030 elimination Effects 0.000 claims description 3
- 238000003379 elimination reaction Methods 0.000 claims description 3
- 238000007689 inspection Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 3
- 238000012843 least square support vector machine Methods 0.000 description 38
- 230000000694 effects Effects 0.000 description 6
- 238000012706 support-vector machine Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012821 model calculation Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 210000000003 hoof Anatomy 0.000 description 1
- 230000008676 import Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Train Traffic Observation, Control, And Security (AREA)
Abstract
本发明公开了基于LS‑SVM和实时大数据的地铁短期客流预测方法,包括步骤:步骤一、获取获得乘客进出站点、进出站时间,得到乘客历史出行站点OD系数;步骤二、对涉及环形线路路径选择的乘客,采用Logit模型计算其路径选择概率;步骤三、采用历史OD系数训练LS‑SVM模型得到进站乘客预测分布站点和线路上下行比例系数;采用进出站客流数据训练LS‑SVM模型得到乘客进出站预测量;步骤四、采用OD系数、Logit模型计算换乘站点的换乘比例,通过实时视频识别技术进行修正;步骤五、获得乘客在路网的分布并更新路网。本发明通过筛选***获得有用的实时数据,并对预测结果进行修正,从而获得准确性和实时性更高的预测结果。
Description
技术领域
本发明提供一种基于LS-SVM和实时大数据的地铁短期客流预测方法,即提供一种基于AFC刷卡数据和路径选择概率的地铁站点和线路断面客流量的预测方法,属于计算机应用技术领域。
背景技术
随着城市地铁建设的快速发展,地铁线网变得复杂,出行可选择的路径多样化。短期线路客流量对乘客路径选择十分重要,如果乘客能够获知5分钟后、30分钟后,甚至是60分钟后的地铁站点和线路的客流量,就可以根据预测客流量及时调整出行计划,避开拥挤线路,对地铁网络来说可以达到均衡客流的目的。短期地铁预测客流量能够及时提醒地铁管理人员在运行过程中潜在的安全隐患,工作人员可根据客流量及时调整相关设备的工作状态,使地铁运行过程达到最佳状态。
现有一种基于SVM预测乘客出行概率的轨道交通客流预测方法,其步骤如下:
一:采集轨道交通历史数据,包括统计乘客出行的起始站点、目的站点,进站时刻和出站时刻;
二:基于历史数据,统计乘客出行比例,针对每一个地铁站,统计乘客站点间的OD系数;
三:利用统计得到的出行比例数据训练最小二乘支持向量机即LS-SVM,预测进站乘客的终点站比例系数;
四:存储预测得到的出行概率,供实时客流预测模块使用;
五:获取实时进站客流数据,起始站点和进站时间;
六:将实时乘客与预测的终点站比例系数相乘,得到乘客出行目的站点
七:结合列车的发车间隔,模拟乘客出行,计算乘客到达和离开每一个站点的时间,并更新全路网客流。
现有方法只是依据历史客流和实时进站客流进行预测,其不足点在于没有对实时进站客流的变化趋势做出判断,影响短期客流预测的效果,在环形线路的路径选择中没有做研究,忽略地铁客流清分,影响站点和线路客流预测。
因此在预测的过程中,有必要将历史数据与实时数据相结合,研究地铁清分路径选择概率,利用实时数据对预测规律进行修正,从而获得预测结果。
发明内容
本发明提出在原有的基于最小二乘法的支持向量机预测方法基础上引入地铁站台空间内的实时视频识别数据和AFC***的大数据,通过筛选***获得有用的实时数据,对预测结果进行修正,从而获得准确性和实时性更高的短时预测结果。
本发明采用如下技术方案实现:
基于LS-SVM和实时大数据的地铁短期客流预测方法,包括步骤:
步骤一、获取AFC***IC卡刷卡数据,获得乘客进出站点、进出站时间,得到乘客历史出行站点OD系数;
步骤二、对涉及环形线路路径选择的乘客,采用Logit模型计算其路径选择概率;
步骤三、采用历史OD系数训练LS—SVM模型,得到进站乘客预测分布站点和线路上下行比例系数;采用进出站客流数据训练LS—SVM模型,得到乘客进出站预测量。
步骤四、采用OD系数和上下行比例系数、Logit模型计算换乘站点的换乘比例,通过实时视频识别技术进行修正;
步骤五、将进站乘客数据与上下行比例系数和换乘系数相乘获得乘客在路网的分布,发布乘客流量并更新路网。
进一步地,步骤一中,所述的获取AFC***IC卡刷卡数据具体是通过AFC***获取乘客进出站闸机中的IC卡数据。
进一步地,获取AFC***IC卡刷卡数据具体包括步骤:
将AFC***中获得的IC卡刷卡数据导入到SQL数据中进行储存;
采用软件先对票卡数据进行字段筛选,根据推算需要仅留下进站编号、进站时间、出站编号等字段;
按照站点、时间进行进出站刷卡信息数量的统计,将输出结果导出到表中,即得到统计时段内各个站点的进出站客流量。
进一步地,步骤二中,所述的路径选择概率采用Logit模型计算中的Logit模型具体是综合采用站点间的距离和问卷获取的乘客乘坐舒适度得到。
进一步地,步骤二中,所述的Logit模型采用多元Logit模型,即MNL模型,所述MNL模型中,地铁环线站点间的路径可被划分为顺时针方向和逆时针方向,同时,通过Logit模型计算历史的方向系数和换乘系数,包括步骤:
通过测量获得OD间的距离,从而获得每条路径的出行时间后建立顺时针和逆时针路径的出行时间矩阵;
通过调查问卷,反映乘客对多种出行条件综合的评价,最终获得综合舒适度矩阵后建立顺时针和逆时针路线的出行舒适度矩阵;
通过IC卡数据筛选获得OD信息后得到历史OD矩阵;
基于上述数据在Transcad中求得Logit模型的参数估计以及t-test检验,从而获得效用函数;
采用以下Logit模型公式计算得到乘客分担率矩阵:
基于乘客OD矩阵和乘客分担率矩阵,通过矩阵中相对应的数值相乘获得顺时针和逆时针路径的乘客分布矩阵;
通过Logit模型得到乘客OD矩阵中的路径划分比例以及每条路径的乘客分布量,基于所述乘客分布量,求得历史的方向系数和换乘系数。
进一步地,步骤三中,所述LS—SVM模型的核函数求解过程包括:
在非线性情况下,假设给定的样本为(x1,y1),(x2,y2),…,(xm,ym),其中,xi∈Rk表示输入向量,yi∈R表示输出向量并且yi=f(xi),i=1,2,…,m,作非线性映射 是特征映射,H是特征空间,则被估计函数f(x)有如下形式:
其中,w是H的权向量,b∈R是偏值,于是LS-SVM估计非线性函数为以下特征空间中的最优问题:
式中,ei∈Rk,i=1,2,…,m为误差变量;
由于w可能为无限维的,所以直接计算上式比较困难,因此,将这一规划问题转化到其对偶空间中,定义Lagrange函数:
式中ai∈R为Lagrange乘子,最优解的条件如下:
消去w与ei,求解的优化问题可转化为求解如下线性方程:
其中向量θ=(1,1,…,1)T,a=(a1,a2,…,am)T,Y=(y1,y2,…,ym)T,Ω为一矩阵,其定义为:
通过求上述公式,可得a,b的值,得到被估计函数f(x)的表达式,最终函数的表达式为:
选取RBF函数作为LS-SVM预测过程中的核函数K(x,xi):
K(x,xi)=tanh(γ(x·xi)+c)。
进一步地,所述采用进出站客流数据训练LS—SVM模型,得到乘客进出站预测量具体包括:
输入并读取包括历史出站客流量、历史方向系数的训练样本,并对读取的数据做归一化处理;
设定LS-SVM中gam参数以及RBF核函数涉及的参数,接着通过trainlssvm函数实现预测模型的建立;
通过训练样本获得LS-SVM模型中的向量以及对应的阀值,并完成预测模型的建立;
最后,通过MATLAB读取需要预测的预测样本并利用已经建立的预测模型对样本数值进行预测得到乘客进出站预测量。
进一步地,步骤四中,所述的实时视频识别技术进行修正具体是通过视频识别技术获取换乘通道内换乘人数,修正LS—SVM和Logit模型获得的换乘系数。
进一步地,所述通过视频识别技术获取换乘通道内换乘人数具体包括:
基于OpenCV并采用光流法将跟踪前与跟踪后的点通过坐标变换归一化到100*100的空间平面中,通过统计前后的点的移动矢量,通过求平均值可以得到总体的移动速度大小与方向;
然后,根据目标监测区域构建一个近处值比较小,远处值比较大,监测区域以外均为0的掩图,将该图与背景差分的图做点乘运算,再统计全图的值的总和,即可用于估计当前画面的客流拥挤度;
最后根据历史客流拥挤度与历史客流量的百分位数的对应关系,将拥挤度转化为具体客流量。
进一步地,步骤五中,所述的发布乘客流量并更新路网过程中,其中5分钟预测值采用实时进站客流的预测值,30分钟、60分钟的预测值采用历史同时期数据的预测值。
相比现有技术,本发明在基于最小二乘法的支持向量机预测方法基础上引入地铁站台空间内的实时视频识别数据和AFC***的大数据,同时考虑到环形线路的路径选择涉及的的地铁客流清分,通过筛选***获得有用的实时数据,对预测结果进行修正,从而获得准确性和实时性更高的短时预测结果,不仅能依据历史客流和实时进站客流进行预测,还能对实时进站客流的变化趋势做出判断。
附图说明
图1为本发明实施例的原理示意图。
图2是数据筛选示意图。
图3是“珠江新城—车陂南—万胜围—客村”环线示意图。
图4是乘客分担率矩阵。
图5是方向系数的预测值与真实值的对比。
图6是方向系数的预测值与真实值的误差系数。
图7是珠江新城站四周断面示意图。
图8是换乘系数的预测值与真实值的对比。
图9是换乘系数的预测值与真实值的预测误差。
图10是线路断面客流量计算结果示意图(5分钟)。
图11是实时视频识别效果。
具体实施方式
下面结合具体实施例对本发明的发明目的作进一步详细地描述。
如图1所示,一种基于LS-SVM和实时大数据的地铁短期客流预测方法,包括步骤:
步骤一、获取AFC***IC卡刷卡数据,获得乘客进出站点、进出站时间,得到乘客历史出行站点OD系数;
步骤二、对涉及环形线路路径选择的乘客,采用Logit模型计算其路径选择概率;
步骤三、采用历史OD系数训练LS—SVM模型,得到进站乘客预测分布站点和线路上下行比例系数;采用进出站客流数据训练LS—SVM模型,得到乘客进出站预测量。
步骤四、采用OD系数和上下行比例系数、Logit模型计算换乘站点的换乘比例,通过实时视频识别技术进行修正;
步骤五、将进站乘客数据与上下行比例系数和换乘系数相乘获得乘客在路网的分布,发布乘客流量并更新路网。
步骤一中,所述的获取AFC***IC卡刷卡数据具体是通过AFC***获取乘客进出站闸机中的IC卡数据。
获取AFC***IC卡刷卡数据具体包括步骤:
将AFC***中获得的IC卡刷卡数据导入到SQL数据中进行储存;
采用软件先对票卡数据进行字段筛选,根据推算需要仅留下进站编号、进站时间、出站编号等字段;
按照站点、时间进行进出站刷卡信息数量的统计,将输出结果导出到表中,即得到统计时段内各个站点的进出站客流量。
步骤二中,所述的路径选择概率采用Logit模型计算中的Logit模型具体是综合采用站点间的距离和问卷获取的乘客乘坐舒适度得到。
步骤二中,所述的Logit模型采用多元Logit模型,即MNL模型,所述MNL模型中,地铁环线站点间的路径可被划分为顺时针方向和逆时针方向,同时,通过Logit模型计算历史的方向系数和换乘系数, 包括步骤:通过测量获得OD间的距离,从而获得每条路径的出行时间后建立顺时针和逆时针路径的出行时间矩阵;通过调查问卷,反映乘客对多种出行条件综合的评价,最终获得综合舒适度矩阵后建立顺时针和逆时针路线的出行舒适度矩阵;通过IC卡数据筛选获得OD信息后得到历史OD矩阵;基于上述数据在Transcad中求得Logit模型的参数估计以及t-test检验,从而获得效用函数;采用以下Logit模型公式计算得到乘客分担率矩阵:
其中,是乘客从i到j的第K中交通方式乘客分担概率;基于乘客OD矩阵和乘客分担率矩阵,通过矩阵中相对应的数值相乘获得顺时针和逆时针路径的乘客分布矩阵;通过Logit模型得到乘客OD矩阵中的路径划分比例以及每条路径的乘客分布量,基于所述乘客分布量,求得历史的方向系数和换乘系数。
步骤三中,所述LS—SVM模型的核函数求解过程包括:
在非线性情况下,假设给定的样本为(x1,y1),(x2,y2),…,(xm,ym),其中,xi∈Rk表示输入向量,yi∈R表示输出向量并且yi=f(xi),i=1,2,…,m,作非线性映射 是特征映射,H是特征空间,则被估计函数f(x)有如下形式:
其中,w是H的权向量,b∈R是偏值,于是LS-SVM估计非线性函数为以下特征空间中的最优问题:
式中,ei∈Rk,i=1,2,…,m为误差变量。
由于w可能为无限维的,所以直接计算上式比较困难,因此,将这一规划问题转化到其对偶空间中,定义Lagrange函数:
式中ai∈R为Lagrange乘子,最优解的条件如下:
消去w与ei,求解的优化问题可转化为求解如下线性方程:
通过求上述公式,可得a,b的值,得到被估计函数f(x)的表达式,最终函数的表达式为:
选取RBF函数作为LS-SVM预测过程中的核函数K(x,xi):
K(x,xi)=tanh(γ(x·xi)+c)。
进一步地,所述采用进出站客流数据训练LS—SVM模型,得到乘客进出站预测量具体包括:
输入并读取包括历史出站客流量、历史方向系数的训练样本,并对读取的数据做归一化处理;
设定LS-SVM中gam参数以及RBF核函数涉及的参数,接着通过trainlssvm函数实现预测模型的建立;
通过训练样本获得LS-SVM模型中的向量以及对应的阀值,并完成预测模型的建立;
最后,通过MATLAB读取需要预测的预测样本并利用已经建立的预测模型对样本数值进行预测得到乘客进出站预测量。
步骤四中,所述的实时视频识别技术进行修正具体是通过视频识别技术获取换乘通道内换乘人数,修正LS—SVM和Logit模型获得的换乘系数。
所述通过视频识别技术获取换乘通道内换乘人数具体包括:
基于OpenCV并采用光流法将跟踪前与跟踪后的点通过坐标变换归一化到100*100的空间平面中,通过统计前后的点的移动矢量,通过求平均值可以得到总体的移动速度大小与方向;然后,根据目标监测区域构建一个近处值比较小,远处值比较大,监测区域以外均为0的掩图,将该图与背景差分的图做点乘运算,再统计全图的值的总 和,即可用于估计当前画面的客流拥挤度;最后根据历史客流拥挤度与历史客流量的百分位数的对应关系,将拥挤度转化为具体客流量。
步骤五中,所述的发布乘客流量并更新路网过程中,其中5分钟预测值采用实时进站客流的预测值,30分钟、60分钟的预测值采用历史同时期数据的预测值。
本发明客流预测研究原理:
(1)基于AFC***的SQL数据库建立及数据筛选***
将AFC***中获得的IC卡刷卡数据导入到SQL数据中进行储存,然后采用软件(Visual Basic)对数据筛选进行编程。先对票卡数据进行字段蹄选,根据推算需要仅留下进站编号、进站时间、出站编号等字段。然后按照站点、时间进行进出站刷卡信息数量的统计,将输出结果导出到表中,即得到统计时段内各个站点的进出站客流量。
(2)基于Logit模型的路径选择分配
本研究采用多元Logit模型(multinomial logitmode),MNL模型。通过TransCAD软件进行模型参数估计并进行统计量检验,利用问卷所得到的统计量进行检验。由于在本次交通预测模型只有地铁一种交通方式,选择不同的线径可被视为交通方式的选择。在MNL模型中,地铁环线站点间的路径可被划分为顺时针方向和逆时针方向。
要通过Logit模型计算历史的方向系数和换乘系数,首先要获得顺时针和逆时针方向的乘客分布矩阵。通过乘客OD矩阵和两个方向路径的乘客分担率相乘获得乘客分布矩阵。乘客OD矩阵可通过调查问卷获得乘客的OD矩阵。而要得到乘客分担率矩阵,首先要计算出 相关的效用函数。
此外,用于计算Logit模型的参数的乘客路径偏好性和舒适度的评估是通过乘客问卷收集的,模型参数通过问卷数据进行检验。
(3)基于最小二乘法的支持向量机预测模型
本发明采用基于最小二乘法的支持向量机方法来建立地铁的短期客流预测模型LS-SVM方法是用于寻找与训练样本最接近的估计函数。
本发明对于LS-SVM预测算法的求解过程可通过MATLAB中的LS-SVM工具箱实现,建立LS-SVM的算法步骤如下。首先,输入并读取如历史出站客流量、历史方向系数等训练样本,并对读取的数据做归一化处理。然后设定LS-SVM中的gam参数以及RBF核函数涉及的参数,接着通过trainlssvm函数实现预测模型的建立。通过训练样本,可获得LS-SVM模型中的向量以及对应的阀值,并完成预测模型的建立。最后,MATLAB读取需要预测的预测样本并利用已经建立的预测模型对样本数值进行预测。
在本文的LS-SVM预测模型中,基于时间序列方法得到样本空间,采用rbf核函数,根据历史数据调节参数。利用历史客流统计特征量,套用模型用于预测单日内不同时间段的方向系数、换乘系数以及进出站客流量。
(4)实时视频识别技术
1)光流法实现人群动向识别。
光流法是指利用图像序列中像素在时间域上的变化以及相邻帧 之间的相关性来找到上一帧跟当前帧之间存在的对应关系,从而计算出相邻帧之间物体的运动信息的一种方法。基于其原理可以通过对目标点附近进行匹配可以实现目标点的跟踪。
2)背景差分实现人群检测。
背景差分利用混合高斯背景建模法,该法是基于像素样本统计信息的背景表示方法,利用像素在较长时间内大量样本值的概率密度等统计信息(如模式数量、每个模式的均值和标准差)表示背景,然后使用统计差分(如3σ原则)进行目标像素判断,可以对复杂动态背景进行建模。
3)透视形变修正识别结果。
利用透视形变的原理矫正视频图像中乘客近大远小的畸变。透视形变的原理是基于矩阵的变换A=TB,T为变换矩阵,通过非奇异变换可以试矩阵从一个坐标投射到另一个坐标。
程序运行基于windows平台,运用OpenCV(Open Source Computer VisionLibrary)开源跨平台计算机视觉库。光流法可以实现跟踪,然而由于在镜头中人群并不会均匀分布,因此可以将跟踪前与跟踪后的点通过坐标变换归一化到100*100的空间平面中,通过统计前后的点的移动矢量,通过求平均值可以得到总体的移动速度大小与方向。
然后,根据目标监测区域构建一个近处值比较小,远处值比较大,监测区域以外均为0的掩图,将该图与背景差分的图做点乘运算,再统计全图的值的总和,即可用于估计当前画面的客流拥挤度。然后 再根据历史客流拥挤度与历史客流量的百分位数的对应关系,将拥挤度转化为具体客流量。
下面结合图3,以广州地铁线路的一个环线“珠江新城—车陂南—万胜围—客村”为实例进行解释说明。通过该环线历史IC卡进出站数据,统计客流特征量,验证预测模型的可行性。
本次预测主要以11月30日(周一)06:00-13:00的上半天的历史数据作为样本,对2015年12月07日(周一)中午12点45分的时刻的客流量进行预测。经过估测从乘客刷卡进站到站台上车平均等待时间为3分钟,因此需要筛选12:42-12:45这一时间段的进出站历史数据作为样本,并且要找到对应时间段的预测的上下行比例和换乘比例。
在客流拥挤度信息预测时划分成三个时间点的预测,分别是5分钟、30分钟以及60分钟后时刻客流拥挤度的信息预测。
现将站点编码为自然数,编码对应如下:
表2站点编码对应表
将数据储存到SQL数据库中,利用Visual Basic软件编程对数据库中的数据进行调用并筛选,最终显示计算所需要的数值。
如图2所示,通过数据筛选***,可以获得在11月30日中午12:00-13:00的历史进出站票务数据,通过进出站数据可以获得相应的 历史OD矩阵。下图为珠江新城地铁站在11月30日中午12:30-13:00的出站数据。
表3珠江新城12:30-13:00的出站客流量
数据处理模块是短期客流预测模型中的重要模块,在这个模块中,将基于历史数据计算相关客流特征量,如使用Logit模型计算换乘系数、方向系数,并使用LS-SVM模型对相关数据进行预测。实时数据也会在这个模块中被引入,以增加计算的精确度。
(1)计算历史方向系数和换乘比例:
将历史OD矩阵和相应的顺时针和逆时针乘客分担率矩阵(见图4)的对应值相乘即可得到乘客分布矩阵。
①乘客分担率矩阵
在乘客分担率矩阵的计算中,主要需要获得相应的效用函数。效用函数可以利用TransCAD软件,导入数据。估算MNL模型参数。
a.出行距离矩阵
b.表4顺时针距离矩阵
b.出行舒适度矩阵
舒适度包括车辆的内部的拥挤度、长距离行程的心理感受、路径换乘等。根据问卷调查,满意度设定如下:
表5满意度设定标准
根据问卷中乘客对各项满意度的评价,最终得到顺逆时针两个方向的综合舒适度。
表6顺时针综合舒适度矩阵
c.历史OD矩阵
表7历史OD矩阵
根据以上三组数据,TransCAD最终生成参数的估计值及t检验 如下表所示。
表8Logit模型参数及t检验
参数的t-Test检验绝对值均大于2,参数估计有效,则可求得其效用函数为:
最终,经Logit模型中的公式,可由TransCAD计算出相应的乘客分担率矩阵。
②受访者OD矩阵
受访者OD矩阵可以在调查乘客舒适度评价的问卷访问中同时获得。
表9受访者OD矩阵
最后,通过以上的受访者od矩阵和乘客分担率矩阵可计算获得顺时针和逆时针的乘客分布矩阵。然后通过乘客分布矩阵可以进一步计算获得预测方向系数和换乘比例,以此得到历史方向系数和换乘系数。
表10顺时针方向乘客分布矩阵
(2)预测方向系数和换乘系数
根据计算得到的历史方向系数和换乘系数,用LS-SVM预测模型预测对应时间段的相关系数。下面以珠江新城站的数据为例,作预测方向系数和换乘系数的数据示例。
①预测方向系数
根据历史方向系数利用LS-SVM预测的珠江新城站进、出站方向系数如下表所示。
表11预测珠江新城站进站方向系数(12:00-13:00)
表12预测珠江新城站出站方向系数(12:00-13:00)
以进站方向系数为例,进站后向西方向的进站方向系数的预测误差如图5和图6所示,进站方向系数的总体预测误差小于10%。
②预测换乘系数
如图7至9所示,根据历史换乘系数利用LS-SVM预测的珠江新城站四周,从断面2换乘到其他方向以及出站的乘客比例如下表所示。
表13珠江新城站预测换乘系数(12:00—13:00)
(3)实时获取进站客流量及预测出站客流量
在进站客流量的获得中,当预测时间间隔为5分钟时,进站客流量可利用AFC***实时获得;当预测时间间隔为30、60分钟时,进 站客流量可根据历史数据利用LS-SVM预测获得。
在出站客流量的获得中,考虑乘客从下车到出站刷卡以及刷卡数据的传输需要一定的时间,所以即使在5分钟的预测间隔中,实时出站客流量的获取需要一定时间差。因此,出站客流量的获取采用预测获得。通过AFC***得到各站点一定时间段内历史出站客流量后,通过LS-SVM模型可以预测指定时间段内各个站点相应的出站客流量。
表14预测出站客流与实时进站客流
(4)计算换乘客流量
由于处于平峰时期,因此采用预测换乘比例对换乘客流进行计算。以珠江新城(中心圆点)为例,其换乘至2号路段的换乘客流量:
H2=1137×0.093+685×0.133=1126
其中1137是6分钟前(包括换乘时间)6号路段的线路断面客流量;685是5号路段的线路断面客流量;0.093和0.133为其分别对应的换乘比例。
表15换乘站点换乘客流量
数据计算模块根据本文的短期客流预测模型中的站点客流量以及线路断面客流量的计算公式,可以计算出在不同预测时间间隔下的最终的站点客流量和线路断面客流量。
(1)站点客流量计算:
①5分钟后站点客流量预测——实时进站客流+预测出站客流(+换乘客流)
表16 5分钟后站点客流量
①30、60分钟后站点客流量预测——预测进站人数+预测出站人数(+换乘客流)
仅凭实时进站人数无法得到较长时间跨度的预测结果,因此在30分钟、60分钟的客流拥挤度信息预测之中,将利用预测的进、出站客流量,以及利用相应换乘系数计算的换乘客流量作为计算量。
表17 60分钟后站点客流量
(2)线路断面客流量计算
①5分钟后线路断面客流量拥挤度预测
如图10所示,线路断面客流量计算由前一断面客流、站点进站客流以及换乘站的换乘客流三部分组成,可根据模型公式计算得到。
②30分钟、60分钟后线路断面客流拥挤度预测
与实时拥挤度发布相似,在发布30分钟、60分钟后线路断面客流量信息时,涉及“前一断面客流量、进站客流量、进站客流方向系数、换乘客流量”四个特征量,均利用LS-SVM模型预测获得。
四:实时视频识别效果
在以上的案例计算中,由于预测时间点处于平峰时期,因此在换乘客流量的计算为利用换乘系数结合公式计算。为了对视频识别技术的效果进行更进一步的详细说明,本文选取广州地铁客村站的换乘通道的客流视频作为案例,检验视频识别技术的检测效果。
如图11所示,混合高斯背景建模效果如下方左边两张图所示,被识别的乘客客流为右图白色区域。被识别的拥挤度为0.82,可换算为228个乘客,而该次客流实际客流量为268人,预测的准确度为85%。
Claims (6)
1.基于LS-SVM和实时大数据的地铁短期客流预测方法,其特征在于:包括步骤:
步骤一、获取AFC***IC卡刷卡数据,获得乘客进出站点、进出站时间,得到乘客历史出行站点OD系数;
步骤二、对涉及环形线路路径选择的乘客,采用基于Logit模型进行路径选择分配;
所述的Logit模型采用多元Logit模型,即MNL模型,所述MNL模型中,地铁环线站点间的路径可被划分为顺时针方向和逆时针方向,同时,通过Logit模型计算历史的方向系数和换乘系数,包括步骤:
通过测量获得OD间的距离,从而获得每条路径的出行时间后建立顺时针和逆时针路径的出行时间矩阵;
通过调查问卷,反映乘客对多种出行条件综合的评价,最终获得综合舒适度矩阵后建立顺时针和逆时针路线的出行舒适度矩阵;
通过IC卡数据筛选获得OD信息后得到历史OD矩阵;
基于上述数据在Transcad中求得Logit模型的参数估计以及t-test检验,从而获得效用函数;
采用以下Logit模型公式计算得到乘客分担率矩阵:
基于乘客OD矩阵和乘客分担率矩阵,通过矩阵中相对应的数值相乘获得顺时针和逆时针路径的乘客分布矩阵;
通过Logit模型得到乘客OD矩阵中的路径划分比例以及每条路径的乘客分布量,基于所述乘客分布量,求得历史的方向系数和换乘系数。
步骤三、采用乘客历史出行站点OD系数训练LS—SVM模型,得到进站乘客预测分布站点和线路上下行比例系数;采用进出站客流数据训练LS—SVM模型,得到乘客进出站预测量;
步骤四、采用乘客历史出行站点OD系数和上下行比例系数、Logit模型计算换乘站点的换乘系数,通过实时视频识别技术进行修正;所述的实时视频识别技术进行修正具体是通过视频识别技术获取换乘通道内换乘人数,修正LS—SVM和Logit模型获得的换乘系数;所述通过视频识别技术获取换乘通道内换乘人数具体包括:
基于OpenCV并采用光流法将跟踪前与跟踪后的点通过坐标变换归一化到100*100的空间平面中,通过统计前后的点的移动矢量,通过求平均值可以得到总体的移动速度大小与方向;
然后,根据目标监测区域构建一个近处值比较小,远处值比较大,监测区域以外均为0的掩图,将该图与背景差分的图做点乘运算,再统计全图的值的总和,即可用于估计当前画面的客流拥挤度;
最后根据历史客流拥挤度与历史客流量的百分位数的对应关系,将拥挤度转化为具体客流量;
步骤五、将进站乘客数据与上下行比例系数和换乘系数相乘获得乘客在路网的分布,发布乘客流量并更新路网。
2.根据权利要求1中所述基于LS-SVM和实时大数据的地铁短期客流预测方法,其特征在于:步骤一中,所述的获取AFC***IC卡刷卡数据具体是通过AFC***获取乘客进出站闸机中的IC卡数据。
3.根据权利要求2中所述基于LS-SVM和实时大数据的地铁短期客流预测方法,其特征在于,获取AFC***IC卡刷卡数据具体包括步骤:
将AFC***中获得的IC卡刷卡数据导入到SQL数据中进行储存;
采用软件先对票卡数据进行字段筛选,根据推算需要仅留下进站编号、进站时间、出站编号字段;
按照站点、时间进行进出站刷卡信息数量的统计,将输出结果导出到表中,即得到统计时段内各个站点的进出站客流量。
4.根据权利要求1中所述基于LS-SVM和实时大数据的地铁短期客流预测方法,其特征在于:步骤三中,所述LS—SVM模型的核函数求解过程包括:
在非线性情况下,假设给定的样本为(x1,y1),(x2,y2),...,(xm,ym),其中,xi∈Rk表示输入向量,yi∈R表示输出向量并且yi=f(xi),i=1,2,...,m,作非线性映射Rk→H,是特征映射,H是特征空间,则被估计函数f(x)有如下形式:
其中,w是H的权向量,b∈R是偏值,于是LS-SVM估计非线性函数为以下特征空间中的最优问题:
式中,ei∈Rk,i=1,2,...,m,为误差变量;
由于w可能为无限维的,所以直接计算上式比较困难,因此,将这一规划问题转化到其对偶空间中,定义Lagrange函数:
式中ai∈R为Lagrange乘子,最优解的条件如下:
消去w与ei,求解的优化问题可转化为求解如下线性方程:
其中向量θ=(1,1,...,1)T,a=(a1,a2,...,am)T,Y=(y1,y2,...,ym)T,Ω为一矩阵,其定义为:
通过求上述公式,可得a,b的值,得到被估计函数f(x)的表达式,最终函数的表达式为:
选取RBF函数作为LS-SVM预测过程中的核函数K(x,xi):
K(x,xi)=tanh(γ(x·xi)+c)。
5.根据权利要求4中所述基于LS-SVM和实时大数据的地铁短期客流预测方法,其特征在于:所述采用进出站客流数据训练LS—SVM模型,得到乘客进出站预测量具体包括:
输入并读取包括历史出站客流量、历史方向系数的训练样本,并对读取的数据做归一化处理;
设定LS-SVM中gam参数以及RBF核函数涉及的参数,接着通过trainlssvm函数实现预测模型的建立;
通过训练样本获得LS-SVM模型中的向量以及对应的阀值,并完成预测模型的建立;
最后,通过MATLAB读取需要预测的预测样本并利用已经建立的预测模型对样本数值进行预测得到乘客进出站预测量。
6.根据权利要求1中所述基于LS-SVM和实时大数据的地铁短期客流预测方法,其特征在于:步骤五中,所述的发布乘客流量并更新路网过程中,其中5分钟预测值采用实时进站客流的预测值,30分钟、60分钟的预测值采用历史同时期数据的预测值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810945933.6A CN109308543B (zh) | 2018-08-20 | 2018-08-20 | 基于ls-svm和实时大数据的地铁短期客流预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810945933.6A CN109308543B (zh) | 2018-08-20 | 2018-08-20 | 基于ls-svm和实时大数据的地铁短期客流预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109308543A CN109308543A (zh) | 2019-02-05 |
CN109308543B true CN109308543B (zh) | 2021-10-22 |
Family
ID=65223956
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810945933.6A Active CN109308543B (zh) | 2018-08-20 | 2018-08-20 | 基于ls-svm和实时大数据的地铁短期客流预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109308543B (zh) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110009429B (zh) * | 2019-04-10 | 2021-04-16 | 金瓜子科技发展(北京)有限公司 | 一种预测流量数据的方法、装置和计算机设备 |
CN110222873B (zh) * | 2019-05-14 | 2023-10-31 | 北京城建智控科技股份有限公司 | 一种基于大数据的地铁站客流量预测方法 |
CN110245788B (zh) * | 2019-05-30 | 2022-08-12 | 河海大学 | 一种基于刷卡数据的地铁客流短期预测方法 |
CN110400016B (zh) * | 2019-07-26 | 2020-06-26 | 中国安全生产科学研究院 | 一种基于大客流监测的地铁票务清分方法 |
CN110532515B (zh) * | 2019-08-05 | 2021-08-03 | 北京交通大学 | 基于afc与视频数据的城市轨道交通乘客行程反演*** |
CN112686417B (zh) * | 2019-10-18 | 2024-03-19 | 深圳先进技术研究院 | 一种地铁大客流预测方法、***及电子设备 |
CN110991607B (zh) * | 2019-11-15 | 2022-08-02 | 佳都科技集团股份有限公司 | 一种地铁客流预测方法、装置、电子设备及存储介质 |
CN113450557B (zh) * | 2020-03-24 | 2022-06-28 | 支付宝(杭州)信息技术有限公司 | 针对车辆客流量的预测模型进行更新的方法及装置 |
CN111757272B (zh) * | 2020-06-29 | 2024-03-05 | 北京百度网讯科技有限公司 | 地铁拥堵程度的预测方法、模型训练方法和装置 |
CN112182838A (zh) * | 2020-08-28 | 2021-01-05 | 浙江众合科技股份有限公司 | 一种基于afc数据的短时客流预测动态模型 |
CN112183815B (zh) * | 2020-08-28 | 2023-04-07 | 浙江众合科技股份有限公司 | 基于规则推荐算法的精准短时客流预测模型 |
CN112529294B (zh) * | 2020-12-09 | 2023-04-14 | 中国科学院深圳先进技术研究院 | 个体随机出行目的地预测模型的训练方法、介质和设备 |
CN112785071B (zh) * | 2021-01-29 | 2023-02-28 | 华南理工大学 | 一种企业用车客流模拟与预测*** |
CN112950943A (zh) * | 2021-02-18 | 2021-06-11 | 重庆交通开投科技发展有限公司 | 基于多元数据的换乘站点推算方法 |
CN112967500A (zh) * | 2021-02-22 | 2021-06-15 | 重庆交通开投科技发展有限公司 | 基于多元数据的公交换乘识别方法 |
CN112907088B (zh) * | 2021-03-03 | 2024-03-08 | 杭州诚智天扬科技有限公司 | 一种清分模型的参数调整方法及*** |
CN113204920B (zh) * | 2021-05-12 | 2022-02-15 | 紫清智行科技(北京)有限公司 | 基于支持向量机的智能车换道舒适性评估及其轨迹规划方法和装置 |
CN113239198B (zh) * | 2021-05-17 | 2023-10-31 | 中南大学 | 一种地铁客流预测方法、装置及计算机存储介质 |
CN113269367B (zh) * | 2021-06-07 | 2022-08-12 | 南京邮电大学 | 一种基于边缘协同交替方向乘子法的地铁客流预测方法 |
CN113468243A (zh) * | 2021-07-02 | 2021-10-01 | 金冰峰 | 地铁客流分析与预测方法及分析与预测*** |
CN113850295B (zh) * | 2021-08-27 | 2024-04-02 | 北京工业大学 | 一种基于Weighted-LeaderRank和GMM聚类的站点选址预测方法 |
CN113873471B (zh) * | 2021-09-09 | 2024-05-14 | 上海伽易信息技术有限公司 | 一种基于svm的地铁轨道线路无线环境指纹库构建方法 |
CN114091579A (zh) * | 2021-11-03 | 2022-02-25 | 深圳技术大学 | 城市轨道交通客流预警***和方法 |
CN115018454B (zh) * | 2022-05-24 | 2024-04-05 | 北京交通大学 | 一种基于出行模式识别的乘客出行时间价值计算方法 |
CN115545360B (zh) * | 2022-12-01 | 2023-04-07 | 北京交研智慧科技有限公司 | 基于孪生场景的客流出行预测的处理方法和*** |
CN116631176B (zh) * | 2023-05-31 | 2023-12-15 | 河南海融软件有限公司 | 站点客流分布状态的控制方法及*** |
CN117272848B (zh) * | 2023-11-22 | 2024-02-02 | 上海随申行智慧交通科技有限公司 | 基于时空影响的地铁客流预测方法及模型训练方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101964085A (zh) * | 2010-09-27 | 2011-02-02 | 北京航空航天大学 | 一种基于Logit模型和贝叶斯决策的客流分配方法 |
CN102306243A (zh) * | 2011-07-27 | 2012-01-04 | 高新现代智能***股份有限公司 | 在轨道交通中的换乘客流清分方法 |
CN102819768A (zh) * | 2011-11-07 | 2012-12-12 | 金蝶软件(中国)有限公司 | 客流数据分析的方法及*** |
CN103310287A (zh) * | 2013-07-02 | 2013-09-18 | 北京航空航天大学 | 基于svm预测乘客出行概率的轨道交通客流预测方法 |
CN105550789A (zh) * | 2016-02-19 | 2016-05-04 | 上海果路交通科技有限公司 | 一种公交出行客流的预测方法 |
CN106372722A (zh) * | 2016-09-18 | 2017-02-01 | 中国科学院遥感与数字地球研究所 | 地铁短时流量预测方法及装置 |
CN106530680A (zh) * | 2016-12-02 | 2017-03-22 | 东南大学 | 一种基于大站快车的公交线路组合服务方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5984150B2 (ja) * | 2014-08-21 | 2016-09-06 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 情報処理装置、情報処理方法、及びプログラム |
-
2018
- 2018-08-20 CN CN201810945933.6A patent/CN109308543B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101964085A (zh) * | 2010-09-27 | 2011-02-02 | 北京航空航天大学 | 一种基于Logit模型和贝叶斯决策的客流分配方法 |
CN102306243A (zh) * | 2011-07-27 | 2012-01-04 | 高新现代智能***股份有限公司 | 在轨道交通中的换乘客流清分方法 |
CN102819768A (zh) * | 2011-11-07 | 2012-12-12 | 金蝶软件(中国)有限公司 | 客流数据分析的方法及*** |
CN103310287A (zh) * | 2013-07-02 | 2013-09-18 | 北京航空航天大学 | 基于svm预测乘客出行概率的轨道交通客流预测方法 |
CN105550789A (zh) * | 2016-02-19 | 2016-05-04 | 上海果路交通科技有限公司 | 一种公交出行客流的预测方法 |
CN106372722A (zh) * | 2016-09-18 | 2017-02-01 | 中国科学院遥感与数字地球研究所 | 地铁短时流量预测方法及装置 |
CN106530680A (zh) * | 2016-12-02 | 2017-03-22 | 东南大学 | 一种基于大站快车的公交线路组合服务方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109308543A (zh) | 2019-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109308543B (zh) | 基于ls-svm和实时大数据的地铁短期客流预测方法 | |
Xu et al. | Real-time prediction of taxi demand using recurrent neural networks | |
Kieu et al. | A modified density-based scanning algorithm with noise for spatial travel pattern analysis from smart card AFC data | |
CN110766942B (zh) | 一种基于卷积长短期记忆网络的交通路网拥堵预测方法 | |
CN108446470B (zh) | 基于车辆轨迹数据和人口分布的医疗设施可达性分析方法 | |
CN107103142A (zh) | 面向公路和铁路网的综合交通网络运行态势推演仿真技术 | |
CN110570651A (zh) | 一种基于深度学习的路网交通态势预测方法及*** | |
CN105404934B (zh) | 一种基于条件随机场的城市人口移动数据模型分析方法 | |
CN115204478A (zh) | 一种结合城市兴趣点和时空因果关系的公共交通流量预测方法 | |
CN107978148A (zh) | 一种基于多源交通数据动态可靠性的交通状态预测方法 | |
Zhu et al. | Inferring left behind passengers in congested metro systems from automated data | |
Cordera et al. | Trip distribution model for regional railway services considering spatial effects between stations | |
Jiang et al. | A unified probabilistic framework for spatiotemporal passenger crowdedness inference within urban rail transit network | |
Ghasedi et al. | Robust optimization of bus stop placement based on dynamic demand using meta heuristic approaches: a case study in a developing country | |
CN109409563A (zh) | 一种公交运营车辆实时人数的分析方法、***和存储介质 | |
CN110309953B (zh) | 采用目标流动性分布预测的城市安防监控布局***及方法 | |
Georgati et al. | Spatially explicit population projections: The case of Copenhagen, Denmark | |
Hermant | Video data collection method for pedestrian movement variables & development of a pedestrian spatial parameters simulation model for railway station environments | |
CN115994787A (zh) | 一种基于神经网络的拼车需求预测匹配方法 | |
Gao et al. | Method of Predicting Passenger Flow in Scenic Areas Considering Multisource Traffic Data. | |
Yu et al. | Combining travel behavior in metro passenger flow prediction: A smart explainable Stacking-Catboost algorithm | |
Zhang et al. | Study on evaluation indicators system of crowd management for transfer stations based on pedestrian simulation | |
CN111327453B (zh) | 一种考虑网格化动态、静态分量的通信带宽估算方法 | |
CN114139773A (zh) | 一种基于时空图卷积网络的公共交通流量预测方法 | |
Al Najada et al. | Highway cluster density and average speed prediction in vehicular ad hoc networks (vanets) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |