CN112001548A - 一种基于深度学习的od客流预测方法 - Google Patents
一种基于深度学习的od客流预测方法 Download PDFInfo
- Publication number
- CN112001548A CN112001548A CN202010861302.3A CN202010861302A CN112001548A CN 112001548 A CN112001548 A CN 112001548A CN 202010861302 A CN202010861302 A CN 202010861302A CN 112001548 A CN112001548 A CN 112001548A
- Authority
- CN
- China
- Prior art keywords
- time
- matrix
- passenger flow
- real
- inbound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000013135 deep learning Methods 0.000 title claims abstract description 10
- 239000011159 matrix material Substances 0.000 claims abstract description 66
- 238000013136 deep learning model Methods 0.000 claims abstract description 20
- 230000006870 function Effects 0.000 claims description 31
- 238000003860 storage Methods 0.000 claims description 11
- 239000013598 vector Substances 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 238000013527 convolutional neural network Methods 0.000 description 22
- 230000007246 mechanism Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 16
- 230000000694 effects Effects 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000004088 simulation Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 239000000835 fiber Substances 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 101100460704 Aspergillus sp. (strain MF297-2) notI gene Proteins 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于深度学习的OD客流预测方法。该方法包括:获取历史的OD矩阵信息和实时的进站客流时间序列信息,将所述历史的OD矩阵信息和所述实时的进站客流时间序列信息输入至经训练的深度学习模型,获得预测的后续时间段的OD矩阵信息,其中所述深度学习模型包括主干结构和分支结构,该主干结构以所述历史的OD矩阵信息作为输入以提取高级特征,该分支结构以所述实时的进站客流时间序列作为输入,并通过对该主干结构的输出进行调整,进而获得预测的后续时间段的OD矩阵信息。本发明能够提高OD短时客流预测的实时性和精确度。
Description
技术领域
本发明涉及交通客流预测技术领域,更具体地,涉及一种基于深度学习的OD客流预测方法。
背景技术
城市轨道交通短时OD(Original Destination)客流预测是构建智能交通***的重要一环,其预测结果是动态客流分配的重要输入,也是进行实时动态客运组织优化的重要参考。
随着深度学习等前沿技术的飞速发展,城市轨道交通领域短时客流预测借助深度学习模型的良好表现取得了突破性进步。目前的研究大多关注进站流和出站流的短时预测,针对于OD短时客流预测的研究相对较少。然而,短时OD客流预测结果是动态客流分配的重要输入,同时可为实时的运营组织管理、路径规划、客流缓堵等提供参考,具有重要的研究意义。
尽管短时进出站流量预测可以为OD矩阵预测(即OD短时客流预测)提供重要的参考信息。然而,在城市轨道交通***中,两者主要存在以下重要区别:
第一,先验信息不同。由于乘客进出地铁站时必须刷卡,所以可以及时获得实时进出站流量。在进行进出站客流预测时,可以将最相近的几个时间间隔内的实际流量作为模型输入。但由于从原点到终点存在一定的行程持续时间,乘客出站存在一定的滞后性,从而很难获得短时OD矩阵。因此在进行OD实时预测时,应仔细考虑模型输入。
第二、数据依赖关系问题。由于所有乘客都有旅行目的地,所以OD的流量取决于进站流量。当乘客进入地铁站时,必将出站。因此,在任何情况下,进站流量等于OD流量的总和。
第三、数据稀疏性问题。一方面,进站流量大小比OD流量大得多,因为进站流将分散到许多终点站,导致单个OD对的流量大幅减小。另一方面,进站量一般只在平峰时段较少。然而,某些OD对甚至全天不存在OD流或OD流极小。例如,在非高峰时段,市中心车站的乘客很少会去郊区车站。如图1所示,这会导致AB、AC、AD和AE之间OD流很小或为零。即使在高峰时段,也有许多OD对流量极小。如表1所示,全天流量为0的OD对超过40%。一天中流量低于2的OD对超过65%。这些流量很小的OD流通常是随机产生的行程,显著降低了客流的规律性,增加了预测的难度。
表1 OD流统计表
第四,待预测的数据量不同。OD流量的数量是地铁站点数量(表示为n)的n2倍,这极大增加了OD流量预测的难度。
在现有技术中,城市轨道交通OD预测领域研究较为滞后,目前存在的技术方案包括最小二乘法、状态空间模型、多主体仿真模型、LSTM模型等。最小二乘法和状态空间模型由于需要消耗大量的计算资源,尤其在网络较为巨大的情况下,不能满足实时性的要求,且预测精度和最新的深度学习模型相比也较差。多主体仿真模型过于复杂,涉及到仿真***的构建,不利于进行模型结构的调整,且仿真精度现在已经不能满足实时预测的要求。LSTM模型通常以一个车站为单位,利用并行计算技术,对单个车站的OD序列预测,最后将所有车站的OD序列进行合并,作为最终的OD矩阵预测结果,但是该方案需要针对每一个车站训练一个模型,建模过程较为繁琐。
综上所述,城市轨道交通短时OD预测中还存在一些需要解决的问题。首先,由于乘客实时OD矩阵不可获取,使用最近几个时间间隔中OD矩阵作为模型输入不可行。因此,在进行实时OD预测时,首先要解决的问题是确定模型输入。其次,现有研究在深度学习模型中普遍忽略了进站流与OD流的关系。因此,在建模时如何利用它们之间的内在依赖关系非常重要。第三,现有研究通常对流量较大和流量较小的OD对处理相同,存在不合理性,因为不存在流量或者流量很小的OD对数量巨大,OD矩阵数据稀疏性问题很严重。因此,如何处理数据稀疏性以提高预测精度是另一个关键问题。
发明内容
本发明的目的是克服上述现有技术的缺陷,提供一种基于深度学习的OD客流预测方法,其是进行城市轨道交通OD短时客流预测的新的技术方案。
本发明提供一种基于深度学习的OD客流预测方法。该方法包括以下步骤:
获取历史的OD矩阵信息和实时的进站客流时间序列信息,其中所述历史的OD矩阵信息以进站时间为基准划分时间段进行OD矩阵提取,用于表征历史多天同一时间段的OD流,所述实时的进站客流时间序列用于表征多个时间段各车站的进站客流时间序列;
将所述历史的OD矩阵信息和所述实时的进站客流时间序列信息输入至经训练的深度学习模型,获得预测的后续时间段的OD矩阵信息,其中所述深度学习模型包括主干结构和分支结构,该主干结构以所述历史的OD矩阵信息作为输入以提取高级特征,该分支结构以所述实时的进站客流时间序列作为输入,并通过对该主干结构的输出进行调整,进而获得预测的后续时间段的OD矩阵信息。
与现有技术相比,本发明的优点在于,仅仅训练一个深度学习模型即能同时对所有OD流进行同步预测,并不需要对每一个车站训练一个模型,显著简化了进行OD短时客流预测的难度。此外,本发明通过分支结构实现inflow-gated mechanism(基于进站流的门控机制),并通过设计masked loss function(基于掩膜结构的损失函数)和Split CNN(分离卷积神经网络)等,有效提高了模型预测精度,解决了轨道交通OD预测领域不能获取实时OD矩阵、数据稀疏性等问题。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。
图1是城市轨道交通的OD流示意图;
图2是根据本发明一个实施例的基于深度学习的OD客流预测方法的流程图;
图3根据本发明一个实施例的深度学习模型的架构图;
图4是根据本发明一个实施例的Split CNN示意图;
图5根据本发明一个实施例的不同卷积核示意图;
图6是根据本发明一个实施例的卷积后使用通道注意力机制的操作示意图;
图7是根据本发明一个实施例的通道注意力机制的内部结构详细示意图;
图8是根据本发明一个实施例的基于进站流的门控机制的示意图;
图9是根据本发明一个实施例的不同模型实验效果对比柱状图;
附图中,Input-输入;Output-输出;Channel-wise attention and Concatenate-通道注意力和级联;Channel-wise attention and Add-通道注意力和相加;Add-相加;Attention-注意力;Masked Loss-掩膜损失函数;Inflow-进站流;Trunk Output-主干输出;Gated-门控;Predicted Output-预测的输出;AvgPool-平均池化;DataSet-数据集。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
简言之,参见图2所示,本发明所提供的基于深度学习的OD客流预测方法包括:步骤S210,获取历史的OD矩阵信息和实时的进站客流时间序列信息,其中所述历史的OD矩阵信息以进站时间为基准划分时间段进行OD矩阵提取,用于表征历史多天同一时间段的OD流,所述实时的进站客流时间序列用于表征多个时间段各车站的进站客流时间序列;步骤S220,将所述历史的OD矩阵信息和所述实时的进站客流时间序列信息输入至经训练的深度学习模型,获得预测的后续时间段的OD矩阵信息,其中所述深度学习模型包括主干结构和分支结构,该主干结构以所述历史的OD矩阵信息作为输入以提取高级特征,该分支结构以所述实时的进站客流时间序列作为输入,并通过对该主干结构的输出进行调整,进而获得预测的后续时间段的OD矩阵信息。
为便于理解,以下分三个部分介绍本发明的技术方案:首先,对本发明要解决的问题进行详细阐释。然后,介绍深度学习模型的各部分结构。最后,介绍本发明在两个真实的北京地铁数据集上的应用结果。
一、问题陈述
本发明的数据来源为北京地铁2个数据集,分别为2016年2月29日至2016年4月3日连续5周的北京地铁刷卡数据(标记为Metro2016),以及2018年10月8号至2018年11月11号连续5周的北京地铁刷卡数据(标记为Metro2018)。其中2016年为276个车站,2018年为308个车站,刷卡时间为05:00到23:00。每条刷卡数据包含***、进站时间,进站站点,出站时间,出站站点。根据刷卡记录可以按照公式(1)至公式(3)提取OD矩阵M和进站客流时间序列N。
式中为第d天第t个时间段从车站i到车站j的OD流。为第d天第t个时间段车站i的OD流之和。为第d天第t个时间段从车站i的进站客流时间序列,该序列中所有车站按照车站所在线路的邻接关系进行排序。进站流和OD流的关系如公式(3)所示,很明显同一个车站的进站流为同一行相应的OD流之和。
需要注意的是,OD矩阵的提取只关注乘车的进站时间,进站车站以及出站车站,即OD矩阵是根据进站时间提取的,同一个OD矩阵的所有OD流在同一个时间段内进站,但由于其行程时间不同,可能在不同的时间段出站。
本发明要解决的问题是,用历史的OD矩阵信息和实时的进站客流时间序列信息预测未来一个时间段内的OD矩阵,可表示为:
Md,t=f(Md-x,t;Nd,t-y),x=1,2,3…;y=1,2,3… (4)
式中Md,t为第d天第t个时间段的OD矩阵。模型有两个输入,其中一个Md-x,t为过去第d-x天同一个第t时间段内的OD矩阵。另外一个输入Nd,t-y为同一天第d天前面第t-y个时间段的进站客流时间序列。
针对实时的OD矩阵信息不能获取的问题,在一个实施例中,本发明提出了一种inflow-gated mechanism(基于进站流的门控机制),即使用进站客流作为其中深度学习模型一个输入,从而提供实时信息。
此外,本发明利用OD吸引度的概念,将全网所有的OD对根据其25个工作日平均OD客流量进行了划分。OD吸引度的计算如公式(5)所示,OD吸引度水平划分结果如表2所示。
式中为连续25个工作日内从车站i到车站j的平均OD流。该指标为动态指标,随时间不同而有所变化。对同一个OD对,其的值可能在高峰时段很大,而在平峰时段很小。该指标也是一个平均指标,是为了避免一些偶然因素。
表2 OD吸引度水平划分
表2中OD吸引度水平根据的值划分为5个层级,分别为Lowest(最低级)、Low(低级)、Middle(中等)、High(高级)、Highest(最高级)。本发明将依据吸引度水平“Low”进行建模,后续将具体介绍吸引度水平在模型中的应用。
二、深度学习模型介绍
在一个实施例中,本发明提出的模型结构如图3所示,其是基于splitconvolutional neural network(分离卷积神经网络,Split CNN)、channel-wiseattention(通道注意力机制)和inlow-gated mechanism(基于进站流的门控机制)的架构,在本文中也称为CAS-CNN模型。整体上,该模型架构包含主干结构和分支结构。例如,主干的输入为过去5天相同时间段的OD矩阵,分支的输入为当天前几个时间段的进站客流序列。
在主干结构中,本发明创新性地提出了Split CNN模型架构,如图4和图5所示,其利用不同尺寸的卷积核捕捉时空关系,同时从稀疏矩阵中提取密集信息。例如,Split CNN同时使用3*3和5*5的卷积核对输入进行卷积,然后对卷积结果进行相加,从而提取密集信息。
在主干结构中,channel-wise attention主要用于对五个输入(即过去5天相同时间段的OD矩阵)进行加权评分,以及对Split CNN提取的高级特征进行加权评分,channel-wise attention的操作如图6所示,即对每个输出的channel(通道)进行加权,将加权后的channel进行相加获取最终输出。channel-wise attention的详细操作细节如图7所示,其输入是包含多个channel的数据,然后经过Average pooling(平均池化,AvgPool),fullyconnected(全连接层,FC),Relu(线性整流函数),fully connected(全连接层,FC),sigmoid(双弯曲S型函数)等一系列操作得到一个权重向量,该权重向量用于对输入进行加权,得到最终的输出。在该实施例中,将注意力机制作用在通道尺度,用于给不同通道特征加权,以提取更精确的特征。
在分支结构中,本发明提出了inflow-gated mechanism结构,如图8所示,首先利用1*1卷积将进站客流时间序列提取为单列向量,然后对列向量进行加权处理得到加权后的向量,并利用该加权后的列向量对主干的输出进行控制调整(例如与主干的输出按行相加,以获得融合了历史OD矩阵信息的结果),然后再经过1*1卷积得到最终的输出结果,即预测的后续时间段的OD矩阵信息。
优选地,本发明还提出了一种masked loss function(掩膜结构的损失函数)。例如,损失函数表示为:
式中MSE为本发明采用的masked loss function。(n×n)no_mask表示矩阵中没有被mask的OD对的数量。为真实值,为相应的预测值,mask为一个0-1值矩阵,代表着相应的OD流是否被mask。如果相应的OD流被mask掉,此处的误差便不会进行反向传播,这种操作有利于提高模型的预测精度。证明过程如下:
假设y=w×x(w表示权重,x表示输入数据),则:
在一个实施例中,掩膜矩阵mask可基于OD吸引度水平构建,例如,基于OD吸引度水平“Low”构建。
需要说明的是,在不违背本发明精神和范围的前提下,本领域技术人员可对上述实施例进行适当的改变或变型,例如,采用不同的卷积核尺寸、深度学***等。
三、实验结论
为进一步验证本发明的效果,进行了实验。实验中的模型配置、模型的评价指标、基准模型参数配置以及实验结果如下。
1)模型配置
本发明使用PyTorch来实现模型。前四周的数据用于训练和验证模型,其余的用于测试模型。验证数据集比例设置为0.1。为了避免模型过拟合,在模型训练中采用了earlystopping技术。该模型主干第一层Split CNN中设置16个滤波器,主干第二层Split CNN中设有1个过滤器。学习率为0.001,batchsize大小为16。Channel-wise attention中,R设为2。本发明主干中使用过去5天同一时间间隔的OD矩阵作为输入。分支利用整个网络最近5个时间步长(2.5小时)的进站流序列作为输入。使用Xavier标准初始化器来初始化CNN相关的参数。所有的模型都是在配有Intel i7-8700K处理器(12M缓存,最高3.20GHz),24GB内存,和NVIDIA GeForce GTX 1070TiGPU的台式计算机上实现。
2)模型评价指标
本发明评估模型所采用的评价指标为均方根误差(RMSE,the root-mean-squarederror),平均绝对误差(MAE,mean absolute error)以及加权平均绝对百分比误差(WMAPE,weighted mean-absolute-percentage error)。
公式中各个参数的含义与公式(6)中的参数相同。
3)基准模型参数配置
在本发明中,将提出的CAS-CNN模型与现有的2D CNN,3D CNN,ConvLSTM,ConvGRU以及TrajGRU五个模型进行了对比。此外,基于CAS-CNN模型,为了验证提出的inflow-gatedmechanism和masked loss function的效果,又分别设计了另外两个模型,一个标记为CAS-CNN(No Inflow),即删掉模型中的inflow-gated mechanism分支,将损失函数替换为普通的MSE。另外一个标记为CAS-CNN(No Mask),即增加模型中的inflow-gated mechanism分支,但仍将损失函数替换为普通的MSE。这两个模型其他的参数和CAS-CNN一样。对于本发明提出的CAS-CNN模型,基于OD吸引度水平“Low”构建了一个mask文件,并将其应用到maskedloss function中。以上所有模型的输入输出是一样的,模型其他的详细信息如下所示。
2D CNN和3D CNN:两个模型均为三层结构,每层分别设置8,16和1个滤波器,前两层的激活函数为ReLU,最后一层的激活函数为Linear。Kernel size是5×5,学习率为0.001,Batchsize为8。
ConvLSTM和ConvGRU:两个模型均为三层结构,每层分别设置8,8和1个滤波器,前两层的激活函数为ReLU,最后一层的激活函数为Linear。Kernel size是3×3,学习率为0.001,Batchsize为8。
TrajGRU:该模型为encoder-forecaster结构。Encoder中层数为2层,每层有32个和64个滤波器。Forecaster中层数为2层,每层有64个和32个滤波器。Kernel size分别为3×3和5×5,学习率为0.001,Batchsize为16。
CAS-CNN(No Inflow):该模型删除了inflow-gated分支,来验证提出的inflow-gated mechanism的有效性,模型中损失函数为普通的MSE而非提出的masked lossfunction。
CAS-CNN(No Mask):该模型添加了inflow-gated mechanism分支,模型中损失函数为普通的MSE而非提出的masked loss function。
4)实验结果分析
将本发明应用在北京地铁的两个数据集上,实验结果如表3和图9所示。可以看出:CAS-CNN(No Inflow)模型比五个现有基准模型效果表现都要好,说明本发明提出的模型结构是有效的。CAS-CNN(No Mask)的效果比CAS-CNN(No Inflow)的效果表现要好,说明本发明中提出的inflow-gated mechanism是有效的。CAS-CNN比CAS-CNN(No Mask)效果表现又有所提升,说明本发明提出的masked loss function是有效的。
表3不同模型实验效果对比
经验证,本发明有效提高了模型预测精度,且该深度学习模型训练并不需要大量的计算资源,仅仅使用本发明中所用的计算机既能完成训练,训练好的深度学习模型经过部署能满足实时性的要求。利用本发明既能有效利用实时的进站客流信息以弥补不能获取实时OD矩阵的不足,又能有效降低矩阵严重的稀疏性对预测结果的影响,取得了很好的预测结果。本发明应用在北京地铁2016年和2018年两个真实轨道交通数据集上,实验结果表明了该模型的先进性,对城市轨道交通实时的运营管理具有重要的参考意义。
综上所述,针对城市轨道交通OD短时客流预测领域不能获取实时的OD矩阵信息、OD矩阵稀疏性严重等问题,本发明利用进站流门控机制分支为城市轨道交通OD短时客流预测提供实时信息,能有效提高模型预测精度,弥补该任务中不能获取实时OD矩阵的缺陷。本发明提出利用具有掩膜结构的损失函数来处理轨道交通OD矩阵中的稀疏值,同时提高了OD矩阵预测精度。此外,本发明中还提出Split CNN结构,用以从稀疏矩阵中产生稠密信息。本发明提供的CAS-CNN模型,仅需训练一个模型便能同时对所有OD流进行同步预测,并不需要对每一个车站训练一个模型,显著简化了进行OD短时客流预测的难度。
本发明可以是***、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、装置(***)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。
Claims (10)
1.一种基于深度学习的OD客流预测方法,包括以下步骤:
获取历史的OD矩阵信息和实时的进站客流时间序列信息,其中所述历史的OD矩阵信息以进站时间为基准划分时间段进行OD矩阵提取,用于表征历史多天同一时间段的OD流;
根据进站时间提取,用于表征多个时间段的OD流,所述实时的进站客流时间序列用于表征多个时间段各车站的进站客流时间序列;
将所述历史的OD矩阵信息和所述实时的进站客流时间序列信息输入至经训练的深度学习模型,获得预测的后续时间段的OD矩阵信息,其中所述深度学习模型包括主干结构和分支结构,该主干结构以所述历史的OD矩阵信息作为输入以提取高级特征,该分支结构以所述实时的进站客流时间序列作为输入,并通过对该主干结构的输出进行调整,进而获得预测的后续时间段的OD矩阵信息。
3.根据权利要求1所述的方法,其中,所述主干结构包括输入层和多个卷积层,且在各卷积层之间、以及输入层和其相邻的卷积层之间设有通道特征加权层,每个卷积层利用不同尺寸的卷积核对输入进行卷积以提取高级特征,所述通道特征加权层对相应卷积层提取的特征或对输入层的不同通道数据进行加权。
4.根据权利要求1所述的方法,其中所述分支结构的处理步骤包括:
利用1*1卷积将所述实时的多个时间段的进站客流时间序列提取为单列向量;
对提取的列向量进行加权处理;
利用加权后的列向量对所述主干结构的输出进行控制调整,以获得融合了历史的OD矩阵信息的结果,并经过1*1卷积得到预测的后续时间段的OD矩阵信息。
5.根据权利要求2所述的方法,其中,基于OD吸引度水平确定掩膜矩阵,并利用该掩码矩阵构建训练所述深度学***反映OD对间吸引客流的程度。
7.根据权利要求1所述的方法,其中,所述分支结构依次包括输入层、平均池化层、第一全连接层,Relu激活层、第二全连接层、sigmoid激活层和输出层。
9.一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现根据权利要求1至8中任一项所述方法的步骤。
10.一种计算机设备,包括存储器和处理器,在所述存储器上存储有能够在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至8中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010861302.3A CN112001548B (zh) | 2020-08-25 | 2020-08-25 | 一种基于深度学习的od客流预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010861302.3A CN112001548B (zh) | 2020-08-25 | 2020-08-25 | 一种基于深度学习的od客流预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112001548A true CN112001548A (zh) | 2020-11-27 |
CN112001548B CN112001548B (zh) | 2023-10-20 |
Family
ID=73471670
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010861302.3A Active CN112001548B (zh) | 2020-08-25 | 2020-08-25 | 一种基于深度学习的od客流预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112001548B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112508303A (zh) * | 2020-12-22 | 2021-03-16 | 西南交通大学 | 一种od客流预测方法、装置、设备及可读存储介质 |
CN112766597A (zh) * | 2021-01-29 | 2021-05-07 | 中国科学院自动化研究所 | 公交客流预测方法及*** |
CN113077281A (zh) * | 2021-03-12 | 2021-07-06 | 中山大学 | 一种地铁客流量分布预测方法以及设备 |
CN113159385A (zh) * | 2021-03-22 | 2021-07-23 | 中铁信(北京)网络技术研究院有限公司 | 一种基于深度强化学习的自反馈客流控制方法及装置 |
CN114612860A (zh) * | 2022-02-28 | 2022-06-10 | 北京交通大学 | 基于计算机视觉的轨道交通站内客流识别与预测方法 |
CN114642413A (zh) * | 2020-12-21 | 2022-06-21 | 奥泰医疗***有限责任公司 | 一种基于深度学习的mri头部3d图像自动扫描定位方法 |
CN114819366A (zh) * | 2022-05-06 | 2022-07-29 | 华侨大学 | 一种od客流短时预测方法、装置、设备及其存储介质 |
CN114881330A (zh) * | 2022-05-09 | 2022-08-09 | 华侨大学 | 一种基于神经网络的轨道交通客流预测方法及*** |
CN116402237A (zh) * | 2023-06-07 | 2023-07-07 | 交控科技股份有限公司 | 客流预测方法、装置、电子设备及介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102014203226A1 (de) * | 2014-02-24 | 2015-08-27 | Siemens Aktiengesellschaft | Verfahren und System zum Bereitstellen von Eingangsdaten für ein Verkehrsmodell eines Verkehrsnetzes |
CN105224992A (zh) * | 2014-05-28 | 2016-01-06 | 国际商业机器公司 | 对等待乘客数进行预测的方法和***以及评价方法和*** |
CN106485359A (zh) * | 2016-10-13 | 2017-03-08 | 东南大学 | 一种基于列车运行时刻表的城市轨道交通断面客流推测方法 |
CN108197739A (zh) * | 2017-12-29 | 2018-06-22 | 中车工业研究院有限公司 | 一种城市轨道交通乘客流量预测方法 |
CN110443422A (zh) * | 2019-08-05 | 2019-11-12 | 北京交通大学 | 基于od吸引度的城市轨道交通od客流预测方法 |
CN111091225A (zh) * | 2019-11-08 | 2020-05-01 | 北京交通大学 | 一种基于深度学习的城市轨道交通短期客流预测方法 |
-
2020
- 2020-08-25 CN CN202010861302.3A patent/CN112001548B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102014203226A1 (de) * | 2014-02-24 | 2015-08-27 | Siemens Aktiengesellschaft | Verfahren und System zum Bereitstellen von Eingangsdaten für ein Verkehrsmodell eines Verkehrsnetzes |
CN105224992A (zh) * | 2014-05-28 | 2016-01-06 | 国际商业机器公司 | 对等待乘客数进行预测的方法和***以及评价方法和*** |
CN106485359A (zh) * | 2016-10-13 | 2017-03-08 | 东南大学 | 一种基于列车运行时刻表的城市轨道交通断面客流推测方法 |
CN108197739A (zh) * | 2017-12-29 | 2018-06-22 | 中车工业研究院有限公司 | 一种城市轨道交通乘客流量预测方法 |
CN110443422A (zh) * | 2019-08-05 | 2019-11-12 | 北京交通大学 | 基于od吸引度的城市轨道交通od客流预测方法 |
CN111091225A (zh) * | 2019-11-08 | 2020-05-01 | 北京交通大学 | 一种基于深度学习的城市轨道交通短期客流预测方法 |
Non-Patent Citations (3)
Title |
---|
AUGUSTIN SOULE: "Traffic Matrices:Balancing Measurements, Inference and Modeling", PERFORMANCE EVALUATION REVIEW * |
宋竹;秦志光;徐进;吴斗;: "基于公交IC卡数据的大规模OD矩阵推导算法研究", 计算机应用研究, no. 07 * |
李梅;李静;魏子健;王思达;陈赖谨;: "基于深度学习长短期记忆网络结构的地铁站短时客流量预测", 城市轨道交通研究, no. 11 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114642413A (zh) * | 2020-12-21 | 2022-06-21 | 奥泰医疗***有限责任公司 | 一种基于深度学习的mri头部3d图像自动扫描定位方法 |
CN112508303A (zh) * | 2020-12-22 | 2021-03-16 | 西南交通大学 | 一种od客流预测方法、装置、设备及可读存储介质 |
CN112766597A (zh) * | 2021-01-29 | 2021-05-07 | 中国科学院自动化研究所 | 公交客流预测方法及*** |
CN112766597B (zh) * | 2021-01-29 | 2023-06-27 | 中国科学院自动化研究所 | 公交客流预测方法及*** |
CN113077281A (zh) * | 2021-03-12 | 2021-07-06 | 中山大学 | 一种地铁客流量分布预测方法以及设备 |
CN113159385A (zh) * | 2021-03-22 | 2021-07-23 | 中铁信(北京)网络技术研究院有限公司 | 一种基于深度强化学习的自反馈客流控制方法及装置 |
CN114612860A (zh) * | 2022-02-28 | 2022-06-10 | 北京交通大学 | 基于计算机视觉的轨道交通站内客流识别与预测方法 |
CN114819366A (zh) * | 2022-05-06 | 2022-07-29 | 华侨大学 | 一种od客流短时预测方法、装置、设备及其存储介质 |
CN114881330A (zh) * | 2022-05-09 | 2022-08-09 | 华侨大学 | 一种基于神经网络的轨道交通客流预测方法及*** |
CN116402237A (zh) * | 2023-06-07 | 2023-07-07 | 交控科技股份有限公司 | 客流预测方法、装置、电子设备及介质 |
CN116402237B (zh) * | 2023-06-07 | 2023-09-01 | 交控科技股份有限公司 | 客流预测方法、装置、电子设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112001548B (zh) | 2023-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112001548B (zh) | 一种基于深度学习的od客流预测方法 | |
CN110928993B (zh) | 基于深度循环神经网络的用户位置预测方法及*** | |
CN109919358B (zh) | 一种基于神经网络时空注意力机制的实时站点流量预测方法 | |
US11100266B2 (en) | Generating integrated circuit floorplans using neural networks | |
CN108197739B (zh) | 一种城市轨道交通乘客流量预测方法 | |
CN107038478B (zh) | 路况预测方法及装置、计算机设备与可读介质 | |
US10636293B2 (en) | Uncertainty modeling in traffic demand prediction | |
Zhu et al. | A bi-level model for single-line rail timetable design with consideration of demand and capacity | |
Ben-Dor et al. | Population downscaling in multi-agent transportation simulations: A review and case study | |
Li et al. | Expected value model for optimizing the multiple bus headways | |
CN114626585B (zh) | 一种基于生成对抗网络的城市轨道交通短时客流预测方法 | |
CN111160622A (zh) | 基于混合神经网络模型的景区客流预测方法和装置 | |
Echenique | Models: a discussion | |
WO2017071369A1 (zh) | 一种预测用户离网的方法和设备 | |
Wang et al. | Predicting the matching probability and the expected ride/shared distance for each dynamic ridepooling order: A mathematical modeling approach | |
CN110443422B (zh) | 基于od吸引度的城市轨道交通od客流预测方法 | |
CN115034496A (zh) | 基于GCN-Transformer的城市轨道交通节假日短时客流预测方法 | |
CN115146844A (zh) | 一种基于多任务学习的多模式交通短时客流协同预测方法 | |
CN103927433A (zh) | 基于流控制的多源点多出口人群应急疏散调度方法 | |
Coulaud et al. | Modeling dwell time in a data-rich railway environment: with operations and passenger flows data | |
Lartey | Predicting traffic congestion: A queuing perspective | |
Huang et al. | A novel two-stage approach for energy-efficient timetabling for an urban rail transit network | |
He et al. | GC-LSTM: a deep spatiotemporal model for passenger flow forecasting of high-speed rail network | |
Liang et al. | Bufformer: A generative ml framework for scalable buffering | |
CN113837383A (zh) | 模型训练方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |