CN112365708B - 基于多图卷积网络的景区交通量预测模型建立和预测方法 - Google Patents

基于多图卷积网络的景区交通量预测模型建立和预测方法 Download PDF

Info

Publication number
CN112365708B
CN112365708B CN202011052408.5A CN202011052408A CN112365708B CN 112365708 B CN112365708 B CN 112365708B CN 202011052408 A CN202011052408 A CN 202011052408A CN 112365708 B CN112365708 B CN 112365708B
Authority
CN
China
Prior art keywords
scenic spot
scenic
traffic flow
map
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011052408.5A
Other languages
English (en)
Other versions
CN112365708A (zh
Inventor
张蕾
施元磊
高原
张小溪
王洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwest University
Original Assignee
Northwest University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwest University filed Critical Northwest University
Priority to CN202011052408.5A priority Critical patent/CN112365708B/zh
Publication of CN112365708A publication Critical patent/CN112365708A/zh
Application granted granted Critical
Publication of CN112365708B publication Critical patent/CN112365708B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications
    • G08G1/0145Measuring and analyzing of parameters relative to traffic conditions for specific applications for active traffic flow control
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/065Traffic control systems for road vehicles by counting the vehicles in a section of the road or in a parking area, i.e. comparing incoming count with outgoing count

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明属于数据挖掘和城市交通数据分析领域,公开了一种基于多图卷积网络的景区交通量预测模型建立和预测方法。包括如下步骤:1.构建多张表征景区间关系的特征图;2.构建基于多张特征图的卷积循环神经网络模型;3.训练卷积循环神经网络模型;4.使用训练好的卷积循环神经网络模型预测景区未来的交通流量值。本发明的新颖之处在于从图的角度构建城市景区网络,通过构建多张特征图来反映不同景区间的关系,然后融合多张特征图并同时捕获时空特征来预测景区未来的交通流量,得到每小时的交通流量值,提高了中长期预测的准确性,同时提高了训练的收敛速度和算法的鲁棒性。

Description

基于多图卷积网络的景区交通量预测模型建立和预测方法
技术领域
本发明属于数据挖掘和城市交通数据分析领域,具体涉及一种基于多图卷积网络的景区交通量预测模型建立和预测方法。
背景技术
随着便携式GPS智能设备的普及和社交媒体平台的成熟,产生了大量的包含时间和空间信息的异构数据。例如滴滴公司盖亚计划公开的出租车GPS轨迹数据,马蜂窝旅游平台的游客行程数据,Foursquare兴趣点(POI)签到数据等,这些多源异构数据为区域的流量预测提供了强有力的支撑。
文化旅游景区是城市中重要的兴趣点,是城市重要的组成部分。准确及时的景区交通流量预测,是城市智能交通***研究的重要内容,其研究有助于交通部门及时地采取措施缓解拥堵,提高道路网络利用率。同时,有助于减少旅行者的旅行时间和费用,改善旅行者的体验。此外,还可广泛的应用于基于位置的应用,例如兴趣点推荐、路径规划和城市规划。
现有的研究技术主要包括:基于统计学的方法、基于机器学习的方法和基于深度学习的方法。基于统计学的交通流量预测方法只关注时间序列数据的规律性,不能分析交通***的空间特征和动态变化,并且易受到异常值的干扰;基于机器学习的方法在短期预测时表现尚佳,但鲁棒性和长期预测的效果有待提高;现有的基于深度学习的交通流量预测方法在空间依赖性建模时仅考虑了交通路网的特征,比如路网连通性,而未充分应用预测对象蕴含的语义信息,比如预测区域的流行度、功能性等,这些因素对区域交通流量有不可忽视的影响。
发明内容
本发明的目的在于提供一种基于多图卷积网络的景区交通量预测模型建立和预测方法,用以解决现有技术中的等问题。
为了实现上述任务,本发明采用以下技术方案:
一种基于多图卷积网络的景区交通量预测模型建立方法,包括如下步骤:
步骤1:获取景区的多源异构数据,对景区的多源异构数据提取特征,获得景区流行度特征图、景区功能相似性特征图、景区距离特征图和景区交通通达度特征图;
步骤2:获取景区历史交通流量,对景区历史交通流量提取特征,获得景区的历史交通流量矩阵;
步骤3:建立构建多图卷积循环神经网络模型,将历史交通流量矩阵、景区流行度特征图、景区功能相似性特征图、景区距离特征图和景区交通通达度特征图作为输入,将景区预测交通流量作为输出,训练模型,将训练好的模型作为景区交通流量预测模型;
所述多图卷积循环神经网络模型包括图卷积网络和循环门控单元,所述图卷积网络用于根据历史交通流量矩阵、景区流行度特征图、景区功能相似性特征图、景区距离特征图和景区交通通达度特征图输出景区特征图的深度特征并根据景区特征图的深度特征建立多特征融合矩阵,所述循环门控单元用于根据多特征融合矩阵输出景区预测交通流量。
进一步的,所述景区流行度特征图的邻接矩阵P通过式1获得:
Figure BDA0002709959740000031
其中,Vi和Vj为景区集合中任意第i个和第j个景区,
Figure BDA00027099597400000318
Figure BDA00027099597400000319
分别为Vi和Vj的用户评论数,
Figure BDA0002709959740000032
为Vi和Vj的流行相似度,
Figure BDA0002709959740000033
的取值范围为[0,1],i和j为正整数。
进一步的,所述景区功能相似性特征图的邻接矩阵F通过式2获得:
Figure BDA0002709959740000034
其中,Vi和Vj为景区集合中任意第i个和第j个景区,
Figure BDA0002709959740000035
Figure BDA0002709959740000036
分别为Vi和Vj内各类POI数量组成的向量,r表示POI的类别总数,k表示第k类,
Figure BDA0002709959740000037
表示Vi的第k类POI数量,
Figure BDA0002709959740000038
表示Vj的第k类POI数量,
Figure BDA0002709959740000039
i、j、r和k均为正整数。
进一步的,所述景区距离特征图的邻接矩阵L通过式3获得:
Figure BDA00027099597400000310
其中,Vi和Vj为景区集合中任意第i个和第j个景区,dist(Vi,Vj)表示Vi和Vj之间的距离且
Figure BDA00027099597400000311
Figure BDA00027099597400000312
R为地球半径,
Figure BDA00027099597400000313
Figure BDA00027099597400000314
分别为Vi和Vj的经度,
Figure BDA00027099597400000315
Figure BDA00027099597400000316
分别为Vi和Vj的纬度,maxmin表示最大最小归一化,n表示景区的数量,i、j∈n,i、j和n均为正整数。
进一步的,所述景区交通通达度特征图的邻接矩阵T通过式4获得:
Figure BDA00027099597400000317
其中,Ti,j表示任意第i个景区和第j个景区的交通通达度,convenienttransportation表示第i个景区和第j个景区在同一路段上。
进一步的,所述景区的历史交通流量矩阵采用式5获得
Figure BDA0002709959740000041
其中,xmn表示第m时间间隔时第n个景区的交通流量值,m表示时间间隔的数量,n表示景区的数量。
进一步的,步骤3训练时的损失函数为:
Figure BDA0002709959740000042
其中,Yt表示t时间段内的实际交通流量,
Figure BDA0002709959740000043
表示t时间段内预测交通流量,Lreg是L2正则化项,μ是属于[0,1]的超参数。
一种基于多图卷积网络的景区交通量预测方法,包括如下步骤:
步骤a:获取目标景区的历史交通流量和目标景区的多源异构数据;
步骤b:对目标景区的多源异构数据提取特征,获得目标景区的景区流行度特征图、目标景区的景区功能相似性特征图、目标景区的景区距离特征图和目标景区的景区交通通达度特征图;对目标景区的历史交通流量提取特征,获得目标景区的历史交通流量矩阵;
步骤c:将目标景区的景区流行度特征图、目标景区的景区功能相似性特征图、目标景区的景区距离特征图和目标景区的景区交通通达度特征图和目标景区的历史交通流量矩阵输入景区预测交通流量,输出目标景区的预测交通流量。
进一步的,所述景区多源异构数据包括景区评论数据、景区POI数据、景区的地理坐标和道路网络数据。
本发明与现有技术相比具有以下技术特点:
(1)本发明结合空间特征与时间特征来对景区的交通流量进行精确的预测。本方案使用图卷积网络(GCN)来提取不同景区之间复杂的空间相关性特征;使用门控循环单元(GRU)来提取景区历史交通流量的时间特征,最后结合二者实现对景区交通流量的精确预测。
(2)本发明在提取景区区域之间的空间关联性方面,由CNN推广到的图卷积网络(GCN)可以处理任意图结构的数据。GCN模型在诸多前沿领域取得了不错的应用效果,比如文献分类、无监督学习和图像分类等。因此,本方案使用GCN模型来学习景区区域之间的空间关联特征。
(3)本发明在提取景区历史交通流量的时间特征方面,在针对序列数据的趋势预测,目前使用最广泛的神经网络模型是循环神经网络(RNN)。然而,由于循环神经网络(RNN)本身存在的梯度消失或梯度***的缺陷,传统的循环神经网络在长期预测方面存在局限性。LSTM模型和GRU模型是循环神经网络的变体,并已被证明可以解决以上问题。相较于结构复杂、参数较多并需要较长训练时间的LSTM模型,GRU模型结构较为简单且参数较少,能够更快学习到时间序列特征。因此,本方案选择了GRU模型从景区的历史流量数据中捕获时间相关性。
附图说明
图1为实施例中西安市4个著名旅游景区的分布示意图;
图2为实施例中西安市4个著名旅游景区的交通流量走势图;
图3为多图卷积循环神经网络景区交通流量预测模型的空间特征模块结构;
图4为门控循环单元(GRU)层数对交通流量预测精度的影响;
图5为输入的历史交通流量时长对交通流量预测精度的影响;
图6为门控循环单元(GRU)隐藏单元数目对交通流量预测精度的影响;
图7为多图卷积循环神经网络的交通流量预测精度与预测未来时长的关系图;
图8为多图卷积循环神经网络景区交通流量预测模型与DCRNN、T-GCN的训练时间成本对比图;
图9为不同特征图对景区交通流量预测精度的影响;
图10为实施例中多图卷积循环神经网络预测模型在长安区博物馆所在区域的交通流量预测结果;
图11为实施例中多图卷积循环神经网络预测模型在陕西历史博物馆所在区域交通流量预测结果。
具体实施方式
图卷积网络(GCN):GCN模型在诸多前沿领域取得了不错的应用效果,比如文献分类、无监督学习和图像分类等。在本发明中用于来提取不同景区之间复杂的空间相关性特征。
门控循环单元(GRU):GRU模型结构较为简单且参数较少,能够更快学习到时间序列特征。来提取景区历史交通流量的时间特征。
邻接矩阵:用表示特征图的节点间的相邻关系,在本发明中特征图上的节点均为景区。
在本实施例中,景区集合是指不同旅游景区的集合V,景区集合中包含多个不同的景区Vi,景区和景点含义相同,每个景区在地图上体现为一个具体坐标值。
交通流量:指一定时间内经过车辆的数量。
在本实施例中公开了一种基于多图卷积网络的景区交通量预测模型建立方法,包括如下步骤:
步骤1:获取景区的多源异构数据,对景区的多源异构数据提取特征,获得景区流行度特征图、景区功能相似性特征图、景区距离特征图和景区交通通达度特征图;
步骤2:获取景区历史交通流量,对景区历史交通流量提取特征,获得景区的历史交通流量矩阵;
步骤3:建立构建多图卷积循环神经网络模型,将历史交通流量矩阵、景区流行度特征图、景区功能相似性特征图、景区距离特征图和景区交通通达度特征图作为输入,将景区预测交通流量作为输出,训练模型,将训练好的模型作为景区交通流量预测模型;
所述多图卷积循环神经网络模型包括图卷积网络和循环门控单元,所述图卷积网络用于根据历史交通流量矩阵、景区流行度特征图、景区功能相似性特征图、景区距离特征图和景区交通通达度特征图输出景区特征图的深度特征并根据景区特征图的深度特征建立多特征融合矩阵,所述循环门控单元用于根据多特征融合矩阵输出景区预测交通流量。
具体的,所述景区多源异构数据包括景区评论数据、景区POI数据、景区的地理坐标和道路网络数据。
所述景区评论数据为使用从美团点评获取文化旅游景区评论数据,所述景区POI数据为从百度地图开放平台爬取到的景区周边要预测范围内的POI数据,所述景区的地理坐标为从百度地图开放平台获取景区的地理坐标数据,所述道路网络数据为从OpenStreetMap获取的城市道路网络数据。
优选的,所述景区流行度特征图的邻接矩阵P通过式1获得:
Figure BDA0002709959740000081
其中,Vi和Vj为景区集合中任意第i个和第j个景区,
Figure BDA0002709959740000082
Figure BDA0002709959740000083
分别为Vi和Vj的用户评论数,
Figure BDA0002709959740000084
为Vi和Vj的流行相似度,i和j为正整数。
在景区流行度特征图中,将景区作为图的节点,将流行相似度矩阵P作为图的邻接矩阵,由于景区流行度是游客对于该景区喜爱程度的直接表现,越流行的区域或POI,往往表现出更高的流量。同理,景区的交通流量也会受到景区热度的影响。两个景区的流行相似度
Figure BDA0002709959740000085
为其中较少的评论数与较多的评论数的比值,进而所有景区两两之间的流行相似度构成流行相似度矩阵P。
优选的,所述景区功能相似性特征图的邻接矩阵F通过式2获得:
Figure BDA0002709959740000086
其中,
Figure BDA0002709959740000087
Figure BDA0002709959740000088
分别为Vi和Vj内各类POI数量组成的向量,r表示POI的类别总数,k表示第k类,
Figure BDA0002709959740000089
表示Vi的第k类POI数量,
Figure BDA00027099597400000810
表示Vj的第k类POI数量,
Figure BDA00027099597400000811
r和k均为正整数。
在景区功能相似性特征图中,将景区作为图的节点,景区间的功能相似性矩阵F作为图的邻接矩阵,通过景区所在区域的各类POI数量分布来表征景区的功能性,并以余弦相似性来度量不同景区间功能相似性。
Figure BDA00027099597400000812
表示这两个向量之间的余弦相似度,以此作为这两个景区的功能相似性,进而所有景区两两之间的功能相似性构成功能相似性矩阵F。
优选的,所述景区距离特征图的邻接矩阵L通过式3获得:
Figure BDA0002709959740000091
其中,dist(Vi,Vj)表示Vi和Vj之间的距离且
Figure BDA0002709959740000092
Figure BDA0002709959740000093
R为地球半径,
Figure BDA0002709959740000094
Figure BDA0002709959740000095
分别为Vi和Vj的经度,
Figure BDA0002709959740000096
Figure BDA0002709959740000097
分别为Vi和Vj的纬度,maxmin表示最大最小归一化,i、j∈n,n为正整数。
在景区距离特征图中,将景区作为图的节点,景区间的距离特征矩阵L作为图的邻接矩阵,
Figure BDA0002709959740000098
其值越接近1,这两个景区的距离越近。
优选的,所述景区交通通达度特征图的邻接矩阵T通过式4获得:
Figure BDA0002709959740000099
其中,convenienttransportation表示Vi和Vj在同一路段上。
在景区交通通达度特征图中,将景区作为图的节点,将交通通达度矩阵T作为图的邻接矩阵,Vi和Vj若在同一路段上,则将其通达度置为1,否则为0,进而所有景区两两之间的通达度构成交通通达度矩阵T。
具体的,步骤2中景区历史交通流量为每个景区一定范围内(一般为预测区域)、一段时间内的出租车数目作为景区在该时段的交通流量。景区的位置分布不同,其所在区域的交通流量也不同。景区交通流量数据可以视作随时间变化的信号,为了预测景区的交通流量,景区的空间位置也是需要考虑的重要信息。因此,将流量值和位置耦合成时空交通流量矩阵作为模型的输入。
具体的,所述景区的历史交通流量矩阵采用式5获得
Figure BDA00027099597400000910
其中,矩阵的行代表时间间隔,矩阵的列代表景区,矩阵中的元素表示该景区在该时间段内的流量值,xmn表示第m时间间隔时第n个景区的交通流量值,m时间间隔的数量,n表示景区的数量。
具体的,在本实施例中,时间间隔为一小时。
具体的,所述图卷积网络(GCN)可以捕获每个景区与其他景区之间的区位接近度、交通通达度、流行相似度、功能相似性等多种空间相关性,以此来表征景区之间流量的相互影响。
具体的,本实施例中图卷积网络(GCN)为两层,第一层图卷积网络的输出作为第二层图卷积网络的输入,第二层图卷积网络的输出为提取到的4个不同的景区特征图的深度特征L*、T*、P*和F*
具体的,所述的多特征融合矩阵通过式5获得
H*=λ1×L*2×T*3×P*4×F* 式5
其中,L*、T*、P*和F*分别代表了景区流行度深度特征、景区所在区域功能相似性深度特征、景区距离深度特征和景区交通通达度深度特征,λ1、λ2、λ3和λ4为权重矩阵,其中元素的取值范围[0,1],训练过程中不断自适应更新。
具体的,所述循环门控单元(GRU)用于历史交通流量数据中挖掘时间特征,GRU在每个迭代过程的输入当前时间间隔内的H*,GRU的输出为当前时间间隔的交通流量预测值Ht,采用式5获得:
H*=λ1×L*2×T*3×P*4×F* 式5
其中,ut=σ(Wu*H*+Wu*Ht-1+bu),ct=tanh(Wc*(rt*Ht-1)+Wc*H*+bc),rt=σ(Wr*H*+Wr*Ht-1+br),ut和rt分别表示当前时间间隔的更新门和重置门,ct表示当前时间间隔的单元状态,Ht-1表示上一个时间间隔t-1的输出,Wu、Wr和Wc表示参数的权重,bu、br和bc分别表示参数中偏置,符号*表示卷积操作,σ和tanh表示激活函数。
优选的,步骤3训练时的损失函数为:
Figure BDA0002709959740000111
其中,Yt表示t时间段内的实际交通流量,
Figure BDA0002709959740000112
表示t时间段内预测交通流量,Lreg是L2正则化项,μ是属于[0,1]的超参数。
选择该损失函数的优势为:由于景区的交通流量受到多个因素的影响,本模型通过构建多个特征图的方式来表征这些因素,然而特征越多也越容易产生过拟合现象,因此在损失函数中加入正则化项来缓解该现象;此外,添加正则化项也可以使得损失函数更易收敛于一个相对稳定的值,减少了由于震荡而带来的不必要的迭代次数。
在模型的实际构造中,本发明通过网格搜索法来调整模型中GRU的相关参数,并在测试集上进行测试评估,以确定最优的相关参数。对GRU的层数在范围(1,2,3,4,5)中进行搜索,其结果如图4所示,确定本模型的GRU层数为3层。对于批量输入的历史交通流量时间长度,在(6,12,18,24,30,36)中进行搜索,其结果如图5所示,确定本模型的历史流量输入时长为24。对于模型中GRU的隐藏单元数目,在(16,32,64,100,128)范围内进行搜索,如图6所示,最终本模型选择效果最好的64个隐藏单元。
在本实施例中还公开了一种基于多图卷积网络的景区交通量预测方法,包括如下步骤:
步骤a:获取目标景区的历史交通流量和目标景区的多源异构数据;
步骤b:对目标景区的多源异构数据提取特征,获得目标景区的景区流行度特征图、目标景区的景区功能相似性特征图、目标景区的景区距离特征图和目标景区的景区交通通达度特征图;对目标景区的历史交通流量提取特征,获得目标景区的历史交通流量矩阵;
步骤c:将目标景区的景区流行度特征图、目标景区的景区功能相似性特征图、目标景区的景区距离特征图和目标景区的景区交通通达度特征图和目标景区的历史交通流量矩阵输入景区预测交通流量,输出目标景区的预测交通流量。
实施例1
本实施例中对西安市四个著名旅游景区进行交通流量预测,包括西安美术馆、大雁塔、大慈恩寺和大唐芙蓉园,实施例中景区评论数据为使用从美团点评获的四个著名旅游景区评论数据,景区POI数据为从百度地图开放平台爬取到的四个著名旅游景区预测范围内的POI数据,景区的地理坐标为从百度地图开放平台获取四个著名旅游景区地理坐标数据,道路网络数据为从OpenStreetMap获取的西安市城市道路网络数据。本实施例中景区的车流量数据来自于西安市交通局提供的西安市出租车GPS轨迹数据集,其GPS点的采样间隔在2S到120S之间。
与其他的交通流量预测模型相比,本方案提出的多图卷积循环神经网络模型在景区交通流量预测问题上具有更高的预测精度。如表1所示,在预测时长为1小时时,多图卷积循环神经网络的准确率比基线方法ARMIA、SVR、GRU、DCRNN、T-GCN分别提高了35.81%、9.12%、1.57%、0.71%和1.73%。这是由于本模型使用了4张不同的特征图,考虑了丰富的领域知识,在区位特征和景区之间连通性的基础上进一步考虑了区域之间的功能相似性、景区之间的流行度相似性,捕获了影响流量变化的重要特征。多图卷积循环神经网络模型有更强的鲁棒性。如图7所示,无论预测时长如何变化,多图卷积循环神经网络模型均能通过训练获得最佳的预测性能,预测结果的变化趋势较为稳定,说明本模型对预测时长相对不敏感。因此,本方案提出的多图卷积循环神经网络不仅可以用于短期交通流量预测,而且更适用于长期交通流量预测。多图卷积循环神经网络模型在训练模型的时间代价上也有很大优势。如图8所示,与需要迭代5000次方能收敛的T-GCN模型相比,多图卷积循环神经网络模型融入了多张特征图,仅需迭代500次就能取得不错的结果,训练模型的时间成本大大降低。
表1不同预测时长下不同方法的交通流量预测性能指标
Figure BDA0002709959740000131
Figure BDA0002709959740000141
为了进一步分析空间相关性建模的效果,本方案通过消融实验评估多图卷积循环神经网络中单个特征图的影响,包括景区区位图、景区交通通达性图、景区流行度相似图,景区所在区域功能相似性图。如图9所示,相较于不使用特征图,每种特征图均对交通流量预任务有一定贡献。这些特征图中,景区交通通达度特征图对流量预测的贡献最为明显,景区功能相似性图对交通留两个预测任务的贡献相对较小,从而验证了多图卷积循环神经网络中引入多种特征图的重要创新意义。

Claims (2)

1.一种基于多图卷积网络的景区交通量预测模型建立方法,其特征在于,包括如下步骤:
步骤1:获取景区的多源异构数据,对景区的多源异构数据提取特征,获得景区流行度特征图、景区功能相似性特征图、景区距离特征图和景区交通通达度特征图;
步骤2:获取景区历史交通流量,对景区历史交通流量提取特征,获得景区的历史交通流量矩阵;
步骤3:建立构建多图卷积循环神经网络模型,将历史交通流量矩阵、景区流行度特征图、景区功能相似性特征图、景区距离特征图和景区交通通达度特征图作为输入,将景区预测交通流量作为输出,训练模型,将训练好的模型作为景区交通流量预测模型;
所述多图卷积循环神经网络模型包括图卷积网络和循环门控单元,所述图卷积网络用于根据历史交通流量矩阵、景区流行度特征图、景区功能相似性特征图、景区距离特征图和景区交通通达度特征图输出景区特征图的深度特征并根据景区特征图的深度特征建立多特征融合矩阵,所述循环门控单元用于根据多特征融合矩阵输出景区预测交通流量;
所述景区流行度特征图的邻接矩阵P通过式1获得:
Figure FDA0003394841010000011
其中,Vi和Vj为景区集合中任意第i个和第j个景区,
Figure FDA0003394841010000012
Figure FDA0003394841010000013
分别为Vi和Vj的用户评论数,
Figure FDA0003394841010000014
为Vi和Vj的流行相似度,
Figure FDA0003394841010000015
的取值范围为[0,1],i和j为正整数;
所述景区功能相似性特征图的邻接矩阵F通过式2获得:
Figure FDA0003394841010000021
其中,Vi和Vj为景区集合中任意第i个和第j个景区,
Figure FDA0003394841010000022
Figure FDA0003394841010000023
分别为Vi和Vj内各类POI数量组成的向量,r表示POI的类别总数,k表示第k类,
Figure FDA0003394841010000024
表示Vi的第k类POI数量,
Figure FDA0003394841010000025
表示Vj的第k类POI数量,
Figure FDA0003394841010000026
i、j、r和k均为正整数;
所述景区距离特征图的邻接矩阵L通过式3获得:
Figure FDA0003394841010000027
其中,Vi和Vj为景区集合中任意第i个和第j个景区,dist(Vi,Vj)表示Vi和Vj之间的距离且
Figure FDA0003394841010000028
Figure FDA0003394841010000029
R为地球半径,
Figure FDA00033948410100000210
Figure FDA00033948410100000211
分别为Vi和Vj的经度,
Figure FDA00033948410100000212
Figure FDA00033948410100000213
分别为Vi和Vj的纬度,maxmin表示最大最小归一化,n表示景区的数量,i、j∈n,i、j和n均为正整数;
所述景区交通通达度特征图的邻接矩阵T通过式4获得:
Figure FDA00033948410100000214
其中,Ti,j表示任意第i个景区和第j个景区的交通通达度,convenienttransportation表示第i个景区和第j个景区在同一路段上;
所述景区的历史交通流量矩阵采用式5获得
Figure FDA0003394841010000031
其中,xmn表示第m时间间隔时第n个景区的交通流量值,m表示时间间隔的数量,n表示景区的数量;
步骤3训练时的损失函数为:
Figure FDA0003394841010000032
其中,Yt表示t时间段内的实际交通流量,
Figure FDA0003394841010000033
表示t时间段内预测交通流量,Lreg是L2正则化项,μ是属于[0,1]的超参数。
2.一种基于多图卷积网络的景区交通量预测方法,其特征在于,包括如下步骤:
步骤a:获取目标景区的历史交通流量和目标景区的多源异构数据;
步骤b:对目标景区的多源异构数据提取特征,获得目标景区的景区流行度特征图、目标景区的景区功能相似性特征图、目标景区的景区距离特征图和目标景区的景区交通通达度特征图;对目标景区的历史交通流量提取特征,获得目标景区的历史交通流量矩阵;
步骤c:将目标景区的景区流行度特征图、目标景区的景区功能相似性特征图、目标景区的景区距离特征图和目标景区的景区交通通达度特征图和目标景区的历史交通流量矩阵输入景区交通量预测模型预测交通流量,所述的景区交通量预测模型采用如权利要求1所述的基于多图卷积网络的景区交通量预测模型建立方法获得,输出目标景区的预测交通流量;
所述景区多源异构数据包括景区评论数据、景区POI数据、景区的地理坐标和道路网络数据。
CN202011052408.5A 2020-09-29 2020-09-29 基于多图卷积网络的景区交通量预测模型建立和预测方法 Active CN112365708B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011052408.5A CN112365708B (zh) 2020-09-29 2020-09-29 基于多图卷积网络的景区交通量预测模型建立和预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011052408.5A CN112365708B (zh) 2020-09-29 2020-09-29 基于多图卷积网络的景区交通量预测模型建立和预测方法

Publications (2)

Publication Number Publication Date
CN112365708A CN112365708A (zh) 2021-02-12
CN112365708B true CN112365708B (zh) 2022-04-19

Family

ID=74507609

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011052408.5A Active CN112365708B (zh) 2020-09-29 2020-09-29 基于多图卷积网络的景区交通量预测模型建立和预测方法

Country Status (1)

Country Link
CN (1) CN112365708B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112766240B (zh) * 2021-03-18 2022-08-12 福州大学 基于时空关系的残差多图卷积人群分布预测方法及***
CN113240904B (zh) * 2021-05-08 2022-06-14 福州大学 基于特征融合的交通流预测方法
CN113505536A (zh) * 2021-07-09 2021-10-15 兰州理工大学 一种优化的基于时空图卷积网络的交通流预测模型
CN115331425B (zh) * 2022-06-30 2023-12-19 银江技术股份有限公司 一种交通预警方法、装置和***
CN115641718B (zh) * 2022-10-24 2023-12-08 重庆邮电大学 一种基于卡口流量相似性和语义关联的短时交通流预测方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109389244A (zh) * 2018-09-06 2019-02-26 浙江鸿程计算机***有限公司 一种基于gru的多因素感知短期景区内游客人数预测方法
CN109993668A (zh) * 2019-04-09 2019-07-09 桂林电子科技大学 一种基于门控循环单元神经网络的景点推荐方法
CN110245285A (zh) * 2019-04-30 2019-09-17 中国科学院信息工程研究所 一种基于异构信息网络的个性化推荐方法
CN110969854A (zh) * 2019-12-13 2020-04-07 深圳先进技术研究院 一种交通流量的预测方法、***及终端设备
CN111126704A (zh) * 2019-12-25 2020-05-08 河海大学常州校区 基于多图卷积和记忆网络的多区域降水量预测模型构建方法
CN111274493A (zh) * 2020-01-17 2020-06-12 电子科技大学 一种基于多源用户评论的评分预测方法
CN111489013A (zh) * 2020-03-11 2020-08-04 北京交通大学 一种基于时空多图卷积网络的交通站点流量预测方法
CN111612122A (zh) * 2019-02-25 2020-09-01 北京嘀嘀无限科技发展有限公司 实时需求量的预测方法、装置及电子设备
CN111612489A (zh) * 2019-02-25 2020-09-01 北京嘀嘀无限科技发展有限公司 订单量的预测方法、装置及电子设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109389244A (zh) * 2018-09-06 2019-02-26 浙江鸿程计算机***有限公司 一种基于gru的多因素感知短期景区内游客人数预测方法
CN111612122A (zh) * 2019-02-25 2020-09-01 北京嘀嘀无限科技发展有限公司 实时需求量的预测方法、装置及电子设备
CN111612489A (zh) * 2019-02-25 2020-09-01 北京嘀嘀无限科技发展有限公司 订单量的预测方法、装置及电子设备
CN109993668A (zh) * 2019-04-09 2019-07-09 桂林电子科技大学 一种基于门控循环单元神经网络的景点推荐方法
CN110245285A (zh) * 2019-04-30 2019-09-17 中国科学院信息工程研究所 一种基于异构信息网络的个性化推荐方法
CN110969854A (zh) * 2019-12-13 2020-04-07 深圳先进技术研究院 一种交通流量的预测方法、***及终端设备
CN111126704A (zh) * 2019-12-25 2020-05-08 河海大学常州校区 基于多图卷积和记忆网络的多区域降水量预测模型构建方法
CN111274493A (zh) * 2020-01-17 2020-06-12 电子科技大学 一种基于多源用户评论的评分预测方法
CN111489013A (zh) * 2020-03-11 2020-08-04 北京交通大学 一种基于时空多图卷积网络的交通站点流量预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于多特征时空图卷积网络的水运通航密度预测;董伟 等;《物联网学报》;20200930;第4卷(第3期);第78-85页 *
基于时空多图卷积网络的交通站点流量预测;荣斌 等;《计算机工程》;20200531;第46卷(第5期);第26-33页 *
多源异构数据融合的城市私家车流量预测研究;刘晨曦 等;《通信学报》;20210331;第42卷(第3期);第54-64页 *

Also Published As

Publication number Publication date
CN112365708A (zh) 2021-02-12

Similar Documents

Publication Publication Date Title
CN112365708B (zh) 基于多图卷积网络的景区交通量预测模型建立和预测方法
CN111080029B (zh) 基于多路段时空相关的城市交通路段速度预测方法及***
CN110598953A (zh) 一种时空相关的空气质量预测方法
CN108629978A (zh) 一种基于高维路网和循环神经网络的交通轨迹预测方法
CN112561146A (zh) 一种基于模糊逻辑和深度lstm的大规模实时交通流预测方法
CN115578852B (zh) 一种基于dstgcn的交通预测方法
CN104462190A (zh) 一种基于海量空间轨迹挖掘的在线的位置预测方法
Xu et al. HighAir: A hierarchical graph neural network-based air quality forecasting method
Ou et al. Learn, assign, and search: real-time estimation of dynamic origin-destination flows using machine learning algorithms
CN114944053A (zh) 一种基于时空超图神经网络的交通流预测方法
Chen et al. A multiscale-grid-based stacked bidirectional GRU neural network model for predicting traffic speeds of urban expressways
CN112419711B (zh) 基于改进gmdh算法的封闭式停车场停车需求预测方法
CN116486624A (zh) 基于时空图卷积神经网络的交通流预测方法及***
CN113887704A (zh) 交通信息预测方法、装置、设备及存储介质
Yang et al. Feature selection in conditional random fields for map matching of GPS trajectories
Wang et al. Reconstruction of missing trajectory data: a deep learning approach
CN110263250A (zh) 一种推荐模型的生成方法及装置
CN112101132B (zh) 一种基于图嵌入模型和度量学习的交通状况预测方法
CN117271899A (zh) 一种基于时空感知的兴趣点推荐方法
CN117037483A (zh) 一种基于多头注意力机制的交通流预测方法
CN116486611A (zh) 一种城市道路车辆速度预测方法
CN113032688B (zh) 针对社交网络用户在未来给定时间的访问位置预测方法
CN115293427A (zh) 一种针对城市早高峰最优出行路线的规划方法及***
Chen et al. Deep citywide multisource data fusion-based air quality estimation
Li et al. MGC-GAN: Multi-graph convolutional generative adversarial networks for accurate citywide traffic flow prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant