CN110570672B - 一种基于图神经网络的区域交通信号灯控制方法 - Google Patents

一种基于图神经网络的区域交通信号灯控制方法 Download PDF

Info

Publication number
CN110570672B
CN110570672B CN201910881544.6A CN201910881544A CN110570672B CN 110570672 B CN110570672 B CN 110570672B CN 201910881544 A CN201910881544 A CN 201910881544A CN 110570672 B CN110570672 B CN 110570672B
Authority
CN
China
Prior art keywords
traffic
network
flow
road network
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910881544.6A
Other languages
English (en)
Other versions
CN110570672A (zh
Inventor
余正旭
蔡登�
魏龙
谢亮
金仲明
黄建强
华先胜
何晓飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201910881544.6A priority Critical patent/CN110570672B/zh
Publication of CN110570672A publication Critical patent/CN110570672A/zh
Application granted granted Critical
Publication of CN110570672B publication Critical patent/CN110570672B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/07Controlling traffic signals
    • G08G1/08Controlling traffic signals according to detected number or speed of vehicles

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明提供了一种基于图神经网络的区域交通信号灯控制方法,同时训练一个交通流量预测器和一个交通信号灯控制器,通过使用交通流量预测器对当前干预动作下的未来车流变化预测值,来帮助交通信号灯控制器生成新的控制方案,并使用其对当前动作的价值的评价信息,来辅助训练交通信号灯控制器最大化交通信号灯控制方案的长期、短期收益。交通流量预测器和信号灯控制器均基于深度消息传播图网络搭建而成。利用本发明,可以不断优化***适应变化的车流,提高路网通畅程度和交通效率。

Description

一种基于图神经网络的区域交通信号灯控制方法
技术领域
本发明属于交通信号灯控制领域,尤其是涉及一种基于图神经网络的区域交通信号灯控制方法。
背景技术
交通信号灯控制是一个关键而又具有挑战性的现实问题,其目的是使路网的交通效率最大化,并避免交叉口内可能的交通冲突。近年来,信号交叉口成为了是城市交通路网中的交通效率提升最大的瓶颈之一。因此,找到一种切实可行的能够根据当期、未来车流情况自动学习调节的交通信号控制方法,能够显著地缓解交通拥堵,并带来显著的经济、环境和社会效益。
目前,许多现代城市中广泛使用的交通信号控制***,如SCATS、SCOOT等***,这些***的交通信号方案主要是依靠基于统计历史交通数据的交通信号控制算法设计得到。这些方法的控制策略(基于预定义相位的控制策略)是改变每个预先定义好的相位的参数如放行时间等。其中相位的概念是指该相位放行时间内各方向各车道的信号状态的组合。这些方法在不断变化,与时间相关的交通场景中既不灵活,也不能动态的根据实时流量调整信号控制方案。除此之外,还有其他较少使用的自适应交通信号控制方法,这些方法根据交叉口附近感应线圈的信号来确定下一秒(或时间段)应该放行哪些车道(相位)。但是这些方法同样也只依据当前的车流情况来干预交通流,并没有充分利用到历史交通数据来帮助优化、设计控制方案。同时这些方法还受到其依赖的感应线圈易损坏、在线率不稳定等问题的影响。
为了解决传统交通控制方法中存在的问题,最近提出了许多基于增强学习的信号灯控制方法。其中大部分方法仍使用每一秒(或时间段)决定下一秒(或时间段)可通行车道组合的相位切换策略。这些方法比使用预定义相位的控制策略显得更为灵活,但是这种方法频繁、突然的相位切换方式容易导致交通事故,并且严重影响驾驶体验。因此,为了避免因相位突然切换而造成驾驶体验不良和交通事故等问题,最近提出了一些基于预定义相位的强化学习方法。
但是,不论是传统方法,或者是基于强化学习的方法,均将主要焦点放在了一个或很少量的交通灯的独立控制上,忽略了交通控制行为对周边路网可能带来的影响。同时,目前的方法仍然局限于对历史交通数据的学习和对当前车流的及时响应,忽略了交通控制行为可能带来的对未来区域车流的影响。
发明内容
本发明提供了一种基于图神经网络的区域交通信号灯控制方法,可以不断优化***适应变化的车流,提高路网通畅程度和交通效率。
一种基于图神经网络的区域交通信号灯控制方法,其特征在于,包括:
(1)从信号灯控制***中获取当前的信号控制方案以及目标区域路网过去几个周期的流量数据,所述的信号控制方案包括周期长度、相位方案和各相位放行时间;一般选择过去五个周期的流量数据,具体周期数目亦可根据应用需求修改(每一个周期指的是每个相位执行一次的时间总长);
(2)将当前相位配时、各目标路口过去数个周期的流量数据、路网连接图输入到基于深度消息传播图网络MPGNN构建的交通流量预测器MPTF中,获得当前周期的各路口各方向的车流量预测数据;
(3)将当前信号控制方案、各目标路口过去数个周期的流量数据、路网连接图以及步骤(2)得到的车流量预测数据输入到基于深度消息传播图网络MPGNN构建的交通信号灯控制器RTSC,将生成的当前周期的各相位配时作为调节后的控制方案;其中,所述的RTSC为每一个控制路口构建控制子网络,每个控制子网络使用同样的MPGNN输出作为输入;
(4)使用交通流量预测器MPTF,输入步骤(3)调节后的控制方案、各目标路口过去数个周期的流量数据、路网连接图,评估步骤(3)调节动作的价值;
(5)使用步骤(3)调节后的控制方案控制路网一个周期时间;
(6)从信号灯控制***中收集当前的路网流量数据,结合该周期开始前的路网流量数据,计算步骤(3)中调节方案的收益;
(7)使用步骤(6)中收集的路网流量数据和调节方案收益,结合步骤(4)中得到的价值估计,训练交通流量预测器MPTF;
(8)使用步骤(6)中得到的调节方案收益和步骤(4)中得到的价值估计,训练交通信号灯控制器RTSC;
(9)开始下一个周期,每个周期重复上述步骤(1)至步骤(8)。
本发明使用当前、历史流量数据以及配时方案,生成信号灯相位配时方案。同时训练一个流量预测器和一个信号灯控制器,可以同时控制多个交通信号灯,并协同优化每个交通信号控制方案;通过在线训练方式,使用交通流量预测器预测当前干预动作下的未来车流变化预测值,来帮助交通信号灯控制器生成新的控制方案,并使用交通流量预测器的动作价值预测器评估新的控制方案的价值,来辅助训练交通信号灯控制器最大化交通信号灯控制方案的长期、短期收益。整个算法以最小化路口等待时间为目标来优化每个步骤。
交通流量预测器和信号灯控制器均基于本发明中提出的深度消息传播图网络(MPGNN)搭建而成。
所述的深度消息传播图网络MPGNN由多个图神经网络层组成,网络输入是由路网上各节点的流量值和表示各节点间连接关系的路网连接图组成的输入图;在MPGNN中的每一层,会对输入图上各节点进行信息传播和信息汇聚两个操作,这两个操作的数学表达式分别为:
Figure BDA0002206012990000041
Figure BDA0002206012990000042
其中,
Figure BDA0002206012990000043
是节点v在经过第k层信息传播操作的输出,
Figure BDA0002206012990000044
是节点v在经过第k层信息汇聚操作的输出,
Figure BDA0002206012990000045
是输入图上节点v的流量值,N(v)表示所有直接连接到节点v的节点的集合,MLP表示由三层全连接神经网络层组成的多层感知机。
步骤(2)中,所述交通流量预测器MPTF获得车流量预测数据的步骤为:首先将当前信号控制方案中的各相位配时使用多层全连接神经网络提取成特征编码;然后将各目标路口过去数个周期的流量数据、路网连接图、相位配时特征编码输入MPGNN,提取得到当前区域路网交通情况的特征向量;最后,将特征向量输入到未来流量预测器中,得到未来流量的预测值。
步骤(3)中,所述交通信号灯控制器RTSC生成行相位配时步骤为:
(3-1)将步骤(2)中得到的车流量预测数据、当前相位配时、各目标路口过去数个周期的流量数据、路网连接图输入一个MPGNN得到当前区域路网交通情况的特征向量;
(3-2)根据需要控制的各路口分别构建一个路口控制子网络,每个子网络输出的相位配时与该路口相位数目有关。具体的,如果一个路口有6个相位,那么控制该路口的子网络将生成6个相位的配时,而另一个控制只有2个相位的子网络将生成2个相位的配时。各子网络均使用当前区域路网交通情况的特征向量作为输入,输出为各路口的控制动作高维连续分布的均值、平方差值;
(3-3)各子网络从对应路口的控制动作高维连续分布中采样出各相位配时,并使用Softmax函数将各相位配时归一化得到各相位配时比例,再乘以周期长度得到各相位配时长度。
步骤(4)中,交通流预测器MPTF的使用方式与步骤(2)中相似,但当前相位配时用步骤(3)中生成的新配时替代。具体步骤为:输入步骤(3)调节后的控制方案、各目标路口过去数个周期的流量数据、路网连接图后,将得到的当前区域路网交通情况特征向量输入到动作价值预测器中用以预测步骤(3)中生成的新配时价值。
步骤(6)中,所述调节方案的收益表达式为:
R(O(t-1),O(t),A(t))=O(t-1)-O(t)
其中,O(i)为第i个周期内,区域路网各路口各方向的车辆排队长度;A(t)为第i个周期开始前步骤(3)中生成的相位配时。该收益的具体意义为区域路网各节点上的排队长度变化值,最终得到的R是一个向量。
步骤(7)中,训练交通流量预测器使用的损失函数为:
Figure BDA0002206012990000051
其中,Vθ(O(t-1),A(t))为步骤(4)中预测的新配时价值,
Figure BDA0002206012990000052
为步骤(2)中得到的流量预测值(车辆排队长度),|*|L1为平均绝对误差函数。
步骤(8)中,训练信号灯控制器使用的目标函数为:
Figure BDA0002206012990000053
其中,N为所有路口的集合,训练采用在线训练策略,每一个周期之后所有网络均会被优化一次。
与现有技术相比,本发明具有以下有益效果:
1、本方法基于图神经网络挖掘区域路网车流的相关特征,对路网车流的演化过程建模,能够提高交通信号灯控制器、流量预测器的对路网车流变化趋势的感知能力。
2、本发明提出的基于图神经网络的所有网络,仅需使用路网连接图来表明路网拓扑结构,而各路口连接边上的车流转移权重由网络动态学习得到。克服了基于卷积图网络的其他方法需要使用拉普拉斯特征基来构建图网络结构的缺点。
3、本发明提出的流量预测器,通过动态对路网车流演化过程建模,能够更好的刻画车流动态变化。在有说服力的公开数据集上测试,效果超过其他目前世界最优秀的流量预测方法。
4、本发明提出的交通信号灯控制器,可同时控制大量路口信号灯。与先前的最优秀的方法相比,能够协同优化所有信号灯,以达到路网流量均衡,有效提升路网通畅程度的作用。基于图神经网络提取得到的当前车流特征为交通信号灯控制器提升了其全局感知能力。
5、本发明将流量预测和交通信号灯控制有机结合,通过在线训练的方式,不断优化***适应变化的车流,并提高路网通畅程度和交通效率。流量预测值的使用,使得交通信号灯控制器提高了对动作未来收益的感知能力,帮助提高交通信号灯控制器的动作价值。同时对动作价值的预测,可以帮助提高交通信号灯控制器产生的动作的远期收益。
附图说明
图1为本发明基于图神经网络的区域交通信号灯控制方法的流程示意图
图2为本发明中交通流量预测器MPTF的结构示意图;
图3为本发明中交通信号灯控制器RTSC的结构示意图;
图4为本发明实施例中基于SUMO模拟器搭建的仿真路网示意图;
图5为本发明实施例在模拟流量配置1下测试的路网平均速度可视化图;
图6为本发明实施例在模拟流量配置1下测试的路网平均排队长度可视化图。
具体实施方式
下面结合附图和实施例对本发明做进一步详细描述,需要指出的是,以下所述实施例旨在便于对本发明的理解,而对其不起任何限定作用。
如图1所示,一种基于图神经网络的区域交通信号灯控制方法,使用预定义相位、调节各相位配时长度的控制策略。本发明使用在线训练方法在运行中不断学习,在每一个周期(每个相位执行一次的时间总长)内,该方法包括以下步骤:
S01从信号灯控制***中获取当前的信号控制方案和流量指标数据。其中信号控制方案包括周期长度、相位方案、各相位放行时间及信号灯结构化静态数据如GPS定位、版本号等。流量指标数据包括目标区域路网过去几个周期各路口各方向的车辆排队长度,亦可根据应用需求替换为其他可表示流量状况的指标如通过车辆数目等。
S02将当前相位配时、各目标路口过去数个周期的流量数据、路网连接图输入基于MPGNN构建的交通流量预测器MPTF,获得当前周期的各路口各方向的车辆排队长度的预测值,交通流量预测器MPTF的结构如图2所示。其中的深度消息传播图网络MPGNN是由多个图神经网络层组成,网络输入是由路网上各节点的流量值和表示各节点间连接关系的路网连接图组成的输入图。在MPGNN中的每一层,会对输入图上各节点进行‘信息传播’和‘信息汇聚’两个操作,这两个操作的数学表达式为:
Figure BDA0002206012990000071
Figure BDA0002206012990000072
其中,
Figure BDA0002206012990000073
是节点v在经过第k层‘信息传播’操作的输出,
Figure BDA0002206012990000074
是节点v在经过第k层‘信息汇聚’操作的输出,
Figure BDA0002206012990000075
是输入图上节点v的流量值,N(v)表示所有直接连接到节点v的节点的集合,MLP表示由三层全连接神经网络层组成的多层感知机。在‘信息传播’操作中,所有直接连接到节点v的节点的信息被线性加和。在‘信息汇聚’操作中,‘信息传播’操作的输出会和上一层输出的节点信息相加,然后输入MLP得到当前层的输出图。
S03将当前信号控制方案、各目标路口过去数个周期的流量数据、S02中得到的流量预测数据、路网连接图输入基于MPGNN构建的交通信号灯控制器RTSC,生成当前周期的各相位配时。交通信号灯控制器RTSC的结构如图3所示。其中,交通信号灯控制器RTSC为每一个控制路口个性化构建控制子网络,每个控制子网络均使用同样的MPGNN的输出作为输入。而各子网络输出的相位配时从一个独立的高维连续分布中采样得到。
S04使用交通流量预测器,输入S03中调节后的控制方案、各目标路口过去数个周期的流量数据、路网连接图,通过深度传播图网络MPGNN后得到当前路网情况的特征向量,再输入到由三个全连接层构成的动作价值预测器中得到调节动作的价值预测值。三个全连接层之间各有一个ReLU激活函数。
S05使用S03中调节后的控制方案控制路网一个周期时间。
S06再次从信号灯控制***中收集当前的路网流量数据,结合该周期开始前的路网流量数据,计算S03中调节方案的收益。收益的计算方式为:
R(O(t-1),O(t),A(t))=O(t-1)-O(t)
其中O(i)为第i个周期内,区域路网各路口各方向的车辆排队长度,A(t)
为第i个周期开始前S03中生成的相位配时。该收益的具体意义为区域路网各节点上的排队长度变化值,最终得到的R是一个向量。
S07使用S06中收集的路网流量数据和计算得到的收益,结合S04中得到的价值估计,训练交通流量预测器。训练交通流量预测器使用的损失函数为:
Figure BDA0002206012990000081
其中Vθ(O(t-1),A(t))为S04中预测的新配时价值,
Figure BDA0002206012990000082
为S02中得到的流量预测值(车辆排队长度),|*|L1为平均绝对误差函数。
S08使用S06中得到的收益和S04中得到的价值估计,训练交通信号灯控制器。训练信号灯控制器使用的目标函数为:
Figure BDA0002206012990000083
其中N为所有路口的集合。本发明使用在线训练策略,每一个周期之后所有网络均会被优化一次。
S09开始下一周期,重复S01到S09。
为了验证本发明对提升交通路网运行效率的有效性,我们在SUMO模拟器上构建了一个具有21个路口、72条道路的仿真路网,仿真路网示意图如图4所示。我们根据真实车流规律生成了具有挑战性的仿真车流,对比本发明同时控制21个路口时与目前最有效的同类方法的效果。SUMO模拟器全称Simulation of Urban Mobility,是由德国航空航天中心运输***研究所(Institute of Transportation Systems at the German AerospaceCenter)开发的一款目前在交通领域最常用的交通仿真软件,以其接近真实的仿真效果著称。我们在SUMO模拟器中生成了三种配置的车流,以验证方法在不同场景下的效果。三种配置车流如下表1所示:
表1
Figure BDA0002206012990000091
其中车流主要趋势表示了该段时间内,车流在路网中路线的趋势,例如西到东表示该股车流在路网中大部分由西向东形势,以此模拟潮汐车流场景。车辆到达率决定了车流量的大小,数值越大,交通压力越大。
在三种交通流配置下本发明与目前最有效的同类方法比较的结果如下表2所示:
表2
Figure BDA0002206012990000101
其中,Traffic Configuration表示表1中的配置编号,Avg.Speed是整个模拟过程中路网平均车速的均值,Avg.Queue是整个模拟过程中路网平均路口排队长度的均值,Avg.Waiting是整个模拟过程中车辆在路网中等待通行(包括拥堵和等红绿灯)的平均时间,Time Duration是完成整个模拟所花费的时间。从结果看出,我们的方法(GraphRTSC)相比于所有选取的同类方法在三种交通流配置下各项指标均超过了同类方法。同时,我们测试了不使用MPTF提供的预测流量时的效果(GraphRTSC-noMPTF),如表2所示,效果差于使用MPTF提供的预测流量(GraphRTSC)。
同时,我们将配置1下每一秒的路网平均车速和平均排队长度记录下来,比较本发明与同类方法的效果。如图5和图6所示,本发明(GraphRTSC)在路网平均车速和平均排队长度上表现均优于同类方法。
另外,为验证本发明中流量预测器的流量预测准确有效性,在METR-LA数据集与目前世界最优秀的流量预测方法进行了对比实验。由南加州大学公开的METR-LA数据集包含从洛杉矶县高速公路环形探测器收集的交通信息,包括207个传感器的从2012年3月1日到2012年6月30日的车流数据。
本实验在测试集上与目前最有效的同类方法DCRNN、STGCN、ST-UNet就15分钟、30分钟和60分钟预测准确率做了比较,对比结果如表3所示。
表3
Figure BDA0002206012990000111
从结果看出,本发明的方法(MPTF)相比于所有选取的同类方法在该数据集上具有明显更高的准确率。
以上所述的实施例对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的具体实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于图神经网络的区域交通信号灯控制方法,其特征在于,包括:
(1)从信号灯控制***中获取当前的信号控制方案以及目标区域路网过去几个周期的流量数据,所述的信号控制方案包括周期长度、相位方案和各相位放行时间;
(2)将当前相位配时、各目标路口过去数个周期的流量数据、路网连接图输入到基于深度消息传播图网络MPGNN构建的交通流量预测器MPTF中,获得当前周期的各路口各方向的车流量预测数据;
(3)将当前信号控制方案、各目标路口过去数个周期的流量数据、路网连接图以及步骤(2)得到的车流量预测数据输入到基于深度消息传播图网络MPGNN构建的交通信号灯控制器RTSC,将生成的当前周期的各相位配时作为调节后的控制方案;其中,所述的RTSC为每一个控制路口构建控制子网络,每个控制子网络使用同样的MPGNN输出作为输入;所述交通信号灯控制器RTSC生成行相位配时步骤为:
(3-1)将步骤(2)中得到的车流量预测数据、当前相位配时、各目标路口过去数个周期的流量数据、路网连接图输入一个MPGNN得到当前区域路网交通情况的特征向量;
(3-2)根据需要控制的各路口分别构建一个路口控制子网络,每个子网络输出的相位配时与该路口相位数目有关,各子网络均使用当前区域路网交通情况的特征向量作为输入,输出为各路口的控制动作高维连续分布的均值、平方差值;
(3-3)各子网络从对应路口的控制动作高维连续分布中采样出各相位配时,并使用Softmax函数将各相位配时归一化得到各相位配时比例,再乘以周期长度得到各相位配时长度;
(4)使用交通流量预测器MPTF,输入步骤(3)调节后的控制方案、各目标路口过去数个周期的流量数据、路网连接图,评估步骤(3)调节动作的价值;
(5)使用步骤(3)调节后的控制方案控制路网一个周期时间;
(6)从信号灯控制***中收集当前的路网流量数据,结合该周期开始前的路网流量数据,计算步骤(3)中调节方案的收益;
(7)使用步骤(6)中收集的路网流量数据和调节方案收益,结合步骤(4)中得到的价值估计,训练交通流量预测器MPTF;
(8)使用步骤(6)中得到的调节方案收益和步骤(4)中得到的价值估计,训练交通信号灯控制器RTSC;
(9)开始下一个周期,每个周期重复上述步骤(1)至步骤(8)。
2.根据权利要求1所述的基于图神经网络的区域交通信号灯控制方法,其特征在于,所述的深度消息传播图网络MPGNN由多个图神经网络层组成,网络输入是由路网上各节点的流量值和表示各节点间连接关系的路网连接图组成的输入图;在MPGNN中的每一层,会对输入图上各节点进行信息传播和信息汇聚两个操作,这两个操作的数学表达式分别为:
Figure FDA0002665604450000021
Figure FDA0002665604450000022
其中,
Figure FDA0002665604450000023
是节点v在经过第k层信息传播操作的输出,
Figure FDA0002665604450000024
是节点v在经过第k层信息汇聚操作的输出,
Figure FDA0002665604450000025
是输入图上节点v的流量值,N(v)表示所有直接连接到节点v的节点的集合,MLP表示由三层全连接神经网络层组成的多层感知机。
3.根据权利要求1所述的基于图神经网络的区域交通信号灯控制方法,其特征在于,步骤(2)中,所述交通流量预测器MPTF获得车流量预测数据的步骤为:首先将当前信号控制方案中的各相位配时使用多层全连接神经网络提取成特征编码;然后将各目标路口过去数个周期的流量数据、路网连接图、相位配时特征编码输入MPGNN,提取得到当前区域路网交通情况的特征向量;最后,将特征向量输入到未来流量预测器中,得到未来流量的预测值。
4.根据权利要求1所述的基于图神经网络的区域交通信号灯控制方法,其特征在于,步骤(4)的具体步骤为:输入步骤(3)调节后的控制方案、各目标路口过去数个周期的流量数据、路网连接图后,将得到的当前区域路网交通情况特征向量输入到动作价值预测器中用以预测步骤(3)中生成的新配时价值。
5.根据权利要求1所述的基于图神经网络的区域交通信号灯控制方法,其特征在于,步骤(6)中,所述调节方案的收益表达式为:
R(O(t-1),O(t),A(t))=O(t-1)-O(t)
其中,O(t)为第t个周期内,区域路网各路口各方向的车辆排队长度;A(t)为第t个周期开始前步骤(3)中生成的相位配时。
6.根据权利要求1所述的基于图神经网络的区域交通信号灯控制方法,其特征在于,步骤(7)中,训练交通流量预测器使用的损失函数为:
Figure FDA0002665604450000031
其中,Vθ(O(t-1),A(t))为步骤(4)中预测的新配时价值,
Figure FDA0002665604450000032
为步骤(2)中得到的流量预测值,|*|L1为平均绝对误差函数。
7.根据权利要求1所述的基于图神经网络的区域交通信号灯控制方法,其特征在于,步骤(8)中,训练信号灯控制器使用的目标函数为:
Figure FDA0002665604450000033
其中,N为所有路口的集合,训练采用在线训练策略,每一个周期之后所有网络均会被优化一次。
CN201910881544.6A 2019-09-18 2019-09-18 一种基于图神经网络的区域交通信号灯控制方法 Active CN110570672B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910881544.6A CN110570672B (zh) 2019-09-18 2019-09-18 一种基于图神经网络的区域交通信号灯控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910881544.6A CN110570672B (zh) 2019-09-18 2019-09-18 一种基于图神经网络的区域交通信号灯控制方法

Publications (2)

Publication Number Publication Date
CN110570672A CN110570672A (zh) 2019-12-13
CN110570672B true CN110570672B (zh) 2020-12-01

Family

ID=68780815

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910881544.6A Active CN110570672B (zh) 2019-09-18 2019-09-18 一种基于图神经网络的区域交通信号灯控制方法

Country Status (1)

Country Link
CN (1) CN110570672B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110969871B (zh) * 2019-12-18 2020-11-24 浙江大学 一种智能交通灯控制***和控制方法
CN111341109B (zh) * 2020-05-19 2020-09-11 银江股份有限公司 一种基于时空相似性的城市级信号推荐***
US20220058944A1 (en) * 2020-08-24 2022-02-24 Quantela Inc Computer-based method and system for traffic congestion forecasting
CN112330962B (zh) * 2020-11-04 2022-03-08 杭州海康威视数字技术股份有限公司 交通信号灯控制方法、装置、电子设备及计算机存储介质
CN112734139B (zh) * 2021-01-28 2023-09-29 腾讯科技(深圳)有限公司 通行时长预测方法和装置、存储介质及电子设备
CN113053122B (zh) * 2021-03-23 2022-02-18 成都信息工程大学 基于wmgirl算法的可变交通管控方案中区域流量分布预测方法
GB2607880A (en) * 2021-06-11 2022-12-21 Vivacity Labs Ltd Traffic control system

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006331002A (ja) * 2005-05-25 2006-12-07 Omron Corp 信号制御装置
CN102906800A (zh) * 2010-02-01 2013-01-30 影视技术集成公司 建模和优化交通网络性能的***及方法
US9363783B2 (en) * 2010-07-09 2016-06-07 Digimarc Corporation Mobile device positioning in dynamic groupings of communication devices
CN109830102A (zh) * 2019-02-14 2019-05-31 重庆邮电大学 一种面向复杂城市交通网络的短时交通流量预测方法
CN110073301A (zh) * 2017-08-02 2019-07-30 强力物联网投资组合2016有限公司 工业物联网中具有大数据集的数据收集环境下的检测方法和***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006331002A (ja) * 2005-05-25 2006-12-07 Omron Corp 信号制御装置
CN102906800A (zh) * 2010-02-01 2013-01-30 影视技术集成公司 建模和优化交通网络性能的***及方法
US9363783B2 (en) * 2010-07-09 2016-06-07 Digimarc Corporation Mobile device positioning in dynamic groupings of communication devices
CN110073301A (zh) * 2017-08-02 2019-07-30 强力物联网投资组合2016有限公司 工业物联网中具有大数据集的数据收集环境下的检测方法和***
CN109830102A (zh) * 2019-02-14 2019-05-31 重庆邮电大学 一种面向复杂城市交通网络的短时交通流量预测方法

Also Published As

Publication number Publication date
CN110570672A (zh) 2019-12-13

Similar Documents

Publication Publication Date Title
CN110570672B (zh) 一种基于图神经网络的区域交通信号灯控制方法
CN111696370B (zh) 基于启发式深度q网络的交通灯控制方法
CN108197739B (zh) 一种城市轨道交通乘客流量预测方法
CN110032782B (zh) 一种城市级智能交通信号控制***及方法
EP3035314B1 (en) A traffic data fusion system and the related method for providing a traffic state for a network of roads
CN112419726B (zh) 一种基于交通流预测的城市交通信号控制***
CN109493599A (zh) 一种基于生成式对抗网络的短时交通流预测方法
CN109272157A (zh) 一种基于门控神经网络的高速公路交通流参数预测方法及***
CN109215355A (zh) 一种基于深度强化学习的单点交叉口信号配时优化方法
CN112907970B (zh) 一种基于车辆排队长度变化率的可变车道转向控制方法
CN109269516B (zh) 一种基于多目标Sarsa学习的动态路径诱导方法
Eriksen et al. Uppaal stratego for intelligent traffic lights
CN113516277B (zh) 一种基于路网动态定价的网联智能交通路径规划方法
Kao et al. A self-organizing map-based adaptive traffic light control system with reinforcement learning
CN113392577B (zh) 一种基于深度强化学习的区域边界主交叉口信号控制方法
CN116758767B (zh) 基于多策略强化学习的交通信号灯控制方法
CN113724507A (zh) 基于深度强化学习的交通控制与车辆诱导协同方法和***
CN108364491A (zh) 基于车流量预测的驾驶员信息提醒方法
CN110021168B (zh) 一种车联网下实现实时智能交通管理的分级决策方法
CN116631203A (zh) 结合交通流预测与强化学习的自适应交通信号控制方法
CN115705771A (zh) 基于强化学习的交通信号控制方法
Wang et al. Hybrid neural network modeling for multiple intersections along signalized arterials-current situation and some new results
Yu et al. Minimize pressure difference traffic signal control based on deep reinforcement learning
CN113657606A (zh) 车联网场景下分压聚合的局域联邦学习方法
Zhong et al. Deep Q‐Learning Network Model for Optimizing Transit Bus Priority at Multiphase Traffic Signal Controlled Intersection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant