CN117373235A - 一种行人与自动驾驶车辆的交互博弈均衡策略探究方法 - Google Patents
一种行人与自动驾驶车辆的交互博弈均衡策略探究方法 Download PDFInfo
- Publication number
- CN117373235A CN117373235A CN202311273246.1A CN202311273246A CN117373235A CN 117373235 A CN117373235 A CN 117373235A CN 202311273246 A CN202311273246 A CN 202311273246A CN 117373235 A CN117373235 A CN 117373235A
- Authority
- CN
- China
- Prior art keywords
- vehicle
- intelligent
- intelligent network
- model
- bicycle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 23
- 230000003993 interaction Effects 0.000 claims abstract description 26
- 230000033001 locomotion Effects 0.000 claims abstract description 12
- 238000004088 simulation Methods 0.000 claims abstract description 6
- 238000005457 optimization Methods 0.000 claims abstract description 5
- 230000006870 function Effects 0.000 claims description 46
- 230000001133 acceleration Effects 0.000 claims description 21
- 238000004891 communication Methods 0.000 claims description 21
- 230000006399 behavior Effects 0.000 claims description 18
- 230000008447 perception Effects 0.000 claims description 13
- 230000007246 mechanism Effects 0.000 claims description 10
- 230000035945 sensitivity Effects 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 8
- 230000008901 benefit Effects 0.000 claims description 7
- 230000016776 visual perception Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 5
- 238000012804 iterative process Methods 0.000 claims description 4
- 238000005303 weighing Methods 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 3
- 239000012634 fragment Substances 0.000 claims description 2
- 230000008878 coupling Effects 0.000 abstract description 2
- 238000010168 coupling process Methods 0.000 abstract description 2
- 238000005859 coupling reaction Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000004438 eyesight Effects 0.000 description 2
- 230000008713 feedback mechanism Effects 0.000 description 2
- 230000035515 penetration Effects 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/16—Anti-collision systems
- G08G1/166—Anti-collision systems for active traffic, e.g. moving vehicles, pedestrians, bikes
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明提供了一种行人与自动驾驶车辆的交互博弈均衡策略探究方法,属于自动驾驶决策与交通安全领域,包括提取出行人和车辆的运动轨迹、交通参数,构建跟驰模型、车辆期望速度函数,构建适合混合交通流信息非完全态的人车博弈均衡模型,对人车博弈均衡模型进行均衡求解;利用SUMO和Carla进行联合仿真,对均衡点的状态和稳定性进行分析,得出混行态下行人与自动驾驶车辆交互博弈的“效率‑安全”优化方案。通过混合自动驾驶跟驰模型与博弈模型的耦合建模,求解混行态下动态博弈模型的均衡点,解决现有技术当中对混合自动驾驶与行人交互博弈理论建模深度浅的问题。
Description
技术领域
本发明涉及自动驾驶决策与交通安全领域,具体是一种行人与自动驾驶车辆的交互博弈均衡策略探究方法
背景技术
本发明旨在研究智能网联化自动驾驶渗透水平由低到高变化下,城市交叉口汇集多种交通参与者异质交通流的冲突博弈问题,尤其针对过街行人与异智车辆(智能单车与多车智能)之间的冲突问题,考虑到自动驾驶交通场景下,如何同时保证行人与自动驾驶车辆之间的博弈均衡,即在车辆自动驾驶智能网联化的大趋势下,兼顾安全与效率的交通管理、载运工具策略制定相关理论和解决方法是迫切需要攻克的难题。
《智能网联汽车技术路线图2.0》研究判断,到2025年,我国PA、CA级智能网联汽车销量占当年汽车总销量比例超过50%,C—V2X终端新车装配率达50%,未来智能单车和智能网联汽车形成混行交通流是汽车行业发展要求下的必然趋势。
随着当下智能网联汽车的占比增加,虽然智能网联汽车能够通过计算机视觉等感知到周边行人的信息,并且通过大数据平台与其他网联汽车实现信息共享;但是由于智能单车只能通过自身感知设备获取周围信息,无法及时获取路侧行人交通流信息,因此在智能单车和多车智能混行的情况下,信息不进行共享,行人与车辆之间又难以实现信息准确识别与传达,因而会出现冲突风险增加和潜在效率损失的情况(如图1、2所示),存在不同智能水平下人车的交互风险。除此之外,行人与混行态的自动驾驶的冲突风险随着智能网联汽车的占比增加而不断变化。
随着智能网联汽车占智能汽车比例由少到多,带来的自动驾驶车辆渗透水平也会由低变高,异智交通流混行现象日益凸显,目前相关方面研究多数为研究行人与单一交通流下的交互博弈或研究自动驾驶车辆对行人的预测和感知,存在着自动驾驶车辆及混行态交通流与行人交互博弈建模深度低和该模型下人车交互均衡博弈的揭示不足的问题。
基于此,本发明提出一种行人与混合智能汽车冲突博弈均衡策略的探究方法,用于探讨交叉口混合智能汽车间因信息的不完全性而造成行人与混合交通流之间的安全问题。
发明内容
为了克服现有技术的不足,本发明的目的在于提供一种行人与自动驾驶车辆的交互博弈均衡策略探究方法,通过混合自动驾驶跟驰模型与博弈模型的耦合建模,将自动驾驶跟驰模型反映信息不共享程度对车辆行驶工况的影响程度引用到动态博弈模型中,再利用动态博弈模型反映博弈双方的动态反馈机制以及行为-风险双向影响机制的内在特点,从而求解混行态下动态博弈模型的均衡点,解决现有技术当中对混合自动驾驶与行人交互博弈理论建模深度浅的问题。
为实现上述目的,本发明提供如下技术方案:
一种行人与自动驾驶车辆的交互博弈均衡策略探究方法,包括以下步骤:
(1)获取大量交叉口人车交互场景视频,通过人工筛选出冲突区域可能发生驾驶人与行人的交互的视频片段;从筛选出的视频片段中提取出行人和车辆的运动参数、道路基本参数以及其它影响驾驶行为与过街行为的相关变量数据;
(2)构建跟驰模型,跟驰模型包括智能单车跟驰模型、智能网联汽车跟驰模型,用于获取智能单车或智能网联汽车混行状态下的加速度;构建车辆期望速度函数,用于获得车辆期望速度;
(3)构建适合混合交通流信息非完全态的人车博弈均衡模型,人车博弈均衡模型中嵌入有跟驰模型、车辆期望速度函数;利用跟驰模型、车辆期望速度函数获得的混行状态下的车辆加速度、车辆期望速度作为解释变量的一部分,与从步骤(1)筛选影响驾驶行为与过街行为的关键影响因素共同纳入效用方程中,将自动驾驶车辆让行概率和行人过街概率表示出来;
(4)针对于步骤(3)中的人车博弈均衡模型构建求解模型,求解模型用于获得混合交通流信息非完全态的人车博弈均衡模型的均衡点;
(5)将步骤(4)中的求解模型应用于SUMO和Carla进行联合仿真,分别推演出单点博弈下的行人与车辆采取某个特定策略的概率,以及到达均衡点的迭代过程,同时分析均衡点的稳定性,通过综合考虑均衡点的状态和稳定性参数,得出混行态下行人与自动驾驶车辆交互博弈的“效率-安全”优化方案。
所述智能单车跟驰模型为:
aK(t)=k[(γVK,i(ΔxK,i(t-τm))+κVK,i+1(ΔxK,i+1(t-τc))-vK(t)]+λ[βΔvK,i(t-τm)] (1),
在智能单车跟驰模型中,智能单车与智能单车、智能网联汽车之间都没有网络数据连接,只有前后雷达传感器与机器视觉提供感知信息;因此智能单车跟驰模型的加速度期望函数只与车辆自身感知***有关,而与混行状态无关;
aK(t)、vK(t)为智能单车K在时刻t的加速度、速度;
ΔxK,i(t-τm)=xi(t-τm)-xK(t-τm)为智能单车K对邻近前车i视觉感知产生的纵向位置差;τm为机器视觉感知延时;
ΔvK,i(t-τm)=vi(t-τm)-vK(t-τm)为智能单车K对邻近前车i视觉感知产生的纵向速度差;
ΔxK,i+1(t-τc)=xK(t-τc)-xi+1(t-τc)为雷达传感器提供给智能单车K与相邻跟随车辆i+1的纵向位置差;
τc为通信延时,在智能单车中,该项为车载网络内部通信延时,γ,β为自动驾驶感知权重;VK,i(.)表示智能单车K与邻近前车i交互产生的车辆期望速度函数,VK,i+1(.)表示智能单车K与邻近后车i+1交互产生的车辆期望速度函数;
κ为前方车辆i对自动驾驶决策的影响程度,k>0,λ>0为敏感性参数。
智能网联汽车跟驰模型的构建步骤如下:
假设在智能网联汽车与智能单车混行状态下,智能网联汽车自前往后依次排列为0、1、2、……j-1、j、j+1、……,智能单车任意混行其中;
情况一,假设智能网联汽车j的相邻前车为智能网联汽车j-1,则智能网联汽车跟驰模型为:
aj(t)、vj(t)为智能网联汽车j在时刻t的加速度、速度;
Δxj,j-n(t-τc)=xj-n(t-τc)-xj(t-τc)为通信网络提供给智能网联汽车j与其前方智能网联汽车j-n的纵向位置差;
Δvj,j-n(t-τc)=vj-n(t-τc)-vj(t-τc)为通信网络提供给智能网联汽车j与其前方智能网联汽车j-n的纵向速度差;
Δxj,i+1(t-τc)=xj(t-τc)-xj+1(t-τc)为雷达传感器提供给智能网联汽车j与相邻跟随车辆i+1的间距;
Δxj,j-1(t-τc)=xj-1(t-τc)-xj(t-τc)为雷达传感器提供给智能网联汽车j与智能网联汽车j-1的间距;
Vj,j-n(.)表示智能网联汽车j与智能网联汽车j-n交互产生的车辆期望速度函数;
τc为通信延时;k>0,λ>0为敏感性参数;p为车辆期望函数系数,wj,j-n为不同前车对智能决策机制的影响权重:
情况二、假设智能网联汽车j的相邻前车为智能单车K时,则智能网联汽车跟驰模型为:
aj(t),vj(t)为智能网联汽车j在时刻t的加速度,速度;
Δxj,j-n(t-τc)=xj-n(t-τc)-xj(t-τc)为通信网络提供给自动驾驶车辆j与前方智能网联汽车j-n的纵向位置差;
Δvj,j-n(t-τc)=vj-n(t-τc)-vj(t-τc)为通信网络提供给自动驾驶车辆j与前方智能网联汽车j-n的纵向速度差;
Δxj,i+1(t-τc)=xj(t-τc)-xi+1(t-τc)为雷达传感器提供给智能决策机制车辆j与相邻跟随i+1的纵向位置差;
Δxj,K(.)为智能网联汽车j对前方相邻智能单车K的机器视觉感知产生的纵向位置差;
Δvj,K(.)为智能网联汽车j对前方相邻智能单车K的机器视觉感知产生的纵向速度差;
Vj,K(.)为智能网联汽车j与智能单车前车K交互产生的车辆期望速度函数;
τm为机器视觉感知延时;k>0,λ>0为敏感性参数;γ,β为自动驾驶感知权重;p为车辆期望函数系数,wj,j-n为不同前车对智能决策机制的影响权重:
V(Δx)为车辆期望速度函数,由下分段函数表示:
F(Δx)为连续单调函数,可以表达为:
Δxst为使汽车停止的人车距离差,Δxgo为允许汽车行驶的人车距离差,vmax为车辆速度以最高车速行驶。
所述构建适合混合交通流信息非完全态的人车博弈均衡模型,包括:
(3.1)将S定义为博弈参与者的选择集,S1为自动驾驶的决策集,S2为行人的选择集,规定博弈双方在交互过程中会采取最高效用的决策,并假定对方同样采取这样决策策略,同时考虑风险变化对于决策效益的负向影响;
(3.2)将步骤(1)中提取出行人和车辆的运动轨迹、交通参数代入到跟驰模型、车辆期望速度函数中,得到混行状态下的车辆加速度、车辆期望速度;从步骤(1)提取出行人和车辆的运动轨迹、交通参数中筛选出影响驾驶行为与过街行为的关键影响因素,并将这些关键影响因素与车辆加速度、车辆期望速度共同纳入效用方程中,得出驾驶人与行人决策收益矩阵,采用Logit-QRE形式将自动驾驶车辆让行概率和行人过街概率表示出来。
与现有技术相比,本发明的有益效果是:
1、本发明基于混合自动驾驶跟驰模型,结合量子响应均衡博弈理论,建立混合自动驾驶交通流与行人交叉口动态博弈模型,利用自动驾驶跟驰模型反映信息不共享程度对车辆行驶工况的影响程度,利用动态博弈模型反映博弈双方的动态反馈机制以及行为-风险双向影响机制的内在特点,结合模型和理论,将信息不共享性由跟驰模型体现,从而求解混行态下动态博弈模型的均衡点,解决现有技术当中对混合自动驾驶与行人交互博弈理论建模深度浅的问题。
2、本发明基于SUMO和Carla的联合仿真,使用较为成熟的方案为求解单点博弈下的行人与车辆采取不同策略的概率和均衡点的迭代过程,为不同自动驾驶渗透水平的交互博弈模型提供建模思路。
附图说明
图1为现有技术中智能单车与行人冲突场景的示意图。
图2为现有技术中智能网联汽车与行人冲突场景的示意图。
图3为本发明的方案流程图。
图4为本发明数据获取步骤流程图。
图5为本发明混合自动驾驶场景信息交互的示意图。
图6为本发明智能网联汽车之间跟驰状态的示意图。
图7为本发明智能网联汽车与智能单车跟驰状态的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
如图3-7所示,本发明公开的一种行人与自动驾驶车辆的交互博弈均衡策略探究方法,包括:
步骤一:获取实验模型数据。获取大量交叉口人车交互场景视频,通过人工筛选出需要截取的视频片段(即冲突区域可能发生车辆与行人的交互的片段,尤其注意车辆右转与行人进行交互的场景)。
步骤二:车辆和行人运动轨迹和交通参数的提取。如图4所示,利用计算机视觉模型YOLO X、R-CNN等对步骤一中的行人和车辆进行轨迹数据采集,提取出行人和车辆的运动参数、道路基本参数以及影响驾驶行为与过街行为的相关变量数据;包括行人过街前后一定时间内周边过街和等待的行人数,行人流密度、过街速度等;以及车辆交通量、密度、速度、车头时距、饱和度、通行能力和车头间距等参数。
步骤三:混合自动驾驶车辆跟驰模型的建立。在混合交通流下,考虑行人的认知和车辆的策略随信息不共享化程度的变化情况,利用自动驾驶跟驰模型(包含智能单车和智能网联化汽车),带入步骤二中的关键数据以及车辆模型的独特设定,分别获取智能单车和智能网联汽车混行状态下的运动参数,构建步骤如下:
分别使用智能单车跟驰模型和智能网联汽车跟驰模型:
1)智能单车跟驰模型:
aK(t)=k[(γVK,i(ΔxK,i(t-τm))+κVK,i+1(ΔxK,i+1(t-τc))-vK(t)]+λ[βΔvK,i(t-τm)] (1)
该模型中,智能单车与智能单车、智能网联汽车之间都没有网络数据连接,只有前后雷达传感器与机器视觉提供感知信息;因此智能单车跟驰模型的加速度期望函数只与车辆自身感知***有关,而与混行状态无关,如图5所示,但图5中仅表示出了部分混行状态,智能单车K前后无论是智能单车、智能网联汽车都是无关紧要的。
aK(t),vK(t)为智能单车K在时刻t的加速度(m/s2),速度(m/s);
ΔxK,i(t-τm)=xi(t-τm)-xK(t-τm)为智能单车K对相邻前车i视觉感知产生的纵向位置差;
ΔvK,i(t-τm)=vi(t-τm)-vK(t-τm)为智能单车K对相邻前车i视觉感知产生的纵向速度差;τm为机器视觉感知延时;
ΔxK,i+1(t-τc)=xK(t-τc)-xi+1(t-τc)为雷达传感器提供给智能单车K与相邻跟随车辆i+1的纵向位置差;
τc为通信延时,在智能单车中,该项为车载网络内部通信延时,γ,β为自动驾驶感知权重。VK,i(.)表示智能单车K与邻近前车i交互产生的车辆期望速度函数,VK,i+1(.)表示智能单车K与邻近后车i+1交互产生的车辆期望速度函数,与公式(2)符号物理意义一致。
κ为前方车辆i对自动驾驶决策的影响程度。k>0,λ>0为敏感性参数。
V(Δx)为车辆期望速度函数,由下分段函数表示:
F(Δx)为连续单调函数,可以表达为:
Δx为传感器传递的纵向位置差,Δxst为使汽车停止的距离差,Δxgo为允许汽车行驶的距离差,vmax为车辆速度以不超过当前交通限速的最高车速行驶(vmax在不同交通场景下会进行适当的调整)。在智能单车跟驰模型中,Δx为ΔxK,i(t-τm),是车辆期望速度函数的变量。
2)在智能网联汽车与智能单车混行状态下,智能网联汽车自前往后依次排列为0、1、2、……j-1、j、j+1、……,智能单车任意混行其中;
情况一,假设智能网联汽车j的邻近前车为智能网联汽车j-1(如图6所示,图6也仅示意出了这种情况下的部分混行状态,例如,智能网联汽车j相邻跟随车辆可以是智能网联汽车,也可以是智能单车),则智能网联汽车跟驰模型为:
aj(t),vj(t)为智能网联汽车j在时刻t的加速度(m/s2),速度(m/s);
Δxj,j-n(t-τc)=xj-n(t-τc)-xj(t-τc)为通信网络提供给自动驾驶车辆j与智能网联前车j-n的纵向位置差;
Δvj,j-n(t-τc)=vj-n(t-τc)-vj(t-τc)为通信网络提供给自动驾驶车辆j与智能网联前车j-n的纵向速度差;
Δxj,i+1(t-τc)=xj(t-τc)-xj+1(t-τc)为雷达传感器提供给智能决策机制车辆j与其相邻跟随车辆i+1的间距;
Δxj,j-1(t-τc)=xj-1(t-τc)-xj(t-τc)为雷达传感器提供给智能决策机制车辆j与相邻前车j-1的间距;
Vj,j-n(.)表示智能网联汽车j与前方智能网联汽车j-n交互产生的车辆期望速度函数,τc为通信延时;k>0,λ>0为敏感性参数。
p为车辆期望函数系数,wj,j-n为不同前车对智能决策机制的影响权重:
情况二、假设智能网联汽车j的邻近前车为智能单车K时(如图7所示,图7也仅示意出了这种情况下的部分混行状态,例如,智能网联汽车j相邻跟随车辆可以是智能网联汽车,也可以是智能单车),则智能网联汽车跟驰模型为:
aj(t),vj(t)为智能网联汽车j在时刻t的加速度(m/s2),速度(m/s);
Δxj,j-n(t-τc)=xj-n(t-τc)-xj(t-τc)为通信网络提供给自动驾驶车辆j与前方智能网联汽车j-n的纵向位置差;
Δvj,j-n(t-τc)=vj-n(t-τc)-vj(t-τc)为通信网络提供给自动驾驶车辆j与前方智能网联汽车j-n的纵向速度差;
Δxj,i+1(t-τc)=xj(t-τc)-xi+1(t-τc)为雷达传感器提供给智能网联汽车j与其相邻跟随车辆i+1的纵向位置差;
Δxj,K(.)为智能网联汽车j对相邻智能单车K的机器视觉感知产生的纵向位置差;
Δvj,K(.)为智能网联汽车j对相邻智能单车K的机器视觉感知产生的纵向速度差;
Vj,K(.)为智能网联汽车j与智能单车前车K交互产生的车辆期望速度函数,
τm为机器视觉感知延时;k>0,λ>0为敏感性参数;γ,β为自动驾驶感知权重;p为车辆期望函数系数,wj,j-n为不同前车对智能决策机制的影响权重,见式(5);
由式(1)、式(4)、式(5)及式中物理量可知,车辆跟驰时的运动参数,会随着车辆互联信息程度变化而变化,即信息不共享程度会影响每一辆智能网联汽车的跟驰状态和跟驰时的决策影响。
步骤四:基于混行态非完全信息的人车交互量子响应博弈建模。将步骤三的跟驰模型嵌入量子响应均衡博弈模型中,构建适合混合交通流信息非完全态的人车博弈均衡模型:
将S定义为博弈参与者的选择集,S1为自动驾驶的决策集,S2为行人的选择集,规定博弈双方在交互过程中会采取最高效用的决策,并假定对方同样采取这样决策策略,同时考虑风险变化对于决策效益的负向影响。
假设自动驾驶决策S1={让行,不让行},行人决策S2={过街,不过街}。
将步骤二的数据和步骤三的关键影响因素,纳入效用方程的建立,效用方程定义如下:
1)行人可以选择行为的期望效用函数表示为:
EU过街=P让行×aU+c1 (7)
EU不过街=bV+c2 (8)
2)驾驶员可以选择行为的期望效用函数表示为:
EU让行=dM+c3 (9)
EU不让行=(1-P过街)×eW+c4 (10)
其中,EU为驾驶员或行人采取相关策略时的效用,U和V分别为行人过街与不过街的解释变量向量,M和W分别为驾驶员让行与不让行的解释变量向量。c1、c2、c3、c4为常数项,a、b、d、e为系数的向量,0≤P让行≤1分别为行人对驾驶员会让路的预期,0≤P过街≤1分别为驾驶员对行人会过马路的预期。
行人过街的解释变量、不过街的解释变量、驾驶员让行的解释变量、驾驶员不让行的解释变量是从步骤二中提取出的行人和车辆运动参数、道路基本参数、其它影响驾驶行为与过街行为的相关变量数据以及步骤三的车辆加速度、车辆期望速度中筛选出来的,筛选的标准为:各个变量之间的Pearson相关系数小于0.5,且根据Boostrap采样t检验,变量的均值在5%的水平上;将筛选出来的关键变量带入相应的期望效用函数中,获得收益值,进而得出驾驶人与行人决策收益矩阵。
为关联自动驾驶决策机制与行人学习认知变化机制,拟采用Logit-QRE形式将自动驾驶车辆让行概率和行人过街概率表示出来:
驾驶人让行的概率为:
行人的过街概率为:
步骤五:均衡点求解模型构建。拟定从量子响应均衡的判断条件出发,结合多次博弈下博弈双方的策略变化趋势。均衡点求解如下:
采用极大似然估计法估计模型参数:
ΔEU过街和ΔEU让行是行人决策和驾车员决策的潜在指数,
ΔEU过街=EU过街-EU不过街 (13)
ΔEU让行=EU让行-EU不让行 (14)
进而构造行人决策的对数似然函数:
其中,a为人过街效用方程的参数系数,S为博弈参与者的选择集,yi=1表示行人选择动作{过街},yi=0表示行人选择动作{不过街},I{yi=1}表示行人i在选择过街策略时的效用系数,I{yi=0}表示行人i在选择不过街策略时的效用系数,是logistic分布的累积分布函数。
同理,可以构造自动驾驶决策的对数似然函数:
其中,b为自动驾驶让行效用方程的参数系数,yj=1表示驾驶员选择操作{让行},yj=0表示驾驶员选择操作{不让行}。
因此,用μ表示所有模型参数的向量,对数似然函数可以表示为:
LL(μ;y;X)=LL行人(a;S,V)+LL车辆(b;S,W) (17)
y表示交互的决策动作,X为效用函数的参数集合;
每次博弈的均衡点是LL,LL行人和LL车辆都处于最优的状态,这是一个多目标优化问题,即:argmax{LL(μ;y,X),LL行人(a;S,V),LL车辆(b;S,W)}。
参数估计-期望最大算法
期望最大化(EM)可以迭代地应用于logit-QRE的求解。P让行和P过街可被认为是潜在变量;对于一对初始概率{P过街,m,P让行,m},通过最大化整个对数似然函数来生成μm:
式中,m均表示迭代次数。
步骤六:仿真推演。结合利用SUMO和Carla进行联合仿真,分别推演出单点博弈下的行人与车辆采取某个特定策略的概率,以及到达均衡点的迭代过程,同时分析均衡点的稳定性,可以得出混行态下行人与自动驾驶车辆交互博弈的“效率-安全”优化方案。
以上所述的,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (5)
1.一种行人与自动驾驶车辆的交互博弈均衡策略探究方法,其特征在于,包括以下步骤:
(1)获取大量交叉口人车交互场景视频,通过人工筛选出冲突区域可能发生驾驶人与行人的交互的视频片段;从筛选出的视频片段中提取出行人和车辆的运动参数、道路基本参数以及其它影响驾驶行为与过街行为的相关变量数据;
(2)构建跟驰模型,跟驰模型包括智能单车跟驰模型、智能网联汽车跟驰模型,用于获取智能单车或智能网联汽车混行状态下的加速度;构建车辆期望速度函数,用于获得车辆期望速度;
(3)构建适合混合交通流信息非完全态的人车博弈均衡模型,人车博弈均衡模型中嵌入有跟驰模型、车辆期望速度函数;利用跟驰模型、车辆期望速度函数获得的混行状态下的车辆加速度、车辆期望速度作为解释变量的一部分,与从步骤(1)筛选影响驾驶行为与过街行为的关键影响因素共同纳入效用方程中,将自动驾驶车辆让行概率和行人过街概率表示出来;
(4)针对于步骤(3)中的人车博弈均衡模型构建求解模型,求解模型用于获得混合交通流信息非完全态的人车博弈均衡模型的均衡点;
(5)将步骤(4)中的求解模型应用于SUMO和Carla进行联合仿真,分别推演出单点博弈下的行人与车辆采取某个特定策略的概率,以及到达均衡点的迭代过程,同时分析均衡点的稳定性,通过综合考虑均衡点的状态和稳定性参数,得出混行态下行人与自动驾驶车辆交互博弈的“效率-安全”优化方案。
2.根据权利要求1所述一种行人与自动驾驶车辆的交互博弈均衡策略探究方法,其特征在于,所述智能单车跟驰模型为:
aK(t)=k[(γVK,i(ΔxK,i(t-τm))+κVK,i+1(ΔxK,i+1(t-τc))-vK(t)]+λ[βΔvK,i(t-τm)](1),
在智能单车跟驰模型中,智能单车与智能单车、智能网联汽车之间都没有网络数据连接,只有前后雷达传感器与机器视觉提供感知信息;因此智能单车跟驰模型的加速度期望函数只与车辆自身感知***有关,而与混行状态无关;
aK(t)、vK(t)为智能单车K在时刻t的加速度、速度;
ΔxK,i(t-τm)=xi(t-τm)-xK(t-τm)为智能单车K对邻近前车i视觉感知产生的纵向位置差;τm为机器视觉感知延时;
ΔvK,i(t-τm)=vi(t-τm)-vK(t-τm)为智能单车K对邻近前车i视觉感知产生的纵向速度差;
ΔxK,i+1(t-τc)=xK(t-τc)-xi+1(t-τc)为雷达传感器提供给智能单车K与相邻跟随车辆i+1的纵向位置差;
τc为通信延时,在智能单车中,该项为车载网络内部通信延时,γ,β为自动驾驶感知权重;VK,i(.)表示智能单车K与邻近前车i交互产生的车辆期望速度函数,VK,i+1(.)表示智能单车K与邻近后车i+1交互产生的车辆期望速度函数;
κ为前方车辆i对自动驾驶决策的影响程度,k>0,λ>0为敏感性参数。
3.根据权利要求1所述一种行人与自动驾驶车辆的交互博弈均衡策略探究方法,其特征在于:智能网联汽车跟驰模型的构建步骤如下:
假设在智能网联汽车与智能单车混行状态下,智能网联汽车自前往后依次排列为0、1、2、……j-1、j、j+1、……,智能单车任意混行其中;
情况一,假设智能网联汽车j的相邻前车为智能网联汽车j-1,则智能网联汽车跟驰模型为:
aj(t)、vj(t)为智能网联汽车j在时刻t的加速度、速度;
Δxj,j-n(t-τc)=xj-n(t-τc)-xj(t-τc)为通信网络提供给智能网联汽车j与其前方智能网联汽车j-n的纵向位置差;
Δvj,j-n(t-τc)=vj-n(t-τc)-vj(t-τc)为通信网络提供给智能网联汽车j与其前方智能网联汽车j-n的纵向速度差;
Δxj,i+1(t-τc)=xj(t-τc)-xj+1(t-τc)为雷达传感器提供给智能网联汽车j与相邻跟随车辆i+1的间距;
Δxj,j-1(t-τc)=xj-1(t-τc)-xj(t-τc)为雷达传感器提供给智能决策机制车辆j与智能网联汽车j-1的间距;
Vj,j-n(.)表示智能网联汽车j与智能网联汽车j-n交互产生的车辆期望速度函数;
τc为通信延时;k>0,λ>0为敏感性参数;p为车辆期望函数系数,wj,j-n为不同前车对智能决策机制的影响权重:
情况二、假设智能网联汽车j的相邻前车为智能单车K时,则智能网联汽车跟驰模型为:
aj(t),vj(t)为智能网联汽车j在时刻t的加速度,速度;
Δxj,j-n(t-τc)=xj-n(t-τc)-xj(t-τc)为通信网络提供给自动驾驶车辆j与前方智能网联汽车j-n的纵向位置差;
Δvj,j-n(t-τc)=vj-n(t-τc)-vj(t-τc)为通信网络提供给自动驾驶车辆j与前方智能网联汽车j-n的纵向速度差;
Δxj,i+1(t-τc)=xj(t-τc)-xi+1(t-τc)为雷达传感器提供给智能决策机制车辆j与相邻跟随i+1的纵向位置差;
Δxj,K(.)为智能网联汽车j对前方相邻智能单车K的机器视觉感知产生的纵向位置差;
Δvj,K(.)为智能网联汽车j对前方相邻智能单车K的机器视觉感知产生的纵向速度差;
Vj,K(.)为智能网联汽车j与前方相邻智能单车K交互产生的车辆期望速度函数;
τm为机器视觉感知延时;k>0,λ>0为敏感性参数;γ,β为自动驾驶感知权重;p为车辆期望函数系数,wj,j-n为不同前车对智能决策机制的影响权重。
4.根据权利要求2或3所述一种行人与自动驾驶车辆的交互博弈均衡策略探究方法,其特征在于,V(Δx)为车辆期望速度函数,由下分段函数表示:
F(Δx)为连续单调函数,可以表达为:
Δxst为使汽车停止的人车距离差,Δxgo为允许汽车行驶的人车距离差,vmax为车辆速度以最高车速行驶。
5.根据权利要求1所述一种行人与自动驾驶车辆的交互博弈均衡策略探究方法,其特征在于,所述构建适合混合交通流信息非完全态的人车博弈均衡模型,包括:
(3.1)将S定义为博弈参与者的选择集,S1为自动驾驶的决策集,S2为行人的选择集,规定博弈双方在交互过程中会采取最高效用的决策,并假定对方同样采取这样决策策略,同时考虑风险变化对于决策效益的负向影响;
(3.2)将步骤(1)中提取出行人和车辆的运动轨迹、交通参数代入到跟驰模型、车辆期望速度函数中,得到混行状态下的车辆加速度、车辆期望速度;从步骤(1)提取出行人和车辆的运动轨迹、交通参数中筛选出影响驾驶行为与过街行为的关键影响因素,并将这些关键影响因素与车辆加速度、车辆期望速度共同纳入效用方程中,得出驾驶人与行人决策收益矩阵,采用Logit-QRE形式将自动驾驶车辆让行概率和行人过街概率表示出来。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311273246.1A CN117373235A (zh) | 2023-09-28 | 2023-09-28 | 一种行人与自动驾驶车辆的交互博弈均衡策略探究方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311273246.1A CN117373235A (zh) | 2023-09-28 | 2023-09-28 | 一种行人与自动驾驶车辆的交互博弈均衡策略探究方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117373235A true CN117373235A (zh) | 2024-01-09 |
Family
ID=89397379
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311273246.1A Pending CN117373235A (zh) | 2023-09-28 | 2023-09-28 | 一种行人与自动驾驶车辆的交互博弈均衡策略探究方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117373235A (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107103749A (zh) * | 2017-05-19 | 2017-08-29 | 长安大学 | 车联网环境下跟驰交通流特性建模方法 |
CN110979309A (zh) * | 2019-12-23 | 2020-04-10 | 北京航空航天大学 | 一种考虑驾驶人感知误差的车辆跟驰模型稳定性控制方法 |
CN111583640A (zh) * | 2020-04-30 | 2020-08-25 | 重庆大学 | 基于车路协同的上匝道协同并道控制方法 |
CN111768616A (zh) * | 2020-05-15 | 2020-10-13 | 重庆大学 | 混合交通场景下基于车路协同的车队一致性控制方法 |
CN114523969A (zh) * | 2022-01-26 | 2022-05-24 | 江苏大学 | 一种车路协同环境下的智能网联车辆的跟驰方法 |
CN114973676A (zh) * | 2022-05-27 | 2022-08-30 | 重庆大学 | 一种快速路车道缩减区的混合交通众从牵制控制方法 |
CN115662113A (zh) * | 2022-09-30 | 2023-01-31 | 合肥工业大学 | 一种信号交叉口人车博弈冲突风险评估与预警方法 |
WO2023087157A1 (zh) * | 2021-11-16 | 2023-05-25 | 华为技术有限公司 | 一种智能驾驶方法及应用该方法的车辆 |
CN116311905A (zh) * | 2023-01-31 | 2023-06-23 | 重庆理工大学 | 一种基于博弈论的无信号右转交叉口行人轨迹预测方法 |
CN116758722A (zh) * | 2023-05-12 | 2023-09-15 | 湖南大学 | 一种基于数据驱动的混合交通环境网联车辆控制***及方法 |
-
2023
- 2023-09-28 CN CN202311273246.1A patent/CN117373235A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107103749A (zh) * | 2017-05-19 | 2017-08-29 | 长安大学 | 车联网环境下跟驰交通流特性建模方法 |
CN110979309A (zh) * | 2019-12-23 | 2020-04-10 | 北京航空航天大学 | 一种考虑驾驶人感知误差的车辆跟驰模型稳定性控制方法 |
CN111583640A (zh) * | 2020-04-30 | 2020-08-25 | 重庆大学 | 基于车路协同的上匝道协同并道控制方法 |
CN111768616A (zh) * | 2020-05-15 | 2020-10-13 | 重庆大学 | 混合交通场景下基于车路协同的车队一致性控制方法 |
WO2023087157A1 (zh) * | 2021-11-16 | 2023-05-25 | 华为技术有限公司 | 一种智能驾驶方法及应用该方法的车辆 |
CN114523969A (zh) * | 2022-01-26 | 2022-05-24 | 江苏大学 | 一种车路协同环境下的智能网联车辆的跟驰方法 |
CN114973676A (zh) * | 2022-05-27 | 2022-08-30 | 重庆大学 | 一种快速路车道缩减区的混合交通众从牵制控制方法 |
CN115662113A (zh) * | 2022-09-30 | 2023-01-31 | 合肥工业大学 | 一种信号交叉口人车博弈冲突风险评估与预警方法 |
CN116311905A (zh) * | 2023-01-31 | 2023-06-23 | 重庆理工大学 | 一种基于博弈论的无信号右转交叉口行人轨迹预测方法 |
CN116758722A (zh) * | 2023-05-12 | 2023-09-15 | 湖南大学 | 一种基于数据驱动的混合交通环境网联车辆控制***及方法 |
Non-Patent Citations (1)
Title |
---|
卢韵西: "基于Agent博弈学习的人车混行交通建模仿真与分析", 中国优秀硕士学位论文全文数据库, 15 May 2021 (2021-05-15) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111311945B (zh) | 一种融合视觉和传感器信息的驾驶决策***及方法 | |
CN111081065B (zh) | 路段混行条件下的智能车辆协同换道决策模型 | |
CN112215337B (zh) | 一种基于环境注意力神经网络模型的车辆轨迹预测方法 | |
CN108595823B (zh) | 一种联合驾驶风格和博弈理论的自主车换道策略计算方法 | |
CN112896170B (zh) | 一种车路协同环境下的自动驾驶横向控制方法 | |
CN109726804B (zh) | 一种基于行车预测场和bp神经网络的智能车辆驾驶行为拟人化决策方法 | |
CN109910909A (zh) | 一种多车运动状态的汽车轨迹网联交互式预测方法 | |
CN109272745A (zh) | 一种基于深度神经网络的车辆轨迹预测方法 | |
CN115662113B (zh) | 一种信号交叉口人车博弈冲突风险评估与预警方法 | |
CN110182217A (zh) | 一种面向复杂超车场景的行驶任务复杂度量化评估方法 | |
CN112487954A (zh) | 一种面向平面交叉口的行人过街行为预测方法 | |
CN115145281A (zh) | 复杂路口下基于多智能体联邦强化学习的车路协同控制***及方法 | |
CN111625989A (zh) | 一种基于a3c-sru的智能车汇入车流方法及*** | |
CN115100867A (zh) | 一种基于数字孪生的城市智能交通仿真方法 | |
CN117227755A (zh) | 基于强化学习的复杂交通场景下自动驾驶决策方法及*** | |
CN115593433A (zh) | 一种自动驾驶车辆远程接管方法 | |
Zhao et al. | An objective evaluation method for automated vehicle virtual test | |
CN114267191A (zh) | 缓解交通拥堵驾驶员控制***、方法、介质、设备及应用 | |
CN117075473A (zh) | 一种人机混驾环境下的多车协同决策方法 | |
CN117373235A (zh) | 一种行人与自动驾驶车辆的交互博弈均衡策略探究方法 | |
CN107612967A (zh) | 一种基于群体智能的车联网服务对象发现方法 | |
CN104616066B (zh) | 一种行车用量数据的采集方法及*** | |
CN106997552A (zh) | 一种基于智能手机的弹性停车激励***及方法 | |
CN118280103A (zh) | 一种面向无信号人行横道的人-车动态博弈决策模型的建立方法 | |
CN114802307B (zh) | 自动与人工混合驾驶场景下的智能车辆横向控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |