CN116311905A - 一种基于博弈论的无信号右转交叉口行人轨迹预测方法 - Google Patents

一种基于博弈论的无信号右转交叉口行人轨迹预测方法 Download PDF

Info

Publication number
CN116311905A
CN116311905A CN202310048086.4A CN202310048086A CN116311905A CN 116311905 A CN116311905 A CN 116311905A CN 202310048086 A CN202310048086 A CN 202310048086A CN 116311905 A CN116311905 A CN 116311905A
Authority
CN
China
Prior art keywords
pedestrian
vehicle
game
track
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310048086.4A
Other languages
English (en)
Inventor
李文礼
唐远航
张祎楠
龚小豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Technology
Original Assignee
Chongqing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Technology filed Critical Chongqing University of Technology
Priority to CN202310048086.4A priority Critical patent/CN116311905A/zh
Publication of CN116311905A publication Critical patent/CN116311905A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/042Backward inferencing
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0129Traffic data processing for creating historical data or processing based on historical data
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/09Arrangements for giving variable traffic instructions
    • G08G1/0962Arrangements for giving variable traffic instructions having an indicator mounted inside the vehicle, e.g. giving voice messages
    • G08G1/0967Systems involving transmission of highway information, e.g. weather, speed limits
    • G08G1/096708Systems involving transmission of highway information, e.g. weather, speed limits where the received information might be used to generate an automatic action on the vehicle control
    • G08G1/096725Systems involving transmission of highway information, e.g. weather, speed limits where the received information might be used to generate an automatic action on the vehicle control where the received information generates an automatic action on the vehicle control
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/16Anti-collision systems
    • G08G1/166Anti-collision systems for active traffic, e.g. moving vehicles, pedestrians, bikes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Atmospheric Sciences (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明属于行人轨迹预测技术领域,尤其涉及一种基于博弈论的无信号右转交叉口行人轨迹预测方法,包括以下步骤:S1、获取行人及车辆在无信号右转交叉口的历史数据;S2、分析无信号右转交叉口的人车博弈因素,构建对应的人车博弈模型;S3、将人车博弈模型***到预设的S‑GAN模型中,得到SDG‑GAN模型,用于对行人的轨迹进行预测;S4、使用S1获取的历史数据,对SDG‑GAN模型进行训练;S5、使用训练好的SDG‑GAN模型对无信号右转交叉口的行人轨迹进行实时预测。本发明可以保证对无信号右转交叉口的行人轨迹的预测准确性,保证无信号右转交叉口的辅助驾驶决策的有效性,从而兼顾车辆通过无信号右转交叉口的效率及安全性。

Description

一种基于博弈论的无信号右转交叉口行人轨迹预测方法
技术领域
本发明属于行人轨迹预测技术领域,尤其涉及一种基于博弈论的无信号右转交叉口行人轨迹预测方法。
背景技术
在辅助驾驶领域,车辆过路口时的通过效率及安全性是非常重要的考量因素。在存在红绿灯的路口处,由于有红绿灯的指示,只需要跟着红绿灯的指示进行自动驾驶或辅助驾驶即可,人车冲突发生概率较低。
但是,在那些不存在红绿灯的特殊路口,如无信号右转交叉口,人车之间的相互关系变得尤为复杂,两者的行为既充满着不确定性又充满着联系,双方往往被多个不确定因素所影响,例如双方性格、环境因素等等。车辆通过无信号右转交叉路口时右转向并不需要接受交通信号的控制,右转机动车的随意行驶和不同方向交通流的相互作用下对行人产生干扰,大幅提高了行人通行的危险性。针对行人方面,由于行人在无信号右转交叉口通行时,具有较强的随机性以及机动性,且不同行人之间的通行意图也有明显区别。仅靠驾驶员主观判断并不准确,无法降低人车交互风险。
因此,要兼顾辅助驾驶/自动驾驶时通过无信号右转交叉口的效率与安全性,就需要对无信号右转交叉路口中行人的轨迹进行准确的预测,也只有这样,才能保证无信号右转交叉口的辅助驾驶决策的有效性。目前,行人的轨迹预测主要分为基于模型驱动的预测和基于历史数据驱动的深度学习预测。模型驱动包括社会力模型、马尔科夫模型、卡尔曼滤波模型等。由于深度学习可以较好的解决模型驱动预测方法的一些不足,使得基于历史数据驱动的深度学习预测逐渐成为了主流研究方向。例如,用于辅助驾驶的S-GAN模型(即Social-GAN,社会生成对抗网络),便在深度学习预测的基础上,加入了人车互动博弈的思想。
博弈论是现代数学的一个重要分支,用于研究双方或多个对象作为玩家,在相互影响的状态下进行决策的一个过程。博弈论的出现对于分析合作和竞争状态以及相互决策得失提供了一种精准的视角。但是,现有的关于交通路口的人车冲突的研究中,人车博弈思想的用途都集中在人车冲突安全性、通行风格、交互行为等研究。加入博弈思想对人车冲突中的各种风险因素分析,特别是对行人的轨迹预测的方式却几乎没有。而在实际交互场景中,人车交互是一个动态变化的过程,需要结合运动因素及宏观博弈决策。这就导致,现有研究的准确性都普遍有待提高,难以用于实际的无信号右转交叉口的辅助驾驶决策。
综上,怎样才能保证对无信号右转交叉口的行人轨迹的预测准确性,从而保证无信号右转交叉口的辅助驾驶决策的有效性,实现兼顾车辆通过无信号右转交叉口的效率及安全性,成为目前亟待解决的问题。
发明内容
针对上述现有技术的不足,本发明提供了一种基于博弈论的无信号右转交叉口行人轨迹预测方法,可以保证对无信号右转交叉口的行人轨迹的预测准确性,保证无信号右转交叉口的辅助驾驶决策的有效性,从而兼顾车辆通过无信号右转交叉口的效率及安全性。
为了解决上述技术问题,本发明采用了如下的技术方案:
一种基于博弈论的无信号右转交叉口行人轨迹预测方法,包括以下步骤:
S1、获取行人及车辆在无信号右转交叉口的历史数据;
S2、分析无信号右转交叉口的人车博弈因素,构建对应的人车博弈模型;
S3、将人车博弈模型***到预设的S-GAN模型中,得到SDG-GAN模型,用于对行人的轨迹进行预测;
S4、使用S1获取的历史数据,对SDG-GAN模型进行训练;
S5、使用训练好的SDG-GAN模型对无信号右转交叉口的行人轨迹进行实时预测。
优选地,S2中,人车博弈模型的构建过程包括:
S21、划分博弈阶段,设计观察区域和冲突区域,行人与车辆一旦进入观察区域则认定博弈开始;并利用后侵入时间来表征人车冲突的危险程度,所述后侵入时间为行人及车辆进入冲突区域的时间差,后侵入时间越短则危险程度越高;
S22、基于行人与车辆在博弈中的决策策略,构建人车博弈支付矩阵;所述决策策略包括行人车辆同时通行、行人等待车辆通行、行人通行车辆等待以及行人车辆同时等待;
S23、基于人车博弈支付矩阵的特征,得到人车博弈模型的期望函数及对应的损失函数;
S24、基于S23得到的期望函数及损失函数,构建人车博弈模型。
优选地,S22中,当行人车辆同时通行时,
行人的支付函数为:
Figure BDA0004056452490000021
车辆的支付函数为:
Figure BDA0004056452490000022
其中,vv表示行人通过速度、av表示行人加速度vp表示车辆通过速度、ap表示车辆加速度、α1表示车辆的速度与加速度的共同影响因子、α2表示行人的速度与加速度的共同影响因子、σv表示车辆的碰撞严重程度因子、σp表示行人的碰撞严重程度因子,且:
Figure BDA0004056452490000031
Figure BDA0004056452490000032
当行人等待车辆通行时,行人的支付函数为:
Figure BDA0004056452490000033
式中,α4为通过时的等待抑制系数,tp为行人等待时间;
车辆的支付函数为:
Figure BDA0004056452490000034
式中,α3为通过时的速度激励系数;
当行人通行车辆等待时,行人的支付函数为:
Figure BDA0004056452490000035
式中,α3为通过时的速度激励系数,vp为行人通过速度;
车辆的支付函数为:
Figure BDA0004056452490000036
式中,α4为通过时的等待抑制系数,tv为车辆等待时间,0.75s为驾驶员反应时间;
当行人车辆同时等待时,行人的支付函数为
Figure BDA0004056452490000037
车辆的支付函数为
Figure BDA0004056452490000038
其中,α5为共同损失下车辆的等待抑制系数;α6为共同损失下行人的等待抑制系数;k为双方的后悔度因子,后悔因子与等待过程中的起步加速度相关联,表征对采取等待策略的后悔度,起步加速度越大则后悔程度越大;
人车博弈支付矩阵为:
Figure BDA0004056452490000039
优选地,S23中,所述期望函数为车辆通过行择等待及行人通过车辆等待的混合优势策略的纳什均衡点时,车辆与行人双方的混合期望收益;
其中,当车辆选择通过时的期望收益
Figure BDA00040564524900000310
为:
Figure BDA0004056452490000041
其中,/>
Figure BDA0004056452490000042
表示行人通过的概率、/>
Figure BDA0004056452490000043
为行人等待的概率;
当车辆选择等待时的期望收益
Figure BDA0004056452490000044
为:
Figure BDA0004056452490000045
对行人的纯策略收益进行分析,行人通过时的期望收益
Figure BDA0004056452490000046
为:
Figure BDA00040564524900000423
其中,/>
Figure BDA0004056452490000047
表示车辆通过的概率、/>
Figure BDA0004056452490000048
表示车辆等待的概率;
当行人选择等待时的期望收益
Figure BDA0004056452490000049
为:
Figure BDA00040564524900000410
当车辆的通过期望收益
Figure BDA00040564524900000411
与等待期望收益/>
Figure BDA00040564524900000412
相同时纳什均衡出现,行人的通过与等待的概率组合如下所示:
Figure BDA00040564524900000413
Figure BDA00040564524900000414
当行人的通过期望收益
Figure BDA00040564524900000415
与等待期望收益/>
Figure BDA00040564524900000416
相同时纳什均衡出现,车辆的通过与等待的概率组合如下所示:
Figure BDA00040564524900000417
Figure BDA00040564524900000418
优选地,SDG-GAN模型对行人的轨迹进行预测时,对行人轨迹定义为在时间序列下的二维坐标位置变化,对行人u在t时刻下的坐标为
Figure BDA00040564524900000419
车辆j在t时刻下的坐标为/>
Figure BDA00040564524900000420
行人u从1到to内每个步长的历史轨迹集合Xu为:
Figure BDA00040564524900000421
式中,1~to为行人历史轨迹的观测帧,to为观测帧长度;
行人u从to+1到tp内每个步长的预测轨迹集合
Figure BDA00040564524900000422
为:
Figure BDA0004056452490000051
式中,to+1~to+tp为行人历史轨迹的预测帧,tp为预测帧长度。
行人u从to+1到tp内每个步长的真实历史轨迹集合Yu为:
Figure BDA0004056452490000052
行人u从1到tp内的真实历史轨迹
Figure BDA0004056452490000053
与预测生成轨迹/>
Figure BDA0004056452490000054
分别为[Xu,Yu]和
Figure BDA0004056452490000055
优选地,S3中,所述SDG-GAN模型包括人车博弈模型、轨迹生成器和轨迹鉴别器;轨迹生成器用于将人车博弈模型的输出结果及行人历史轨迹进行编码解码,输出行人预测轨迹;轨迹鉴别器用于鉴别行人预测轨迹为真实轨迹的概率。
优选地,轨迹生成器包括轨迹编码器、博弈机制模块、池化模块和轨迹解码器;
轨迹编码器用于将每个时间步下的行人坐标位置与车辆坐标位置嵌入至含有Relu非线性激活函数的嵌入函数φ中,获得固定长度向量
Figure BDA0004056452490000056
与/>
Figure BDA0004056452490000057
再通过LSTM单元编码获得行人历史轨迹特征向量/>
Figure BDA0004056452490000058
与车辆历史轨迹特征向量/>
Figure BDA0004056452490000059
Figure BDA00040564524900000510
Figure BDA00040564524900000511
式中,嵌入函数φ为全连接神经网络层,
Figure BDA00040564524900000512
为嵌入函数的权重参数,/>
Figure BDA00040564524900000513
为LSTM单元权重参数;
博弈机制模块用于基于人车双方的博弈支付函数,对人车双方的博弈相关数据进行提取;所述博弈相关数据包括速度、加速度、相对距离和等待时间;还用于利用每个时间步下的双方速度和与冲突区域的间隔距离获得此时的后侵入时间;利用后侵入时间数值判断此时间步下双方交互的危险程度;并通过双方此时的位置坐标判断其在观察区域或冲突区域;
博弈机制模块还用于根据真实世界下人车双方的交互决策进行标定,获得决策下的双方具体期望得失
Figure BDA00040564524900000514
和/>
Figure BDA00040564524900000515
具体期望得失对人车双方历史轨迹特征向量进行影响得到双方博弈特征向量/>
Figure BDA00040564524900000516
并融合成为人车混合博弈特征向量/>
Figure BDA00040564524900000517
Figure BDA00040564524900000518
式中,
Figure BDA00040564524900000519
为行人u与车辆j各自的碰撞严重程度因子,/>
Figure BDA00040564524900000520
为行人u与车辆j各自实时坐标区域,fpet为碰撞程度判定函数,fR为实时区域判断函数,tpet为人车交互时的后侵入时间,ωpet为碰撞程度权重参数,ωR为实时区域权重参数;
Figure BDA0004056452490000061
Figure BDA0004056452490000062
Figure BDA0004056452490000063
式中,fpay为博弈计算函数,
Figure BDA0004056452490000064
为双方不同策略下的具体支付函数,finf为博弈影响函数,fmix为博弈混合函数;
池化模块用于将人车相对距离嵌入至嵌入函数φ中得到人车相对位置特征向量
Figure BDA0004056452490000065
与人车混合博弈特征向量/>
Figure BDA0004056452490000066
连接并通过多层感知机最后输出得到博弈池化向量
Figure BDA0004056452490000067
Figure BDA0004056452490000068
Figure BDA0004056452490000069
式中,MlpGP为池化模块多层感知机网络层,Cat用于连接特征向量,
Figure BDA00040564524900000610
为对应各自网络层的权重参数;
轨迹解码器用于将博弈池化向量
Figure BDA00040564524900000611
与行人历史轨迹特征向量/>
Figure BDA00040564524900000612
进行连接,并通过解码器模块多层感知机MlpGD,与网络随机高斯噪声Z进行连接最后得到解码器特征向量/>
Figure BDA00040564524900000613
Figure BDA00040564524900000614
与经过嵌入函数编码后的行人坐标向量/>
Figure BDA00040564524900000615
初始化细胞全零向量/>
Figure BDA00040564524900000616
一并输入至LSTM神经网络层得到向量/>
Figure BDA00040564524900000617
最后将/>
Figure BDA00040564524900000618
经过解码器多层感知机最终得到行人轨迹预测坐标/>
Figure BDA00040564524900000619
Figure BDA00040564524900000620
Figure BDA00040564524900000621
Figure BDA00040564524900000622
Figure BDA00040564524900000623
式中,
Figure BDA00040564524900000624
ωλ为对应网络层的权重参数。
优选地,S3中,轨迹鉴别器的工作过程包括:将轨迹生成器输出的行人预测轨迹
Figure BDA00040564524900000625
和真实的行人历史轨迹Yu一并输入至鉴别器神经网络中,通过嵌入全连接神经网络层输出高维度特征向量/>
Figure BDA0004056452490000071
再依次通过LSTM神经网络层和鉴别器多层感知机,最后输出得到为真实轨迹的概率;
Figure BDA0004056452490000072
Figure BDA0004056452490000073
Figure BDA0004056452490000074
式中,
Figure BDA0004056452490000075
为LSTM网络层输出向量,/>
Figure BDA0004056452490000076
对应各自网络层的权重参数,Preal为判别为真实轨迹的概率。
优选地,S3中,SDG-GAN模型的损失函数LSDG-GAN包含生成器和鉴别器的交叉熵损失函数LGAN(G,D)与行人真实轨迹和行人预测轨迹的最小差值损失函数LL2(G);
LSDG-GAN=LGAN(G,D)+LL2(G);
Figure BDA0004056452490000077
Figure BDA0004056452490000078
式中,E为所得期望值,r为输入的行人真实轨迹数据,S为基于模型生成结果的采样个数,Z为输入的高斯噪声分布,D表示鉴别器、G表示生成器。
优选地,S1中,历史数据包括:视频的帧数、行人的坐标、行人的加速度、行人的等待时间、车辆的坐标、车辆的加速度、车辆的等待时间、人车距离以及后侵入时间;所述人车距离为行人与车辆之间的欧式距离。
本发明与现有技术相比,具有如下有益效果:
1、本发明在S-GAN的基础上,利用微观数据和博弈思想进行分析,得到不同时刻下无信号右转交叉口的人车的宏观交互策略;同时对人车交互进行阶段划分,包括观察区域与冲突区域。当处于观察区域中时,双方博弈支付收益通过概率获取其期望收益。当双方处于冲突区域时则判定已有决策,直接获取双方策略收益,实现对人车的博弈过程进行更为细致的分析。并在此基础上构建了SDG-GAN模型。之后,通过微观人车交互数据和宏观人车博弈策略收益共同驱动SDG-GAN模型对行人进行轨迹预测。通过这样的方式,本发明在实际交互场景中结合微观运动因素以及宏观博弈决策,将博弈思想加入人车交互状态中,可以对无信号右转交叉口的行人轨迹进行准确的预测。
综上,本发明可以保证对无信号右转交叉口的行人轨迹的预测准确性,保证无信号右转交叉口的辅助驾驶决策的有效性,从而兼顾车辆通过无信号右转交叉口的效率及安全性。
2、本发明构建的SDG-GAN算法融合宏观博弈与微观运动参数,对人车双方关系考虑更为全面,能够表达博弈状态下行人的真实反映,提高了预测行人轨迹的精准度及可解释性。
3、本发明分析可无信号右转交叉口的特殊交互场景下的具体人车博弈因素,划分了博弈阶段,并利用侵犯后时间指标来区分人车冲突的危险程度,还通过与起步加速度相关联的“后悔因子”来表征博弈双方的后悔度,尽可能的综合考虑了博弈双方的各种因素,并在此基础上建立了人车博弈支付矩阵。并且,还结合完全信息博弈的纳什均衡思想嵌入深度学习网络模型中,实现对行人轨迹的预测。这样的处理,可以保证无信号右转交叉口的行人轨迹的预测准确性。
附图说明
为了使发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步的详细描述,其中:
图1为实施例中的流程图;
图2为实施例中的博弈场景示意图;
图3为实施例中的SDG-GAN模型的结构示意图;
图4为实施例中的数据采集场景示意图。
具体实施方式
下面通过具体实施方式进一步详细的说明:
实施例:
如图1所示,本实施例中公开了一种基于博弈论的无信号右转交叉口行人轨迹预测方法,包括以下步骤:
S1、获取行人及车辆在无信号右转交叉口的历史数据。
具体实施时,史数据包括:视频的帧数、行人的坐标、行人的加速度、行人的等待时间、车辆的坐标、车辆的加速度、车辆的等待时间、人车距离以及后侵入时间;所述人车距离为行人与车辆之间的欧式距离。
并依据收集的历史数据,建立人车数据集:
(frame,id,xP,yP,vP,aP,wP,xV,yV,vV,aV,wV,R,PET),其中,右下标中的v、p分别指车辆和行人、frame表示视频的帧数,x/y表示坐标、v表示速度、a表示加速度、w表示等待时间、R表示人车距离、PET表示后侵入时间(即行人与车辆到达冲突区域的时间差)。
S2、分析无信号右转交叉口的人车博弈因素,构建对应的人车博弈模型。
通过实际场景观察与数据采集发现,依据当地交通法规规定在具体交互场景中车辆右转时需减速慢行,由于右转车辆车速相较直行车辆速度较慢,行人通行时的危险感并不强烈,大部分行人的通行意图非常强烈,并不愿意浪费时间等待。通过统计分析行人的通行行为发现,右转无信号交叉路口中由于无明确路权分布,行人普遍选择通行,而驾驶员普遍选择减速让行,由于车辆博弈失败其延误时间明显高于行人延误时间。
本发明提出一种人车博弈模型,建立博弈公式,给定宏观决策概率,具体分析行人通行时的影响因素。
模型定义。(1)行人与驾驶员存在理性思考,会根据自身情况进行选择策略。(2)行人与车辆一旦进入判断区域则认定博弈开始。(3)行人与驾驶员决定是否通过服从完全信息静态博弈,双方同时决策。(4)当行人与车辆同时进入冲突区域时则认定人车发生冲突。
模型建立。(1)玩家:在博弈过程中一共包含两位玩家,i=1,2,i=1代表行人,i=2代表车辆。(2)策略:行人与车辆博弈过程中,行人与车辆拥有两种相同策略{passgae,wait}。(3)效益:博弈过程中,每个玩家将会获得其他玩家对自身的影响与自身决策的结果。包括玩家等待时的延迟损失、双方冲突下的损失以及一方等待一方通过时的收益等等。不同情况下的玩家效益将进行具体分析。
行人与车辆在博弈中一共会产生四种决策结果,设定集合为sn,n∈[1,2,3,4],分别对应行人车辆同时通行、行人等待车辆通行、行人通行车辆等待以及行人车辆同时等待。当行人与车辆同时进入观察区域时,驾驶员与行人开始分析并选择策略,并在下一步执行策略。博弈双方最终都将进入冲突区域,其进入冲突区域的相对时间差即为后侵入时间,象征着此次博弈的危险程度,如图2所示。
基于上述分析,具体实施时,S2中,人车博弈模型的构建过程包括:
S21、划分博弈阶段,设计观察区域和冲突区域,行人与车辆一旦进入观察区域则认定博弈开始;并利用后侵入时间来表征人车冲突的危险程度,所述后侵入时间为行人及车辆进入冲突区域的时间差,后侵入时间越短则危险程度越高;
S22、基于行人与车辆在博弈中的决策策略,构建人车博弈支付矩阵;所述决策策略包括行人车辆同时通行、行人等待车辆通行、行人通行车辆等待以及行人车辆同时等待;
当行人车辆同时通行时,
行人的支付函数为:
Figure BDA0004056452490000091
车辆的支付函数为:
Figure BDA0004056452490000092
其中,vv表示行人通过速度、av表示行人加速度vp表示车辆通过速度、ap表示车辆加速度、α1表示车辆的速度与加速度的共同影响因子、α2表示行人的速度与加速度的共同影响因子、σv表示车辆的碰撞严重程度因子、σp表示行人的碰撞严重程度因子,且:
Figure BDA0004056452490000101
Figure BDA0004056452490000102
当行人等待车辆通行时,行人的支付函数为:
Figure BDA0004056452490000103
式中,α4为通过时的等待抑制系数,tp为行人等待时间;
车辆的支付函数为:
Figure BDA0004056452490000104
式中,α3为通过时的速度激励系数;
当行人通行车辆等待时,行人的支付函数为:
Figure BDA0004056452490000105
式中,α3为通过时的速度激励系数,vp为行人通过速度;
车辆的支付函数为:
Figure BDA0004056452490000106
式中,α4为通过时的等待抑制系数,tv为车辆等待时间,0.75s为驾驶员反应时间;
当行人车辆同时等待时,行人的支付函数为
Figure BDA0004056452490000107
车辆的支付函数为
Figure BDA0004056452490000108
其中,α5为共同损失下车辆的等待抑制系数;α6为共同损失下行人的等待抑制系数;k为双方的后悔度因子,后悔因子与等待过程中的起步加速度相关联,表征对采取等待策略的后悔度,起步加速度越大则后悔程度越大;
人车博弈支付矩阵为:
Figure BDA0004056452490000109
从人车博弈支付矩阵中可以得知,车辆选择通过行人选择等待、行人选择通过车辆选择等待这两种策略更为合理。由于这两种策略更占优势因此在演化过程中并不稳定,通过纳什均衡原理可知,在博弈中若存在混合优势策略组合则一定存在纳什均衡点,通过计算可知车辆与行人双方的混合期望收益。
S23、基于人车博弈支付矩阵的特征,得到人车博弈模型的期望函数及对应的损失函数;
具体实施时,所述期望函数为车辆通过行择等待及行人通过车辆等待的混合优势策略的纳什均衡点时,车辆与行人双方的混合期望收益;
其中,当车辆选择通过时的期望收益
Figure BDA0004056452490000111
为:
Figure BDA0004056452490000112
其中,/>
Figure BDA0004056452490000113
表示行人通过的概率、/>
Figure BDA0004056452490000114
为行人等待的概率;
当车辆选择等待时的期望收益
Figure BDA0004056452490000115
为:
Figure BDA0004056452490000116
对行人的纯策略收益进行分析,行人通过时的期望收益
Figure BDA0004056452490000117
为:
Figure BDA0004056452490000118
其中,/>
Figure BDA0004056452490000119
表示车辆通过的概率、/>
Figure BDA00040564524900001110
表示车辆等待的概率;
当行人选择等待时的期望收益
Figure BDA00040564524900001111
为:
Figure BDA00040564524900001112
当车辆的通过期望收益
Figure BDA00040564524900001113
与等待期望收益/>
Figure BDA00040564524900001114
相同时纳什均衡出现,行人的通过与等待的概率组合如下所示:
Figure BDA00040564524900001115
Figure BDA00040564524900001116
当行人的通过期望收益
Figure BDA00040564524900001117
与等待期望收益/>
Figure BDA00040564524900001118
相同时纳什均衡出现,车辆的通过与等待的概率组合如下所示:
Figure BDA00040564524900001119
Figure BDA00040564524900001120
S24、基于S23得到的期望函数及损失函数,构建人车博弈模型。
S3、将人车博弈模型***到预设的S-GAN模型中,得到SDG-GAN模型,用于对行人的轨迹进行预测。SDG-GAN模型的结构如图3所示。
SDG-GAN模型对行人的轨迹进行预测时,对行人轨迹定义为在时间序列下的二维坐标位置变化,对行人u在t时刻下的坐标为
Figure BDA0004056452490000121
车辆j轨迹坐标与行人坐标标定相同,车辆j在t时刻下的坐标为/>
Figure BDA0004056452490000122
行人u从1到to内每个步长的历史轨迹集合Xu为:
Figure BDA0004056452490000123
式中,1~to为行人历史轨迹的观测帧,to为观测帧长度;
行人u从to+1到tp内每个步长的预测轨迹集合
Figure BDA0004056452490000124
为:
Figure BDA0004056452490000125
式中,to+1~to+tp为行人历史轨迹的预测帧,tp为预测帧长度。
行人u从to+1到tp内每个步长的真实历史轨迹集合Yu为:
Figure BDA0004056452490000126
行人u从1到tp内的真实历史轨迹
Figure BDA0004056452490000127
与预测生成轨迹/>
Figure BDA0004056452490000128
分别为[Xu,Yu]和
Figure BDA0004056452490000129
具体实施时,SDG-GAN模型包括人车博弈模型、轨迹生成器和轨迹鉴别器;轨迹生成器用于将人车博弈模型的输出结果及行人历史轨迹进行编码解码,输出行人预测轨迹;轨迹鉴别器用于鉴别行人预测轨迹为真实轨迹的概率。
轨迹生成器包括轨迹编码器、博弈机制模块、池化模块和轨迹解码器;
轨迹编码器用于将每个时间步下的行人坐标位置与车辆坐标位置嵌入至含有Relu非线性激活函数的嵌入函数φ中,获得固定长度向量
Figure BDA00040564524900001210
与/>
Figure BDA00040564524900001211
再通过LSTM单元编码获得行人历史轨迹特征向量/>
Figure BDA00040564524900001212
与车辆历史轨迹特征向量/>
Figure BDA00040564524900001213
Figure BDA00040564524900001214
Figure BDA00040564524900001215
式中,嵌入函数φ为全连接神经网络层,
Figure BDA00040564524900001216
为嵌入函数的权重参数,/>
Figure BDA00040564524900001217
为LSTM单元权重参数。
博弈机制模块用于基于人车双方的博弈支付函数,对人车双方的博弈相关数据进行提取;所述博弈相关数据包括速度、加速度、相对距离和等待时间;还用于利用每个时间步下的双方速度和与冲突区域的间隔距离获得此时的后侵入时间;利用后侵入时间数值判断此时间步下双方交互的危险程度;并通过双方此时的位置坐标判断其在观察区域或冲突区域;
博弈机制模块还用于根据真实世界下人车双方的交互决策进行标定,获得决策下的双方具体期望得失
Figure BDA0004056452490000131
和/>
Figure BDA0004056452490000132
具体期望得失对人车双方历史轨迹特征向量进行影响得到双方博弈特征向量/>
Figure BDA0004056452490000133
并融合成为人车混合博弈特征向量/>
Figure BDA0004056452490000134
Figure BDA0004056452490000135
式中,
Figure BDA0004056452490000136
为行人u与车辆j各自的碰撞严重程度因子,/>
Figure BDA0004056452490000137
为行人u与车辆j各自实时坐标区域,fpet为碰撞程度判定函数,fR为实时区域判断函数,tpet为人车交互时的后侵入时间,ωpet为碰撞程度权重参数,ωR为实时区域权重参数;
Figure BDA0004056452490000138
Figure BDA0004056452490000139
Figure BDA00040564524900001310
式中,fpay为博弈计算函数,
Figure BDA00040564524900001311
为双方不同策略下的具体支付函数,finf为博弈影响函数,fmix为博弈混合函数;
池化模块用于将人车相对距离嵌入至嵌入函数φ中得到人车相对位置特征向量
Figure BDA00040564524900001312
与人车混合博弈特征向量/>
Figure BDA00040564524900001313
连接并通过多层感知机最后输出得到博弈池化向量
Figure BDA00040564524900001314
Figure BDA00040564524900001315
Figure BDA00040564524900001316
式中,MlpGP为池化模块多层感知机网络层,Cat用于连接特征向量,
Figure BDA00040564524900001317
为对应各自网络层的权重参数;/>
轨迹解码器用于将博弈池化向量
Figure BDA00040564524900001318
与行人历史轨迹特征向量/>
Figure BDA00040564524900001319
进行连接,并通过解码器模块多层感知机MlpGD,与网络随机高斯噪声Z进行连接最后得到解码器特征向量/>
Figure BDA00040564524900001320
Figure BDA00040564524900001321
与经过嵌入函数编码后的行人坐标向量/>
Figure BDA00040564524900001322
初始化细胞全零向量/>
Figure BDA00040564524900001323
一并输入至LSTM神经网络层得到向量/>
Figure BDA00040564524900001324
最后将/>
Figure BDA00040564524900001325
经过解码器多层感知机最终得到行人轨迹预测坐标/>
Figure BDA00040564524900001326
Figure BDA00040564524900001327
Figure BDA0004056452490000141
Figure BDA0004056452490000142
Figure BDA0004056452490000143
式中,
Figure BDA0004056452490000144
ωλ为对应网络层的权重参数。
轨迹鉴别器的工作过程包括:将轨迹生成器输出的行人预测轨迹
Figure BDA0004056452490000145
和真实的行人历史轨迹Yu一并输入至鉴别器神经网络中,通过嵌入全连接神经网络层输出高维度特征向量/>
Figure BDA0004056452490000146
再依次通过LSTM神经网络层和鉴别器多层感知机,最后输出得到为真实轨迹的概率;
Figure BDA0004056452490000147
Figure BDA0004056452490000148
Figure BDA0004056452490000149
式中,
Figure BDA00040564524900001410
为LSTM网络层输出向量,/>
Figure BDA00040564524900001411
对应各自网络层的权重参数,Preal为判别为真实轨迹的概率。
SDG-GAN模型的损失函数LSDG-GAN包含生成器和鉴别器的交叉熵损失函数LGAN(G,D)与行人真实轨迹和行人预测轨迹的最小差值损失函数LL2(G);
LSDG-GAN=LGAN(G,D)+LL2(G);
Figure BDA00040564524900001412
Figure BDA00040564524900001413
式中,E为所得期望值,r为输入的行人真实轨迹数据,S为基于模型生成结果的采样个数,Z为输入的高斯噪声分布,D表示鉴别器、G表示生成器。
S4、使用S1获取的历史数据,对SDG-GAN模型进行训练。
S5、使用训练好的SDG-GAN模型对无信号右转交叉口的行人轨迹进行实时预测。
对技术方案进行实际的实施时,发明人选取了C市BN区X大道一处无信号右转交叉路口作为数据采集地点,主要对行人与车的基本指标进行采集。由于此地点人流量密集,人车交互频繁,导致人车冲突发生频率较高,且此场景右转第一车道具有停车位,右转车辆仅能驶入第二车道,更加精确了人车交互区域。因此此地点更加适合捕捉人车博弈过程,如图4所示。
将采集的人车数据集输入SDG-GAN模型进行训练,得到结果。在观察区域中,车辆与行人都未决策,SDG-GAN算法通过现实通行概率得到行人博弈期望收益并结合人车相对位置共同影响行人轨迹预测结果,预测机制更为完善,故预测结果良好。当行人博弈成功,车辆等待时,行人动态博弈支付为正,车辆动态博弈支付为负。博弈机制会指明车辆危险性降低并激励行人向前行走。当行人博弈失败并等待时,行人动态博弈支付为负,车辆动态博弈支付为正。博弈机制会抑制行人继续前进,并扩大车辆通过的危险性。当人车冲突时,行人与车辆动态博弈支付同时为负。博弈机制表明双方发生冲突概率迅速增大,并依据双方微观数据更加细化双方冲突的严重程度对行人轨迹进行影响。当人车同时等待时,交通堵塞,通行效率降低,双方动态博弈支付皆为负,博弈机制通过后悔因子影响行人轨迹预测。
本发明在S-GAN的基础上,利用微观数据和博弈思想进行分析,得到不同时刻下无信号右转交叉口的人车的宏观交互策略;同时对人车交互进行阶段划分,包括观察区域与冲突区域。当处于观察区域中时,双方博弈支付收益通过概率获取其期望收益。当双方处于冲突区域时则判定已有决策,直接获取双方策略收益,实现对人车的博弈过程进行更为细致的分析。并且,本发明分析可无信号右转交叉口的特殊交互场景下的具体人车博弈因素,划分了博弈阶段,并利用侵犯后时间指标来区分人车冲突的危险程度,还通过与起步加速度相关联的“后悔因子”来表征博弈双方的后悔度,尽可能的综合考虑了博弈双方的各种因素,并在此基础上建立了人车博弈支付矩阵。并且,还结合完全信息博弈的纳什均衡思想嵌入深度学习网络模型中,实现对行人轨迹的预测。并在此基础上构建了SDG-GAN模型。SDG-GAN算法融合宏观博弈与微观运动参数,对人车双方关系考虑更为全面,能够表达博弈状态下行人的真实反映,提高了预测行人轨迹的精准度及可解释性。之后,通过微观人车交互数据和宏观人车博弈策略收益共同驱动SDG-GAN模型对行人进行轨迹预测。通过这样的方式,本发明在实际交互场景中结合微观运动因素以及宏观博弈决策,将博弈思想加入人车交互状态中,可以对无信号右转交叉口的行人轨迹进行准确的预测。本发明可以保证对无信号右转交叉口的行人轨迹的预测准确性,保证无信号右转交叉口的辅助驾驶决策的有效性,从而兼顾车辆通过无信号右转交叉口的效率及安全性。
最后需要说明的是,以上实施例仅用以说明本发明的技术方案而非限制技术方案,本领域的普通技术人员应当理解,那些对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,均应涵盖在本发明的权利要求范围当中。

Claims (10)

1.一种基于博弈论的无信号右转交叉口行人轨迹预测方法,其特征在于,包括以下步骤:
S1、获取行人及车辆在无信号右转交叉口的历史数据;
S2、分析无信号右转交叉口的人车博弈因素,构建对应的人车博弈模型;
S3、将人车博弈模型***到预设的S-GAN模型中,得到SDG-GAN模型,用于对行人的轨迹进行预测;
S4、使用S1获取的历史数据,对SDG-GAN模型进行训练;
S5、使用训练好的SDG-GAN模型对无信号右转交叉口的行人轨迹进行实时预测。
2.如权利要求1所述的基于博弈论的无信号右转交叉口行人轨迹预测方法,其特征在于:S2中,人车博弈模型的构建过程包括:
S21、划分博弈阶段,设计观察区域和冲突区域,行人与车辆一旦进入观察区域则认定博弈开始;并利用后侵入时间来表征人车冲突的危险程度,所述后侵入时间为行人及车辆进入冲突区域的时间差,后侵入时间越短则危险程度越高;
S22、基于行人与车辆在博弈中的决策策略,构建人车博弈支付矩阵;所述决策策略包括行人车辆同时通行、行人等待车辆通行、行人通行车辆等待以及行人车辆同时等待;
S23、基于人车博弈支付矩阵的特征,得到人车博弈模型的期望函数及对应的损失函数;
S24、基于S23得到的期望函数及损失函数,构建人车博弈模型。
3.如权利要求2所述的基于博弈论的无信号右转交叉口行人轨迹预测方法,其特征在于:S22中,当行人车辆同时通行时,
行人的支付函数为:
Figure FDA0004056452480000011
车辆的支付函数为:
Figure FDA0004056452480000012
其中,vv表示行人通过速度、av表示行人加速度vp表示车辆通过速度、ap表示车辆加速度、α1表示车辆的速度与加速度的共同影响因子、α2表示行人的速度与加速度的共同影响因子、σv表示车辆的碰撞严重程度因子、σp表示行人的碰撞严重程度因子,且:
Figure FDA0004056452480000013
Figure FDA0004056452480000014
当行人等待车辆通行时,行人的支付函数为:
Figure FDA0004056452480000015
式中,α4为通过时的等待抑制系数,tp为行人等待时间;
车辆的支付函数为:
Figure FDA0004056452480000021
式中,α3为通过时的速度激励系数;
当行人通行车辆等待时,行人的支付函数为:
Figure FDA0004056452480000022
式中,α3为通过时的速度激励系数,vp为行人通过速度;
车辆的支付函数为:
Figure FDA0004056452480000023
式中,α4为通过时的等待抑制系数,tv为车辆等待时间,0.75s为驾驶员反应时间;
当行人车辆同时等待时,行人的支付函数为
Figure FDA0004056452480000024
车辆的支付函数为
Figure FDA0004056452480000025
其中,α5为共同损失下车辆的等待抑制系数;α6为共同损失下行人的等待抑制系数;k为双方的后悔度因子,后悔因子与等待过程中的起步加速度相关联,表征对采取等待策略的后悔度,起步加速度越大则后悔程度越大;
人车博弈支付矩阵为:
Figure FDA0004056452480000026
4.如权利要求3所述的基于博弈论的无信号右转交叉口行人轨迹预测方法,其特征在于:S23中,所述期望函数为车辆通过行人选择等待及行人通过车辆选择等待的混合优势策略的纳什均衡点时,车辆与行人双方的混合期望收益;
其中,当车辆选择通过时的期望收益
Figure FDA0004056452480000027
为:
Figure FDA0004056452480000028
其中,/>
Figure FDA0004056452480000029
表示行人通过的概率、/>
Figure FDA00040564524800000210
为行人等待的概率;
当车辆选择等待时的期望收益
Figure FDA00040564524800000211
为:
Figure FDA00040564524800000212
对行人的纯策略收益进行分析,行人通过时的期望收益
Figure FDA00040564524800000213
为:
Figure FDA0004056452480000031
其中,/>
Figure FDA0004056452480000032
表示车辆通过的概率、/>
Figure FDA0004056452480000033
表示车辆等待的概率;
当行人选择等待时的期望收益
Figure FDA0004056452480000034
为:
Figure FDA0004056452480000035
当车辆的通过期望收益
Figure FDA0004056452480000036
与等待期望收益/>
Figure FDA0004056452480000037
相同时纳什均衡出现,行人的通过与等待的概率组合如下所示:
Figure FDA0004056452480000038
Figure FDA0004056452480000039
当行人的通过期望收益
Figure FDA00040564524800000310
与等待期望收益/>
Figure FDA00040564524800000311
相同时纳什均衡出现,车辆的通过与等待的概率组合如下所示:
Figure FDA00040564524800000312
Figure FDA00040564524800000313
5.如权利要求4所述的基于博弈论的无信号右转交叉口行人轨迹预测方法,其特征在于:SDG-GAN模型对行人的轨迹进行预测时,对行人轨迹定义为在时间序列下的二维坐标位置变化,对行人u在t时刻下的坐标为
Figure FDA00040564524800000314
车辆j在t时刻下的坐标为/>
Figure FDA00040564524800000315
行人u从1到to内每个步长的历史轨迹集合Xu为:
Figure FDA00040564524800000316
式中,1~to为行人历史轨迹的观测帧,to为观测帧长度;
行人u从to+1到tp内每个步长的预测轨迹集合
Figure FDA00040564524800000317
为:
Figure FDA00040564524800000318
式中,to+1~to+tp为行人历史轨迹的预测帧,tp为预测帧长度;
行人u从to+1到tp内每个步长的真实历史轨迹集合Yu为:
Figure FDA00040564524800000319
行人u从1到tp内的真实历史轨迹
Figure FDA00040564524800000320
与预测生成轨迹/>
Figure FDA00040564524800000321
分别为[Xu,Yu]和/>
Figure FDA00040564524800000322
6.如权利要求5所述的基于博弈论的无信号右转交叉口行人轨迹预测方法,其特征在于:S3中,所述SDG-GAN模型包括人车博弈模型、轨迹生成器和轨迹鉴别器;轨迹生成器用于将人车博弈模型的输出结果及行人历史轨迹进行编码解码,输出行人预测轨迹;轨迹鉴别器用于鉴别行人预测轨迹为真实轨迹的概率。
7.如权利要求6所述的基于博弈论的无信号右转交叉口行人轨迹预测方法,其特征在于:轨迹生成器包括轨迹编码器、博弈机制模块、池化模块和轨迹解码器;
轨迹编码器用于将每个时间步下的行人坐标位置与车辆坐标位置嵌入至含有Relu非线性激活函数的嵌入函数φ中,获得固定长度向量
Figure FDA0004056452480000041
与/>
Figure FDA0004056452480000042
再通过LSTM单元编码获得行人历史轨迹特征向量/>
Figure FDA0004056452480000043
与车辆历史轨迹特征向量/>
Figure FDA0004056452480000044
Figure FDA0004056452480000045
Figure FDA0004056452480000046
式中,嵌入函数φ为全连接神经网络层,
Figure FDA0004056452480000047
为嵌入函数的权重参数,/>
Figure FDA0004056452480000048
为LSTM单元权重参数;
博弈机制模块用于基于人车双方的博弈支付函数,对人车双方的博弈相关数据进行提取;所述博弈相关数据包括速度、加速度、相对距离和等待时间;还用于利用每个时间步下的双方速度和与冲突区域的间隔距离获得此时的后侵入时间;利用后侵入时间数值判断此时间步下双方交互的危险程度;并通过双方此时的位置坐标判断其在观察区域或冲突区域;
博弈机制模块还用于根据真实世界下人车双方的交互决策进行标定,获得决策下的双方具体期望得失
Figure FDA0004056452480000049
和/>
Figure FDA00040564524800000410
具体期望得失对人车双方历史轨迹特征向量进行影响得到双方博弈特征向量/>
Figure FDA00040564524800000411
并融合成为人车混合博弈特征向量/>
Figure FDA00040564524800000412
Figure FDA00040564524800000413
式中,
Figure FDA00040564524800000414
为行人u与车辆j各自的碰撞严重程度因子,/>
Figure FDA00040564524800000415
为行人u与车辆j各自实时坐标区域,fpet为碰撞程度判定函数,fR为实时区域判断函数,tpet为人车交互时的后侵入时间,ωpet为碰撞程度权重参数,ωR为实时区域权重参数;
Figure FDA00040564524800000416
Figure FDA00040564524800000417
Figure FDA0004056452480000051
式中,fpay为博弈计算函数,
Figure FDA0004056452480000052
为双方不同策略下的具体支付函数,finf为博弈影响函数,fmix为博弈混合函数;
池化模块用于将人车相对距离嵌入至嵌入函数φ中得到人车相对位置特征向量
Figure FDA0004056452480000053
与人车混合博弈特征向量/>
Figure FDA0004056452480000054
连接并通过多层感知机最后输出得到博弈池化向量/>
Figure FDA0004056452480000055
Figure FDA0004056452480000056
Figure FDA0004056452480000057
式中,MlpGP为池化模块多层感知机网络层,Cat用于连接特征向量,
Figure FDA0004056452480000058
为对应各自网络层的权重参数;
轨迹解码器用于将博弈池化向量
Figure FDA0004056452480000059
与行人历史轨迹特征向量/>
Figure FDA00040564524800000510
进行连接,并通过解码器模块多层感知机MlpGD,与网络随机高斯噪声Z进行连接最后得到解码器特征向量
Figure FDA00040564524800000511
Figure FDA00040564524800000512
与经过嵌入函数编码后的行人坐标向量/>
Figure FDA00040564524800000513
初始化细胞全零向量/>
Figure FDA00040564524800000514
一并输入至LSTM神经网络层得到向量/>
Figure FDA00040564524800000515
最后将/>
Figure FDA00040564524800000516
经过解码器多层感知机最终得到行人轨迹预测坐标/>
Figure FDA00040564524800000517
Figure FDA00040564524800000518
Figure FDA00040564524800000519
Figure FDA00040564524800000520
Figure FDA00040564524800000521
式中,
Figure FDA00040564524800000522
ωλ为对应网络层的权重参数。
8.如权利要求7所述的基于博弈论的无信号右转交叉口行人轨迹预测方法,其特征在于:S3中,轨迹鉴别器的工作过程包括:将轨迹生成器输出的行人预测轨迹
Figure FDA00040564524800000523
和真实的行人历史轨迹Yu一并输入至鉴别器神经网络中,通过嵌入全连接神经网络层输出高维度特征向量/>
Figure FDA00040564524800000524
再依次通过LSTM神经网络层和鉴别器多层感知机,最后输出得到为真实轨迹的概率;
Figure FDA00040564524800000525
Figure FDA00040564524800000526
Figure FDA0004056452480000061
式中,
Figure FDA0004056452480000062
为LSTM网络层输出向量,/>
Figure FDA0004056452480000063
对应各自网络层的权重参数,Preal为判别为真实轨迹的概率。
9.如权利要求8所述的基于博弈论的无信号右转交叉口行人轨迹预测方法,其特征在于:S3中,SDG-GAN模型的损失函数LSDG-GAN包含生成器和鉴别器的交叉熵损失函数LGAN(G,D)与行人真实轨迹和行人预测轨迹的最小差值损失函数LL2(G);
LSDG-GAN=LGAN(G,D)+LL2(G);
Figure FDA0004056452480000064
Figure FDA0004056452480000065
式中,E为所得期望值,r为输入的行人真实轨迹数据,S为基于模型生成结果的采样个数,Z为输入的高斯噪声分布,D表示鉴别器、G表示生成器。
10.如权利要求9所述的基于博弈论的无信号右转交叉口行人轨迹预测方法,其特征在于:S1中,历史数据包括:视频的帧数、行人的坐标、行人的加速度、行人的等待时间、车辆的坐标、车辆的加速度、车辆的等待时间、人车距离以及后侵入时间;所述人车距离为行人与车辆之间的欧式距离。
CN202310048086.4A 2023-01-31 2023-01-31 一种基于博弈论的无信号右转交叉口行人轨迹预测方法 Pending CN116311905A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310048086.4A CN116311905A (zh) 2023-01-31 2023-01-31 一种基于博弈论的无信号右转交叉口行人轨迹预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310048086.4A CN116311905A (zh) 2023-01-31 2023-01-31 一种基于博弈论的无信号右转交叉口行人轨迹预测方法

Publications (1)

Publication Number Publication Date
CN116311905A true CN116311905A (zh) 2023-06-23

Family

ID=86833164

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310048086.4A Pending CN116311905A (zh) 2023-01-31 2023-01-31 一种基于博弈论的无信号右转交叉口行人轨迹预测方法

Country Status (1)

Country Link
CN (1) CN116311905A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117227763A (zh) * 2023-11-10 2023-12-15 新石器慧通(北京)科技有限公司 基于博弈论和强化学习的自动驾驶行为决策方法和装置
CN117373235A (zh) * 2023-09-28 2024-01-09 合肥工业大学 一种行人与自动驾驶车辆的交互博弈均衡策略探究方法
CN117475090A (zh) * 2023-12-27 2024-01-30 粤港澳大湾区数字经济研究院(福田) 一种轨迹生成模型、轨迹生成方法、装置、终端及介质
CN117765737A (zh) * 2024-02-21 2024-03-26 天津大学 交通异常检测方法、装置、设备、介质及程序产品

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117373235A (zh) * 2023-09-28 2024-01-09 合肥工业大学 一种行人与自动驾驶车辆的交互博弈均衡策略探究方法
CN117227763A (zh) * 2023-11-10 2023-12-15 新石器慧通(北京)科技有限公司 基于博弈论和强化学习的自动驾驶行为决策方法和装置
CN117227763B (zh) * 2023-11-10 2024-02-20 新石器慧通(北京)科技有限公司 基于博弈论和强化学习的自动驾驶行为决策方法和装置
CN117475090A (zh) * 2023-12-27 2024-01-30 粤港澳大湾区数字经济研究院(福田) 一种轨迹生成模型、轨迹生成方法、装置、终端及介质
CN117475090B (zh) * 2023-12-27 2024-06-11 粤港澳大湾区数字经济研究院(福田) 一种轨迹生成模型、轨迹生成方法、装置、终端及介质
CN117765737A (zh) * 2024-02-21 2024-03-26 天津大学 交通异常检测方法、装置、设备、介质及程序产品
CN117765737B (zh) * 2024-02-21 2024-05-14 天津大学 交通异常检测方法、装置、设备、介质及程序产品

Similar Documents

Publication Publication Date Title
CN116311905A (zh) 一种基于博弈论的无信号右转交叉口行人轨迹预测方法
CN110298131B (zh) 一种混合驾驶环境下自动驾驶换道决策模型建立方法
CN110362910B (zh) 基于博弈论的自动驾驶车辆换道冲突协调模型建立方法
Toromanoff et al. End-to-end model-free reinforcement learning for urban driving using implicit affordances
CN112907967B (zh) 一种基于不完全信息博弈的智能车换道决策方法
CN112258841B (zh) 一种基于它车辆轨迹预测的智能车辆风险评估方法
CN110843789B (zh) 一种基于时序卷积网络的车辆换道意图预测方法
Casas et al. The importance of prior knowledge in precise multimodal prediction
US11345368B2 (en) Guidance system, guidance method, and storage medium
Quintanar et al. Predicting vehicles trajectories in urban scenarios with transformer networks and augmented information
CN113516846B (zh) 车辆换道行为预测模型构建、预测预警方法及***
CN114495046A (zh) 驾驶员行为风险评估和行人意识
CN114118349A (zh) 用于用户可理解的可解释学习模型的方法、***和设备
CN112949597A (zh) 一种基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法
CN114511999A (zh) 一种行人行为预测方法及装置
CN115743179A (zh) 一种车辆概率多模态预期轨迹预测方法
CN116501820A (zh) 车辆轨迹预测方法、装置、设备及存储介质
CN116842340A (zh) 一种基于att-gru模型的行人轨迹预测方法和设备
CN115973179A (zh) 模型训练方法、车辆控制方法、装置、电子设备及车辆
Sharma et al. Wad: A deep reinforcement learning agent for urban autonomous driving
WO2023004698A1 (zh) 智能驾驶决策方法、车辆行驶控制方法、装置及车辆
Li et al. Pedestrian interaction algorithm for autonomous vehicles considering crossing intention and driving style
CN113743767A (zh) 基于时间和安全性的车辆派单方法、***、计算机及介质
CN117709602B (zh) 一种基于社会价值取向的城市智能车辆拟人化决策方法
CN117208019B (zh) 基于值分布强化学习的感知遮挡下纵向决策方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination