CN118182516A

CN118182516A - 一种轨迹规划方法以及相关设备

Info

Publication number: CN118182516A
Application number: CN202311006346.8A
Authority: CN
Inventors: 刘飞; 郝东浩; 汤磊; 杨绍宇; 程思源; 张洪波
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2023-08-10
Filing date: 2023-08-10
Publication date: 2024-06-14

Abstract

本申请实施例公开一种轨迹规划方法以及相关设备，该方法可用于人工智能中的自动驾驶领域，方法包括：获取弱势交通参与者的第一状态信息，弱势交通参与者在自车感知范围内，第一状态信息包括弱势交通参与者的位置；基于第一状态信息，确定弱势交通参与者在后续N个时刻中每个时刻的一个或多个可达位置以及每个可达位置的概率，进而对自车的轨迹进行规划；由于在对自车进行路径规划时考虑了弱势参与者的每个可达位置的概率，也即不会直接避开弱势交通参与者的所有可达位置，则扩大了自车在行进过程中的探索范围，有利于得到自车更优的行进轨迹。

Description

一种轨迹规划方法以及相关设备

技术领域

本申请涉及自动驾驶领域，尤其涉及一种轨迹规划方法以及相关设备。

背景技术

人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说，人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

将人工智能技术应用于自动驾驶领域是一种常见的应用方式，目前采用的一种方式包括：基于交通参与者在当前时刻的状态信息，确定交通参与者在下一时刻的可达集，该可达集包括交通参与者在下一时刻能够到达的所有位置。

但上述方案仅计算了交通参与者在下一时刻可能到达的位置，并在后续对自车进行路径规划时避开了可达集内所有的位置，很大程度上缩小了自车的前进范围。

发明内容

为解决上述技术问题，本申请提供了一种轨迹规划方法以及相关设备，由于在对自车进行路径规划时考虑了弱势参与者的每个可达位置的概率，也即不会直接避开弱势交通参与者的所有可达位置，从而扩大了自车在行进过程中的探索范围，有利于得到自车更优的行进轨迹。

本申请提供的技术方案具体如下：

第一方面，本申请提供一种轨迹规划方法，可用于人工智能领域的自动驾驶领域中，方法包括：第一设备获取弱势交通参与者(vulnerable road user，VRU)的第一状态信息，弱势交通参与者在自车感知范围内，第一状态信息包括弱势交通参与者的位置；示例性地，弱势交通参与者具有如下任一种或多种特点：运动惯性小、规则性差、在道路中行进时约束少或其他特点等，例如，弱势交通参与者可以为自行车、电动车或行人等等。第一设备可以基于弱势交通参与者的第一状态信息，确定弱势交通参与者在后续N个时刻的状态信息，N个时刻的状态信息包括弱势交通参与者在N个时刻中每个时刻的一个或多个可达位置以及每个可达位置的概率，N为大于0的整数；进而基于弱势交通参与者在后续N个时刻的状态信息，对自车的轨迹进行规划。

本实现方式中，先基于弱势交通参与者的位置，确定弱势交通参与者在后续N个时刻中每个时刻的可达位置以及每个可达位置的概率，由于在对自车进行路径规划时考虑了弱势参与者的每个可达位置的概率，也即不会直接避开弱势交通参与者的所有可达位置，从而扩大了自车在行进过程中的探索范围，有利于得到自车更优的行进轨迹。

在第一方面的一种可能的实现方式中，第一状态信息包括所述弱势交通参与者在t时刻的位置，所述弱势交通者在后续N个时刻的状态信息包括所述弱势交通参与者在t+1时刻的第二状态信息，其中，第一设备基于第一状态信息，确定弱势交通参与者在后续N个时刻的状态信息，可以包括：

第一设备确定与弱势交通参与者对应的第一转移概率，第一转移概率指示弱势交通参与者从t时刻至t+1时刻执行至少一个动作中每个动作的概率；应理解，“第一转移概率指示弱势交通参与者从t时刻至t+1时刻执行至少一个动作中每个动作的概率”也可以理解为“第一转移概率指示弱势交通参与者在t时刻决定从t时刻至t+1时刻执行至少一个动作中每个动作的概率”。

第一设备根据第一状态信息和第一转移概率，确定弱势交通参与者在t+1时刻的第二状态信息，第二状态信息包括弱势交通参与者在t+1时刻的一个或多个可达位置以及每个可达位置所对应的概率。可选地，第一弱势交通参与者在t+1时刻的第二状态信息还可以包括如下任一项或多项信息：每个可达位置所对应的速度、加速度、转向角或其他信息等等。

本实现方式中，先获取弱势交通参与者在t时刻的状态信息，再确定弱势交通参与者从t时刻至t+1时刻执行至少一个动作中每个动作的概率(也即第一转移概率)，进而根据弱势交通参与者在t时刻的状态信息以及第一转移概率，确定弱势交通参与者在t+1时刻的一个或多个可达位置以及每个可达位置所对应的概率，前述方案的实现逻辑与弱势交通参与者实际的行进逻辑是相符的，能够较为准确的反映出弱势交通参与者在每个可达位置上的概率。

在第一方面的一种可能的实现方式中，第一转移概率基于第二转移概率和/或第三转移概率得到。其中，第二转移概率指示弱势交通参与者从t时刻至t+1时刻采用至少一个加速度中每个加速度的概率，例如，第二转移概率可以包括与多个加速度一一对应的多个第二转移概率值，每个第二转移概率值代表弱势交通参与者从t时刻至t+1时刻采用多个加速度中的一个加速度的概率。第三转移概率指示弱势交通参与者从t时刻至t+1时刻采用至少一个转向角中每个转向角的概率，例如，第三转移概率可以包括与多个转向角一一对应的多个第三转移概率值，每个第三转移概率值代表弱势交通参与者从t时刻至t+1时刻采用多个转向角中的一个转向角的概率。

本实现方式中，分别确定第二转移概率和第三转移概率，第二转移概率指示弱势交通参与者从t时刻至t+1时刻采用多个加速度中任意一个加速度的概率，第三转移概率指示弱势交通参与者从t时刻至t+1时刻采用多个转向角中任意一个转向角的概率，进而基于第二转移概率和/或第三转移概率确定第一转移概率，使得第一转移概率的确定过程更为精细化，有利于得到更为准确的第一转移概率，进而有利于对弱势交通参与者的位置进行更为精准的预测。

在第一方面的一种可能的实现方式中，第一状态信息还包括弱势交通参与者在t时刻的第二加速度，方法还包括：第一设备获取弱势交通参与者的第一信息，第一信息指示弱势交通参与者抢行的概率；每个弱势交通参与者的第一信息可以理解为每个弱势交通参与者的激进度，每个弱势交通参与者的第一信息不仅可以指示该弱势交通参与者与自车抢行的概率，还可以指示该弱势交通参与者为自车让行的概率。可选地，该弱势交通参与者与自车抢行的概率，与该弱势交通参与者为自车让行的概率相加等于1。进而第一设备根据第二加速度和第一信息，确定第二转移概率。

本实现方式中，由于弱势交通参与者的第一信息能够指示弱势交通参与者抢行的概率，而某个弱势交通参与者抢行的概率越大，则该弱势交通参与者越有可能加速，某个弱势交通参与者抢行的概率越小，则该弱势交通参与者越有可能减速；因此，结合弱势交通参与者的第一信息和弱势交通参与者在t时刻采用的加速度，确定该弱势交通参与者所对应的第二转移概率，也即确定该弱势交通参与者从t时刻至t+1时刻采用多个加速度中每个加速度的概率，前述第二转移概率的确定过程更加贴合弱势交通参与者行进的实际情况，有利于得到更为准确的第二转移概率，进而有利于更为准确的预测弱势交通参与者在t+1时刻的位置。

在第一方面的一种可能的实现方式中，第一设备根据第二加速度和第一信息，确定第二转移概率，包括：第一设备根据第二加速度，确定弱势交通参与者从t时刻至t+1时刻采用第一加速度的第一概率，第一加速度为上述至少一个加速度中任意一个，第一加速度与第二加速度之间的距离越近，第一概率越大；第一设备根据第一信息，确定弱势交通参与者从t时刻至t+1时刻采用第一加速度的第一调整系数，进而可以根据第一概率和第一调整系数，确定第二转移概率。

本实现方式中，由于弱势交通参与者在行进过程中具有连续性，“第一加速度与第二加速度之间的距离越近，第一概率越大”这一限定是符合弱势交通参与者的实际行进情况的，而如果弱势交通参与者想要抢行，则该弱势交通参与者有可能会提高加速度，如果弱势交通参与者不想要抢行，则该弱势交通参与者有可能会降低加速度；因此，在“第一加速度与第二加速度之间的距离越近，第一概率越大”这一前提下，基于第一信息确定第一调整系数，进而根据第一概率和第一调整系数共同确定第二转移概率，有利于得到更符合弱势交通参与者实际情况的第二转移概率。

在第一方面的一种可能的实现方式中，第一状态信息还包括弱势交通参与者在t时刻的第二转向角，方法还包括：第一设备获取弱势交通参与者的第二信息，第二信息指示弱势交通参与者的至少一个第一预测轨迹；第一设备根据第二转向角和第二信息，确定第三转移概率。本实现方式中，由于弱势交通参与者的第一预测轨迹能够一定程度上反映弱势交通参与者在t时刻之后的行进情况，基于弱势交通参与者的至少一个预测轨迹来确定弱势交通参与者采用第二转向角的概率，有利于得到更为准确的第三转移概率。

在第一方面的一种可能的实现方式中，第一设备根据第二转向角和第二信息，确定第三转移概率，包括：第一设备根据第二转向角，确定弱势交通参与者从t时刻至t+1时刻采用第一转向角的第二概率，第一转向角为上述至少一个转向角中任意一个，第一转向角与第二转向角之间的距离越近，第二概率越大；第一设备根据第二信息，确定弱势交通参与者从t时刻至t+1时刻采用第一转向角的第二调整系数，进而可以根据第二概率和第二调整系数，确定第三转移概率。

本实现方式中，由于弱势交通参与者在行进过程中具有连续性，“第一转向角与第二转向角之间的距离越近，第二概率越大”这一限定是符合弱势交通参与者的实际行进情况的，因此，在“第一转向角与第二转向角之间的距离越近，第二概率越大”这一前提下，基于第二信息确定第二调整系数，进而根据第二概率和第二调整系数共同确定第三转移概率，有利于得到更符合弱势交通参与者实际情况的第三转移概率。

在第一方面的一种可能的实现方式中，方法还包括：第一设备根据弱势交通参与者的第一倾斜度，确定弱势交通参与者的可行的转向角范围，第一倾斜度指示弱势交通参与者在转向过程中容许的最大倾斜度，其中，上述至少一个转向角基于弱势交通参与者的可行的转向角范围得到。

本实现方式中，基于弱势交通参与者在转向过程中容许的最大倾斜度和力学原理，确定弱势交通参与者在当前情况下的转向角范围，得到的转向角范围更加符合弱势交通参与者的当前情况，有利于得到弱势交通参与者更为准确的转向角范围，进而有利于更为准确的预测弱势交通参与者的位置。

在第一方面的一种可能的实现方式中，第一设备确定与弱势交通参与者对应的第一转移概率，包括：第一设备基于马尔科夫链(Markov Chain)算法，确定与弱势交通参与者对应的第一转移概率；示例性地，基于马尔科夫链算法的每一步中，自车可以从t时刻至t+1时刻执行某一动作后，致使自车从t时刻的一个状态变到t+1时刻的另一状态；或者，自车也可能在保持当前状态。状态的改变叫做转移，与状态改变相关的概率叫做转移概率。

本实现方式中，基于马尔科夫链算法，确定弱势交通参与者从t时刻至t+1时刻执行某一动作的概率，与弱势交通参与者的灵活运动性以及不确定性比较适配，能够较为准确的反映出弱势交通参与者在每个可达位置上的概率。

在第一方面的一种可能的实现方式中，第一设备根据第一状态信息和第一转移概率，确定弱势交通参与者在t+1时刻的第二状态信息，包括：第一设备根据第一状态信息、弱势交通参与者的可行的加速度范围、弱势交通参与者的可行的转向角范围、运动学模型以及第一转移概率，确定弱势交通参与者在t+1时刻的第二状态信息。本实现方式中，获取弱势交通参与者在t时刻的第一状态信息、弱势交通参与者的可行的加速度范围、弱势交通参与者的可行的转向角范围、运动学模型以及弱势交通参与者所对应的第一转移概率，第一转移概率指示弱势交通参与者从t时刻至t+1时刻执行至少一个动作中每个动作的概率，基于前述多种信息，确定弱势交通参与者在t+1时刻的第二状态信息，“t+1时刻的第二状态信息”的确定过程符合运动学的约束，且充分结合了弱势交通参与者在t时刻的状态信息，有利于得到弱势交通参与者在t+1时刻更为准确的状态信息，也即有利于得到弱势交通参与者在t+1时刻的更为准确的可达位置。

在第一方面的一种可能的实现方式中，第一设备根据第一状态信息、弱势交通参与者的可行的加速度范围、弱势交通参与者的可行的转向角范围、运动学模型以及第一转移概率，确定弱势交通参与者在t+1时刻的第二状态信息，包括：第一设备可以根据第一弱势交通参与者的第一状态信息、第一弱势交通参与者的可行的加速度范围、第一弱势交通参与者的可行的转向角范围以及动力学模型，确定第一弱势交通参与者从t时刻至t+1时刻能够执行的动作合集，前述动作合集包括第一弱势交通参与者从t时刻至t+1时刻能够执行的至少一个动作。

第一设备可以根据第一弱势交通参与者从t时刻至t+1时刻能够执行的动作合集和第一弱势交通参与者所对应的第一转移概率，确定第一弱势交通参与者在t+1时刻的第二状态信息。

在第一方面的一种可能的实现方式中，方法还包括：第一设备获取自车的至少一个第二预测轨迹，每个第二预测轨迹指示自车在t时刻之后的N个时刻内的位置，N为大于或等于1的整数；示例性地，第一设备可以根据周围的环境信息、交通规则、自车的动力学运动约束和/或其他信息等，确定自车在t时刻之后的N个时刻内至少一个可行的策略，对自车在t时刻之后的N个时刻内采用每种策略的情况进行推演，能够得到与至少一个可行的策略一一对应的至少一个第二预测轨迹。

第一设备基于弱势交通参与者在后续N个时刻的状态信息，对自车的路径进行规划，包括：第一设备根据弱势交通参与者在后续N个时刻的状态信息，生成每个第二预测轨迹的评价信息，也可以代表推演出该第二预测轨迹的策略的评价信息；进而可以基于每个第二预测轨迹的评价信息，对自车的轨迹进行规划。其中，弱势交通参与者在后续N个时刻的状态信息根据弱势交通参与者的第一状态信息得到。可选地，每个第二预测轨迹的评价信息可以表现为每个第二预测轨迹所对应的评分，每个第二预测轨迹所对应的评分越低，可以代表该第二预测轨迹越好，也即代表推演出该第二预测轨迹的策略越优。

本实现方式中，还可以根据弱势交通参与者在后续N个时刻的状态信息，生成自车的在t时刻之后的N个时刻的每个预测轨迹的评价信息，进而基于每个第二预测轨迹的评价信息对自车的轨迹进行规划，而不是直接将弱势交通参与者在后续N个时刻的可达位置从自车的行进路线中筛除掉，有利于扩大自车行进过程中的探索空间，进而有利于规划处自车更优的路径。

在第一方面的一种可能的实现方式中，方法还包括：第一设备根据弱势交通参与者在目标时刻的一个或多个可达位置和弱势交通参与者在目标时刻的位置，对第一参数进行更新，目标时刻包括t时刻之后的一个或多个时刻，第一参数包括在生成与弱势交通参与者对应的转移概率的过程中采用到的至少一个参数。可选地，第一参数可以包括在生成第一调整系数过程中采用的至少一个参数，和/或，在生成第二调整系数过程中采用的至少一个参数。

本实现方式中，第一参数包括在生成与弱势交通参与者对应的转移概率的过程中采用到的至少一个参数，也即第一参与包括生成弱势交通参与者在t时刻之后的状态信息的过程中所采用的参数；根据弱势交通参与者在t时刻之后的一个或多个时刻的实际位置，以及弱势交通参与者在t时刻之后的一个或多个时刻的可达位置，对第一参数进行更新，也即根据弱势交通参与者在t时刻之后的一个或多个时刻的实际位置，对生成弱势交通参与者在t时刻之后的一个或多个时刻的可达位置过程中所采用到的参数进行调整，从而有利于后续能够生成弱势交通参与者更为准确的可达位置。

第二方面，本申请提供一种轨迹规划装置，可用于人工智能领域的自动驾驶领域中，轨迹规划装置包括：获取模块，用于获取弱势交通参与者的第一状态信息，弱势交通参与者在自车感知范围内，第一状态信息包括弱势交通参与者的位置；确定模块，用于基于第一状态信息，确定弱势交通参与者在后续N个时刻的状态信息，N个时刻的状态信息包括弱势交通参与者在N个时刻中每个时刻的一个或多个可达位置以及每个可达位置的概率，N为大于0的整数；规划模块，用于基于弱势交通参与者在后续N个时刻的状态信息，对自车的轨迹进行规划。

本申请第二方面中，轨迹规划装置还可以用于执行第一方面的各个可能实现方式中第一设备执行的步骤，对于本申请第二方面以及第二方面的各种可能实现方式的具体实现步骤，以及每种可能实现方式所带来的有益效果，均可以参考第一方面中各种可能的实现方式中的描述，此处不再一一赘述。

第三方面，本申请提供了一种设备，可以包括存储器、处理器以及总线***，其中，存储器用于存储程序，处理器用于执行存储器中的程序，包括如下步骤：总线***用于连接存储器以及处理器，以使存储器以及处理器进行通信。

本申请第三方面中，设备中的处理器还可以用于执行第一方面的各个可能实现方式中第一设备执行的步骤，具体均可以参阅第一方面，此处不再赘述。

第四方面，本申请提供了一种车辆，可以包括上述第二方面中的轨迹规划装置，或者，可以包括上述第三方面中的设备。

第五方面，本申请提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机程序，当其在计算机上运行时，使得计算机执行上述第一方面所述的轨迹规划方法。

第六方面，本申请提供了一种电路***，所述电路***包括处理电路，所述处理电路配置为执行上述第一方面所述的轨迹规划方法。

第七方面，本申请提供了一种计算机程序产品，当其在计算机上运行时，使得计算机执行上述第一方面所述的轨迹规划方法。

第八方面，本申请提供了一种芯片***，该芯片***包括处理器，用于支持实现上述方面中所涉及的功能，例如，发送或处理上述方法中所涉及的数据和/或信息。在一种可能的设计中，所述芯片***还包括存储器，所述存储器，用于保存服务器或通信设备必要的程序指令和数据。该芯片***，可以由芯片构成，也可以包括芯片和其他分立器件。

附图说明

图1为本申请实施例提供的轨迹规划方法的一种流程示意图；

图2为本申请实施例提供的轨迹规划方法的另一种流程示意图；

图3为本申请实施例提供的“第一概率的大小”与“第一加速度与第二加速度之间的距离”之间的关系的一种示意图；

图4为本申请实施例提供的交通参与者在t时刻之后的N个时刻的状态信息的获取过程的一种示意图；

图5为本申请实施例提供的基于t时刻之后N个时刻的状态信息对自车进行路径规划的一个示意图；

图6为本申请实施例提供的交通参与者在t+1时刻的所有可达位置、每个可达位置所对应的概率以及交通参与者在t+1时刻的实际位置的一种示意图；

图7为本申请实施例提供的自车所处交通场景的一种示意图；

图8为本申请提供的轨迹规划方法的另一个流程示意图；

图9为本申请实施例提供的交通参与者B1在t时刻、t+1时刻以及t+2时刻的状态信息的一种示意图；

图10为本申请实施例提供的交通参与者B1在t时刻之后某一时刻的一个子状态信息所对应的碰撞时间差的一种示意图；

图11为本申请实施例提供的基于每个碰撞时间差得到每个碰撞时间差的评分所采用的第一函数的一个示意图；

图12为本申请实施例提供的基于加速度变化量得到舒适性评分所采用的第二函数的一个示意图；

图13为本申请实施例提供的基于自车的加速度与预设的加速度之间的差值得到通行性评分所采用的第三函数的一个示意图；

图14为本申请实施例提供的在图7示出的交通场景中的行驶策略的两种示意图；

图15为本申请实施例提供的轨迹规划装置的一种结构示意图；

图16为本申请实施例提供的设备的一种结构示意图；

图17为本申请实施例提供的车辆的一种结构示意图。

具体实施方式

本申请的说明书和权利要求书及上述附图中的术语“第一”、第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换，这仅仅是描述本申请的实施例中对相同属性的对象在描述时所采用的区分方式。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，以便包含一系列单元的过程、方法、***、产品或设备不必限于那些单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。

下面结合附图，对本申请的实施例进行描述。本领域普通技术人员可知，随着技术的发展和新场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

本申请实施例可以应用于各种能够行驶的设备(为方便描述，后续称为“第一设备”)中，可选地，本申请实施例可以用于在第一设备行驶过程中，对第一设备的轨迹进行规划。

示例性地，第一设备可以为车辆、移动机器人或其他能够行驶的设备等，第一设备还可以是芯片、车载域控制器、车载计算平台等，本申请实施例中不做限定。例如，车辆可以为轿车、卡车、摩托车、公共汽车、船、飞机、直升飞机、割草机、娱乐车、游乐场车辆、施工设备、电车、高尔夫球车、火车或其他类型的车辆等等，本申请实施例中均不做限定。

此外，弱势交通参与者(vulnerable road user，VRU)具有如下任一种或多种特点：运动惯性小、规则性差、在道路中行进时约束少或其他特点等，例如，弱势交通参与者可以为自行车、电动车或行人等等。基于以上原因，在智能驾驶中，对弱势交通参与者的可预测性较差，进而影响与弱势交通参与者存在可能交互行为的自车的行驶轨迹的规划的安全性、合理性以及类人性。

基于上述描述，本申请提供了一种轨迹规划方法，具体的，请参阅图1，图1为本申请实施例提供的轨迹规划方法的一种流程示意图。

101、第一设备获取弱势交通参与者的第一状态信息，弱势交通参与者在自车感知范围内，第一状态信息包括弱势交通参与者的位置。

可选地，第一状态信息还可以包括如下任一个或多个信息：弱势交通参与者的速度、弱势交通参与者的第二加速度、弱势交通参与者的第二转向角或弱势交通参与者的其他信息等，本申请实施例中不做限定。需要说明的是，“第一加速度”和“第一转向角”这两个概念将在后续步骤中使用，此处先不做说明。

102、第一设备基于第一状态信息，确定弱势交通参与者在后续N个时刻的状态信息，N个时刻的状态信息包括弱势交通参与者在N个时刻中每个时刻的一个或多个可达位置以及每个可达位置的概率，N为大于0的整数。

可选地，弱势交通参与者在后续N个时刻的状态信息还可以包括如下任一项或多项信息：每个可达位置所对应的速度、加速度、转向角或其他信息等等，本申请实施例中不做限定。

103、第一设备基于弱势交通参与者在后续N个时刻的状态信息，对自车的轨迹进行规划。

本申请实施例中，由于在对自车进行路径规划时考虑了弱势参与者的每个可达位置的概率，也即不会直接避开弱势交通参与者的所有可达位置，从而扩大了自车在行进过程中的探索范围，有利于得到自车更优的行进轨迹。

以下仅以第一设备为车辆为例，对本申请提供的轨迹规划方法的具体实现方案进行详细描述，对于第一设备表现为其他类型的设备的情况可以参阅理解，本申请实施例中不再赘述。请参阅图2，图2为本申请实施例提供的轨迹规划方法的另一种流程示意图，本申请实施例提供的轨迹规划方法可以包括：

201、获取交通参与者的在t时刻的第一状态信息，t为大于或等于0的整数，该交通参与者在自车感知范围内，第一状态信息包括交通参与者在t时刻的位置。

本申请实施例中，t时刻可以为当前时刻，或者t时刻为当前时刻之前的预设范围内的某一时刻。

可选地，图2对应实施例中的交通参与者可以为弱势交通参与者；示例性地，弱势交通参与者具有如下任一种或多种特点：运动惯性小、规则性差、在道路中行进时约束少或其他特点等，例如，弱势交通参与者可以为自行车、电动车或行人等等。

示例性地，在一种实现方式中，自车在与其他的交通参与者交互的过程中，可以识别对自车有风险的至少一个交通参与者，进而在步骤201获取对自车有风险的每个交通参与者的第一状态信息。或者，在另一种实现方式中，自车在识别出对自车有风险的至少一个交通参与者之后，可以从对自车有风险的至少一个交通参与者中筛选出与自车具有博弈交互的至少一个交通参与者，进而在步骤201中获取与自车具有博弈交互的每个交通参与者的第一状态信息。

在另一种实现方式中，自车在识别出自车周围的至少一个交通参与者之后，可以在步骤201中获取自车周围的每个交通参与者的第一状态信息等，具体获取哪些交通参与者的第一状态信息可以基于实际应用场景灵活确定，本申请实施例中不做限定。

202、获取交通参与者的第一信息和/或第二信息，第一信息指示交通参与者抢行的概率，第二信息指示交通参与者的至少一个第一预测轨迹。

本申请实施例中，步骤202为可选步骤。在自车获取到每个交通参与者的第一状态信息之后，还可以获取每个交通参与者的第一信息和/或第二信息。示例性地，第一信息和/或第二信息可以通过机器学习模型生成，例如，前述机器学习模型可以为神经网络，也可以为贝叶斯推理网络等，具体获得方式可以结合实际应用产品确定，本申请实施例中不做限定。

每个交通参与者的第一信息可以理解为每个交通参与者的激进度，每个交通参与者的第一信息不仅可以指示该交通参与者与自车抢行的概率，还可以指示该交通参与者为自车让行的概率。可选地，该交通参与者与自车抢行的概率，与该交通参与者为自车让行的概率相加等于1。

每个交通参与者的第二信息可以指示该交通参与者的至少一个第一预测轨迹；可选地，每个交通参与者的第二信息还可以包括前述每个第一预测轨迹所对应的概率，该交通参与者的每个第一预测轨迹指示该交通参与者在t时刻之后的多个时刻的可达位置，该交通参与者的每个第一预测轨迹所对应的概率代表该交通参与者在t时刻之后的多个时刻的位置符合前述第一预测轨迹的概率。

示例性地，交通参与者A1的第二信息包括预测轨迹1和预测轨迹1所对应的概率0.2，预测轨迹2和预测轨迹2所对应的概率0.3，以及预测轨迹3和预测轨迹3所对应的概率0.5，则代表交通参与者A1在t时刻之后的多个时刻的位置符合预测轨迹1上的概率为0.2，交通参与者A1在t时刻之后的多个时刻的位置符合预测轨迹2上的概率为0.3，交通参与者A1在t时刻之后的多个时刻的位置符合预测轨迹3上的概率为0.5，应理解，前述示例仅为方便理解本方案，不用于限定本方案。

203、获取交通参与者的可行的加速度范围。

本申请实施例中，步骤203为可选步骤。可选地，在一种实现方式中，自车可以根据每个交通参与者的类型，确定该交通参与者的可行的加速度范围；一个交通参与者的类型可以为：行人、自行车、摩托车、公交车、轿车或其他类型等等，此处不做穷举。示例性地，自车中可以部署有第一映射信息，第一映射信息包括每种类型的交通参与者所对应的可行的加速度范围，则自车可以根据每个交通参与者的类型和第一映射信息，确定每个交通参与者的可行的加速度范围。

或者，在另一种实现方式中，自车可以根据每个交通参与者的类型以及该交通参与者的速度，采用查表法确定该交通参与者的可行的加速度范围等，本申请实施例中不做限定。

204、根据交通参与者的第一倾斜度，确定交通参与者的可行的转向角范围，第一倾斜度指示交通参与者在转向过程中容许的最大倾斜度，其中，第三转移概率基于交通参与者的可行的转向角范围得到。

本申请实施例中，步骤204为可选步骤。自车可以获取每个交通参与者的第一倾斜度。可选地，在一种实现方式中，自车可以根据每个交通参与者的类型，确定每个交通参与者的第一倾斜度。示例性地，自车中可以部署有第二映射信息，第二映射信息包括每种类型的交通参与者所对应的第一倾斜度，则自车可以根据每个交通参与者的类型和第二映射信息，确定每个交通参与者的第一倾斜度。

或者，在另一种实现方式中，自车可以根据每个交通参与者的类型以及该交通参与者的速度，确定该交通参与者的第一倾斜度等，本申请实施例中不做限定。

示例性地，步骤204可以包括：自车在确定了每个交通参与者的第一倾斜度之后，可以将0至第一倾斜度确定为每个交通参与者在转向过程中容许的倾斜度范围；进而可以根据每个交通参与者的倾斜度范围，基于平衡状态下的力学原理，确定每个交通参与者的可行的转向角范围。为进一步理解本方案，以下对“基于每个交通参与者的倾斜度范围，确定每个交通参与者的转向角范围所采用的公式”的一个示例进行展示：

其中，φ代表交通参与者的转向角，atan(.)代表反正切函数，g代表重力加速度，L代表交通参与者在纵向上的轴距，也即L代表交通参与者在前后方向上的轴距，v代表交通参与者的速度，代表交通参与者的倾斜度；将每个交通参与者在转向过程中容许的倾斜度范围中最小的倾斜度带入公式(1)后，可以得到每个交通参与者可行的转向角范围中最小的转向角，将每个交通参与者在转向过程中容许的最大的倾斜度(也即第一倾斜度)带入公式(1)后，可以得到每个交通参与者可行的转向角范围中最大的转向角，通过前述方式，实现了根据每个交通参与者容许的倾斜度范围，确定每个交通参与者可行的转向角范围；需要说明的是，公式(1)中的示例仅为方便理解本方案，不用于限定本方案。

本申请实施例中，基于交通参与者在转向过程中容许的最大倾斜度和力学原理，确定交通参与者在当前情况下的转向角范围，得到的转向角范围更加符合交通参与者的当前情况，有利于得到交通参与者更为准确的转向角范围，进而有利于更为准确的预测交通参与者的位置。

需要说明的是，步骤204为可选步骤，若不执行步骤204，自车还可以根据每个交通参与者的类型，确定每个交通参与者的转向角范围。示例性地，自车中可以部署有第三映射信息，第三映射信息包括每种类型的交通参与者所对应的转向角范围，则自车可以根据每个交通参与者的类型和第三映射信息，确定每个交通参与者的转向角范围。或者，自车还可以根据每个交通参与者的类型和速度，确定每个交通参与者的转向角范围等等，本申请实施例中不做限定。

205、确定与交通参与者对应的第一转移概率，第一转移概率指示交通参与者从t时刻至t+1时刻执行至少一个动作中每个动作的概率。

本申请实施例中，t+1时刻代表在t时刻之后过去了一个步长的时间；例如，一个步长的时间可以为0.5秒、1秒、2秒或其他时长等等，具体可以根据实际情况灵活确定，此处不做限定。

应理解，“第一转移概率指示交通参与者从t时刻至t+1时刻执行至少一个动作中每个动作的概率”也可以理解为“第一转移概率指示交通参与者在t时刻决定从t时刻至t+1时刻执行至少一个动作中每个动作的概率”。

“交通参与者从t时刻至t+1时刻执行第一动作的概率”可以被理解为交通参与者从t时刻至t+1时刻采用某一加速度的概率，或者，也可以被理解为交通参与者从t时刻至t+1时刻采用某一转向角的概率，或者，也可以理解为交通参与者从t时刻至t+1时刻采用某一加速度且采用某一转向角的概率等，需要说明的时，“交通参与者从t时刻至t+1时刻执行第一动作的概率”还可以被理解为交通参与者在行进过程中采用其他动作的概率，具体可以结合实际情况确定，此处不做限定。

可选地，第一转移概率可以基于第二转移概率和/或第三转移概率得到。其中，第二转移概率指示交通参与者从t时刻至t+1时刻采用至少一个加速度中每个加速度的概率，例如，第二转移概率可以包括与多个加速度一一对应的多个第二转移概率值，每个第二转移概率值代表交通参与者从t时刻至t+1时刻采用多个加速度中的一个加速度的概率；第三转移概率指示交通参与者从t时刻至t+1时刻采用至少一个转向角中每个转向角的概率，例如，第三转移概率可以包括与多个转向角一一对应的多个第三转移概率值，每个第三转移概率值代表交通参与者从t时刻至t+1时刻采用多个转向角中的一个转向角的概率。

示例性地，自车可以对每个交通参与者对应的第二转移概率和第三转移概率均进行归一化处理，将归一化处理后的第二转移概率以及归一化处理后的第三转移概率相乘，得到每个交通参与者对应的第一转移概率。本申请实施例中，分别确定第二转移概率和第三转移概率，第二转移概率指示交通参与者从t时刻至t+1时刻采用多个加速度中任意一个加速度的概率，第三转移概率指示交通参与者从t时刻至t+1时刻采用多个转向角中任意一个转向角的概率，进而基于第二转移概率和/或第三转移概率确定第一转移概率，使得第一转移概率的确定过程更为精细化，有利于得到更为准确的第一转移概率，进而有利于对交通参与者的位置进行更为精准的预测。

或者，第一转移概率也可以直接采用第二转移概率；或者，第一转移概率也可以直接采用第三转移概率，或者，当“交通参与者从t时刻至t+1时刻执行第一动作的概率”被理解为交通参与者在行进过程中采用其他动作的概率时，第一转移概率还可以表现为其他形式，本申请实施例中均不做限定。

可选地，自车可以根据每个交通参与者在t时刻采用的第二加速度以及每个交通参与者的第一信息，确定每个交通参与者所对应的上述第二转移概率。每个交通参与者所对应的第一信息指示每个交通参与者与自车抢行的概率，“每个交通参与者所对应的第一信息”的具体表现形式以参与上述描述，此处不做赘述。

针对自车确定至少一个交通参与者中任意一个交通参与者(为方便描述，后续称为“第一交通参与者”)所对应的第二转移概率的具体实现过程，可选地，自车根据第一交通参与者所对应的第二加速度和第一信息，确定第一交通参与者所对应的第二转移概率，可以包括：自车通过上述步骤可以获取到第一交通参与者的可行的加速度范围，对第一交通参与者的可行的加速度范围进行离散化，得到第一交通参与者可行的至少一个加速度，第一加速度为前述可行的至少一个加速度中任意一个。

自车可以根据第一交通参与者的第二加速度，确定第一交通参与者从t时刻至t+1时刻采用至少一个加速度中第一加速度的第一概率。其中，第一加速度与第二加速度之间的距离越近，也即第一加速度与第二加速度之间差值的绝对值越小，第一概率越大；第一加速度与第二加速度之间的距离越远，也即第一加速度与第二加速度之间差值的绝对值越大，第一概率越小。

为更直观地理解本方案，请参阅图3，图3为本申请实施例提供的“第一概率的大小”与“第一加速度与第二加速度之间的距离”之间的关系的一种示意图，图3中每个方格代表第一交通参与者的可行的加速度范围中一个加速度所对应的一个第一概率的值，图3中从左到右的多个方格所对应的多个加速度的值逐渐变大，黑色的方格所对应的加速度与第一交通参与者在t时刻采用的第二加速度相同；与多个加速度一一对应的多个第一概率的分布情况可以如方格上方的曲线，与第二加速度对应的第一概率的取值最大，某一加速度与第二加速度之间差值越大，则该加速度所对应的第一概率越小，应理解，图3中的示例仅为方便理解本方案，不用于限定本方案。

自车可以根据第一交通参与者的第一信息，确定第一交通参与者从t时刻至t+1时刻采用至少一个加速度中第一加速度的第一调整系数。为进一步理解本方案，如下公开确定第一调整系数的公式的一个示例：

其中，λ_a代表第一调整系数，p代表第一交通参与者的第一信息，和/>分别为两个系数，/>和/>的取值可以均基于第一加速度确定；示例性地，自车上可以部署有与多个加速度一一对应的/>的多个取值，以及与多个加速度一一对应的/>的多个取值，则在确定了第一加速度之后，可以确定与第一加速度对应的/>的一个取值以及与第一加速度对应的/>的一个取值，进而可以得到λ_a的值，应理解，公式(2)中的示例仅为方便理解本方案，不用于限定本方案。

自车根据上述步骤得到的第一调整系数以及与第一加速度对应的第一概率，确定第一交通参与者从t时刻至t+1时刻采用第一加速度的第二转移概率值。示例性地，自车可以将与第一加速度对应的第一概率和前述第一调整系数相乘，得到与第一加速度对应的第二转移概率值。为进一步理解本方案，如下公开了确定与第一加速度对应的第二转移概率值所采用公式的一个示例：

Γ(α,β)＝p_βλ_a； (3)

其中，α代表第一交通参与者的第二加速度，β代表第一交通参与者的可行的加速度范围中任意一个第一加速度，Γ(α,β)代表与第一加速度对应的第二转移概率值，p_β代表与第一加速度对应的第一概率，λ_a代表第一调整系数，应理解，公式(3)中的示例仅为方便理解本方案，不用于限定本方案。

自车重复执行上述步骤多次，能够得到第一交通参与者的可行的加速度范围内至少一个加速度中每个加速度所对应的第二转移概率值，也即得到了与第一交通参与者对应的第二转移概率。

自车重复执行上述步骤一次或多次，能够得到至少一个交通参与者中每个交通参与者所对应的第二转移概率。

本申请实施例中，由于交通参与者的第一信息能够指示交通参与者抢行的概率，而某个交通参与者抢行的概率越大，则该交通参与者越有可能加速，某个交通参与者抢行的概率越小，则该交通参与者越有可能减速；因此，结合交通参与者的第一信息和交通参与者在t时刻采用的加速度，确定该交通参与者所对应的第二转移概率，也即确定该交通参与者从t时刻至t+1时刻采用多个加速度中每个加速度的概率，前述第二转移概率的确定过程更加贴合交通参与者行进的实际情况，有利于得到更为准确的第二转移概率，进而有利于更为准确的预测交通参与者在t+1时刻的位置。

由于交通参与者在行进过程中具有连续性，“第一加速度与第二加速度之间的距离越近，第一概率越大”这一限定是符合交通参与者的实际行进情况的，而如果交通参与者想要抢行，则该交通参与者有可能会提高加速度，如果交通参与者不想要抢行，则该交通参与者有可能会降低加速度；因此，在“第一加速度与第二加速度之间的距离越近，第一概率越大”这一前提下，基于第一信息确定第一调整系数，进而根据第一概率和第一调整系数共同确定第二转移概率，有利于得到更符合交通参与者实际情况的第二转移概率。

可选地，自车可以根据每个交通参与者在t时刻采用的第二转向角和每个交通参与者的第二信息，确定每个交通参与者所对应的上述第三转移概率。每个交通参与者所对应的第二信息指示每个交通参与者的至少一个第一预测轨迹；可选地，每个交通参与者所对应的第二信息还可以包括前述每个第一预测轨迹所对应的概率，“每个交通参与者所对应的第二信息”的具体表现形式以参与上述描述，此处不做赘述。

针对自车确定至少一个交通参与者中任意一个交通参与者(为方便描述，后续称为“第一交通参与者”)所对应的第三转移概率的具体实现过程，可选地，自车根据第一交通参与者所对应的第二转向角和第二信息，确定第一交通参与者所对应的第三转移概率，可以包括：自车通过上述步骤可以获取到第一交通参与者的可行的转向角范围，对第一交通参与者的可行的转向角范围进行离散化，得到第一交通参与者可行的至少一个转向角，第一转向角为前述可行的至少一个转向角中任意一个。

自车可以根据第一交通参与者在t时刻采用的第二转向角，确定第一交通参与者从t时刻至t+1时刻采用第一转向角的第二概率。其中，第一转向角与第二转向角之间的距离越近，也即第一转向角与第二转向角之间差值的绝对值越小，第二概率越大；第一转向角与第二转向角之间的距离越远，也即第一转向角与第二转向角之间差值的绝对值越大，第二概率越小。

自车可以根据第一交通参与者的第二信息，确定第一交通参与者从t时刻至t+1时刻采用第一转向角的第二调整系数。示例性地，在一种实现方式中，第一交通参与者从t时刻至t+1时刻采用第一转向角之后得到的第一交通参与者在t+1时刻的可达位置，获取第一交通参与者在t+1时刻的可达位置与至少一个第一预测轨迹中最近的第一距离，根据前述第一距离确定第二调整系数；其中，第一距离越小，则第一交通参与者从t时刻至t+1时刻采用第一转向角的第二调整系数越大。

在另一种实现方式中，第一交通参与者从t时刻至t+1时刻采用第一转向角之后得到的第一交通参与者在t+1时刻的可达位置，获取第一交通参与者在t+1时刻的可达位置与至少一个第一预测轨迹中每个第一预测轨迹之间的距离，也即得到与至少一个第一预测轨迹一一对应的至少一个距离，根据前述至少一个距离以及每个第一预测轨迹所对应的概率，确定第一交通参与者从t时刻至t+1时刻采用第一转向角的第二调整系数；其中，第一交通参与者在t+1时刻的可达位置与至少一个第一预测轨迹中每个第一预测轨迹之间的距离越近，则第一交通参与者从t时刻至t+1时刻采用第一转向角的第二调整系数越大。

示例性地，交通参与者A1的第二信息包括预测轨迹1和预测轨迹1所对应的概率0.2，预测轨迹2和预测轨迹2所对应的概率0.3，以及预测轨迹3和预测轨迹3所对应的概率0.5，若交通参与者A1从t时刻至t+1时刻采用转向角1得到交通参与者A1在t+1时刻的可达位置1，自车获取可达位置1与预测轨迹1之间的距离为距离1，自车根据距离1确定交通参与者A1从t时刻至t+1时刻采用转向角1的调整系数1，距离1越小，调整系数1越大；自车获取可达位置1与预测轨迹2之间的距离为距离2，自车根据距离2确定交通参与者A1从t时刻至t+1时刻采用转向角1的调整系数2，距离2越小，调整系数2越大；自车获取可达位置1与预测轨迹3之间的距离为距离3，自车根据距离3确定交通参与者A1从t时刻至t+1时刻采用转向角1的调整系数3，距离3越小，调整系数3越大。自车对调整系数1、调整系数2以及调整系数3进行加权求和，预测轨迹1所对应的概率作为调整系数1的权重，预测轨迹2所对应的概率作为调整系数2的权重，预测轨迹3所对应的概率作为调整系数3的权重，应理解，此处举例仅为方便理解本方案，不用于限定本方案。

为进一步理解本方案，如下公开了基于“距离”确定“调整系数”所采用公式的一个示例：

/>

其中，λ_αβ代表调整系数，Δ代表距离，Δ_ref是一个超参数；可以基于上述第一距离，通过公式(4)计算第二调整系数；也可以基于上述“距离1”，通过公式(4)计算调整系数1，基于上述“距离2”，通过公式(4)计算调整系数2，基于上述“距离3”，通过公式(4)计算调整系数3等，需要说明的是，此处对公式(4)中的示例仅为方便理解本方案，不用于限定本方案。

自车可以根据第一交通参与者从t时刻至t+1时刻采用第一转向角的第二概率和第二调整系数，确定自车从t时刻至t+1时刻采用第一转向角的第三转移概率值。示例性地，自车可以将前述第一交通参与者从t时刻至t+1时刻采用第一转向角的第二概率和第二调整系数相乘，得到第一交通参与者从t时刻至t+1时刻采用第一转向角的第三转移概率值。

自车重复执行上述步骤多次，能够得到第一交通参与者的可行的转向角范围内至少一个转向角中每个转向角所对应的第三转移概率值，也即得到了与第一交通参与者对应的第三转移概率。

自车重复执行上述步骤一次或多次，能够得到至少一个交通参与者中每个交通参与者所对应的第三转移概率。

本申请实施例中，由于交通参与者的第一预测轨迹能够一定程度上反映交通参与者在t时刻之后的行进情况，基于交通参与者的至少一个预测轨迹来确定交通参与者采用第二转向角的概率，有利于得到更为准确的第三转移概率。

由于交通参与者在行进过程中具有连续性，“第一转向角与第二转向角之间的距离越近，第二概率越大”这一限定是符合交通参与者的实际行进情况的，因此，在“第一转向角与第二转向角之间的距离越近，第二概率越大”这一前提下，基于第二信息确定第二调整系数，进而根据第二概率和第二调整系数共同确定第三转移概率，有利于得到更符合交通参与者实际情况的第三转移概率。

示例性地，在一种实现方式中，步骤205可以包括：第一设备基于马尔科夫链(Markov Chain)算法，确定与每个交通参与者对应的第一转移概率。示例性地，基于马尔科夫链(Markov Chain)算法的每一步中，自车可以从t时刻至t+1时刻执行某一动作后，致使自车从t时刻的一个状态变到t+1时刻的另一状态；或者，自车也可能在保持当前状态。状态的改变叫做转移，与状态改变相关的概率叫做转移概率。

本实现方式中，基于马尔科夫链算法，确定交通参与者从t时刻至t+1时刻执行某一动作的概率，与交通参与者的灵活运动性以及不确定性比较适配，能够较为准确的反映出交通参与者在每个可达位置上的概率。

在另一种实现方式中，步骤205可以包括：第一设备中可以部署有执行过训练操作的第一机器学习模型，第一设备可以将至少一个交通参与者中每个交通参与者在t时刻的第一状态信息输入第一机器学习模型中，通过第一机器学习模型对前述第一状态信息进行处理，得到第一机器学习模型输出的上述与每个交通参与者对应的第一转移概率。

206、根据第一状态信息和第一转移概率，确定交通参与者在t+1时刻的第二状态信息，第二状态信息包括交通参与者在t+1时刻的一个或多个可达位置以及每个可达位置所对应的概率。

本申请实施例中，可选地，步骤206可以包括：自车根据至少一个交通参与者中每个交通参与者在t时刻的第一状态信息、每个交通参与者的可行的加速度范围、每个交通参与者的可行的转向角范围、运动学模型以及每个交通参与者的第一转移概率，确定每个交通参与者在t+1时刻的第二状态信息；需要说明的是，具体需要确定哪些交通参与者在t+1时刻的第二状态信息，可以结合实际应用场景灵活确定，本申请实施例中不做限定。

其中，第一状态信息可以包括每个交通参与者在t时刻的位置，可选地，第一状态信息还可以包括每个交通参与者在t时刻的速度、加速度和转向角中的一种或多种。上述运动学模型可以为二阶自行车(Bicylce)运动学模型或其他类型的运动学模型等，本申请实施例中不做穷举。

针对第一交通参与者(也即至少一个交通参与者中的任意一个交通参与者)的第二状态信息的获取过程，自车可以根据第一交通参与者的第一状态信息、第一交通参与者的可行的加速度范围、第一交通参与者的可行的转向角范围以及动力学模型，确定第一交通参与者从t时刻至t+1时刻能够执行的动作合集，前述动作合集包括第一交通参与者从t时刻至t+1时刻能够执行的至少一个动作。

自车可以根据第一交通参与者从t时刻至t+1时刻能够执行的动作合集和第一交通参与者所对应的第一转移概率，确定第一交通参与者在t+1时刻的第二状态信息。示例性地，第一交通参与者在t+1时刻的第二状态信息指示每个交通参与者在t+1时刻的至少一个可达位置以及每个可达位置所对应的概率；可选地，第一交通参与者在t+1时刻的第二状态信息还可以包括如下任一项或多项信息：每个可达位置所对应的速度、加速度、转向角或其他信息等等，本申请实施例中不做限定。

为进一步理解本方案，如下公开了基于第一交通参与者在t时刻的状态信息，确定第一交通参与者在t+1时刻的状态信息所采用的公式的一个示例：

p(t_k+1)＝Γ(t_k)p(t_k)；(5)

其中，p(t_k+1)代表第一交通参与者在t+1时刻的状态信息，p(t_k)代表第一交通参与者在t时刻的状态信息，Γ(t_k)基于与第一交通参与者对应的第一转移概率以及第一交通参与者从t时刻至t+1时刻能够执行的动作合集得到，Γ(t_k)代表第一交通参与者从t时刻至t+1时刻执行前述动作合集中每个动作的概率，应理解，公式(5)中的示例仅为方便理解本方案，不用于限定本方案。

本申请实施例中，获取交通参与者在t时刻的第一状态信息、交通参与者的可行的加速度范围、交通参与者的可行的转向角范围、运动学模型以及交通参与者所对应的第一转移概率，第一转移概率指示交通参与者从t时刻至t+1时刻执行至少一个动作中每个动作的概率，基于前述多种信息，确定交通参与者在t+1时刻的第二状态信息，“t+1时刻的第二状态信息”的确定过程符合运动学的约束，且充分结合了交通参与者在t时刻的状态信息，有利于得到交通参与者在t+1时刻更为准确的状态信息，也即有利于得到交通参与者在t+1时刻的更为准确的可达位置。

207、获取自车的至少一个第二预测轨迹，每个第二预测轨迹指示自车在t时刻之后的N个时刻内的位置，N为大于或等于1的整数。

本申请实施例中，步骤207为可选步骤。示例性地，自车可以根据周围的环境信息、交通规则、自车的动力学运动约束和/或其他信息等，确定自车在t时刻之后的N个时刻内至少一个可行的策略，对自车在t时刻之后的N个时刻内采用每种策略的情况进行推演，能够得到与至少一个可行的策略一一对应的至少一个第二预测轨迹。

208、根据交通参与者在t时刻之后的N个时刻的状态信息，生成每个第二预测轨迹的评价信息，其中，交通参与者在前述N个时刻的状态信息根据交通参与者在t时刻的状态信息得到。

本申请实施例中，步骤208为可选步骤。t时刻之后的N个时刻代表在t时刻之后，经过了N个时间步长，每个步长的长度可以结合实际情况确定，本申请实施例中不做限定。

交通参与者在t时刻之后的N个时刻的状态信息可以包括交通参与者在t时刻之后的N个时刻中每个时刻的状态信息。其中，交通参与者在t时刻之后的每个时刻的状态信息至少包括交通参与者在该时刻的至少一个可达位置以及每个可达位置所对应的概率，“交通参与者在t时刻之后的N个时刻中每个时刻的状态信息”所包含的信息的类型与“第二状态信息”所包含的信息的类型相似，可参阅上述描述进行理解，此处不再进行赘述。

示例性地，自车在根据第一交通参与者(也即至少一个交通参与者中的任意一个交通参与者)在t时刻的第一状态信息，确定了第一交通参与者在t+1时刻的第二状态信息之后，可以基于马尔科夫链算法，根据第一交通参与者在t+1时刻的第二状态信息，继续推演第一交通参与者在下一时刻的状态信息，重复执行前述步骤多次，能够得到第一交通参与者在t时刻之后的N个时刻的状态信息。自车重复执行上述步骤，能够得到至少一个交通参与者中每个交通参与者在t时刻之后的N个时刻的状态信息。

为更直观地理解本方案，请继续参阅图4，图4为本申请实施例提供的交通参与者在t时刻之后的N个时刻的状态信息的获取过程的一种示意图。t时刻之后的第k个时刻为t时刻之后的N个时刻中的任意一个，如图4所示，自车基于马尔科夫链(Markov Chain)算法，根据第一交通参与者在t时刻之后的第k个时刻的状态信息、第一交通参与者在t时刻之后的第k个时刻的可行的加速度范围、第一交通参与者在t时刻之后的第k个时刻的可行的转向角范围、运动学模型以及第一交通参与者在在t时刻之后的第k个时刻的第一转移概率，确定第一交通参与者在下一时刻的状态信息，也即图4中示出的第一交通参与者在t时刻之后的第k+1个时刻的状态信息。

“自车根据第一交通参与者在t时刻之后的第k+1个时刻的状态信息，生成第一交通参与者在下一时刻的状态信息”的具体实现方式，与“自车根据第一交通参与者在t时刻之后的第k个时刻的状态信息，生成第一交通参与者在下一时刻的状态信息”的具体实现方式类似。也即自车基于马尔科夫链算法，将第一交通参与者在t时刻之后的第k+1个时刻的状态信息、第一交通参与者在t时刻之后的第k+1个时刻的可行的加速度范围、第一交通参与者在t时刻之后的第k+1个时刻的可行的转向角范围、运动学模型以及第一交通参与者在在t时刻之后的第k+1个时刻的第一转移概率，确定第一交通参与者在下一时刻的状态信息，也即图4中示出的第一交通参与者在t时刻之后的第k+2个时刻的状态信息。

应理解，图4中的示例仅为方便理解自车依次得到第一交通参与者在t时刻之后的N个时刻中每个时刻的状态信息的过程，不用于限定本方案。

示例性地，为方便描述，将至少一个第二预测轨迹中任意一个第二预测轨迹称为目标预测轨迹，自车可以基于至少一个交通参与者中每个交通参与者在t时刻之后的N个时刻的状态信息，确定目标预测轨迹的第一评分，也即得到了目标预测轨迹的评价信息。自车可以重复执行前述步骤多次，得到至少一个第二预测轨迹中每个第二预测轨迹的评价信息。

可选地，每个第二预测轨迹的评价信息可以表现为每个第二预测轨迹所对应的评分，每个第二预测轨迹所对应的评分越低，可以代表该第二预测轨迹越好，也即代表推演出该第二预测轨迹的策略越优。当然，也可以设定每个第二预测轨迹所对应的评分越高，代表该第二预测轨迹越好，本申请实施例不做具体限定。

示例性地，“根据第一交通者在t时刻之后的N个时刻的状态信息，确定目标预测轨迹所对应的第一评分”的具体实现过程中的参考因素可以包括如下任一项或多项：每个第二预测轨迹所对应的风险性评分、每个第二预测轨迹所对应的舒适性评分、每个第二预测轨迹所对应的通行性评分、每个第二预测轨迹所对应的偏移性评分或其他因素等等，本申请实施例中不做限定。

为进一步理解本方案，以下以目标预测轨迹(也即至少一个第二预测轨迹中任意一个第二预测轨迹)为例，分别对上述“风险性评分”、“舒适性评分”、“通行性评分”以及“偏移性评分”这四个参考因素的确定方法进行详细描述。

(1)风险性评分

可选地，目标预测轨迹所对应的风险性评分越低，代表目标预测轨迹的安全程度越高；目标预测轨迹所对应的风险性评分越高，代表目标预测轨迹的安全程度越低。

自车可以根据目标预测轨迹以及第一交通参与者在t时刻之后的N个时刻的状态信息，确定与安全性相关的至少一个维度上的评分，对前述与安全性相关的至少一个维度上的评分进行加权求和，得到目标预测轨迹所对应的风险性评分。示例性地，与安全性相关的至少一个维度可以包括：目标预测轨迹与第一交通参与者在t时刻之后的N个时刻内的至少一个碰撞时间差、目标预测轨迹与第一交通参与者在t时刻之后的N个时刻中的至少一个最小距离、目标预测轨迹与第一交通参与者在t时刻之后的N个时刻内的至少一个碰撞速度和/或其他信息等等，此处不做穷举。

示例性地，在一种实现方式中，第一交通参与者在t时刻之后的N个时刻中每个时刻的状态信息可以包括一个或多个子状态信息，每个子状态信息指示第一交通参与者的一个可达位置、该可达位置的概率、第一交通参与者的速度、第一交通参与者的加速度、第一交通者的转向角。自车可以根据第一交通参与者在t时刻之后每个时刻的子状态信息，确定第一交通参与者在前述N个时刻中每个时刻内的每个子状态信息所对应的碰撞时间差；自车可以根据每个子状态信息所对应的碰撞时间差，确定每个碰撞时间差所对应的评分；根据每个碰撞时间差所对应的评分，得到目标预测轨迹在“碰撞时间差”这个维度上的一个子评分，前述一个子评分与目标预测轨迹以及第一交通参与者对应。自车重复执行前述步骤至少一次，得到每个交通参与者所对应的一个子评分，进而可以根据每个交通参与者所对应的一个子评分，确定目标预测轨迹在“碰撞时间差”这个维度上的评分。

为方便理解“每个碰撞时间差所对应的评分”的获取过程，此处将第一交通参与者在前述N个时刻中多个子状态信息中任意一个子状态信息称为目标子状态信息，目标子状态信息包含于第一交通参与者在t时刻之后的第n个时刻的状态信息，t时刻之后的第n个时刻为t时刻之后的N个时刻中的一个。例如，自车可以根据目标子状态信息指示的可达位置、速度、加速度以及转向角，对第一交通参与者进行匀速推演，得到第一交通参与者与目标预测轨迹的一个目标交点(也即与目标子状态信息对应的一个目标交点)；自车基于目标预测轨迹可得自车是在t时刻之后的第一时间点到达目标交点，确定第n个时刻和第一时间点之间的第一时间差；自车基于目标子状态信息，可以确定第一交通参与者将在第二时间点到达目标交点，确定第n个时刻和第二时间点之间的第二时间差；自车可以将第一时间差与第二时间差之间差值的绝对值，确定为目标子状态信息所对应的碰撞时间差；进而可以确定前述碰撞时间差所对应的评分，可选地，每个碰撞时间差越小，每个碰撞时间差所对应的评分越高，每个碰撞时间差越大，每个碰撞时间差所对应的评分越低。

例如，自车在基于目标预测轨迹以及第一交通参与者在t时刻之后的N个时刻中每个时刻的状态信息得到上述每个碰撞时间差所对应的评分之后，可以对基于目标预测轨迹第一交通参与者在t时刻之后的N个时刻中每个时刻的状态信息得到的所有碰撞时间差所对应的评分进行加权求和，得到与目标预测轨迹以及第一交通参与者对应的一个子评分。

在另一种实现方式中，基于目标预测轨迹以及第一交通参与者在t时刻之后的N个时刻中每个时刻的状态信息确定的上述“碰撞时间差”还可以理解为：当目标预测轨迹与第一交通参与者在t时刻之后的每个时刻内所有的可达位置中至少一个可达位置出现重合时，自车可以获取与出现重合的至少一个可达位置一一对应的至少一个碰撞时间差。

为方便描述，此处将出现重合的至少一个可达位置中任意一个称为目标可达位置，目标可达位置所对应的碰撞时间差代表“基于目标预测轨迹确定的自车到达目标可达位置的第三时间点”与“基于第一交通参与者在t时刻之后的N个时刻内的状态信息确定的第一交通参与者到达目标可达位置的第四时间点”之间差值的绝对值；出现重合的至少一个可达位置中每个可达位置所对应的碰撞时间差的含义可以参阅前述“目标可达位置所对应的碰撞时间差”的含义进行理解。

示例性地，自车可以获取与重合的至少一个可达位置一一对应的至少一个碰撞时间差中每个碰撞时间差的评分，对至少一个碰撞时间差中每个碰撞时间差所对应的评分进行加权求和，得到目标预测轨迹在“碰撞时间差”这个维度上的一个子评分，前述一个子评分与目标预测轨迹以及第一交通参与者对应；其中，“每个碰撞时间差所对应的评分的权重”可以为“第一交通参与者在t时刻之后的N个时刻的状态信息包括的，每个碰撞时间差所对应的重合的可达位置所对应的概率”。可选地，至少一个碰撞时间差中每个碰撞时间差越大，目标预测轨迹在“碰撞时间差”这一维度上的子评分越低；至少一个碰撞时间差中每个碰撞时间差越小，目标预测轨迹在“碰撞时间差”这一维度上的子评分越高。

自车重复执行上述步骤至少一次，得到每个交通参与者所对应的在“碰撞时间差”这一维度上的一个子评分，进而可以根据每个交通参与者所对应的在“碰撞时间差”这一维度上的一个子评分，确定目标预测轨迹在“碰撞时间差”这个维度上的评分。

上述“至少一个最小距离”可以包括第一交通参与者在t时刻之后的每个时刻里与目标预测轨迹最近的一个距离，也即“至少一个最小距离”可以包括与t时刻之后的N个时刻一一对应的N个距离。

示例性地，自车可以基于目标预测轨迹和第一交通参与者在t时刻之后的N个时刻的状态信息，确定第一交通参与者在t时刻之后的每个时刻中与目标预测轨迹最近的一个可达位置，获取前述可达位置所对应的概率。自车可以对上述N个距离中的每个距离进行评分，对N个距离的评分进行加权求和，得到目标预测轨迹在“最小距离”这个维度上的一个子评分；其中，N个距离中每个距离的评分所对应的权重可以为该距离所对应的可达位置的概率；前述在“最小距离”这个维度上的一个子评分与目标预测轨迹以及第一交通参与者对应。可选地，前述N个距离中每个距离越大，目标预测轨迹在“最小距离”这个维度上的子评分越低，前述N个距离中每个距离越小，目标预测轨迹在“最小距离”这个维度上的子评分越高。

自车重复执行上述步骤至少一次，得到每个交通参与者所对应的在“最小距离”这一维度上的一个子评分，进而可以根据每个交通参与者所对应的在“最小距离”这一维度上的一个子评分，确定目标预测轨迹在“最小距离”这个维度上的评分。

上述“至少一个碰撞速度”代表当目标预测轨迹与第一交通参与者在t时刻之后的N个时刻内所有的可达位置中至少一个可达位置出现重合时，在前述每个出现重合的可达位置上，自车的预测速度与第一交通参与者的预测速度之间的相对速度；需要说明的时，若目标预测轨迹与第一交通参与者在t时刻之后的N个时刻内所有的可达位置均未出现重合，则不存在碰撞速度。

示例性地，自车可以获取上述至少一个碰撞速度中每个碰撞速度的评分，对至少一个碰撞速度中每个碰撞速度的评分进行加权求和，得到目标预测轨迹在“碰撞速度”这个维度上的一个子评分；其中，“每个碰撞速度所对应的评分的权重”可以为“第一交通参与者在t时刻之后的N个时刻的状态信息包括的，每个碰撞速度所对应的重合的可达位置所对应的概率”；前述在“碰撞速度”这个维度上的一个子评分与目标预测轨迹以及第一交通参与者对应。可选地，至少一个碰撞速度中每个碰撞速度越小，目标预测轨迹在“碰撞速度”这个维度上的子评分越低；至少一个碰撞速度中每个碰撞速度越大，目标预测轨迹在“碰撞速度”这个维度上的子评分越高。

自车重复执行上述步骤至少一次，得到每个交通参与者所对应的在“碰撞速度”这一维度上的一个子评分，进而可以根据每个交通参与者所对应的在“碰撞速度”这一维度上的一个子评分，确定目标预测轨迹在“碰撞速度”这个维度上的评分。

(2)舒适性评分

由于在自车的行进过程中，自车倾向于保持当前的运动状态，在自车基于目标预测轨迹前进的过程中，自车的运动状态变化程度越大，证明自车基于目标预测轨迹行进时的舒适度越低，则目标预测轨迹所对应的舒适性评分越高；自车的运动状态变化越小，证明自车基于目标预测轨迹行进时的舒适度越高，则目标预测轨迹所对应的舒适性评分越低。用于指示自车的运动状态的指标可以包括如下任一项或多项：加速度、转向角、速度或其他信息的等，此处不做限定。

可选地，自车可以根据自车在t时刻的加速度以及当自车基于目标预测轨迹前进时所采用的加速度，确定目标预测轨迹所对应的舒适性评分；自车在t时刻的加速度以及当自车基于目标预测轨迹前进时所采用的加速度之间差值越大，目标预测轨迹所对应的舒适性评分越高。

示例性地，自车中可以部署有第四映射信息，第四映射信息指示多个第一差值范围中每个第一差值范围所对应的评分，自车在确定t时刻的加速度与基于目标预测轨迹前进时所采用的加速度之间的第一差值之后，可以根据第四映射信息，确定第一差值归属于前述多个第一差值范围中的一个目标差值范围，将第四映射信息中获取与目标差值范围对应的一个评分，确定为目标预测轨迹所对应的舒适性评分。

(3)通行性评分

示例性地，在一种实现方式中，自车中可以部署有预设的加速度，自车可以基根据在基于目标预测轨迹行进时采用的加速度和预设的加速度之间的差值，得到目标预测轨迹所对应的通行性评分。

可选地，在基于目标预测轨迹行进时采用的加速度大于或等于预设的加速度的情况下，目标预测轨迹所对应的通行性评分为第二评分，在基于目标预测轨迹行进时采用的加速度小于预设的加速度的情况下，目标预测轨迹所对应的通行性评分为第三评分，第三评分大于第二评分。

示例性地，在基于目标预测轨迹行进时采用的加速度大于或等于预设的加速度的情况下，目标预测轨迹所对应的通行性评分均为0；在基于目标预测轨迹行进时采用的加速度小于预设的加速度的情况下，目标预测轨迹所对应的通行性评分均大于0。

在另一种实现方式中，自车可以根据至少一个交通参与者中每个交通参与者的至少一个预测轨迹，确定自车的目标预测轨迹与前述至少一个交通参与者中所有交通参与者的至少一个预测轨迹之间的交点和/或潜在冲突点；自车将“保持自车在t时刻的速度匀速通过前述交点和/或潜在冲突点所消耗的时间”与“基于目标预测轨迹通过前述交点和/或潜在冲突点所消耗的时间”进行比较，若基于“基于目标预测轨迹通过前述交点和/或潜在冲突点所消耗的时间”小于或等于“保持自车在t时刻的速度匀速通过前述交点和/或潜在冲突点所消耗的时间”，则确定目标预测轨迹的通行性代价较低，则可以确定目标预测轨迹所对应的通行性评分为0；若基于“基于目标预测轨迹通过前述交点和/或潜在冲突点所消耗的时间”大于“保持自车在t时刻的速度匀速通过前述交点和/或潜在冲突点所消耗的时间”，则确定目标预测轨迹的通行性代价较高，则可以确定目标预测轨迹所对应的通行性评分为大于0。

需要说明的时，自车还可以通过其他方式来确定目标预测轨迹所对应的通行性评分，此处示例仅为方便理解本方案，不用于限定本方案。

(4)偏移性评分

自车还可以获取当自车基于目标预测轨迹前进时，自车需要偏离当前车道中心线的偏移量，前述偏移量越大，则目标预测轨迹所对应的偏移性评分越高。

自车可以将目标预测轨迹所对应的风险性评分、舒适性评分、通行性评分以及偏移性评分进行加权求和，得到目标预测轨迹的第一评分。示例性地，目标预测轨迹所对应的风险性评分、舒适性评分、通行性评分以及偏移性评分的权重可以相同或不同，具体可以结合实际情况灵活确定，此处不做限定。

自车可以重复执行上述步骤多次，直至得到至少一个第二预测轨迹中每个第二预测轨迹的第一评分(也即每个第二预测轨迹的评价信息)，也即得到了每个第二预测轨迹所对应的策略的第一评分。

本申请实施例中，还可以根据交通参与者在t时刻之后的N个时刻的状态信息，生成自车的在t时刻之后的N个时刻的每个预测轨迹的评价信息，而不是直接将交通参与者在t时刻之后的N个时刻的可达位置从自车的行进路线中筛除掉，有利于扩大自车行进过程中的探索空间，进而有利于规划处自车更优的路径。

209、对自车的轨迹进行规划。

本申请实施例中，步骤207和208为可选步骤，若执行步骤207和208，则步骤209可以包括：自车基于每个第二预测轨迹的评价信息，对自车的轨迹进行规划。

示例性地，自车在获取到每个第二预测轨迹的第一评分之后，可以从自车的至少一个第二预测轨迹中确定评分最低的一个第二预测轨迹；进而自车可以根据评分最低的一个第二预测轨迹、至少一个交通参与者中每个交通参与者在t时刻之后的N个时刻的子状态信息，对自车的路径进行规划。

或者，自车在获取到每个第二预测轨迹的第一评分之后，也即得到了策略集合中每个策略的第一评分，可以从策略集合中确定评分最低的一个策略；进而可以根据评分最低的一个策略、至少一个交通参与者中每个交通参与者在t时刻之后的N个时刻的子状态信息，对自车的路径进行规划。

为了更直观地理解本方案，请参阅图5，图5为本申请实施例提供的基于t时刻之后N个时刻的状态信息对自车进行路径规划的一个示意图。图5中以至少一个交通参与者包括1个对自车有风险且与自车之间存在博弈关系的交通参与者为例，图5中的t₁、t₂、…t_N分别代表该交通参与者在t时刻之后的N个时刻中每个时刻的状态信息。自车可以根据交通参与者在t时刻之后的N个时刻中每个时刻的状态信息，生成自车的每个第二预测轨迹的第一评分，也即得到了自车的策略集合中每个策略所对应的第一评分；自车可以根据策略集合中评分最低的一个策略以及交通参与者在t时刻之后的N个时刻中每个时刻的状态信息，对自车的路径进行规划，应理解，图5中的示例仅为方便理解本方案，不用于限定本方案。

若不执行步骤207和208，自车还可以基于交通参与者在t时刻之后的N个时刻的状态信息，确定交通参与者在t时刻之后的N个时刻中概率大于或等于概率阈值的可达位置，将前述概率大于或等于概率阈值的可达位置从交通参与者的前进路线上移除，进而对自车的轨迹进行规划。

210、根据交通参与者在目标时刻的一个或多个可达位置和交通参与者在目标时刻的位置，对第一参数进行更新，目标时刻包括t时刻之后的一个或多个时刻，第一参数包括在生成与交通参与者对应的转移概率的过程中采用到的至少一个参数。

本申请实施例中，步骤209为可选步骤。目标时刻可以包括t时刻之后的N个时刻中的一个或多个时刻。可选地，第一参数可以包括在生成第一调整系数过程中采用的至少一个参数，和/或，在生成第二调整系数过程中采用的至少一个参数。

示例性地，第一参数可以包括上述公式(2)中的和/>还可以包括公式(4)中的Δ_ref，应理解，此处举例仅为方便理解本方案，不用于限定本方案。

在一种实现方式中，自车也可以根据每个交通参与者在t时刻之后的连续的T个时刻的实际位置，对上述步骤中得到的每个交通参与者在t时刻之后的连续的T个时刻的状态信息进行评估，得到至少一个评估指标的第一参数值，前述至少一个评估指标的第一参数值用于指示每个交通参与者在t时刻之后的连续的T个时刻的状态信息对该交通参与者在t时刻之后的连续的T个时刻的实际位置的覆盖情况，T为大于或等于1且小于或等于N的整数，具体T的取值可以结合实际情况确定，此处不做限定；根据前述至少一个评估指标的第一参数值，对第一参数进行更新。

或者，自车可以根据每个交通参与者在t+1时刻实际的位置，对上述步骤中得到的每个交通参与者在t+1时刻的状态信息进行评估，得到至少一个评估指标的第二参数值，前述至少一个评估指标的第二参数值用于指示每个交通参与者在t+1时刻的状态信息对该交通参与者在t+1时刻的实际位置的覆盖情况；根据前述至少一个评估指标的第二参数值，对第一参数进行更新。

可选地，自车还可以根据每个交通参与者在t+2时刻的实际位置，对上述步骤中得到的每个交通参与者在t+2时刻的状态信息进行评估，得到至少一个评估指标的第一参数值，前述至少一个评估指标的第一参数值用于指示每个交通参与者在t+2时刻的状态信息对该交通参与者在t+2时刻的实际位置的覆盖情况；根据前述至少一个评估指标的第一参数值，对第一参数进行更新。

依次类推，自车还可以根据每个交通参与者在t+3时刻的实际位置，对第一参数进行更新等等，直至根据每个交通参与者在t+N时刻的实际位置，对第一参数进行更新。

应理解，目标时刻可以包括t时刻之后的N个时刻中的任意一个或多个时刻，具体根据每个交通参与者在哪些时刻的实际位置对第一参数进行更新，可以结合实际应用场景灵活确定，此处不做限定。

示例性地，“至少一个评估指标”可以包括如下任一个或多个评估指标：覆盖率、几何偏差、偏差期望或者其他评估指标等，本申请中不做限定。

为进一步理解本方案，如下分别公开了覆盖率、几何偏差以及偏差期望的计算公式，此处以第一交通参与者(也即至少一个交通参与者中的任意就一个)所对应的覆盖率代表第一交通参与者在t时刻之后T个时刻的实际位置包含于第一交通参与者在t时刻之后T个时刻的至少一个可达位置中的概率；第一交通参与者所对应的几何偏差代表第一交通参与者在t时刻之后T个时刻的实际位置与第一交通参与者在t时刻之后的T个时刻的至少一个可达位置的边界之间的距离的概率期望；第一交通参与者所对应的偏差期望代表第一交通参与者在t时刻之后的T个时刻的实际位置与第一交通参与者在t时刻之后的T个时刻的至少一个可达位置之间的距离的概率期望为例进行说明：

其中，E₁代表覆盖率，E₂(t_k)代表在t时刻之后的第k个时刻的几何偏差，E₃代表几何偏差，E₄代表偏差期望，T代表目标时刻包括t时刻之后的T个时刻，x(t_k)代表第一交通参与者在t时刻之后的第k个时刻的实际位置，I(x(t_k))为示性函数，X(t_k)代表第一交通参与者在t时刻之后的第k个时刻的多个可达位置，Conv(X(t_k))代表第一交通参与者在t时刻之后的第k个时刻的多个可达位置构成的凸包，代表第一交通参与者在t时刻之后的第k个时刻的多个可达位置构成的凸包的边界，x_i代表第一交通参与者在t时刻之后的第k个时刻的任意一个可达位置，p(x_i,t_k)代表第一交通参与者在t时刻之后的第k个时刻的多个可达位置中每个可达位置的概率，应理解，公式(6)至(9)中的示例仅为方便理解本方案，不用于限定本方案。

为更直观地理解本方案，请参阅图6，图6为本申请实施例提供的交通参与者在t+1时刻的所有可达位置、每个可达位置所对应的概率以及交通参与者在t+1时刻的实际位置的一种示意图。图6中示出了第一交通参与者在t+1时刻(也即t时刻之后的0.5s)的7个可达位置，7个可达位置所对应的概率分别为[0.1,0.1,0.2,0.4,0.2,0.1,0.1]，7个可达位置与第一交通参与者在t+1时刻的实际位置之间的距离分别为[2.1,1.8,0.9,1.4,1.7,0.9,1.3]，7个可达位置构成的凸包边界与第一交通参与者在t+1时刻的实际位置之间的距离为0.5，应理解，图6中的示例仅为方便了解本方案，不用于限定本方案。基于图6示出的情况可得，第一交通参与者在t+1时刻的实际位置没有被第一交通参与者在t+1时刻的7个可达位置覆盖，此种情况下t+1时刻的所有可达位置对实际位置的覆盖率为0，期望偏差为1.69，几何偏差为0.5，应理解，图6中的示例仅为方便理解本方案，不用于限定本方案。

本申请实施例中，第一参数包括在生成与交通参与者对应的转移概率的过程中采用到的至少一个参数，也即第一参与包括生成交通参与者在t时刻之后的状态信息的过程中所采用的参数；根据交通参与者在t时刻之后的一个或多个时刻的实际位置，以及交通参与者在t时刻之后的一个或多个时刻的可达位置，对第一参数进行更新，也即根据交通参与者在t时刻之后的一个或多个时刻的实际位置，对生成交通参与者在t时刻之后的一个或多个时刻的可达位置过程中所采用到的参数进行调整，从而有利于后续能够生成交通参与者更为准确的可达位置。

为了进一步理解本方案，如下结合图7和图8示出了本申请提供的轨迹规划方法的一个具体实施例，图7为本申请实施例提供的自车所处交通场景的一种示意图，自车位于无保护的十字路口中，自车位于左转车道中；交通参与者B1位于自车对向的直行车道中。如图7所示，自车的规划路径(也即图7中的左转)和交通参与者B1的预测路径(也即图7中的直行)之间存在冲突，也即自车和交通参与者B1在图7示出的交点处可能发生碰撞，在图7示出的场景中，可以利用本申请提供的轨迹规划方法来获取交通参与者B1在t时刻之后的可达位置，请参与图8，图8为本申请提供的轨迹规划方法的另一个流程示意图。本申请实施例提供的轨迹规划方法可以包括：

801、获取交通参与者B1的在t时刻的第一状态信息，t为大于或等于0的整数。

本申请实施例中，可选地，图8对应实施例中的交通参与者可以为弱势交通参与者，对于弱势交通参与者的定义可以参阅上述描述，此处不做赘述。

自车在位于图7示出的路口时，可以识别出交通参与者B1为对自车有风险的交通参与者，且交通参与者B1是与自车具有博弈交互的；自车可以获取交通参与者B1在t时刻(也即当前时刻)的第一状态信息。其中，交通参与者B1在t时刻的第一状态信息可以包括交通参与者B1在t时刻的位置、速度、加速度和转向角。示例性地，交通参与者B1在t时刻的速度为4.0m/s。

802、获取交通参与者B1的第一信息和第二信息，第一信息指示交通参与者B1抢行的概率，第二信息指示交通参与者B1的至少一个第一预测轨迹。

本申请实施例中，步骤802为可选步骤。示例性地，交通参与者B1抢行的概率可以为0.6；交通参与者B1的一个第一预测轨迹可以如图7所示。

803、获取交通参与者B1的可行的加速度范围以及可行的转向角范围。

本申请实施例中，步骤803为可选步骤。自车在确定了交通参与者B1在t时刻的速度为4.0m/s之后，可以采用查表法确定交通参与者B1的可行的加速度范围为[-1.5,1.5]m/s²。

自车可以采用查表法，确定交通参与者B1容许的最大倾斜度为20^°，也即确定了交通参与者B1的容许的倾斜度范围为0至20^°；自车根据交通参与者B1容许的倾斜度范围，得到交通参与者B1的可行的转向角的度数范围为[-12.56,12.56]。

804、确定与交通参与者B1对应的第一转移概率，第一转移概率指示交通参与者B1从t时刻至t+1时刻执行至少一个动作中每个动作的概率。

本申请实施例中，上述第一转移概率基于第二转移概率和/或第三转移概率得到。其中，第二转移概率指示交通参与者B1从t时刻至t+1时刻采用第一加速度的概率，例如，第二转移概率可以包括与多个加速度值一一对应的多个第二转移概率值，每个第二转移概率值代表交通参与者B1从t时刻至t+1时刻采用多个加速度值中的一个加速度值的概率。第三转移概率指示交通参与者B1从t时刻至t+1时刻采用第一转向角的概率，第三转移概率可以包括与多个转向角一一对应的多个第三转移概率值，每个第三转移概率值代表交通参与者B1从t时刻至t+1时刻采用多个转向角中的一个转向角的概率。

自车对交通参与者B1的可行的加速度范围进行离散处理，得到交通参与者B1的多个可行的加速度包括[-1.5,-0.9,-0.3,0,0.3,0.9,1.5]m/s²。

本实施例中以交通参与者B1从t时刻至t+1时刻的多个可行的加速度所对应的多个第一概率服从正态分布为例，确定前述正态分布的期望为0.2m/s²，前述正态分布的标准差为(1.5-(-1.5))/4＝0.75，则与交通参与者B1的可行的加速度[-1.5,-0.9,-0.3,0,0.3,0.9,1.5]m/s²一一对应的多个第一概率为[0.016,0.072,0.180,0.205,0.210,0.137,0.047]，对前述多个概率值进行归一化，得到与交通参与者B1的多个可行的加速度一一对应的多个第一概率为[0.018,0.084,0.198,0.239,0.245,0.159,0.055]。

交通参与者B1的多个可行的加速度中每个加速度所对应的第一调整系数可以对和/>进行加权得到，示例性地，每个加速度所对应的第一调整系数可以基于公式得到，/>的权重为上述交通参与者B1的第一信息(也即p＝0.6)，/>的权重为0.4(也即1-0.6)。交通参与者B1的多个可行的加速度中每个加速度所对应的/>可以不同，示例性地，与交通参与者B1的可行的加速度[-1.5,-0.9,-0.3,0,0.3,0.9,1.5]m/s²一一对应的多个/>可以为[-0.7,-0.2,0.3,0.8,1.3,1.8,2.3]；交通参与者B1的多个可行的加速度中每个加速度所对应的/>可以不同，示例性地，与交通参与者B1的多个可行的加速度[-1.5,-0.9,-0.3,0,0.3,0.9,1.5]m/s²一一对应的多个/>可以为[2.7,2.2,1.7,1.2,0.7,0.2,-0.3]，基于公式/>可得，与交通参与者B1的多个可行的加速度一一对应的多个第一调整系数为[0.66,0.76,0.86,0.96,1.06,1.16,1.26]。

自车将交通参与者B1每个可行的加速度所对应的第一概率以及第一调整系数相乘，并进行归一化处理后得到与交通参与者B1的多个可行的加速度的值[-1.5,-0.9,-0.3,0,0.3,0.9,1.5]一一对应的多个概率值为[0.013,0.06,0.17,0.23,0.26,0.19,0.07]，也即交通参与者B1从t时刻至t+1时刻的第二转移概率为：[0.013,0.06,0.17,0.23,0.26,0.19,0.07]。

自车对交通参与者B1的可行的转向角范围进行离散化处理，得到交通参与者B1的多个可行的转向角的度数分别为[-12.56,-7.536,-2.512,2.512,7.536,12.56]。

本实施例中以交通参与者B1从t时刻至t+1时刻的多个可行的转向角所对应的多个第二概率服从正态分布为例，同理可得，与交通参与者B1的多个可行的转向角的度数一一对应的多个第二概率为[0.044,0.158,0.299,0.299,0.158,0.044]。

自车假定交通参与者B1的加速度不变的情况下，遍历每个可行的转向角，基于交通参与者B1的运动学特性进行推演，可计算得到每个可行的转向角所对应的交通参与者B1在t+1时刻的位置以及该位置与交通参与者B1的一个第一预测轨迹之间的最小距离。例如，在交通参与者B1的加速度为-1.5的情况下，计算得到每个可行的转向角所对应的交通参与者B1在t+1时刻的位置与交通参与者B1的一个第一预测轨迹之间的第一距离为：[-0.24m,-0.12m,0.05m,0.13m,0.20m,0.31m]。基于前述多个第一距离能够得到与交通参与者B1的多个可行的转向角的度数[-12.56,-7.536,-2.512,2.512,7.536,12.56]一一对应的多个第二调整系数为[0.79,0.94,0.99,0.93,0.85,0.68]，对前述多个第二调整系数进行归一化处理后为[0.15,0.18,0.19,0.18,0.16,0.13]。[0.044,0.158,0.299,0.299,0.158,0.044]。

示例性地，上述多个第二调整系数的计算过程中采用的公式可以为其中，λ_αβ代表一个第二调整系数，Δ_ref＝0.5m，Δ代表第一距离，应理解，此处举例仅为方便理解本方案，不用于限定本方案。

自车将交通参与者B1每个可行的转向角所对应的第二概率以及第二调整系数相乘，并进行归一化处理后得到与交通参与者B1的多个可行的转向角一一对应的多个概率值为[0.04,0.16,0.32,0.30,0.15,0.03]，也即交通参与者B1从t时刻至t+1时刻的第三转移概率为：[0.04,0.16,0.32,0.30,0.15,0.03]。

由于与交通参与者B1的多个可行的加速度的值[-1.5,-0.9,-0.3,0,0.3,0.9,1.5]一一对应的多个转移概率值为[0.013,0.06,0.17,0.23,0.26,0.19,0.07]，与交通参与者B1的多个可行的转向角的角度[-12.56,-7.536,-2.512,2.512,7.536,12.56]一一对应的多个转移概率值为[0.04,0.16,0.32,0.30,0.15,0.03]，自车可以基于前述第二转移概率和第三转移概率，确定交通参与者B1从t时刻至t+1时刻执行多个联合动作中每个联合动作的转移概率。例如，某个联合动作可以为采用加速度值-1.5且转向角为-12.56的转移概率可以为0.013与0.04的乘积0.0005；又例如，某个联合动作可以为采用加速度值-1.5且转向角为-7.536的转移概率可以为0.013与0.16的乘积0.0021等等，其他可行的加速度与转向角的联合动作的转移概率的计算同理。为进一步理解本方案，如下通过表1公开了第一转移概率中所有的转移概率值。

表1

其中，表1中的示例仅为方便理解本方案，不用于限定本方案，表1中示出的每个值代表交通参与者B1采用某一加速度且采用某一转向角的转移概率值。例如，交通参与者B1采用加速度-0.3且采用转向角-2.512时的转移概率值为0.0544；又例如，交通参与者B1采用加速度0且采用转向角2.512时的转移概率值为0.069；又例如，交通参与者B1采用加速度0.3且采用转向角12.56的转移概率值为0.0078等，此处不对表1中示出的所有值的含义进行解释，可结合表1进行理解。

805、根据交通参与者B1的第一状态信息和第一转移概率，确定交通参与者B1在t时刻之后的N个时刻的状态信息，交通参与者B1在t时刻之后的每个时刻的状态信息包括交通参与者B1在该时刻的一个或多个可达位置以及每个可达位置所对应的概率。

本申请实施例中，自车在确定了交通参与者B1在t时刻的一个第一状态信息之后，可以基于运动学模型，确定交通参与者B1从t时刻至t+1时刻能够执行的动作合集，基于交通参与者B1从t时刻至t+1时刻的第一转移概率对交通参与者B1进行状态转移；取时间步长为0.5s，可得到t时刻之后0.5s内的第二状态信息。示例性地，可以得到交通参与者B1在t时刻之后0.5s的35个子状态信息，交通参与者B1在t时刻之后0.5s的35个子状态信息指示交通参与者B1在t时刻之后0.5s的35个可达位置以及每个可达位置所对应的概率；对前述35个子状态信息进行归并，得到归并后的7个子状态信息，共组成交通参与者B1在t+1时刻的第二状态信息。

自车可以遍历交通参与者B1在t+1时刻的7个子状态信息，根据交通参与者B1在t+1时刻的每个子状态信息，基于马尔科夫链算法和运动学模型，分别执行转移概率计算、确定参与者B1在t+1时刻至t+2时刻的可行的动作合集以及子状态信息的归并等操作，可以得到交通参与者B1在t+2时刻的状态信息，依次类推，直至得到交通参与者B1在t时刻之后的N个时刻内的所有状态信息。

为更直观地理解本方案，请参阅图9，图9为本申请实施例提供的交通参与者B1在t时刻、t+1时刻以及t+2时刻的状态信息的一种示意图，图9中每个带颜色的方格代表交通参与者B1的一个可达位置，图9中的R0代表交通参与者B1在t时刻的状态信息，R1代表交通参与者B1在t+1时刻的状态信息，R2代表交通参与者B1在t+2时刻的状态信息。如图9所示，自车基于交通参与者B1在t时刻的状态信息，得到交通参与者B1在t+1时刻的状态信息，交通参与者B1在t+1时刻的状态信息包括与7个可达位置一一对应的7个子状态信息；自车基于交通参与者B1在t+1时刻的7个子状态信息，得到交通参与者B1在t+2时刻的状态信息，交通参与者B1在t+2时刻的状态信息包括与19个可达位置一一对应的19个子状态信息，应理解，图9中的示例仅为方便理解本方案，不用于限定本方案。

806、获取自车的至少一个第二预测轨迹，每个第二预测轨迹指示自车在t时刻之后的N个时刻内的位置，N为大于或等于1的整数。

本申请实施例中，自车可以确定自车的可行的策略集合，进而推演出策略集合中每个策略所对应的一个第二预测轨迹。示例性地，自车在纵向上的策略，可以用加速度的大小来表征。在图7示出的场景中，自车在t时刻的速度为17km/h，自车在t时刻的加速度的为-0.67m/s²，道路静态限速60km/h。基于自车的动力学约束，自车允许的加速度区间为[-4.0,2.0]m/s²，考虑到计算复杂度和采样策略空间精度之间的平衡，将不同的加速度之间的间隔定为1m/s²。

自车在横向上的策略可以采用自车在横向上的偏移量来表征。示例性地，当自车继续保持沿当前车道的中心线行驶时视为自车的偏移量为0，当自车向左避让即偏移车道中心线左侧1m时，记为+1m，当自车偏离车道中心线右侧1m时，记为-1m。

基于自车在纵向上的策略和横向上的策略可以得到自车的策略集合，示例性地，自车的策略集合可以包括加速度-3和偏移量-1，加速度-3和偏移量0，加速度-3和偏移量1，加速度-2和偏移量-1，加速度-2和偏移量0，加速度-2和偏移量1，加速度-1和偏移量-1，加速度-1和偏移量0，加速度-1和偏移量1，加速度0和偏移量-1，加速度0和偏移量0，加速度0和偏移量1，加速度1和偏移量-1，加速度1和偏移量0，加速度1和偏移量1，加速度2和偏移量-1，加速度2和偏移量0，以及加速度2和偏移量1。

自车可根据上述策略集合中每个可行的策略，对自车在t时刻之后的N个时刻的状态进行推演，得到自车的多个第二预测轨迹；示例性地，N的取值可以为10，也即每个第二预测轨迹能够指示自车在t时刻之后5s内的可达位置。需要说明的是，前述推演过程需遵守自车***的延迟以及道路限速等约束条件，当自车加速到道路限速后，假定自车保持在道路限速的速度上匀速前进。

807、根据交通参与者B1在t时刻之后的N个时刻的状态信息，生成每个第二预测轨迹的评价信息，进而根据评价信息对自车的轨迹进行规划。

本申请实施例中，自车在获取到交通参与者B1在t时刻之后的N个时刻的状态信息以及自车的至少一个第二预测轨迹之后，可以生成每个第二预测轨迹的评价信息，也即生成每个第二预测轨迹所对应的自车的一个可行的策略的评价信息。

自车可以获取到交通参与者B1在t时刻之后的10个时刻中每个时刻的状态信息，也即分别得到交通参与者B1在t时刻之后的0秒、0.5秒、1秒、1.5秒、2秒、2.5秒、3秒、3.5秒、4秒、4.5秒以及5秒的状态信息。自车可以从风险性评分、舒适性评分、通行性评分以及偏移性评分四个角度，生成自车的每个第二预测轨迹的评价信息。如下仅以目标预测轨迹(也即至少一个第二预测轨迹中任意一个)是加速度1和偏移量0这一策略得到的为例，来生成目标预测轨迹的评价信息。

(1)风险性评分

为更直观地理解本方案，此处结合图10和图11进行详细描述，先参阅图10，图10为本申请实施例提供的交通参与者B1在t时刻之后某一时刻的一个子状态信息所对应的碰撞时间差的一种示意图，图10中以自车采用的加速度为1和偏移量0为例，在t时刻之后的0.5s时，自车在t时刻之后的0.5s的可达位置为图10中的C1所示，交通参与者B1在t时刻之后的0.5s时的19个子状态信息如图10中的19个带颜色的栅格示出，其中箭头引出的一个子状态信息(为方便描述，后续称为子状态信息1)指示交通参与者B1在t时刻之后的0.5s时的速度为4.2m/s、航向角为-1.42rad、交通参与者B1在t时刻之后的0.5s时到达该可达位置的概率为0.08，对交通参与者B1在子状态信息1指示的状态下进行匀速推演，可得到与目标预测轨迹的交点C2；交通参与者B1从t时刻之后的0.5s开始至到达交点C2所消耗的时间为0.32s，C3代表自车沿着目标预测轨迹在t时刻之后的0.82s时到达的位置，自车沿着目标预测轨迹从t时刻之后的0.5s开始至到达交点C2所消耗的时间为0.56s，则可以得到子状态信息1所对应的碰撞时间差为0.24s。

再参阅图11，图11为本申请实施例提供的基于每个碰撞时间差得到每个碰撞时间差的评分所采用的第一函数的一个示意图，图11中以第一函数表现为分段函数为例，当碰撞时间差的取值为0至1时，碰撞时间差的评分为1至0.2；当碰撞时间差的取值为1至5时，碰撞时间差的评分为0.2至0；当碰撞时间差的取值大于5时，碰撞时间差的评分均为0。自车可以根据子状态信息1所对应的碰撞时间差0.24s，基于第一函数，确定子状态信息1所对应的评分为0.808；应理解，图10和图11中的示例仅为方便理解本方案，不用于限定本方案。

自车可以重复执行上述步骤多次，得到交通参与者B1在t时刻之后的N个时刻的状态信息所包括的每个子状态信息所对应的碰撞时间差，进而得到每个碰撞时间差所对应的评分；对基于所有子状态信息得到的多个碰撞时间差所对应的评分进行加权求和，可以得到目标预测轨迹所对应的风险性评分。

可选地，每个碰撞时间差所对应的评分的权重可以为该碰撞时间差所对应的子状态信息中携带的概率；示例性地，基于上述子状态信息1得到的碰撞时间差所对应的评分的权重可以为0.08，则将子状态信息1所对应的评分0.808与0.08相乘后得到0.06464；以此类推，基于交通参与者B1在t时刻之后的0.5s所对应所有子状态信息，得到t时刻之后的0.5s所对应的一个总评分为0.44。基于前述原理，自车可以对交通参与者B1在t时刻之后10个时刻内每个时刻所对应所有子状态信息，得到在t时刻之后10个时刻内每个时刻所对应的一个评分，对前述10个时刻中每个时刻所对应的一个总评分进行加权求和，得到目标预测轨迹所对应的一个风险性评分0.58。

(2)舒适性评分

自车在根据目标预测轨迹行进的过程中，自车的加速度变化量越小，则代表目标预测轨迹所对应的舒适性越好，则目标预测轨迹所对应的舒适性评分越低。

示例性地，自车在根据目标预测轨迹行进时采用的加速度为1，偏移量为0，自车在t时刻的加速度为-0.67，则自车在根据目标预测轨迹行进的过程中，自车的加速度变化量为1.67，得到目标预测轨迹所对应的舒适性评分为0.315。

可选地，“目标预测轨迹所对应的加速度变化量”与“目标预测轨迹所对应的舒适性评分”之间的关系可以符合第二函数，则自车在得到根据目标预测轨迹行进的过程中，自车的加速度变化量之后，可以根据第二函数，确定目标预测轨迹所对应的舒适性评分。为更直观地理解本方案，请参阅图12，图12为本申请实施例提供的基于加速度变化量得到舒适性评分所采用的第二函数的一个示意图。如图12所示，当加速度变化量为7时，基于加速度变化量确定的舒适性评分为1，应理解，图12中的示例仅为方便理解本方案，不用于限定本方案。

(3)通行性评分

示例性地，自车在根据目标预测轨迹行进时采用的加速度为1，预设的加速度的取值为0.8，当自车采用的加速度大于或等于预设的加速度时，目标预测轨迹所对应的通行性评分可以为0。

可选地，“目标预测轨迹所对应的加速度与预设的加速度之间的差值”与“目标预测轨迹所对应的通行性评分”之间的关系可以符合第三函数，则自车在得到根据目标预测轨迹行进的过程中，自车的加速度之后，可以根据第三函数，确定目标预测轨迹所对应的通行性评分。

为更直观地理解本方案，请参阅图13，图13为本申请实施例提供的基于自车的加速度与预设的加速度之间的差值得到通行性评分所采用的第三函数的一个示意图。如图13所示，第三函数可以为分段函数，当目标预测轨迹所对应的加速度与预设的加速度之间的差值大于或等于0时，目标预测轨迹所对应的通过性评分均为0；当目标预测轨迹所对应的加速度与预设的加速度之间的差值小于或等于-3.2时，目标预测轨迹所对应的通过性评分均为1；当目标预测轨迹所对应的加速度与预设的加速度之间的差值小于0且大于-3.2时，前述差值越小，目标预测轨迹所对应的通过性评分越大，应理解，图13中的示例仅为方便理解本方案，不用于限定本方案。

(4)偏移性评分

示例性地，当偏移量为0时得到的偏移性评分为0；当偏移量为1或-1时得到的偏移性评分可以为0.3；由于自车在根据目标预测轨迹行进时采用的偏移量为0，则目标预测轨迹所对应的偏移性评分为0。

自车可以将目标预测轨迹所对应的风险性评分、舒适性评分、通行性评分以及偏移性评分进行加权求和，得到目标预测轨迹的第一评分，也即得到了推演出目标预测轨迹的一个策略的第一评分。示例性地，风险性评分的权重可以为0.8，舒适性评分的权重可以为0.7，则当自车采用加速度为1且偏移量为0这一策略推演出的目标预测轨迹所对应的第一评分为：0.58×0.8+0.315×0.7+0+0＝0.464+0.221＝0.685。

自车可以重复执行上述步骤，能够得到每个第二预测轨迹的第一评分，也即得到自车的策略集合中每个策略所对应的第一评分。为更直观地理解本方案，如下通过表2示出每个第二预测轨迹的第一评分，也即示出自车的策略集合中每个策略所对应的第一评分。

表2

	-3	-2	-1	0	1	2
							+1	0.760	0.674	0.642	0.657	0.723	0.901
0	0.725	0.664	0.625	0.577	0.685	0.854
							-1	0.711	0.648	0.593	0.517	0.562	0.673

其中，表2的第一行中示出了自车可以采用的多个加速度，分别为-3、-2、-1、0、1以及2；表2中的第一列示出了自车可以采用的多个偏移量，分别为1、0以及1。表2中的剩余数值代表每个策略所对应的第一评分，例如，加速度-3和偏移量1所对应的第一评分为0.760；又例如，加速度-2和偏移量1所对应的第一评分为0.674；又例如，加速度-1和偏移量1所对应的第一评分为0.642等等，表2中其他数值的含义可以参阅前述描述进行理解，此处不对表2中其他数值的含义一一进行介绍。

通过上述表2可知，评分最低的一个策略(也即最优的一个策略)为：加速度为0且偏移量为-1。

可选地，自车可以根据评分最低的一个策略、交通参与者B1在t时刻之后的N个时刻的状态信息，确定自车在当前场景中选择抢行还是让行；进而对自车进行路径规划。

808、根据交通参与者B1在目标时刻的一个或多个可达位置和交通参与者B1在目标时刻的位置，对第一参数进行更新，目标时刻包括t时刻之后的N个时刻中的至少一个时刻，第一参数包括在生成与交通参与者B1对应的转移概率的过程中采用到的至少一个参数。

本申请实施例中，步骤807为可选步骤。示例性地，目标时刻包括t时刻之后连续的5个时刻，也即分别包括t时刻之后的0.5s、t时刻之后的1s、t时刻之后的1.5s、t时刻之后的1.5s、t时刻之后的2s以及t时刻之后的2.5s。

自车也可以根据交通参与者B1在t时刻之后的连续的5个时刻的实际位置，对交通参与者B1在t时刻之后的连续的5个时刻的状态信息进行评估，得到至少一个评估指标的第一参数值，前述至少一个评估指标的第一参数值用于指示交通参与者B1在t时刻之后的连续的5个时刻的状态信息对交通参与者B1在t时刻之后的连续的5个时刻的实际位置的覆盖情况；根据前述至少一个评估指标的第一参数值，对第一参数进行更新。至少一个指标包括覆盖率、几何偏差和偏差期望，如下通过表3分别示出了t时刻之后的连续的5个时刻中每个时刻所对应的覆盖率、几何偏差以及偏差期望的取值。

表3

	偏差期望	几何偏差	覆盖率
				t时刻之后的0.5s	1.09	0.025	0.55
t时刻之后的1s	1.83	0.028	0.59
				t时刻之后的1.5s	2.54	0.032	0.80
t时刻之后的2s	3.80	0.080	0.61
				t时刻之后的2.5s	5.09	0.047	0.59

其中，表3中第二行示出了基于交通参与者B1在t时刻之后的0.5s的实际位置，对交通参与者B1在t时刻之后的0.5s的状态信息进行评估，得到偏差期望为1.09，几何偏差为0.025以及覆盖率为0.55；表3中第三行至第六行的内容可以参阅前述对第一行的描述进行理解，此处不再一一赘述。

自车可以基于图2对应实施例中的公式(6)至(8)对表3中的多个参数值进行汇总，也即对t时刻之后的连续的5个时刻中每个时刻所对应的覆盖率、几何偏差以及偏差期望的取值进行汇总，得到至少一个评估指标的第一参数值，至少一个评估指标的第一参数值可以包括覆盖率的一个参数值0.608，偏差期望的一个参数值1425，

自车可以根据至少一个评估指标的第一参数值，对上述公式中的和/>以及Δ_ref进行更新。

本申请实施例中，提供了一种确定交通参与者在下一时刻的每个可达位置上的概率的方案；先获取交通参与者在t时刻的状态信息，再确定交通参与者从t时刻至t+1时刻执行至少一个动作中每个动作的概率(也即第一转移概率)，进而根据交通参与者在t时刻的状态信息以及第一转移概率，确定交通参与者在t+1时刻的可达位置以及每个可达位置所对应的概率，前述方案的实现逻辑与交通参与者实际的行进逻辑是相符的，能够较为准确的反映出交通参与者在每个可达位置上的概率。

为了对本申请实施例所带来的有益效果有更为直观的认识，以下结合上述图7以及图14对本申请实施例所带来的有益效果作进一步的介绍，图14为本申请实施例提供的在图7示出的交通场景中的行驶策略的两种示意图。图14中示出了在当前时刻之后的多个时刻中自车采用的加速度，如图14所示，采用本申请的方法得到的行驶策略包括：由于自车确定交通参与者B1存在较大风险，因此对自车进行适当减速，减速一段时间后，自车确定与交通参与者B1之间的风险降到了合理水平，交通参与者B1可以安全通过，随后自车加速驶离，整个过程较为平稳类人，前述描述所对应的加速度曲线请参阅图14。基线方法中的行驶策略包括：自车采用重刹的策略，导致驾驶体验极其不佳，前述描述所对应的加速度曲线请参阅图14。应理解，图14中的示例仅为方便理解本方案，不用于限定本方案。

在图1至图14所对应的实施例的基础上，为了更好的实施本申请实施例的上述方案，下面还提供用于实施上述方案的相关设备。具体参阅图15，图15为本申请实施例提供的轨迹规划装置的一种结构示意图。

轨迹规划装置1500可以包括：

获取模块1501，用于获取弱势交通参与者的第一状态信息，弱势交通参与者在自车感知范围内，第一状态信息包括弱势交通参与者的位置；

确定模块1502，用于基于第一状态信息，确定弱势交通参与者在后续N个时刻的状态信息，N个时刻的状态信息包括弱势交通参与者在N个时刻中每个时刻的一个或多个可达位置以及每个可达位置的概率，N为大于0的整数；

规划模块1503，用于基于弱势交通参与者在后续N个时刻的状态信息，对自车的轨迹进行规划。

可选地，第一状态信息包括弱势交通参与者在t时刻的位置，弱势交通者在后续N个时刻的状态信息包括弱势交通参与者在t+1时刻的第二状态信息，其中，确定模块1502，具体用于：

确定与弱势交通参与者对应的第一转移概率，第一转移概率指示弱势交通参与者从t时刻至t+1时刻执行至少一个动作中每个动作的概率；根据第一状态信息和第一转移概率，确定弱势交通参与者在t+1时刻的第二状态信息，第二状态信息包括弱势交通参与者在t+1时刻的一个或多个可达位置以及每个可达位置所对应的概率。

可选地，第一转移概率基于第二转移概率和/或第三转移概率得到，第二转移概率指示弱势交通参与者从t时刻至t+1时刻采用至少一个加速度中每个加速度的概率，第三转移概率指示弱势交通参与者从t时刻至t+1时刻采用至少一个转向角中每个转向角的概率。

可选地，第一状态信息还包括弱势交通参与者在t时刻的第二加速度；获取模块1501，还用于获取弱势交通参与者的第一信息，第一信息指示弱势交通参与者抢行的概率；确定模块1502，还用于根据第二加速度和第一信息，确定第二转移概率。

可选地，确定模块1502，具体用于：根据第二加速度，确定弱势交通参与者从t时刻至t+1时刻采用第一加速度的第一概率，第一加速度为至少一个加速度中的任意一个，第一加速度与第二加速度之间的距离越近，第一概率越大；根据第一信息，确定弱势交通参与者从t时刻至t+1时刻采用第一加速度的第一调整系数，根据第一概率和第一调整系数，确定第二转移概率。

可选地，第一状态信息还包括弱势交通参与者在t时刻的第二转向角；获取模块1501，还用于获取弱势交通参与者的第二信息，第二信息指示弱势交通参与者的至少一个第一预测轨迹；确定模块1502，还用于根据第二转向角和第二信息，确定第三转移概率。

可选地，确定模块1502，具体用于：根据第二转向角，确定弱势交通参与者从t时刻至t+1时刻采用第一转向角的第二概率，第一转向角为至少一个转向角中的任意一个，第一转向角与第二转向角之间的距离越近，第二概率越大；根据第二信息，确定弱势交通参与者从t时刻至t+1时刻采用第一转向角的第二调整系数，根据第二概率和第二调整系数，确定第三转移概率。

可选地，确定模块1502，还用于根据弱势交通参与者的第一倾斜度，确定弱势交通参与者的可行的转向角范围，第一倾斜度指示弱势交通参与者在转向过程中容许的最大倾斜度，其中，至少一个转向角基于弱势交通参与者的可行的转向角范围得到。

可选地，确定模块1502，具体用于基于马尔科夫链算法，确定与弱势交通参与者对应的第一转移概率。

可选地，确定模块1502，具体用于根据第一状态信息、弱势交通参与者的可行的加速度范围、弱势交通参与者的可行的转向角范围、运动学模型以及第一转移概率，确定弱势交通参与者在t+1时刻的第二状态信息。

可选地，获取模块1501，还用于获取自车的至少一个第二预测轨迹，每个第二预测轨迹指示自车在N个时刻内的位置；规划模块1503，具体用于：根据弱势交通参与者在后续N个时刻的状态信息，生成每个第二预测轨迹的评价信息；基于每个第二预测轨迹的评价信息，对自车的轨迹进行规划。

可选地，轨迹规划装置1500还包括：更新模块1504，用于根据弱势交通参与者在目标时刻的一个或多个可达位置和弱势交通参与者在目标时刻的位置，对第一参数进行更新，目标时刻包括t时刻之后的一个或多个时刻，第一参数包括在生成与弱势交通参与者对应的转移概率的过程中采用到的至少一个参数。

需要说明的是，轨迹规划装置1500中各模块/单元之间的信息交互、执行过程等内容，与本申请中图1至图14对应的各个方法实施例基于同一构思，具体内容可参见本申请前述所示的方法实施例中的叙述，此处不再赘述。

本申请实施例还提供了一种设备，示例性地，前述设备可以为车辆、移动机器人或其他设备等。请参阅图16，图16为本申请实施例提供的设备的一种结构示意图，设备1600包括：接收器1601、发射器1602、处理器1603和存储器1604(其中执行设备1600中的处理器1603的数量可以一个或多个，图16中以一个处理器为例)，其中，处理器1603可以包括应用处理器16031和通信处理器16032。在本申请的一些实施例中，接收器1601、发射器1602、处理器1603和存储器1604可通过总线或其它方式连接。

存储器1604可以包括只读存储器和随机存取存储器，并向处理器1603提供指令和数据。存储器1604的一部分还可以包括非易失性随机存取存储器(non-volatile randomaccess memory，NVRAM)。存储器1604存储有处理器和操作指令、可执行模块或者数据结构，或者它们的子集，或者它们的扩展集，其中，操作指令可包括各种操作指令，用于实现各种操作。

处理器1603控制执行设备的操作。具体的应用中，执行设备的各个组件通过总线***耦合在一起，其中总线***除包括数据总线之外，还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见，在图中将各种总线都称为总线***。

上述本申请实施例揭示的方法可以应用于处理器1603中，或者由处理器1603实现。处理器1603可以是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器1603中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1603可以是通用处理器、数字信号处理器(digital signal processing，DSP)、微处理器或微控制器，还可进一步包括专用集成电路(application specific integratedcircuit，ASIC)、现场可编程门阵列(field-programmable gate array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。该处理器1603可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1604，处理器1603读取存储器1604中的信息，结合其硬件完成上述方法的步骤。

接收器1601可用于接收输入的数字或字符信息，以及产生与执行设备的相关设置以及功能控制有关的信号输入。发射器1602可用于通过第一接口输出数字或字符信息；发射器1602还可用于通过第一接口向磁盘组发送指令，以修改磁盘组中的数据；发射器1602还可以包括显示屏等显示设备。

本申请实施例中，在一种情况下，处理器1603，用于执行图1至图14对应实施例中的第一设备执行的轨迹规划方法。需要说明的是，处理器1603执行前述各个步骤的具体方式，与本申请中图1至图14对应的各个方法实施例基于同一构思，其带来的技术效果与本申请中图1至图14对应的各个方法实施例相同，具体内容可参见本申请前述所示的方法实施例中的叙述，此处不再赘述。

请继续参阅图17，图17为本申请实施例提供的车辆的一种结构示意图，车辆10配置为完全或部分地自动驾驶模式，例如，车辆10可以在处于自动驾驶模式中的同时控制自身，并且可通过人为操作来确定车辆及其周边环境的当前状态，确定周边环境中的至少一个其他车辆的可能行为，并确定其他车辆执行可能行为的可能性相对应的置信水平，基于所确定的信息来控制车辆10。在车辆10处于自动驾驶模式中时，也可以将车辆10置为在没有和人交互的情况下操作。

车辆10可包括各种子***，例如行进***102、传感器***104、控制***106、一个或多个***设备108以及电源110、计算机***112和用户接口116。可选地，车辆10可包括更多或更少的子***，并且每个子***可包括多个部件。另外，车辆10的每个子***和部件可以通过有线或者无线互连。

行进***102可包括为车辆10提供动力运动的组件。在一个实施例中，行进***102可包括引擎118、能量源119、传动装置120和车轮/轮胎121。

其中，引擎118可以是内燃引擎、电动机、空气压缩引擎或其他类型的引擎组合，例如，汽油发动机和电动机组成的混动引擎，内燃引擎和空气压缩引擎组成的混动引擎。引擎118将能量源119转换成机械能量。能量源119的示例包括汽油、柴油、其他基于石油的燃料、丙烷、其他基于压缩气体的燃料、乙醇、太阳能电池板、电池和其他电力来源。能量源119也可以为车辆10的其他***提供能量。传动装置120可以将来自引擎118的机械动力传送到车轮121。传动装置120可包括变速箱、差速器和驱动轴。在一个实施例中，传动装置120还可以包括其他器件，比如离合器。其中，驱动轴可包括可耦合到一个或多个车轮121的一个或多个轴。

传感器***104可包括感测关于自动驾驶车辆100周边的环境的信息的若干个传感器。例如，传感器***104可包括定位***122(定位***可以是全球定位GPS***，也可以是北斗***或者其他定位***)、惯性测量单元(inertial measurement unit，IMU)124、雷达126、激光测距仪128以及相机130。传感器***104还可包括被监视自动驾驶车辆100的内部***的传感器(例如，车内空气质量监测器、燃油量表、机油温度表等)。来自这些传感器中的一个或多个的传感数据可用于检测对象及其相应特性(位置、形状、方向、速度等)。这种检测和识别是自主自动驾驶车辆100的安全操作的关键功能。

其中，定位***122可用于估计自动驾驶车辆100的地理位置。IMU 124用于基于惯性加速度来感知自动驾驶车辆100的位置和朝向变化。在一个实施例中，IMU 124可以是加速度计和陀螺仪的组合。雷达126可利用无线电信号来感知自动驾驶车辆100的周边环境内的物体，具体可以表现为毫米波雷达或激光雷达。在一些实施例中，除了感知物体以外，雷达126还可用于感知物体的速度和/或前进方向。激光测距仪128可利用激光来感知自动驾驶车辆100所位于的环境中的物体。在一些实施例中，激光测距仪128可包括一个或多个激光源、激光扫描器以及一个或多个检测器，以及其他***组件。相机130可用于捕捉自动驾驶车辆100的周边环境的多个图像。相机130可以是静态相机或视频相机。

控制***106为控制车辆10及其组件的操作。控制***106可包括各种部件，其中包括转向***132、油门134、制动单元136、计算机视觉***140、线路控制***142以及障碍避免***144。

其中，转向***132可操作来调整车辆10的前进方向。例如在一个实施例中可以为方向盘***。油门134用于控制引擎118的操作速度并进而控制车辆10的速度。制动单元136用于控制车辆10减速。制动单元136可使用摩擦力来减慢车轮121。在其他实施例中，制动单元136可将车轮121的动能转换为电流。制动单元136也可采取其他形式来减慢车轮121转速从而控制车辆10的速度。计算机视觉***140可以操作来处理和分析由相机130捕捉的图像以便识别车辆10周边环境中的物体和/或特征。所述物体和/或特征可包括交通信号、道路边界和障碍体。计算机视觉***140可使用物体识别算法、运动中恢复结构(Structurefrom Motion，SFM)算法、视频跟踪和其他计算机视觉技术。在一些实施例中，计算机视觉***140可以用于为环境绘制地图、跟踪物体、估计物体的速度等等。线路控制***142用于确定车辆10的行驶路线以及行驶速度。在一些实施例中，线路控制***142可以包括横向规划模块1421和纵向规划模块1422，横向规划模块1421和纵向规划模块1422分别用于结合来自障碍避免***144、GPS122和一个或多个预定地图的数据为车辆10确定行驶路线和行驶速度。障碍避免***144用于识别、评估和避免或者以其他方式越过车辆10的环境中的障碍体，前述障碍体具体可以表现为实际障碍体和可能与车辆10发生碰撞的虚拟移动体。在一个实例中，控制***106可以增加或替换地包括除了所示出和描述的那些以外的组件。或者也可以减少一部分上述示出的组件。

车辆10通过***设备108与外部传感器、其他车辆、其他计算机***或用户之间进行交互。***设备108可包括无线通信***146、车载电脑148、麦克风150和/或扬声器152。在一些实施例中，***设备108为车辆10的用户提供与用户接口116交互的手段。例如，车载电脑148可向车辆10的用户提供信息。用户接口116还可操作车载电脑148来接收用户的输入。车载电脑148可以通过触摸屏进行操作。在其他情况中，***设备108可提供用于车辆10与位于车内的其它设备通信的手段。例如，麦克风150可从车辆10的用户接收音频(例如，语音命令或其他音频输入)。类似地，扬声器152可向车辆10的用户输出音频。无线通信***146可以直接地或者经由通信网络来与一个或多个设备无线通信。例如，无线通信***146可使用3G蜂窝通信，例如CDMA、EVD0、GSM/GPRS，或者4G蜂窝通信，例如LTE。或者5G蜂窝通信。无线通信***146可利用无线局域网(wireless localarea network，WLAN)通信。在一些实施例中，无线通信***146可利用红外链路、蓝牙或ZigBee与设备直接通信。其他无线协议，例如各种车辆通信***，例如，无线通信***146可包括一个或多个专用短程通信(dedicated short range communications，DSRC)设备，这些设备可包括车辆和/或路边台站之间的公共和/或私有数据通信。

电源110可向车辆10的各种组件提供电力。在一个实施例中，电源110可以为可再充电锂离子或铅酸电池。这种电池的一个或多个电池组可被配置为电源为车辆10的各种组件提供电力。在一些实施例中，电源110和能量源119可一起实现，例如一些全电动车中那样。

车辆10的部分或所有功能受计算机***112控制。计算机***112可包括至少一个处理器113，处理器113执行存储在例如存储器114这样的非暂态计算机可读介质中的指令115。计算机***112还可以是采用分布式方式控制车辆10的个体组件或子***的多个计算设备。处理器113可以是任何常规的处理器，诸如商业可获得的中央处理器(centralprocessing unit，CPU)。可选地，处理器113可以是诸如专用集成电路(applicationspecific integrated circuit，ASIC)或其它基于硬件的处理器的专用设备。尽管图17功能性地图示了处理器、存储器、和在相同块中的计算机***112的其它部件，但是本领域的普通技术人员应该理解该处理器、或存储器实际上可以包括不存储在相同的物理外壳内的多个处理器、或存储器。例如，存储器114可以是硬盘驱动器或位于不同于计算机***112的外壳内的其它存储介质。因此，对处理器113或存储器114的引用将被理解为包括可以并行操作或者可以不并行操作的处理器或存储器的集合的引用。不同于使用单一的处理器来执行此处所描述的步骤，诸如转向组件和减速组件的一些组件每个都可以具有其自己的处理器，所述处理器只执行与特定于组件的功能相关的计算。

在此处所描述的各个方面中，处理器113可以位于远离车辆10并且与车辆10进行无线通信。在其它方面中，此处所描述的过程中的一些在布置于车辆10内的处理器113上执行而其它则由远程处理器113执行，包括采取执行单一操纵的必要步骤。

在一些实施例中，存储器114可包含指令115(例如，程序逻辑)，指令115可被处理器113执行来执行车辆10的各种功能，包括以上描述的那些功能。存储器114也可包含额外的指令，包括向行进***102、传感器***104、控制***106和***设备108中的一个或多个发送数据、从其接收数据、与其交互和/或对其进行控制的指令。除了指令115以外，存储器114还可存储数据，例如道路地图、路线信息，车辆的位置、方向、速度以及其它这样的车辆数据，以及其他信息。这种信息可在车辆10在自主、半自主和/或手动模式中操作期间被车辆10和计算机***112使用。用户接口116，用于向车辆10的用户提供信息或从其接收信息。可选地，用户接口116可包括在***设备108的集合内的一个或多个输入/输出设备，例如无线通信***146、车载电脑148、麦克风150和扬声器152。

计算机***112可基于从各种子***(例如，行进***102、传感器***104和控制***106)以及从用户接口116接收的输入来控制车辆10的功能。例如，计算机***112可利用来自控制***106的输入以便控制转向***132来避免由传感器***104和障碍避免***144检测到的障碍体。在一些实施例中，计算机***112可操作来对车辆10及其子***的许多方面提供控制。

可选地，上述这些组件中的一个或多个可与车辆10分开安装或关联。例如，存储器114可以部分或完全地与车辆10分开存在。上述组件可以按有线和/或无线方式来通信地耦合在一起。

可选地，上述组件只是一个示例，实际应用中，上述各个模块中的组件有可能根据实际需要增添或者删除，图17不应理解为对本申请实施例的限制。在道路行进的自动驾驶车辆，如上面的车辆10，可以识别其周围环境内的物体以确定对当前速度的调整。所述物体可以是其它车辆、交通控制设备、或者其它类型的物体。在一些示例中，可以独立地考虑每个识别的物体，并且基于物体的各自的特性，诸如它的当前速度、加速度、与车辆的间距等，可以用来确定自动驾驶车辆所要调整的速度。

可选地，车辆10或者与车辆10相关联的计算设备如图17的计算机***112、计算机视觉***140、存储器114可以基于所识别的物体的特性和周围环境的状态(例如，交通、雨、道路上的冰、等等)来预测所识别的物体的行为。可选地，每一个所识别的物体都依赖于彼此的行为，因此还可以将所识别的所有物体全部一起考虑来预测单个识别的物体的行为。车辆10能够基于预测的所识别的物体的行为来调整它的速度。换句话说，车辆10能够基于所预测的物体的行为来确定车辆将需要调整到(例如，加速、减速、或者停止)什么稳定状态。在这个过程中，也可以考虑其它因素来确定车辆10的速度，诸如，车辆10在行驶的道路中的横向位置、道路的曲率、静态和动态物体的接近度等等。除了提供调整自动驾驶车辆的速度的指令之外，计算设备还可以提供修改车辆10的转向角的指令，以使得车辆10遵循给定的轨迹和/或维持与车辆10附近的物体(例如，道路上的相邻车道中的轿车)的安全横向和纵向距离。

上述车辆10可以为轿车、卡车、摩托车、公共汽车、船、飞机、直升飞机、割草机、娱乐车、游乐场车辆、施工设备、电车、高尔夫球车和火车等，本申请实施例不做特别的限定。

具体的，车辆10中的处理器113可以通过至少两个加速度计124获取至少两个加速度信息，前述至少两个加速度计124部署于车辆10的不同位置上。车辆10中的处理器113可以根据至少两个加速度信息和位置信息，确定车辆10的角速度信息，该位置信息指示至少两个加速度计124中不同的加速度计124之间的相对位置。

需要说明的是，车辆10中可以部署有图15所对应的轨迹规划装置1500，或者，车辆10中可以部署有图16所对应的设备1600，车辆10中的处理器113可以执行图1至图14对应的各个方法实施例中中自车执行的步骤，处理器113执行前述各个步骤的具体方式，与本申请中图1至图14对应的各个方法实施例基于同一构思，其带来的技术效果与本申请中图1至图14对应的各个方法实施例相同，具体内容可参见本申请前述所示的方法实施例中的叙述，此处不再赘述。

本申请实施例中还提供一种计算机可读存储介质，该计算机可读存储介质中存储有程序，当其在计算机上运行时，使得计算机执行如前述图1至图14所示实施例描述的方法中自车所执行的步骤。

本申请实施例中还提供一种包括计算机程序产品，计算机程序产品包括程序，当前述程序在计算机上运行时，使得计算机执行如前述图1至图14所示实施例描述的方法中自车所执行的步骤。

本申请实施例中还提供一种电路***，所述电路***包括处理电路，所述处理电路配置为执行如前述图1至图14所示实施例描述的方法中自车所执行的步骤。

本申请实施例提供的轨迹规划装置或设备具体可以为芯片，芯片包括：处理单元和通信单元，所述处理单元例如可以是处理器，所述通信单元例如可以是输入/输出接口、管脚或电路等。该处理单元可执行存储单元存储的计算机执行指令，以使服务器内的芯片执行上述图1至图14所示实施例描述的轨迹规划方法。可选地，所述存储单元为所述芯片内的存储单元，如寄存器、缓存等，所述存储单元还可以是所述无线接入设备端内的位于所述芯片外部的存储单元，如只读存储器(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，RAM)等。

其中，上述任一处提到的处理器，可以是一个通用中央处理器，微处理器，ASIC，或一个或多个用于控制上述第一方面方法的程序执行的集成电路。

另外需说明的是，以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外，本申请提供的装置实施例附图中，模块之间的连接关系表示它们之间具有通信连接，具体可以实现为一条或多条通信总线或信号线。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件的方式来实现，当然也可以通过专用硬件包括专用集成电路、专用CLU、专用存储器、专用元器件等来实现。一般情况下，凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现，而且，用来实现同一功能的具体硬件结构也可以是多种多样的，例如模拟电路、数字电路或专用电路等。但是，对本申请而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在可读取的存储介质中，如计算机的软盘、U盘、移动硬盘、ROM、RAM、磁碟或者光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。

所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘(Solid State Disk，SSD))等。

Claims

1.一种轨迹规划方法，其特征在于，所述方法包括：

获取弱势交通参与者的第一状态信息，所述弱势交通参与者在自车感知范围内，所述第一状态信息包括所述弱势交通参与者的位置；

基于所述第一状态信息，确定所述弱势交通参与者在后续N个时刻的状态信息，所述N个时刻的状态信息包括所述弱势交通参与者在所述N个时刻中每个时刻的一个或多个可达位置以及每个所述可达位置的概率，N为大于0的整数；

基于所述弱势交通参与者在后续N个时刻的状态信息，对自车的轨迹进行规划。

2.根据权利要求1所述的方法，其特征在于，所述第一状态信息包括所述弱势交通参与者在t时刻的位置，所述弱势交通者在后续N个时刻的状态信息包括所述弱势交通参与者在t+1时刻的第二状态信息，其中，所述基于所述第一状态信息，确定所述弱势交通参与者在后续N个时刻的状态信息，包括：

确定与所述弱势交通参与者对应的第一转移概率，所述第一转移概率指示所述弱势交通参与者从所述t时刻至t+1时刻执行至少一个动作中每个动作的概率；

根据所述第一状态信息和所述第一转移概率，确定所述弱势交通参与者在所述t+1时刻的第二状态信息，所述第二状态信息包括所述弱势交通参与者在所述t+1时刻的一个或多个可达位置以及每个所述可达位置所对应的概率。

3.根据权利要求2所述的方法，其特征在于，所述第一转移概率基于第二转移概率和/或第三转移概率得到，所述第二转移概率指示所述弱势交通参与者从所述t时刻至所述t+1时刻采用至少一个加速度中每个加速度的概率，所述第三转移概率指示所述弱势交通参与者从所述t时刻至所述t+1时刻采用至少一个转向角中每个转向角的概率。

4.根据权利要求3所述的方法，其特征在于，所述第一状态信息还包括所述弱势交通参与者在所述t时刻的第二加速度，所述方法还包括：

获取所述弱势交通参与者的第一信息，所述第一信息指示所述弱势交通参与者抢行的概率；

根据所述第二加速度和所述第一信息，确定所述第二转移概率。

5.根据权利要求4所述的方法，其特征在于，所述根据所述第二加速度和所述第一信息，确定所述第二转移概率，包括：

根据所述第二加速度，确定所述弱势交通参与者从所述t时刻至所述t+1时刻采用第一加速度的第一概率，所述第一加速度为所述至少一个加速度中的任意一个，所述第一加速度与所述第二加速度之间的距离越近，所述第一概率越大；

根据所述第一信息，确定所述弱势交通参与者从所述t时刻至所述t+1时刻采用所述第一加速度的第一调整系数，根据所述第一概率和所述第一调整系数，确定所述第二转移概率。

6.根据权利要求3所述的方法，其特征在于，所述第一状态信息还包括所述弱势交通参与者在所述t时刻的第二转向角，所述方法还包括：

获取所述弱势交通参与者的第二信息，所述第二信息指示所述弱势交通参与者的至少一个第一预测轨迹；

根据所述第二转向角和所述第二信息，确定所述第三转移概率。

7.根据权利要求6所述的方法，其特征在于，所述根据所述第二转向角和所述第二信息，确定所述第三转移概率，包括：

根据所述第二转向角，确定所述弱势交通参与者从所述t时刻至所述t+1时刻采用第一转向角的第二概率，所述第一转向角为所述至少一个转向角中的任意一个，所述第一转向角与所述第二转向角之间的距离越近，所述第二概率越大；

根据所述第二信息，确定所述弱势交通参与者从所述t时刻至所述t+1时刻采用所述第一转向角的第二调整系数，根据所述第二概率和所述第二调整系数，确定所述第三转移概率。

8.根据权利要求3至7任一项所述的方法，其特征在于，所述方法还包括：

根据所述弱势交通参与者的第一倾斜度，确定所述弱势交通参与者的可行的转向角范围，所述第一倾斜度指示所述弱势交通参与者在转向过程中容许的最大倾斜度，其中，所述至少一个转向角基于所述弱势交通参与者的可行的转向角范围得到。

9.根据权利要求2至7任一项所述的方法，其特征在于，确定与所述弱势交通参与者对应的第一转移概率，包括：基于马尔科夫链算法，确定与所述弱势交通参与者对应的第一转移概率。

10.根据权利要求2至7任一项所述的方法，其特征在于，所述根据所述第一状态信息和所述第一转移概率，确定所述弱势交通参与者在所述t+1时刻的第二状态信息，包括：

根据所述第一状态信息、所述弱势交通参与者的可行的加速度范围、所述弱势交通参与者的可行的转向角范围、运动学模型以及所述第一转移概率，确定所述弱势交通参与者在所述t+1时刻的第二状态信息。

11.根据权利要求1至7任一项所述的方法，其特征在于，所述方法还包括：

获取自车的至少一个第二预测轨迹，每个所述第二预测轨迹指示所述自车在所述N个时刻内的位置；

所述基于所述弱势交通参与者在后续N个时刻的状态信息，对自车的轨迹进行规划，包括：

根据所述弱势交通参与者在后续N个时刻的状态信息，生成每个所述第二预测轨迹的评价信息；

基于每个所述第二预测轨迹的评价信息，对所述自车的轨迹进行规划。

12.根据权利要求2至7任一项所述的方法，其特征在于，所述方法还包括：

根据所述弱势交通参与者在目标时刻的一个或多个可达位置和所述弱势交通参与者在所述目标时刻的位置，对第一参数进行更新，所述目标时刻包括所述t时刻之后的一个或多个时刻，所述第一参数包括在生成与所述弱势交通参与者对应的转移概率的过程中采用到的至少一个参数。

13.一种轨迹规划装置，其特征在于，所述装置包括：

获取模块，用于获取弱势交通参与者的第一状态信息，所述弱势交通参与者在自车感知范围内，所述第一状态信息包括所述弱势交通参与者的位置；

确定模块，用于基于所述第一状态信息，确定所述弱势交通参与者在后续N个时刻的状态信息，所述N个时刻的状态信息包括所述弱势交通参与者在所述N个时刻中每个时刻的一个或多个可达位置以及每个所述可达位置的概率，N为大于0的整数；

规划模块，用于基于所述弱势交通参与者在后续N个时刻的状态信息，对自车的轨迹进行规划。

14.根据权利要求13所述的装置，其特征在于，所述第一状态信息包括所述弱势交通参与者在t时刻的位置，所述弱势交通者在后续N个时刻的状态信息包括所述弱势交通参与者在t+1时刻的第二状态信息，其中，所述确定模块，具体用于：

15.根据权利要求14所述的装置，其特征在于，所述第一转移概率基于第二转移概率和/或第三转移概率得到，所述第二转移概率指示所述弱势交通参与者从所述t时刻至所述t+1时刻采用至少一个加速度中每个加速度的概率，所述第三转移概率指示所述弱势交通参与者从所述t时刻至所述t+1时刻采用至少一个转向角中每个转向角的概率。

16.根据权利要求15所述的装置，其特征在于，所述第一状态信息还包括所述弱势交通参与者在所述t时刻的第二加速度；

所述获取模块，还用于获取所述弱势交通参与者的第一信息，所述第一信息指示所述弱势交通参与者抢行的概率；

所述确定模块，还用于根据所述第二加速度和所述第一信息，确定所述第二转移概率。

17.根据权利要求16所述的装置，其特征在于，所述确定模块，具体用于：

18.根据权利要求15所述的装置，其特征在于，所述第一状态信息还包括所述弱势交通参与者在所述t时刻的第二转向角；

所述获取模块，还用于获取所述弱势交通参与者的第二信息，所述第二信息指示所述弱势交通参与者的至少一个第一预测轨迹；

所述确定模块，还用于根据所述第二转向角和所述第二信息，确定所述第三转移概率。

19.根据权利要求18所述的装置，其特征在于，所述确定模块，具体用于：

20.根据权利要求15至19任一项所述的装置，其特征在于，

所述确定模块，还用于根据所述弱势交通参与者的第一倾斜度，确定所述弱势交通参与者的可行的转向角范围，所述第一倾斜度指示所述弱势交通参与者在转向过程中容许的最大倾斜度，其中，所述至少一个转向角基于所述弱势交通参与者的可行的转向角范围得到。

21.根据权利要求14至19任一项所述的装置，其特征在于，

所述确定模块，具体用于基于马尔科夫链算法，确定与所述弱势交通参与者对应的第一转移概率。

22.根据权利要求14至19任一项所述的装置，其特征在于，

所述确定模块，具体用于根据所述第一状态信息、所述弱势交通参与者的可行的加速度范围、所述弱势交通参与者的可行的转向角范围、运动学模型以及所述第一转移概率，确定所述弱势交通参与者在所述t+1时刻的第二状态信息。

23.根据权利要求13至19任一项所述的装置，其特征在于，所述获取模块，还用于获取自车的至少一个第二预测轨迹，每个所述第二预测轨迹指示所述自车在所述N个时刻内的位置；

所述规划模块，具体用于：

24.根据权利要求13至19任一项所述的装置，其特征在于，所述装置还包括：

更新模块，用于根据所述弱势交通参与者在目标时刻的一个或多个可达位置和所述弱势交通参与者在所述目标时刻的位置，对第一参数进行更新，所述目标时刻包括所述t时刻之后的一个或多个时刻，所述第一参数包括在生成与所述弱势交通参与者对应的转移概率的过程中采用到的至少一个参数。

25.一种设备，其特征在于，包括处理器，所述处理器和存储器耦合，所述存储器存储有程序指令，当所述存储器存储的程序指令被所述处理器执行时实现权利要求1至12中任一项所述的方法。

26.一种车辆，其特征在于，所述车辆包括如权利要求13至24任一项所述的装置，或者，所述车辆包括如权利要求25所述的设备。

27.一种计算机可读存储介质，包括程序，当其在计算机上运行时，使得计算机执行如权利要求1至12中任一项所述的方法。

28.一种电路***，其特征在于，所述电路***包括处理电路，所述处理电路配置为执行如权利要求1至12中任一项所述的方法。