CN115071704B

CN115071704B - 轨迹预测方法、装置、介质、设备、芯片和车辆

Info

Publication number: CN115071704B
Application number: CN202210848278.9A
Authority: CN
Inventors: 赵燕顺
Original assignee: Xiaomi Automobile Technology Co Ltd
Current assignee: Xiaomi Automobile Technology Co Ltd
Priority date: 2022-07-19
Filing date: 2022-07-19
Publication date: 2022-11-11
Anticipated expiration: 2042-07-19
Also published as: CN115071704A

Abstract

本公开涉及一种轨迹预测方法、装置、介质、设备、芯片和车辆。该方法包括：获取目标对象的目标历史移动轨迹，将该目标历史移动轨迹输入目标轨迹预测模型，得到目标轨迹预测模型输出的目标对象在第一预设时间段内的目标预测轨迹，其中，该目标轨迹预测模型为根据第一训练样本集，基于待定轨迹预测模型和待定轨迹回溯模型进行互相监督训练后得到的轨迹预测模型，在训练过程中对第一训练样本集进行了扩充，从而提高了训练后得到的目标轨迹预测模型的预测准确度，也提高了自动驾驶车辆的安全性。

Description

轨迹预测方法、装置、介质、设备、芯片和车辆

技术领域

本公开涉及自动驾驶技术领域，具体地，涉及一种轨迹预测方法、装置、介质、设备、芯片和车辆。

背景技术

随着计算机技术的发展，自动驾驶的应用越来越多。为了提高自动驾驶车辆的安全性，需要对车辆周边的障碍物进行检测，并根据障碍物的位置进行相关的车辆控制。实际环境中既会存在静态障碍物（例如交通标志、树木、路障等），也会存在动态障碍物（例如机动车、非机动车、行人等），为了避免与动态障碍物发生碰撞，需要对动态障碍物的移动轨迹进行预测。但是，在相关技术中，存在轨迹预测不准确的情况，影响自动驾驶车辆的安全性。

发明内容

为克服相关技术中存在的上述问题，本公开提供一种轨迹预测方法、装置、介质、设备、芯片和车辆。

根据本公开实施例的第一方面，提供一种轨迹预测方法，所述方法包括：

获取目标对象的目标历史移动轨迹；

将所述目标历史移动轨迹输入目标轨迹预测模型，得到所述目标轨迹预测模型输出的所述目标对象在第一预设时间段内的目标预测轨迹；

其中，所述目标轨迹预测模型是将第一训练样本集中的样本预测轨迹作为待定轨迹回溯模型的输入，得到所述待定轨迹回溯模型输出的第一历史轨迹，所述第一训练样本集包括样本历史轨迹和所述样本预测轨迹；将所述第一历史轨迹作为所述样本预测轨迹对应的新的样本历史轨迹，添加至所述第一训练样本集，得到第二训练样本集，并根据所述第二训练样本集对待定轨迹预测模型进行训练得到的模型；

所述待定轨迹回溯模型是将所述第一训练样本集中的所述样本历史轨迹作为所述待定轨迹预测模型的输入，得到所述待定轨迹预测模型输出的第一预测轨迹，将所述第一预测轨迹作为所述样本历史轨迹对应的新的样本预测轨迹，添加至所述第一训练样本集，得到第三训练样本集，并根据所述第三训练样本集进行训练得到的模型。

在一些实施例中，所述目标轨迹预测模型是通过以下方式训练得到的：

获取多个所述第一训练样本集；

确定所述待定轨迹预测模型和所述待定轨迹回溯模型；

循环执行模型训练步骤，直至确定训练后的待定轨迹预测模型满足目标停止迭代条件，根据训练后的待定轨迹预测模型获取所述目标轨迹预测模型；

其中，所述模型训练步骤包括：

将所述样本预测轨迹输入所述待定轨迹回溯模型，得到所述第一历史轨迹；

将所述第一历史轨迹作为所述样本预测轨迹对应的新的样本历史轨迹，添加至所述第一训练样本集，得到第二训练样本集；

根据所述第二训练样本集对所述待定轨迹预测模型进行训练，将训练后的待定轨迹预测模型作为新的待定轨迹预测模型。

在一些实施例中，在所述将所述样本预测轨迹输入所述待定轨迹回溯模型，得到第一历史轨迹之前，所述模型训练步骤还包括：

将所述样本历史轨迹输入所述待定轨迹预测模型，得到第一预测轨迹；

将所述第一预测轨迹作为所述样本历史轨迹对应的新的样本预测轨迹，添加至所述第一训练样本集，得到第三训练样本集；

根据所述第三训练样本集对所述待定轨迹回溯模型进行训练，将训练后的待定轨迹回溯模型作为新的待定轨迹回溯模型。

在一些实施例中，所述根据所述第三训练样本集对所述待定轨迹回溯模型进行训练，将训练后的待定轨迹回溯模型作为新的待定轨迹回溯模型包括：

将所述第一预测轨迹输入所述待定轨迹回溯模型，得到所述第一预测轨迹对应的一个或多个第二历史轨迹；

通过第一损失函数计算得到所述第二历史轨迹与所述样本历史轨迹的第一损失值；其中，该第一损失值用于表征所述第二历史轨迹与所述样本历史轨迹的差异程度；

根据所述第一损失值更新所述待定轨迹回溯模型的参数，得到训练后的待定轨迹回溯模型，并将训练后的待定轨迹回溯模型作为新的待定轨迹回溯模型。

在一些实施例中，所述根据所述第二训练样本集对所述待定轨迹预测模型进行训练，将训练后的待定轨迹预测模型作为新的待定轨迹预测模型包括：

将所述第一历史轨迹输入所述待定轨迹预测模型，得到所述第一历史轨迹对应的一个或多个第二预测轨迹；

通过第二损失函数计算得到所述第二预测轨迹与所述样本预测轨迹的第二损失值；其中，该第二损失值用于表征所述第二预测轨迹与所述样本预测轨迹的差异程度；

在根据所述第二损失值确定所述待定轨迹预测模型不满足所述目标停止迭代条件的情况下，根据所述第二损失值更新所述待定轨迹预测模型的参数，得到训练后的待定轨迹预测模型，并将训练后的待定轨迹预测模型作为新的待定轨迹预测模型。

在一些实施例中，所述确定所述待定轨迹预测模型和所述待定轨迹回溯模型包括：

根据所述第一训练样本集，对预设轨迹预测模型进行预训练，得到待定轨迹预测模型；

根据所述第一训练样本集，对预设轨迹回溯模型进行预训练，得到待定轨迹回溯模型。

根据本公开实施例的第二方面，提供一种轨迹预测装置，所述装置包括：

轨迹获取模块，被配置为获取目标对象的目标历史移动轨迹；

轨迹预测模块，被配置为将所述目标历史移动轨迹输入目标轨迹预测模型，得到所述目标轨迹预测模型输出的所述目标对象在第一预设时间段内的目标预测轨迹；

其中，所述目标轨迹预测模型是将第一训练样本集中的样本预测轨迹作为待定轨迹回溯模型的输入，得到所述待定轨迹回溯模型输出的第一历史轨迹，所述第一训练样本集包括样本历史轨迹和所述样本预测轨迹；将所述第一历史轨迹作为所述样本预测轨迹对应的新的样本历史轨迹，添加至所述第一训练样本集，得到第二训练样本集，并根据所述第二训练样本集对待定轨迹预测模型进行训练得到的模型；所述待定轨迹回溯模型是将所述第一训练样本集中的所述样本历史轨迹作为所述待定轨迹预测模型的输入，得到所述待定轨迹预测模型输出的第一预测轨迹，将所述第一预测轨迹作为所述样本历史轨迹对应的新的样本预测轨迹，添加至所述第一训练样本集，得到第三训练样本集，并根据所述第三训练样本集进行训练得到的模型。

在一些实施例中，所述装置还包括模型训练模块，所述模型训练模块，被配置为通过以下方式训练得到的：

获取多个所述第一训练样本集；

确定所述待定轨迹预测模型和所述待定轨迹回溯模型；

其中，所述模型训练步骤包括：

在一些实施例中，所述模型训练模块，还被配置为将所述样本历史轨迹输入所述待定轨迹预测模型，得到第一预测轨迹；将所述第一预测轨迹作为所述样本历史轨迹对应的新的样本预测轨迹，添加至所述第一训练样本集，得到第三训练样本集；根据所述第三训练样本集对所述待定轨迹回溯模型进行训练，将训练后的待定轨迹回溯模型作为新的待定轨迹回溯模型。

在一些实施例中，所述模型训练模块，被配置为将所述第一预测轨迹输入所述待定轨迹回溯模型，得到所述第一预测轨迹对应的一个或多个第二历史轨迹；通过第一损失函数计算得到所述第二历史轨迹与所述样本历史轨迹的第一损失值；其中，该第一损失值用于表征所述第二历史轨迹与所述样本历史轨迹的差异程度；根据所述第一损失值更新所述待定轨迹回溯模型的参数，得到训练后的待定轨迹回溯模型，并将训练后的待定轨迹回溯模型作为新的待定轨迹回溯模型。

在一些实施例中，所述模型训练模块，被配置为将所述第一历史轨迹输入所述待定轨迹预测模型，得到所述第一历史轨迹对应的一个或多个第二预测轨迹；通过第二损失函数计算得到所述第二预测轨迹与所述样本预测轨迹的第二损失值；其中，该第二损失值用于表征所述第二预测轨迹与所述样本预测轨迹的差异程度；在根据所述第二损失值确定所述待定轨迹预测模型不满足所述目标停止迭代条件的情况下，根据所述第二损失值更新所述待定轨迹预测模型的参数，得到训练后的待定轨迹预测模型，并将训练后的待定轨迹预测模型作为新的待定轨迹预测模型。

在一些实施例中，所述模型训练模块，被配置为根据所述第一训练样本集，对预设轨迹预测模型进行预训练，得到待定轨迹预测模型；根据所述第一训练样本集，对预设轨迹回溯模型进行预训练，得到待定轨迹回溯模型。

根据本公开实施例的第三方面，提供一种电子设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为执行本公开第一方面所提供的轨迹预测方法的步骤。

根据本公开实施例的第四方面，提供一种计算机可读存储介质，其上存储有计算机程序指令，该计算机程序指令被处理器执行时实现本公开第一方面所提供的轨迹预测方法的步骤。

根据本公开实施例的第五方面，提供一种芯片，包括处理器和接口；所述处理器用于读取指令以执行本公开第一方面所提供的轨迹预测方法的步骤。

根据本公开实施例的第六方面，提供一种车辆，该车辆包括本公开第三方面所提供的电子设备。

本公开的实施例提供的技术方案可以包括以下有益效果：获取目标对象的目标历史移动轨迹，将目标历史移动轨迹输入目标轨迹预测模型，得到目标轨迹预测模型输出的目标对象在第一预设时间段内的目标预测轨迹，其中，该目标轨迹预测模型为根据第一训练样本集，基于待定轨迹预测模型和待定轨迹回溯模型进行互相监督训练后得到的轨迹预测模型，在训练过程中对第一训练样本集进行了扩充，从而提高了训练后得到的目标轨迹预测模型的预测准确度，也提高了自动驾驶车辆的安全性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的一种轨迹预测方法的流程图。

图2是根据一示例性实施例示出的一种目标轨迹预测模型的训练方法的流程图。

图3是根据一示例性实施例示出的一种轨迹预测装置的框图。

图4是根据一示例性实施例示出的另一种轨迹预测装置的框图。

图5是根据一示例性实施例示出的一种电子设备的框图。

图6是根据一示例性实施例示出的一种车辆的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

需要说明的是，本公开中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下，并获得由相应装置所有者给予授权的情况下进行的。

在本公开的描述中，使用的术语如“第一”、“第二”等是用于区别类似的对象，而不必理解为特定的顺序或先后次序。另外，在未作相反说明的情况下，在参考附图的描述中，不同附图中的同一标记表示相同的要素。

在本公开的描述中，除非另有说明，“多个”是指两个或多于两个，其它量词与之类似；“以下至少一项（个）”或其类似表达，是指的这些项中的任意组合，包括单项（个）或复数项（个）的任意组合。例如，a，b，或c中的至少一项（个），可以表示：a，b，c，a-b，a-c，b-c，或a-b-c，其中a，b，c可以是单个，也可以是多个；“和/或”是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况，其中A，B可以是单数或者复数。

在本公开实施例中尽管在附图中以特定的顺序描述操作，但是不应将其理解为要求按照所示的特定顺序或是串行顺序来执行这些操作，或是要求执行全部所示的操作以得到期望的结果。在特定环境中，多任务和并行处理可能是有利的。

首先，对本公开的应用场景进行说明。本公开可以应用于自动驾驶场景。为了提高自动驾驶车辆的安全性，需要对车辆周边的障碍物进行检测，并对动态障碍物的移动轨迹进行预测，以便根据预测轨迹控制车辆行驶。在相关技术中，可以根据样本轨迹数据对神经网络模型进行训练，并通过训练后的模型进行轨迹预测。但是样本轨迹数据的获取和标注较为复杂，往往难以获取到足够多的样本对模型进行训练，会导致训练后的模型存在轨迹预测不准确的情况，影响自动驾驶车辆的安全性。

为了解决上述问题，本公开提供了一种轨迹预测方法、装置、介质、设备、芯片和车辆，根据第一训练样本集，基于待定轨迹预测模型和待定轨迹回溯模型进行互相监督训练，在训练过程中对第一训练样本集进行扩充，从而提高了训练后得到的目标轨迹预测模型的预测准确度，这样，将目标对象的目标历史移动轨迹输入目标轨迹预测模型，可以得到目标轨迹预测模型输出的目标对象在第一预设时间段内的目标预测轨迹。提高了轨迹预测的准确度，也提高了自动驾驶车辆的安全性。

下面结合具体实施例对本公开进行说明。

图1是根据一示例性实施例示出的一种轨迹预测方法，可以应用于电子设备，该电子设备可以包括终端设备，例如智能手机、智能可穿戴设备、智能音箱、智能平板、PDA（Personal Digital Assistant，个人数字助理）、CPE（Customer Premise Equipment，客户终端设备）、个人计算机等；该电子设备也可以包括服务器，例如本地服务器或云服务器；该电子设备也可以包括车载终端设备。如图1所示，该方法可以包括：

S101、获取目标对象的目标历史移动轨迹。

其中，该目标对象可以是目标车辆周边的任意障碍物，示例地，可以是通过目标车辆自身设置的摄像头检测得到的与该目标车辆在一定距离范围内的移动障碍物；也可以是通过目标车辆外部的摄像头检测得到的与该目标车辆在一定距离范围内的移动障碍物。该移动障碍物可以包括机动车、非机动车、行人、动物等，本公开对此不作限定。

在一些实施例中，该目标车辆外部的摄像头可以包括道路摄像头。该道路摄像头可以将拍摄的图像传输至该电子设备，该电子设备根据该图像检测得到上述目标对象。

在另一些实施例中，该目标车辆外部的摄像头也可以包括该目标车辆对应的目标无人机的摄像头。示例地，该目标车辆可以配置无人机，该无人机跟随该目标车辆行进，通过该无人机的摄像头拍摄得到更大距离的环境图像，该无人机可以通过无线通信网络将该环境图像传输至该电子设备，该电子设备根据该环境图像可以检测得到上述目标对象。

在本步骤中，可以将目标对象在预设时间范围内的移动轨迹作为该目标历史移动轨迹，该预设时间范围可以是当前时间之前的任意时间范围，例如，可以将当前时间之前的10秒内或30秒内的时间作为该预设时间范围。

S102、将目标历史移动轨迹输入目标轨迹预测模型，得到目标轨迹预测模型输出的目标对象在第一预设时间段内的目标预测轨迹。

其中，目标轨迹预测模型是将第一训练样本集中的样本预测轨迹作为待定轨迹回溯模型的输入，得到待定轨迹回溯模型输出的第一历史轨迹，第一训练样本集包括样本历史轨迹和样本预测轨迹；将第一历史轨迹作为样本预测轨迹对应的新的样本历史轨迹，添加至第一训练样本集，得到第二训练样本集，并根据第二训练样本集对待定轨迹预测模型进行训练得到的模型；

待定轨迹回溯模型是将第一训练样本集中的样本历史轨迹作为待定轨迹预测模型的输入，得到待定轨迹预测模型输出的第一预测轨迹，将第一预测轨迹作为样本历史轨迹对应的新的样本预测轨迹，添加至第一训练样本集，得到第三训练样本集，并根据第三训练样本集进行训练得到的模型。

需要说明的是，上述待定轨迹预测模型可以用于根据输入的历史轨迹进行预测，得到该历史轨迹对应的第一预设时间段内的预测轨迹，该第一预设时间段可以包括该历史轨迹对应的结束时间之后的一段时间（例如5秒或10秒）；上述待定轨迹回溯模型，可以用于根据输入的预测轨迹进行回溯，得到该预测轨迹对应的第二预设时间段内历史轨迹，该第二预设时间段可以包括该预测轨迹对应的起始时间之前的一段时间（例如5秒或10秒）。

采用上述方法，获取目标对象的目标历史移动轨迹，将目标历史移动轨迹输入目标轨迹预测模型，得到目标轨迹预测模型输出的目标对象在第一预设时间段内的目标预测轨迹，其中，该目标轨迹预测模型为根据第一训练样本集，基于待定轨迹预测模型和待定轨迹回溯模型进行互相监督训练后得到的轨迹预测模型，在训练过程中对第一训练样本集进行了扩充，从而提高了训练后得到的目标轨迹预测模型的预测准确度，也提高了自动驾驶车辆的安全性。

图2是根据一示例性实施例示出的一种目标轨迹预测模型的训练方法的流程图，如图2所示，该训练方法可以包括：

S201、获取多个第一训练样本集。

其中，该第一训练样本集可以包括样本历史轨迹和样本预测轨迹。示例地，该第一训练样本集可以包括多个第一训练样本，每个第一训练样本均包括相互对应的样本历史轨迹和样本预测轨迹。例如可以获取多个移动对象在一段时间内的实际移动轨迹，将该实际移动轨迹作为一个训练样本，将该实际移动轨迹从某个特定时刻进行划分，将该特定时刻之前的轨迹作为样本历史轨迹，将该特定时刻之后的轨迹作为样本预测轨迹，将样本历史轨迹和样本预测轨迹的组合作为一个第一训练样本。

S202、确定待定轨迹预测模型和待定轨迹回溯模型。

其中，待定轨迹预测模型和待定轨迹回溯模型可以是预先设置的神经网络模型。

在一些实施例中，该待定轨迹预测模型可以是预先训练的模型，示例地，可以根据第一训练样本集，对预设轨迹预测模型进行预训练，得到待定轨迹预测模型。

其中，该预设轨迹预测模型可以是神经网络模型。示例地，该预设轨迹预测模型可以包括ActorNet、MapNet和PredNet。

其中，ActorNet、MapNet和PredNet均可以为卷积神经网络。ActorNet可以为轨迹特征提取网络，可以用于获取历史轨迹的轨迹特征，例如，ActorNet可根据输入的历史轨迹输出轨迹特征；MapNet可以为地图特征提取网络，可以用于获取上述历史轨迹对应的高精地图的地图特征，例如，ActorNet可根据输入的历史轨迹对应的高精地图输出地图特征；该地图特征可以包括道路特征、车道特征和环境特征中的一项或多项；上述轨迹特征和地图特征可以输入PredNet，该PredNet可以为预测网络，可以根据轨迹特征和地图特征进行预测得到该历史轨迹对应的预测轨迹。

在另一些实施例中，该待定轨迹回溯模型可以是预先训练的模型，示例地，可以根据第一训练样本集，对预设轨迹回溯模型进行预训练，得到待定轨迹回溯模型。

其中，该预设轨迹回溯模型可以是神经网络模型。示例地，该预设轨迹回溯模型可以包括ActorNet、MapNet和PredNet。

需要说明的是，上述预设轨迹预测模型和预设轨迹回溯模型的模型结构可以相同，也可以不同。

S203、循环执行模型训练步骤，直至确定训练后的待定轨迹预测模型满足目标停止迭代条件，根据训练后的待定轨迹预测模型获取目标轨迹预测模型。

在一些实施例中，上述模型训练步骤可以包括以下步骤：

S11、将样本预测轨迹输入待定轨迹回溯模型，得到第一历史轨迹。

其中，该第一历史轨迹可以为一个或多个。示例地，可以根据一个样本预测轨迹，得到N个第一历史轨迹，N为大于或等于1的任意正整数，例如N可以为3或5。

在一些实施例中，将样本预测轨迹输入待定轨迹回溯模型后，该待定轨迹回溯模型可以输出W个待定历史轨迹以及每个待定历史轨迹的第一置信度，可以根据该第一置信度从大到小对待定历史轨迹进行排序，将排序靠前的N个待定历史轨迹作为第一历史轨迹。其中，N为大于或等于1的任意正整数，W为大于或等于N的任意正整数。

S12、将第一历史轨迹作为样本预测轨迹对应的新的样本历史轨迹，添加至第一训练样本集，得到第二训练样本集。

S13、根据第二训练样本集对待定轨迹预测模型进行训练，将训练后的待定轨迹预测模型作为新的待定轨迹预测模型。

这样，通过待定轨迹回溯模型可以对每个样本预测轨迹对应的样本历史轨迹进行扩充，从而可以节省人工获取样本数据并进行标注的成本，既提高了训练后的模型预测准确性，又提高了样本数据获取的效率。

在另一些实施例中，上述模型训练步骤可以包括以下步骤：

S21、将样本历史轨迹输入待定轨迹预测模型，得到第一预测轨迹。

其中，该第一预测轨迹可以为一个或多个。示例地，可以根据一个样本历史轨迹，得到M个第一预测轨迹，M为大于或等于1的任意正整数，例如M可以为3或5。需要说明的是，M和N可以相等，也可以不相等。

在一些实施例中，将样本历史轨迹输入待定轨迹预测模型后，该待定轨迹预测模型可以输出V个待定预测轨迹以及每个待定预测轨迹的第二置信度，可以根据该第二置信度从大到小对待定预测轨迹进行排序，将排序靠前的M个待定预测轨迹作为第一预测轨迹。其中，M为大于或等于1的任意正整数，V为大于或等于M的任意正整数。

S22、将第一预测轨迹作为样本历史轨迹对应的新的样本预测轨迹，添加至第一训练样本集，得到第三训练样本集。

S23、根据第三训练样本集对待定轨迹回溯模型进行训练，将训练后的待定轨迹回溯模型作为新的待定轨迹回溯模型。

S24、将样本预测轨迹输入待定轨迹回溯模型，得到第一历史轨迹。

同样地，其中，该第一历史轨迹可以为一个或多个。示例地，可以根据一个样本预测轨迹，得到N个第一历史轨迹，N为大于或等于1的任意正整数，例如N可以为3或5。

S25、将第一历史轨迹作为样本预测轨迹对应的新的样本历史轨迹，添加至第一训练样本集，得到第二训练样本集。

S26、根据第二训练样本集对待定轨迹预测模型进行训练，将训练后的待定轨迹预测模型作为新的待定轨迹预测模型。

在一些实施例中，上述S23步骤可以通过以下方式对待定轨迹回溯模型进行训练：

首先，将第一预测轨迹输入待定轨迹回溯模型，得到第一预测轨迹对应的一个或多个第二历史轨迹。

其次，通过第一损失函数计算得到第二历史轨迹与样本历史轨迹的第一损失值。

其中，该样本历史轨迹可以是生成该第一预测轨迹的样本历史轨迹，第一损失值用于表征第二历史轨迹与样本历史轨迹的差异程度。

在一些实施例中，该第一损失函数可以包括分类损失函数，示例地，该第一损失函数可以包括以下公式（1）：

（1）

其中，

表示第一损失值，N表示第二历史轨迹的数目，

表示第一预测轨迹对应的样本历史轨迹，

表示根据第一预测轨迹生成的第i个第二历史轨迹。

在另一些实施例中，该第一损失函数可以包括Exponential L2 Loss函数，示例地，该第一损失函数可以包括以下公式（2）：

（2）

其中，

表示第一损失值，N表示第二历史轨迹的数目，

表示第一预测轨迹对应的样本历史轨迹，

表示根据第一预测轨迹生成的第i个第二历史轨迹，e表示数学常数，

表示预设超参数。

需要说明的是，该第一损失函数也可以使用相关技术中常用的损失函数，本公开对此不作限定。

最后，根据第一损失值更新待定轨迹回溯模型的参数，得到训练后的待定轨迹回溯模型，并将训练后的待定轨迹回溯模型作为新的待定轨迹回溯模型。

需要说明的是，若该第一损失值已经满足第一停止迭代条件，则在后续的循环执行中可以不再执行上述步骤S21至S23。

示例地，在循环执行上述模型训练步骤的过程中，若在第A次执行上述模型训练步骤时，该第一损失值满足第一停止迭代条件，则从第A+1次执行上述模型训练步骤开始，不再执行上述S21至S23的步骤。这样，在第一损失值满足第一停止迭代条件时，说明待定轨迹回溯模型已经训练完成，继续训练已经不能再得到更好的性能，因此，在后续的循环过程中，可以不再对待定轨迹回溯模型进行训练，而只对待定轨迹预测模型进行训练。

其中，该第一停止迭代条件可以包括以下一项或多项：

第一损失值小于或等于第一预设损失目标值；

第一损失值连续X轮不收敛，其中，X为大于或等于2的任意正整数。损失值不收敛的判断方式可以有多种，例如，连续X轮得到的第一损失值均在增大，且与第一预设损失目标值的差值越来越大，其中，X为大于或等于2的任意正整数。再例如，连续X轮得到的第一损失值均未降低。再例如，连续X轮迭代得到的第一损失值的最大值和最小值的差值小于或等于第一预设差值目标。

在一些实施例中，上述S26步骤可以通过以下方式对待定轨迹预测模型进行训练：

首先，将第一历史轨迹输入待定轨迹预测模型，得到第一历史轨迹对应的一个或多个第二预测轨迹。

其次，通过第二损失函数计算得到第二预测轨迹与样本预测轨迹的第二损失值。

其中，该样本预测轨迹可以是生成该第一历史轨迹的样本预测轨迹；第二损失值用于表征第二预测轨迹与样本预测轨迹的差异程度。

需要说明的是，该第二损失函数也可以使用相关技术中常用的损失函数，该第二损失函数可以与第一损失函数相同，也可以不同，本公开对此不作限定。

最后，在根据第二损失值确定待定轨迹预测模型不满足目标停止迭代条件的情况下，根据第二损失值更新待定轨迹预测模型的参数，得到训练后的待定轨迹预测模型，并将训练后的待定轨迹预测模型作为新的待定轨迹预测模型。

其中，该目标停止迭代条件可以包括以下一项或多项：

第二损失值小于或等于第二预设损失目标值；

第二损失值连续Y轮不收敛，其中，Y为大于或等于2的任意正整数。损失值不收敛的判断方式可以有多种，例如，连续Y轮得到的第一损失值均在增大，且与第一预设损失目标值的差值越来越大，其中，Y为大于或等于2的任意正整数。再例如，连续Y轮得到的第一损失值均未降低。再例如，连续Y轮迭代得到的第一损失值的最大值和最小值的差值小于或等于第一预设差值目标。

这样，通过上述方式，基于待定轨迹预测模型和待定轨迹回溯模型进行互相监督训练，在训练过程中对第一训练样本集进行了扩充，提高了样本分布的多样性，从而提高了训练后得到的目标轨迹预测模型的预测准确度。

图3是根据一示例性实施例示出的一种轨迹预测装置300的框图，如图3所示，该装置300可以包括：

轨迹获取模块301，被配置为获取目标对象的目标历史移动轨迹；

轨迹预测模块302，被配置为将所述目标历史移动轨迹输入目标轨迹预测模型，得到所述目标轨迹预测模型输出的所述目标对象在第一预设时间段内的目标预测轨迹；

图4是根据一示例性实施例示出的另一种轨迹预测装置300的框图，如图4所示，该装置300还可以包括模型训练模块303，所述模型训练模块303，被配置为通过以下方式训练得到的：

获取多个所述第一训练样本集；

确定所述待定轨迹预测模型和所述待定轨迹回溯模型；

其中，所述模型训练步骤包括：

在一些实施例中，所述模型训练模块303，还被配置为将所述样本历史轨迹输入所述待定轨迹预测模型，得到第一预测轨迹；将所述第一预测轨迹作为所述样本历史轨迹对应的新的样本预测轨迹，添加至所述第一训练样本集，得到第三训练样本集；根据所述第三训练样本集对所述待定轨迹回溯模型进行训练，将训练后的待定轨迹回溯模型作为新的待定轨迹回溯模型。

在一些实施例中，所述模型训练模块303，被配置为将所述第一预测轨迹输入所述待定轨迹回溯模型，得到所述第一预测轨迹对应的一个或多个第二历史轨迹；通过第一损失函数计算得到所述第二历史轨迹与所述样本历史轨迹的第一损失值；其中，该第一损失值用于表征所述第二历史轨迹与所述样本历史轨迹的差异程度；根据所述第一损失值更新所述待定轨迹回溯模型的参数，得到训练后的待定轨迹回溯模型，并将训练后的待定轨迹回溯模型作为新的待定轨迹回溯模型。

在一些实施例中，所述模型训练模块303，被配置为将所述第一历史轨迹输入所述待定轨迹预测模型，得到所述第一历史轨迹对应的一个或多个第二预测轨迹；通过第二损失函数计算得到所述第二预测轨迹与所述样本预测轨迹的第二损失值；其中，该第二损失值用于表征所述第二预测轨迹与所述样本预测轨迹的差异程度；在根据所述第二损失值确定所述待定轨迹预测模型不满足所述目标停止迭代条件的情况下，根据所述第二损失值更新所述待定轨迹预测模型的参数，得到训练后的待定轨迹预测模型，并将训练后的待定轨迹预测模型作为新的待定轨迹预测模型。

在一些实施例中，所述模型训练模块303，被配置为根据所述第一训练样本集，对预设轨迹预测模型进行预训练，得到待定轨迹预测模型；根据所述第一训练样本集，对预设轨迹回溯模型进行预训练，得到待定轨迹回溯模型。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图5是根据一示例性实施例示出的电子设备2000的框图。该电子设备2000可以是终端设备，例如移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理，路由器等；该电子设备2000也可以是服务器，例如本地服务器或云服务器；该电子设备2000也可以是车载终端设备。

参照图5，该电子设备2000可以包括以下一个或多个组件：处理组件2002，存储器2004，电力组件2006，多媒体组件2008，音频组件2010，输入/输出（I/O）接口2012，传感器组件2014，以及通信组件2016。

处理组件2002可以用于控制该电子设备2000的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件2002可以包括一个或多个处理器2020来执行指令，以完成上述轨迹预测方法的全部或部分步骤。此外，处理组件2002可以包括一个或多个模块，便于处理组件2002和其他组件之间的交互。例如，处理组件2002可以包括多媒体模块，以方便多媒体组件2008和处理组件2002之间的交互。

存储器2004被配置为存储各种类型的数据以支持在电子设备2000的操作。这些数据的示例包括用于在电子设备2000上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器2004可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器（SRAM），电可擦除可编程只读存储器（EEPROM），可擦除可编程只读存储器（EPROM），可编程只读存储器（PROM），只读存储器（ROM），磁存储器，快闪存储器，磁盘或光盘。

电力组件2006为电子设备2000的各种组件提供电力。电力组件2006可以包括电源管理***，一个或多个电源，及其他与为电子设备2000生成、管理和分配电力相关联的组件。

多媒体组件2008包括在所述电子设备2000和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器（LCD）和触摸面板（TP）。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件2008包括一个前置摄像头和/或后置摄像头。当电子设备2000处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。

音频组件2010被配置为输出和/或输入音频信号。例如，音频组件2010包括一个麦克风（MIC），当电子设备2000处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器2004或经由通信组件2016发送。在一些实施例中，音频组件2010还包括一个扬声器，用于输出音频信号。

输入/输出接口2012为处理组件2002和***接口模块之间提供接口，上述***接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件2014包括一个或多个传感器，用于为电子设备2000提供各个方面的状态评估。例如，传感器组件2014可以检测到电子设备2000的打开/关闭状态，组件的相对定位，例如所述组件为电子设备2000的显示器和小键盘，传感器组件2014还可以检测电子设备2000或电子设备2000一个组件的位置改变，用户与电子设备2000接触的存在或不存在，电子设备2000方位或加速/减速和电子设备2000的温度变化。传感器组件2014可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件2014还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件2014还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件2016被配置为便于电子设备2000和其他设备之间有线或无线方式的通信。电子设备2000可以接入基于通信标准的无线网络，例如Wi-Fi，2G、3G、4G、5G、6G、NB-IOT、eMTC等，或它们的组合。在一个示例性实施例中，通信组件2016经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件2016还包括近场通信（NFC）模块，以促进短程通信。例如，在NFC模块可基于射频识别（RFID）技术，红外数据协会（IrDA）技术，超宽带（UWB）技术，蓝牙（BT）技术和其他技术来实现。

在示例性实施例中，电子设备2000可以被一个或多个应用专用集成电路（ASIC）、数字信号处理器（DSP）、数字信号处理设备（DSPD）、可编程逻辑器件（PLD）、现场可编程门阵列（FPGA）、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述轨迹预测方法。

上述电子设备2000可以是独立的电子设备，也可以是独立电子设备的一部分，例如在一种实施例中，该电子设备可以是集成电路（Integrated Circuit，IC）或芯片，其中该集成电路可以是一个IC，也可以是多个IC的集合；该芯片可以包括但不限于以下种类：GPU（Graphics Processing Unit，图形处理器）、CPU（Central Processing Unit，中央处理器）、FPGA（Field Programmable Gate Array，可编程逻辑阵列）、DSP（Digital SignalProcessor，数字信号处理器）、ASIC（Application Specific Integrated Circuit，专用集成电路）、SOC（System on Chip，SoC，片上***或***级芯片）等。上述的集成电路或芯片中可以用于执行可执行指令（或代码），以实现上述轨迹预测方法。其中该可执行指令可以存储在该集成电路或芯片中，也可以从其他的装置或设备获取，例如该集成电路或芯片中包括处理器、存储器，以及用于与其他的装置通信的接口。该可执行指令可以存储于该处理器中，当该可执行指令被处理器执行时实现上述轨迹预测方法；或者，该集成电路或芯片可以通过该接口接收可执行指令并传输给该处理器执行，以实现上述轨迹预测方法。

在示例性实施例中，本公开还提供了一种计算机可读存储介质，其上存储有计算机程序指令，该程序指令被处理器执行时实现本公开提供的轨迹预测方法的步骤。示例地，该计算机可读存储介质可以是一种包括指令的非临时性计算机可读存储介质，例如，可以是包括指令的上述存储器2004，上述指令可由电子设备2000的处理器2020执行以完成上述轨迹预测方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器（RAM）、CD-ROM、磁带、软盘和光数据存储设备等。

在另一示例性实施例中，还提供一种计算机程序产品，该计算机程序产品包含能够由可编程的装置执行的计算机程序，该计算机程序具有当由该可编程的装置执行时用于执行上述轨迹预测方法的代码部分。

图6是根据一示例性实施例示出的车辆的框图，如图6所示，该车辆可以包括上述电子设备2000。需要说明的是，该车辆可以为各种类型的行驶工具，例如，轿车、卡车、摩托车、公共汽车、船、飞机、直升飞机、娱乐车、火车等等，本公开实施例不做特别的限定。

本领域技术人员在考虑说明书及实践本公开后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种轨迹预测方法，其特征在于，所述方法包括：

获取目标对象的目标历史移动轨迹；

所述待定轨迹回溯模型是将所述第一训练样本集中的所述样本历史轨迹作为所述待定轨迹预测模型的输入，得到所述待定轨迹预测模型输出的第一预测轨迹，将所述第一预测轨迹作为所述样本历史轨迹对应的新的样本预测轨迹，添加至所述第一训练样本集，得到第三训练样本集，并根据所述第三训练样本集进行训练得到的模型；

所述目标轨迹预测模型是通过以下方式训练得到的：

获取多个所述第一训练样本集；

确定所述待定轨迹预测模型和所述待定轨迹回溯模型；

其中，所述模型训练步骤包括：

2.根据权利要求1所述的方法，其特征在于，在所述将所述样本预测轨迹输入所述待定轨迹回溯模型，得到第一历史轨迹之前，所述模型训练步骤还包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述第三训练样本集对所述待定轨迹回溯模型进行训练，将训练后的待定轨迹回溯模型作为新的待定轨迹回溯模型包括：

4.根据权利要求1所述的方法，其特征在于，所述根据所述第二训练样本集对所述待定轨迹预测模型进行训练，将训练后的待定轨迹预测模型作为新的待定轨迹预测模型包括：

5.根据权利要求1所述的方法，其特征在于，所述确定所述待定轨迹预测模型和所述待定轨迹回溯模型包括：

6.一种轨迹预测装置，其特征在于，所述装置包括：

其中，所述目标轨迹预测模型是将第一训练样本集中的样本预测轨迹作为待定轨迹回溯模型的输入，得到所述待定轨迹回溯模型输出的第一历史轨迹，所述第一训练样本集包括样本历史轨迹和所述样本预测轨迹；将所述第一历史轨迹作为所述样本预测轨迹对应的新的样本历史轨迹，添加至所述第一训练样本集，得到第二训练样本集，并根据所述第二训练样本集对待定轨迹预测模型进行训练得到的模型；所述待定轨迹回溯模型是将所述第一训练样本集中的所述样本历史轨迹作为所述待定轨迹预测模型的输入，得到所述待定轨迹预测模型输出的第一预测轨迹，将所述第一预测轨迹作为所述样本历史轨迹对应的新的样本预测轨迹，添加至所述第一训练样本集，得到第三训练样本集，并根据所述第三训练样本集进行训练得到的模型；

所述装置还包括模型训练模块，所述模型训练模块，被配置为通过以下方式训练得到目标轨迹预测模型：

获取多个所述第一训练样本集；

确定所述待定轨迹预测模型和所述待定轨迹回溯模型；

其中，所述模型训练步骤包括：

7.一种电子设备，其特征在于，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：执行权利要求1至5中任一项所述方法的步骤。

8.一种计算机可读存储介质，其上存储有计算机程序指令，其特征在于，所述计算机程序指令被处理器执行时实现权利要求1至5中任一项所述方法的步骤。

9.一种芯片，其特征在于，包括处理器和接口；所述处理器用于读取指令以执行权利要求1至5中任一项所述方法的步骤。

10.一种车辆，其特征在于，所述车辆包括权利要求7所述的电子设备。