CN112541449A

CN112541449A - 一种基于无人机航拍视角的行人轨迹预测方法

Info

Publication number: CN112541449A
Application number: CN202011505987.4A
Authority: CN
Inventors: 刘昱; 王天保
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2020-12-18
Filing date: 2020-12-18
Publication date: 2021-03-23

Abstract

本发明公开了一种基于无人机航拍视角的行人轨迹预测方法，步骤1：行人轨迹预处理通过目标检测算法获得行人位置，并通过目标跟踪算法快速得到一段时间之内的行人位置序列；步骤2：轨迹编码将一段时长的轨迹序列使用长短期记忆网络进行编码，获得轨迹运动特征；步骤3：图卷积网络交互构建将每个行人坐标作为图卷积网络的顶点，使用图卷积网络构建行人间的交互关系，得到轨迹交互特征；步骤4：最大互信息优化；步骤5：使用长短期记忆网络对轨迹运动特征和轨迹交互特征进行解码，得到一定时长的预测序列，完成轨迹预测。与现有技术相比，本发明实现了通过构建行人间的交互模式并进行轨迹预测的技术效果，具有良好的鲁棒性。

Description

一种基于无人机航拍视角的行人轨迹预测方法

技术领域

本发明涉及智能机器人及无人驾驶平台领域，特别涉及一种基于无人机航拍视角的行人轨迹预测方法。

背景技术

在城市街道等密集行人场景中，自动驾驶车辆、机器人等运动主体需要根据其他行人的位置规划自身路径，通过对目标的位置预测得以保持安全距离并排除风险因素，行人未来位置预测的准确性对于运动主体的决策***至关重要。行人轨迹预测是一项复杂任务，由于每个行人自身的运动习惯有着天然差异，并且群体环境中存在人与人的交互，个人的运动模式会受到周围行人隐含的影响，人们会遵循社会规则方面的常识来调整自己的路线，运动主体需要预测他人的动作和社会行为。构建具有较高可解释性和泛化能力的行人交互模式是轨迹预测问题的重点。

路面视角的密集行人场景存在大量遮挡等问题，并且普通单目相机对距离的判断能力十分有限，而无人机可以灵活得获取行人的水平位置信息，因此使用无人机航拍视角可以高效地获得行人位置并进行轨迹预测工作。

现有的计算机视觉方法中，图神经网络将深度学习应用在非欧几里得结构上，构建顶点和边表示对象间的关系，展现出良好的鲁棒性和可解释性，通过图拓扑结构建模行人之间的交互模式是一种有效的方式。

发明内容

考虑到图卷积网络在建立交互模型中所具有的优势及存在问题，本发明提出了一种基于无人机航拍视角的行人轨迹预测方法，实现了新的基于无人机航拍视角的图卷积神经网络轨迹预测模型，从而构建行人间的交互模式并进行轨迹预测。

1.本发明的一种基于无人机航拍视角的行人轨迹预测方法，其特征在于，该方法具体包括如下步骤：

步骤1：进行无人机航拍的行人视频中的行人轨迹预处理，包括快速对行人进行定位，即取目标框的中心位置为行人的位置，设全部观测行人的轨迹坐标X＝X₁,X₂,…,X_n；

步骤2：进行行人轨迹编码：将前帧、后帧之间单个行人轨迹的相对位置变化表示为：

使用长短期记忆网络编码为固定长度的运动向量

随后使用长短期记忆网络进行编码以获取轨迹运动特征

步骤3：构建图卷积网络交互：使用图结构G^t＝(V^t,E^t)建立t时刻行人间的交互模型，将行人作为图结构中顶点的集合V^t，行人间的交互关系为边的集合E^t，将每一个时间点中顶点V^t的连接关系E^t表示为邻接矩阵A^t，将邻接矩阵A^t中的边

根据距离不同分配的权重

表示为：

轨迹运动特征

作为图卷积网络中顶点的输入特征

将两层图卷积网络相叠加，通过两层GCN结构得到第i条轨迹的输出特征

对图卷积网络输出特征

进行长短期记忆网络编码，从而得到轨迹交互特征

步骤4：使用最大互信息方法实现最大化轨迹交互特征的局部特征与全局特征间的互信息，具体过程为：首先制作图卷积网络输入的负样本

通过图卷积网络获得输出

同时提取全局特征

然后训练判断器D，使得判断器能将负样本的输出

判错并将正样本的输出Z判对，从而训练判别器的损失函数L_inf，L_inf表示为：

通过以上训练过程，优化图卷积网络的提取结果；

步骤5：进行轨迹预测：使用长短期记忆网络对轨迹运动特征

和轨迹交互特征

进行解码，输出一帧二维行人轨迹预测，判断总输出长度是否达到预测序列长度？如否则将新的输出帧加入到输入序列中，第一帧输入被丢弃，如是则输出预测序列，由此得到一定时长的预测序列，完成轨迹预测。

与现有技术相比，本发明实现了通过构建行人间的交互模式并进行轨迹预测的技术效果，预测结果具有良好的鲁棒性。

附图说明

图1是本发明的一种基于无人机航拍视角的行人轨迹预测方法整体流程图；

图2是本发明的一种基于无人机航拍视角的行人轨迹预测方法的实施例模型框架结构示意图；

图3是轨迹预测实景示意图，图中实线为观察到的历史轨迹，深色虚线为真实未来轨迹，浅色虚线为预测未来轨迹，图(a)右侧两名行人自右向左走，左侧一名行人从左向右走；图(b)三名行人从右向左走。从图中可观察到与浅色虚线基本重合，说明本专利预测效果较好

具体实施方式

以下结合附图对本发明的技术方案进行详细说明。

本发明的整体思路是采用基于无人机航拍所获得的俯视行人视频，实现对行人轨迹进行预测。

如图1所示，为该方法主要包括以下步骤：

步骤1：进行无人机航拍的行人视频中的行人轨迹预处理：无人机航拍的行人视频包含若干俯视视角的行人，使用已有的目标检测和目标跟踪方法快速对行人进行定位，即：取目标框的中心位置为行人的位置，设全部观测行人的轨迹坐标X＝X₁,X₂,…,X_n提取行人二维位置序列，设置输入序列和预测序列长度；

使用长短期记忆网络编码为固定长度的运动向量

随后使用长短期记忆网络进行编码对运动向量以获取轨迹运动特征

步骤3：构建图卷积网络交互模型：使用图结构G^t＝(V^t,E^t)建立t时刻行人间的交互模型，将行人作为图结构中顶点的集合V^t，行人间的交互关系为边的集合E^t，将每一个时间点中顶点V^t的连接关系E^t表示为邻接矩阵A^t，将邻接矩阵A^t中的边

根据距离不同分配的权重

表示为：

轨迹运动特征

作为图卷积网络中顶点的输入特征

对图卷积网络输出特征

进行长短期记忆网络编码，从而得到轨迹交互特征

步骤4：为使图卷积网络能够构建良好的行人轨迹交互关系，使用最大互信息方法实现最大化轨迹交互特征的局部特征与全局特征间的互信息，即实现最大互信息优化，具体过程为：首先制作图卷积网络输入的负样本

通过图卷积网络获得输出

同时提取全局特征

然后训练判断器D，使得判断器能将负样本的输出

通过以上训练过程，优化图卷积网络的提取结果；

步骤5：进行轨迹预测：使用长短期记忆网络对轨迹运动特征

和轨迹交互特征

Claims

1.一种基于无人机航拍视角的行人轨迹预测方法，其特征在于，该方法具体包括如下步骤：

使用长短期记忆网络编码为固定长度的运动向量

随后使用长短期记忆网络进行编码以获取轨迹运动特征

根据距离不同分配的权重

表示为：

轨迹运动特征

作为图卷积网络中顶点的输入特征V_i ^t，将两层图卷积网络相叠加，通过两层GCN结构得到第i条轨迹的输出特征

对图卷积网络输出特征

进行长短期记忆网络编码，从而得到轨迹交互特征

通过图卷积网络获得输出

同时提取全局特征

然后训练判断器D，使得判断器能将负样本的输出

通过以上训练过程，优化图卷积网络的提取结果；

步骤5：进行轨迹预测：使用长短期记忆网络对轨迹运动特征

和轨迹交互特征