CN112464886A

CN112464886A - 一种飞行器识别追踪方法

Info

Publication number: CN112464886A
Application number: CN202011465723.0A
Authority: CN
Inventors: 钱久超; 薛建伟; 潘敏婷; 朱肖光; 刘佩林
Original assignee: Shanghai Jiaotong University
Current assignee: Shanghai Jiaotong University
Priority date: 2020-12-14
Filing date: 2020-12-14
Publication date: 2021-03-09

Abstract

本发明公开了一种飞行器识别追踪方法包括：利用YOLOv3对包含飞行器的视频数据检测识别，如果判断为飞行器，则记录所述飞行器的边界框信息和中心点信息；构建所述飞行器的飞行状态向量，所述飞行状态向量包括所述中心点信息和所述边界框信息；将所述飞行状态向量通过卡尔曼滤波器对所述飞行器的运动轨迹进行预测；对所述飞行器的所述运动轨迹预测进行校正。本发明通过特定的图像帧的检测的位置信息与卡尔曼滤波器预测得到的信息进行对比，以在数据帧中确立出一个特定的范围，提高追踪的速度。此外，当预测与检测的关键中发现边框信息差别比较大，可以及时进行调整，是一种带有反馈机制的作用于飞行器的识别和跟踪的方法。

Description

一种飞行器识别追踪方法

技术领域

本发明涉及计算机视觉处理领域，具体涉及视频数据中的物体识别以及追踪方法。

背景技术

飞行器的跟踪识别是国家航空安全领域一项十分重要的技术，特别的，对于一些战斗机的识别跟踪具有十分重要的意义，因此在军事领域中通过一些科技手段来加强我国领空的安全也愈加受到国家的重视。目标跟踪作为计算机视觉领域中非常重要的一个部分，可以实现对获取的视频影像中的飞行器进行识别以及追踪的技术。

近年来，随着深度学习技术及计算机能力的发展，各种基于深度学习的应用层出不穷，特别的各种深度学习的算法广泛应用于计算机视觉领域中，基于深度学习的目标检测识别以及跟踪技术得到了迅速的发展。与传统的方法相比，基于深度学习的识别追踪方法在准确度得到了很大的提高，其追踪性能得到了巨大的提升。目前主流的物体检测策略，分为区域建议与区域分布俩大类。但是由于飞行器跟踪的准确性主要受到复杂环境的影响，以及其速度快，帧图像中与帧图像中的差距比较大，其视觉跟踪算法仍然存在一些挑战性的问题，如突发性运动、姿态变化、物体遮挡、背景杂波、光照或者视点变化等问题都会导致跟踪的性能下降，甚至追踪失败，这些都是影响飞行器追踪效果的外在因素。因此，如何更加可靠，更加准确的对飞行器进行识别追踪是目前有待解决的问题。

发明内容

本发明要解决的技术问题是如何更加可靠，更加准确的对飞行器进行识别追踪，提供一种飞行器识别追踪方法。

本发明是通过下述技术方案来解决上述技术问题：

一种飞行器识别追踪方法，所述方法包括：

利用YOLOv3对包含飞行器的视频数据检测识别，如果判断为飞行器，则记录所述飞行器的边界框信息和中心点信息；

构建所述飞行器的飞行状态向量，所述飞行状态向量包括所述中心点信息和所述边界框信息；

将所述飞行状态向量通过卡尔曼滤波器对所述飞行器的运动轨迹进行预测：

当所述飞行器相邻图像间中心点轨迹为直线时，飞行器中心点位置向量采用线性模型，根据下一时刻的预测结果与当前时刻的检测结果进行卡尔曼增益计算，并对上一时刻的预测结果和所述当前时刻的检测结果做计算，确定出当前时刻的所述运动轨迹预测的不确定性；

当所述飞行器相邻图像间中心点轨迹为非线性轨迹时，采用扩展卡尔曼滤波器进行预测，飞行器中心点位置向量采用非线性模型，之后确定出当前时刻的所述运动轨迹预测的不确定性；

将所述线性模型预测部分和非线性模型预测部分结合，对所述飞行器的运动轨迹进行预测；

对所述飞行器的所述运动轨迹预测进行校正；

判断所述边界框能否检测出所述飞行器，当所述预测结果和所述检测结果偏差较大时，根据目标对象的大小限制有效范围提高检测速度，如果所述飞行器的预测边界框与检测边界框的重叠度值大于预先定义的阈值，则根据前一帧的预测边界框去修改当前检测边界框的位置与大小，否则便将此飞行器为中心，重新确定边界框并输入检测网络进行训练。

较佳地，所述视频数据统一处理成固定长度的视频，并组成数据集对所述检测网络进行训练，所述数据集包括：用于训练的训练集和用于验证的验证集。

进一步地，当所述飞行器中心点位置向量采用线性模型近似时，状态转移矩阵和观测矩阵为常数；当所述飞行器中心点位置向量采用非线性模型近似时，所述状态转移矩阵和所述观测矩阵分别为：

其中，F_k为状态变化矩阵，其中H_k为观测矩阵。其中

为输入参数的观测值，下角标k表示为第k个时刻，其中u_k为控制向量。

进一步地，所述校正包括一种边框校正公式：

其中δ_b,δ_a分别表示相邻图像之间检测结果的置信度，其值越高，说明模型的精确度越高，其中w_a，w_b，w_c分别表示相邻图像及校正后的边界框的宽度，h_a,h_b,h_c分别表示相邻图像及校正后的边界框的高度，其中(x_a,y_a),(x_b,y_b),(x_c,y_c)分别表示相邻图像及校正后的边界框的水平和竖直高度。

在符合本领域常识的基础上，上述各优选条件，可任意组合，即得本发明各较佳实例。

本发明的积极进步效果在于：通过特定的图像帧的检测的位置信息与卡尔曼滤波器预测得到的信息进行对比，以在数据帧中确立出一个特定的范围，提高追踪的速度。此外，当预测与检测的关键中发现边框信息差别比较大，可以及时进行调整，是一种带有反馈机制的作用于飞行器的识别和跟踪的方法。

附图说明

图1为本发明一种飞行器识别追踪方法一实施例中的方法流程图；

图2为本发明一种飞行器识别追踪方法一实施例中的边框校正方法示意图。

具体实施方式

为了便于理解本申请，下面将参照相关附图对本申请进行更全面的描述。附图中给出了本申请的首选实施例。但是，本申请可以以许多不同的形式来实现，并不限于本文所描述的实施例。相反地，提供这些实施例的目的是使对本申请的公开内容更加透彻全面。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。

如图1所示为本发明一种飞行器识别追踪的方法流程图：

S01：利用YOLOv3对包含飞行器的视频数据检测识别，如果判断为飞行器，则记录所述飞行器的边界框信息和中心点信息；

在一个示例中，首先，YOLOV3将输入图片压缩到416×416，通过特征提取网络对输入图像提取特征得到大小一定的特征图，比如13×13，然后将输入图像分成13×13个网格，接着如果GT(Ground True，真实值)中某个目标的中心坐标落在哪个网格中，那么就由该网格来预测该目标。每个网格都会预测3个边界框。之后根据边框的值进行确定所检测到的物体的种类，其中边框包含四个值v＝(v_x,v_y,v_w,v_h),用于后续的计算，其中v_x,v_y表示物体中心点x和y的坐标，v_w,v_h示边界框的宽度和高度；

将ROI(Region Of Interesting，感兴趣区域)划分为左上、左下、右上、右下四个子区域，这些子区域作为分数图，则边框的顶点可以分别由以下的表示方法。

其中B_tl表示左上角的顶点，B_tr表示右上角的顶点，B_bl表示左下角的顶点，B_br表示右下角的顶点。

S02：构建所述飞行器的飞行状态向量，所述飞行状态向量包括所述中心点信息和所述边界框信息；

在一个示例中，构建飞机的飞行状态向量

用于描述飞机的运动状态，其中，

用于描述目标中心点的位置，

用于描述飞机的边框的比例和横纵的比例。

S03：将所述飞行状态向量通过卡尔曼滤波器对所述飞行器的运动轨迹进行预测；

在一个示例中，(1)

可以由线性模型进行近似，因为相邻图像之间的运动轨迹可以用直线进行标识，从构建出的状态向量中单独取出上述参数用于描述运动目标。

x_k＝Ax_k-1+Bu_k+w_k (1)

z_k＝Hx_k+v_k (2)

其中x表示***的状态向量，z为观测值，A是状态转移矩阵，由于本发明所应用为非可控***，因此B和u构成的控制参数可做忽略。其中H是观测模型，即观测矩阵，可将真是的状态映射到观测空间。w和v分别表示状态更新和观测过程中的噪声。上述所有参数的下角标k表示在第k时刻。

(2)根据卡尔曼滤波器的原理可知：

其中，P是预测值与实际值之间的误差协方差矩阵，用于表示预测结果的不确定性，Q为预测过程中新增加的不确定性。公式3表示上一时刻与外界输入共同决定的当前状态，公式4表示由于之前存在的不确定性带来的新的不确定性Q。

(3)计算卡尔曼增益K和第k次的预测值

可以由下列公式计算得到：

其中公式5表示由预测结果的不确定性

和观测结果的不确定性R计算卡尔曼增益K。公式6表示对预测结果做加权平均，得到当前时刻的状态估计。

(4)更新

表示本次状态估计的不确定性。

采用扩展卡尔曼滤波器对s和r中不适用于线性模型的部分进行预测。与第二步中相同的方式创建状态向量，此时的状态矩阵不再是常数矩阵，其更新方式通过以下进行表示：

其中，矩阵F_k和H_k由雅可比矩阵得到，其中F_k与卡尔曼滤波器中的矩阵A对应，而H_k与常数矩阵H对应。

将非线性部分的推理加入线性推理***中，即可以描述飞机的运动状态。

S04：对所述飞行器的所述运动轨迹预测进行校正；

如图1和图2所示，在一个示例中，判断此时的边框能否正确的检测出上飞机，如果在特定图像中，飞机的预测边框与飞机实际的检测边框的重叠度的值大于预先定义好的阈值，则根据检测的边框信息重新更新状态变量，其具体的校正公式如下：

其中δ_b,δ_a分别表示前后图像之间检测结果的置信度，其值越高，说明模型的精确度越高，其中w_a，w_b，w_c分别表示相邻图像及校正后的边界框的宽度，h_a,h_b,h_c分别表示相邻图像及校正后的边界框的高度，其中(x_a,y_a),(x_b,y_b),(x_c,y_c)分别表示前后图像及校正后的边界框的水平和竖直高度。

在一个示例中，搜集包含飞机运动的视频数据，统一处理成为固定长度的视频，并组成数据集，其中80％的作为训练集输入所述检测网络中，并通过20％的数据做验证。

虽然以上描述了本发明的具体实施方式，但是本领域的技术人员应当理解，这仅是举例说明，本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下，可以对这些实施方式做出多种变更或修改，但这些变更和修改均落入本发明的保护范围。

Claims

1.一种飞行器识别追踪方法，其特征在于，所述方法包括：

对所述飞行器的所述运动轨迹预测进行校正；

2.如权利要求1所述的一种飞行器识别追踪方法，其特征在于，所述视频数据统一处理成固定长度的视频，并组成数据集对所述检测网络进行训练，所述数据集包括：用于训练的训练集和用于验证的验证集。

3.如权利要求2所述的一种飞行器识别追踪方法，其特征在于，当所述飞行器中心点位置向量采用线性模型近似时，状态转移矩阵和观测矩阵为常数；当所述飞行器中心点位置向量采用非线性模型近似时，所述状态转移矩阵和所述观测矩阵分别为：

其中，F_k为状态变化矩阵，其中H_k为观测矩阵。其中

4.如权利要求2所述的一种飞行器识别追踪方法，其特征在于，所述校正包括一种边框校正公式：