CN112785627A

CN112785627A - 一种基于重识别技术的多目标跟踪方法

Info

Publication number: CN112785627A
Application number: CN202110143991.9A
Authority: CN
Inventors: 董乐; 张宁; 徐浩然
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2021-02-02
Filing date: 2021-02-02
Publication date: 2021-05-11

Abstract

本发明涉及计算机图像处理领域，具体是一种基于重识别技术的多目标跟踪方法，包括如下步骤：步骤一、数据预处理；步骤二、训练分支网络，构建分支网络的损失函数；步骤三、利用分支网络的损失函数构建主干网络的损失函数；步骤四、基于分支网络使用DeepSORT算法进行多目标跟踪；解决多目标跟踪准确性与实时性不足的问题。

Description

一种基于重识别技术的多目标跟踪方法

技术领域

本发明涉及计算机图像处理领域，具体是指一种基于重识别技术的多目标跟踪方法。

背景技术

多目标检测跟踪是计算机视觉的核心也是一直以来广泛被研究的领域之一，该技术可以应用于人数统计，视频分析，动作识别，异常行为检测，人机交互等方面，目前多目标检测跟踪的很多解决方案主要在于两方面：检测与关联，前者通过检测模型检测并定位到目标，后者通过关联模型抽取目标重识别特征，然后将其关联到某一条已经存在的轨迹上，目前已经提出的检测与重识别模型已经在很大程度上提高了整体的跟踪性能，但是当有很多的目标需要被跟踪的时候，这些方法都无法达到一个令人满意的实时性，而其原因之一在于：检测模型与re-ID模型没有共享特征，因此浪费了很多的计算性能在特征计算上，针对这个问题，Voigleander等人也提出了“一步式”的方法，他们使用ROI-Align在Mask R-CNN的上层增加了重识别分支，减少了重用主干网络对重识别分支的影响，但是使用这种方式跟踪的精确度相对于“两步式”有明显降低，为了解决这种精度损失问题，本发明研究了该问题的原因所在，并提出了相对应的解决方法，从而使得跟踪实时性与精度都得到巨大提升。

发明内容

基于以上问题，本发明提供了一种基于重识别技术的多目标跟踪方法，解决多目标跟踪准确性与实时性不足的问题。

为解决以上技术问题，本发明采用的技术方案如下：

一种基于重识别技术的多目标跟踪方法，包括如下步骤：

步骤一、数据预处理；

步骤二、训练分支网络，构建分支网络的损失函数；

步骤三、利用分支网络的损失函数构建主干网络的损失函数；

步骤四、基于分支网络使用DeepSORT算法进行多目标跟踪。

进一步，所述主干网络包括ResNet34网络和DLA34网络，所述分支网络包括检测分支网络和重识别分支网络，所述检测分支网络包括确定中心点网络、确定中心点偏移网络和确定目标大小网络。

进一步，所述确定中心点网络的损失函数构建如下：

对于数据集中的每一个目标标定框

计算目标中心点

其中，

目标中心点除以步长后得到

heatmap网络在(x,y)处的响应为

其中，N表示目标总数，σ是标准差，使用逻辑回归与focal loss构建确定中心点网络的损失函数如下：

其中，

表示确定中心点网络的估计值，α、β表示预定义参数。

进一步，所述确定中心点偏移网络和确定目标大小网络的损失函数构建如下：

对于数据集中的每一个目标标定框

计算目标大小

计算中心点偏移为

构建确定中心点偏移网络和确定目标大小网络损失函数如下：

其中，

分别为对应位置处的估计值，确定中心点偏移网络的输出为

确定目标大小网络输出为

进一步，通过确定中心点网络获取到目标中心点，对于每一个目标中心点，抽取出其重识别特征向量，通过分类学习将其映射到一个分类向量P＝{p(k),k∈[1,k]}，重识别模型的损失函数如下：

其中，K表示类别总数，Lⁱ(k)为类别标签的独热编码表示。

进一步，主干网络的损失函数L_total如下：

L_dtection＝L_heat+L_box；

其中，w₁、w₂表示学习参数。

与现有技术相比，本发明的有益效果是：

1.对比现有技术***(CenterTrack、TubeTK、SST等)在各项指标上都有很大的提升，如多目标跟踪精确度(MOTA)、FPS等指标，可以应用于一些对实时性要求较高的领域。

2、使用基于Anchor-free的检测方法，可以避免网络歧义性，并且采用DLA34深层特征融合网络，并行地生成检测模型与重识别模型。

附图说明

图1为本实施例的流程图。

具体实施方式

下面结合附图对本发明作进一步的说明。本发明的实施方式包括但不限于下列实施例。

基于Anchor-Based检测器产生出来的anchor并不适合去学习合适的重识别信息，原因有二，其一是一个物体可能被多个anchor负责并进行检测，这会导致严重的网络模糊性(ambiguities for the network)；第二个原因是实际物体的中心可能与负责对该物体进行检测的anchor中心有偏差。

基于上述anchor-free的方式检测目标，提出了一种基于重识别技术的多目标跟踪方法，包括如下步骤：

步骤一、数据预处理；

其中，选用多目标跟踪数据集进行标签标定预处理，用于重识别模型的训练；使用标定好的数据集用于训练检测模型，另外，标定好的数据集包括但不限于MOT17。

步骤二、训练分支网络，构建分支网络的损失函数；

其中，分支网络包括检测分支网络和重识别分支网络，检测分支网络包括确定中心点网络、确定中心点偏移网络和确定目标大小网络，对于检测分支网络中的每一个分支网络，通过主干网络提取特征图并对特征图进行特征融合后，使用一个3×3(256channels)的卷积，进行ReLU后使用一个1×1卷积生成特征图；

另外，分别构建确定中心点网络、确定中心点偏移网络和确定目标大小网络的损失函数，确定中心点网络的损失函数构建方法如下：

对于数据集中的每一个目标标定框

计算目标中心点

其中，

目标中心点除以步长后得到

heatmap网络在(x,y)处的响应为

其中，

表示确定中心点网络的估计值，α、β表示预定义参数；

另外，确定中心点偏移网络和确定目标大小网络的损失函数如下：

对于数据集中的每一个目标标定框

计算目标大小

计算中心点偏移为

其中，

分别为对应位置处的估计值，确定中心点偏移网络的输出为

确定目标大小网络输出为

另外，重识别分支网络的损失函数如下：

通过确定中心点网络获取到目标中心点，对于每一个目标中心点，抽取出其重识别特征向量，通过分类学习将其映射到一个分类向量P＝{p(k),k∈[1,k]}，重识别模型的损失函数如下：

其中，K表示类别总数，Lⁱ(k)为类别标签的独热编码表示。

步骤三、利用分支模型的损失函数构建主干网络的损失函数；

其中，主干网络包括ResNet34网络和DLA34网络，为了能够在精确性和速度上取得一个较好的平衡，利用ResNet34网络提取出图像的特征图并对该特征图进行一些图形变换后，使用DLA34网络进行特征融合，DLA34网络融合其底层与高层特征避免一些底层特征的丢失，在该主干网络对特征图和对特征图进行特征融合的基础上，对分支网络进行学习；

另外，主干网络的损失函数L_total如下：

L_dtection＝L_heat+L_box；

其中，w₁、w₂表示学习参数。

步骤四、基于分支网络使用DeepSORT算法进行多目标跟踪。

如上即为本发明的实施例。上述实施例以及实施例中的具体参数仅是为了清楚表述发明人的发明验证过程，并非用以限制本发明的专利保护范围，本发明的专利保护范围仍然以其权利要求书为准，凡是运用本发明的说明书及附图内容所作的等同结构变化，同理均应包含在本发明的保护范围内。