CN110287927A

CN110287927A - 基于深度多尺度和上下文学习的遥感影像目标检测方法

Info

Publication number: CN110287927A
Application number: CN201910583811.1A
Authority: CN
Inventors: 张向荣; 唐旭; 王少娜; 陈璞花; 古晶; 马文萍; 马晶晶; 侯彪
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2019-07-01
Filing date: 2019-07-01
Publication date: 2019-09-27
Anticipated expiration: 2039-07-01
Also published as: CN110287927B

Abstract

本发明公开了一种基于深度多尺度和上下文学***均精度，可用于获取一幅遥感影像里感兴趣的目标及目标的位置。

Description

基于深度多尺度和上下文学习的遥感影像目标检测方法

技术领域

本发明属于遥感影像技术领域，特别涉及一种遥感影像目标检测方法，可用于获得一幅遥感影像里感兴趣的目标及其目标的位置。

背景技术

遥感影像目标检测是遥感领域的重要研究内容之一，广泛应用于国土规划、灾情监测、军事侦察等领域。遥感影像目标检测的目的在于判定遥感影像中是否存在感兴趣的目标，并确定目标的位置。

传统的遥感影像目标检测方法有基于模板匹配的方法、基于知识的方法和基于检测对象的方法，这些方法极大程度上依赖于大量的特征工程来实现对遥感影像中目标的检测。然而，对于复杂多变的遥感影像背景环境，目标尺度差异明显等问题，这些方法的适应性并不强。近年来，遥感影像目标检测普遍采用基于深度学习的方法。深度卷积神经网络在目标检测问题上不需要手工设计特征，对遥感影像数据自行进行特征提取，性能表现超过传统算法。其中RetinaNet(Focal Loss for Dense Object Detection)模型具有无需生成候选区域，目标检测速度快，精度高等优点。然而RetinaNet模型仍然存在局限。由于RetinaNet采用的网络架构是特征金字塔网络，特征金字塔网络将当前层的特征图与相邻的更高级特征图相加融合得到的特征图用来检测目标。这种情况下，特征融合方式较为粗略，忽略了对高级特征图更有效的利用以及上下文信息的利用，这都制约着遥感影像目标检测精度的提高。

发明内容

本发明的目的在于针对克服现有技术的不足，提出一种基于深度多尺度和上下文学习的遥感影像目标检测方法，以提高遥感影像中的目标检测精度。

本发明的技术方案是：充分考虑更有效的特征图融合方式以及如何利用全局上下文特征信息的问题，在RetinaNet检测模型中引入多尺度特征增强模块以及上下文特征增强模块，构建多尺度和上下文特征增强的RetinaNet检测模型。其首先从RetinaNet检测模型的骨干网络和特征金字塔网络获取多个层级的特征图，接着引入多尺度特征增强模块，对于多个层级下的特征图，将每个相对高级特征图的语义信息引导到相邻的低级特征图中，丰富每个相对低级特征图的语义信息，然后，对融合多尺度增强后的金字塔特征图引入上下文特征增强模块，获取遥感影像场景的全局上下文特征，最后将增强后的金字塔特征图用在检测模型中，通过多任务学习实现多目标的类别确定和目标位置定位。具体实现步骤包括如下：

1.一种基于深度多尺度和上下文学习的遥感影像目标检测方法，其特征在于，包括如下：

(1)将遥感影像目标检测数据集中的75％作为训练样本，剩余的25％作为测试样本；

(2)构建多尺度和上下文特征增强的RetinaNet检测模型：

(2a)从RetinaNet检测模型的骨干网络ResNet-101中获得3个卷积特征图C3,C4，C5；

(2b)从RetinaNet检测模型的特征金字塔网络中获得4个金字塔特征图P3，P4，P5，P6；

(2c)构建一个由7个特征图组成的多尺度特征增强模块；

(2d)将3个卷积特征图C3，C4，C5和第四个金字塔特征图P6作为多尺度特征增强模块的输入，得到3个融合多尺度增强后的金字塔特征图F3，F4，F5；

(2e)构建一个由5个特征图组成的上下文特征增强模块；

(2f)将3个融合多尺度增强后的金字塔特征图F3，F4，F5作为上下文特征增强模块的输入，得到3个融合多尺度上下文特征增强后的金字塔特征图G3，G4，G5；

(3)设定多尺度和上下文特征增强的RetinaNet检测模型中目标分类与目标位置回归任务的整体损失函数L：

(3a)将现有Focal Loss函数设定为多尺度和上下文特征增强的RetinaNet检测模型中目标分类任务的损失函数，用L_cls表示；

(3b)将现有Smooth L1Loss函数设定为多尺度和上下文特征增强的RetinaNet检测模型中目标位置回归任务的损失函数，用L_reg表示：

(3c)由目标分类任务的损失函数L_cls和目标位置回归任务的损失函数L_reg，设定多尺度和上下文特征增强的RetinaNet检测模型整体损失函数L为：

L＝L({p_i},{t_i})，

其中，为目标检测任务和目标位置回归任务整体的损失函数，N_cls表示目标分类任务中正样本锚框的总数量，p_i表示第i个锚框为预测目标的概率，表示第i个锚框为真实目标的概率，为多尺度和上下文特征增强的RetinaNet检测模型中目标分类任务的损失函数，λ表示目标分类任务与目标位置回归任务间的平衡权重参数，N_reg表示目标位置回归任务中正样本锚框的总数量，表示第i个锚框相对于真实目标边框的偏移量，t_i表示第i个锚框相对于预测目标边框的偏移量，为多尺度和上下文特征增强的RetinaNet检测模型中目标位置回归任务的损失函数，i表示锚框的索引，其取值范围是从1到M，M为锚框总数；

(4)训练(2)构建的多尺度和上下文特征增强的RetinaNet检测模型：

(4a)设学习率为0.00001，优化器使用Adam，训练步数设为2000，训练轮数设为100，在ImageNet数据集上使用骨干网络ResNet-101预训练得到的分类模型参数，作为多尺度和上下文特征增强的RetinaNet检测模型的初始化参数；

(4b)将(1)中获得的训练样本输入到多尺度和上下文特征增强的RetinaNet检测模型中，使用优化器Adam优化(3c)中的整体损失函数L，更新权重参数，当训练轮数达到100时，得到包含权重参数的多尺度和上下文特征增强的RetinaNet检测模型；

(5)将测试样本输入到包含权重参数的多尺度和上下文特征增强的RetinaNet检测模型中，预测输出测试样本中目标边界框位置，目标类别及目标的置信度分数。

本发明与现有技术相比，具有以下优点：

第一，本发明在现有技术中，引入多尺度特征增强模块，其考虑高效利用高级特征图的语义信息，引导高级特征图与低级特征图进行融合，使得低级特征图在分辨率不变的前提下，具有丰富的语义信息，加强了低级特征图的表达，同时提升目标的分类置信度。

第二，本发明考虑到了全局上下文特征信息的利用，引入上下文特征增强模块，有效利用遥感影像场景复杂的特性，从特征层面建立当前位置与其它位置间的联系，获取遥感影像场景的全局上下文特征，从而提升目标检测精度。

附图说明

图1为本发明的实现流程图；

图2为用本发明和基准方法对棒球场进行检测的仿真结果图像；

图3为用本发明和基准方法对桥梁进行检测的仿真结果图像；

图4为用本发明和基准方法对飞机进行检测的仿真结果图像。

具体实施方式

下面结合附图对本发明的实施例及效果作进一步的详细描述。

参照图1，本实施例的实现步骤如下：

步骤1，获取训练样本和测试样本。

获取公开的遥感图像目标检测数据集NWPU VHR-10-v2，该数据集包括1172张400×400像素大小的遥感图像，以及遥感图像上相应的标注目标类别和目标位置数据，本实例将遥感影像目标检测数据集中75％的数据作为训练样本，剩余25％的数据作为测试样本，即将其中的879张样本图像作为训练样本，剩余的293张图像作为测试样本。

步骤2，构建多尺度和上下文特征增强的RetinaNet检测模型。

2.1)从RetinaNet检测模型的骨干网络获得3个卷积特征图C3,C4，C5:

RetinaNet检测模型的骨干网络包括有ResNet-50，ResNet-101，ResNet-152，本实施例中使用骨干网络ResNet-101，即从RetinaNet检测模型的骨干网络ResNet-101中获得3个卷积特征图C3,C4，C5；

2.2)从RetinaNet检测模型的特征金字塔网络中获得4个金字塔特征图P3，P4，P5，P6；

2.3)构建一个由7个特征图组成的多尺度特征增强模块：

2.3.1)构建2个特征图，其中第一个是高级特征图T1，第二个是低级特征图T2；

2.3.2)对第一个高级特征图T1采取并列的2个分支操作：

将第一个分支依次经过全局平均池化层，维度变换层，第一个步长为1的1×1卷积层和第一个上采样层，得到包含全局上下文信息的低级特征图T3；

将第二个分支依次经过第二个步长为1的1×1卷积层和第二个上采样层，得到上采样后的低级特征图T4；

2.3.3)将第二个低级特征图T2输入到步长为1的3×3卷积层，输出得到通道变换后的低级特征图T5；

2.3.4)将包含全局上下文信息的低级特征图T3和通道变换后的低级特征图T5输入到融合乘法层，得到融合相乘后的低级特征图T6；

2.3.5)将融合相乘后的低级特征图T6和上采样后的低级特征图T4输入到融合加法层，得到多尺度增强后的特征图T7；

2.4)将3个卷积特征图C3，C4，C5和第四个金字塔特征图P6作为多尺度特征增强模块的输入，得到3个融合多尺度增强后的金字塔特征图F3，F4，F5：

2.4.1)将第二个卷积特征图C4作为多尺度特征增强模块中的高级特征图T2输入，将第一个卷积特征图C3作为多尺度增强模块中的低级特征图T1输入，输出得到多尺度增强后的第一个特征图E3；

2.4.2)将多尺度增强后的第一个特征图E3与第一个金字塔特征图P3相加融合，得到融合多尺度增强后的第一个金字塔特征图F3；

2.4.3)将第三个卷积特征图C5作为多尺度特征增强模块中的高级特征图T2输入，将第二个卷积特征图C4作为多尺度特征增强模块中的低级特征图T1输入，输出得到多尺度增强后的第二个特征图E4；

2.4.4)将多尺度增强后的第二个特征图E4与第二个金字塔特征图P4相加融合，得到融合多尺度增强后的第二个金字塔特征图F4；

2.4.5)将第四个金字塔特征图P6作为多尺度特征增强模块中的高级特征图T2输入，将第三个卷积特征图C5作为多尺度特征增强模块中的低级特征图T1输入，输出得到多尺度增强后的第三个特征图E5；

2.4.6)将多尺度增强后的第三个特征图E5与第三个金字塔特征图P5相加融合，得到融合多尺度增强后的第三个金字塔特征图F5；

2.5)构建一个由5个特征图组成的上下文特征增强模块：

2.5.1)构建一个融合多尺度增强后的金字塔特征图S1，将其依次经过第一个步长为1的1×1卷积层和softmax层，得到激活后的金字塔特征图S2；

2.5.2)将激活后的金字塔特征图S2与融合多尺度增强后的金字塔特征图S1输入到第一个融合相乘层，得到融合相乘后的金字塔特征图S3；

2.5.3)将融合相乘后的金字塔特征图S3依次经过第二个步长为1的1×1卷积层、修正线性单元层和第三个步长为1的1×1卷积层，得到修正融合后的金字塔特征图S4；

2.5.4)将修正融合后的金字塔特征图S4与融合多尺度增强后的金字塔特征图S1输入到第二个融合相乘层，得到融合上下文特征增强后的金字塔特征图S5；

2.6)将3个融合多尺度增强后的金字塔特征图F3，F4，F5作为上下文特征增强模块的输入，得到3个融合多尺度上下文特征增强的金字塔特征图G3，G4，G5：

2.6.1)将融合多尺度增强后的第一个金字塔特征图F3作为上下文特征增强模块的特征图S1输入，得到融合上下文特征增强后的第一个金字塔特征图G3；

2.6.2)将融合多尺度增强后的第二个金字塔特征图F4作为上下文特征增强模块的特征图S1输入，得到融合上下文特征增强后的第二个金字塔特征图G4；

2.6.3)将融合多尺度增强后的第三个金字塔特征图F5作为上下文特征增强模块的特征图S1输入，得到融合上下文特征增强后的第三个金字塔特征图G5。

步骤3，设定构建的多尺度和上下文特征增强的RetinaNet检测模型中目标分类与目标位置回归任务的整体损失函数L。

3.1)将现有Focal Loss函数设定为多尺度和上下文特征增强的RetinaNet检测模型中目标分类任务的损失函数，用L_cls表示为：

L_cls＝FL(p_i)，

其中，FL(p_i)＝-α(1-p_i)^γ×log(p_i)表示焦点损失函数，α表示正负样本的平衡参数，γ表示专注参数，p_i表示第i个锚框为预测目标的概率，i表示锚框的索引，其取值范围是从1到M，M为锚框总数；

本实施例中，设定α为0.25，设定γ为2.0；

3.2)将现有Smooth L1Loss函数设定为多尺度和上下文特征增强的RetinaNet检测模型中目标位置回归任务的损失函数，用L_reg表示为：

L_reg＝Smooth_L1(x)，

其中，Smooth_L1(x)表示平滑L1平方损失函数，表示第i个锚框相对于预测目标边框的偏移量t_i与第i个锚框相对于真实目标边框的偏移量的差值；

3.3)由目标分类任务的损失函数L_cls和目标位置回归任务的损失函数L_reg，设定多尺度和上下文特征增强的RetinaNet检测模型整体损失函数L为：

L＝L({p_i},{t_i})，

其中，为目标检测任务和目标位置回归任务整体的损失函数，N_cls表示目标分类任务中正样本锚框的总数量，表示第i个锚框为真实目标的概率，为多尺度和上下文特征增强的RetinaNet检测模型中目标分类任务的损失函数，λ表示目标分类任务与目标位置回归任务间的平衡权重参数，N_reg表示目标位置回归任务中正样本锚框的总数量，表示第i个锚框相对于真实目标边框的偏移量，t_i表示第i个锚框相对于预测目标边框的偏移量，为多尺度和上下文特征增强的RetinaNet检测模型中目标位置回归任务的损失函数；

本实施例中，λ取1。

步骤4，对步骤2构建的多尺度和上下文特征增强的RetinaNet检测模型进行训练。

4.1)设置训练参数：

在本实施例中，设学习率为0.00001，优化器使用Adam，训练步数设为2000，训练轮数设为100，在ImageNet数据集上使用骨干网络ResNet-101预训练得到的分类模型参数，作为多尺度和上下文特征增强的RetinaNet检测模型的初始化参数；

4.2)将步骤1中的训练样本输入到多尺度和上下文特征增强的RetinaNet检测模型中，并使用优化器Adam优化步骤3中的整体损失函数L，更新权重参数，当训练轮数达到100时，得到包含权重参数的多尺度和上下文特征增强的RetinaNet检测模型。

步骤5，将步骤1中的测试样本输入到包含权重参数的多尺度和上下文特征增强的RetinaNet检测模型中，预测输出测试样本图像中目标边界框的位置，目标类别及目标的置信度分数。

本发明的效果可通过以下仿真实验进一步说明：

一.仿真条件和内容

仿真采用公开且被广泛应用于遥感影像目标检测算法性能测评的NWPU VHR-10-v2数据集进行多尺度和上下文特征增强的RetinaNet检测模型的训练和测试，所用的基准方法为RetinaNet检测模型。

设NWPU VHR-10-v2数据集中包括10个目标类别，分别是：飞机，舰船，储油罐，棒球场，篮球场，网球场，操场，港口，车辆和桥梁。

仿真所用的处理器为Xeon(R)CPU [email protected]×40，内存为64.00GB，GPU为8G的GeForce GTX1080，仿真平台为Ubuntu16.04操作***，使用Keras深度学习框架，采用Python语言实现。

二.仿真内容

仿真1：使用本发明和现有的基准方法对棒球场进行检测仿真，结果如图2所示，从图2可见，基准方法棒球场的分类置信度分数为0.929，如图2(a)所示，本发明中棒球场的分类置信度分数达到1.000，如图2(b)所示，与基准方法相比，本发明对棒球场的分类性能有了相对明显的提升。

仿真2：使用本发明和现有的基准方法对桥梁进行检测仿真，结果如图3所示，从图3可见，基准方法2个桥梁的分类置信度分数分别为0.660，0.850，如图3(a)所示，本发明中2个桥梁的分类置信度分数分别达到0.974，0.927，如图3(b)所示，与基准方法相比，本发明对桥梁的分类置信度分数提升明显，其主要是由于桥梁对场景上下文信息依赖强，引入的上下文特征增强模块，加强了上下文特征的表达。

仿真3：使用本发明和现有基准方法对5架飞机进行检测仿真，结果如图4所示，从图4可见，基准方法中5架飞机的分类置信度分数都是1.000，如图4(a)所示，本发明中5架飞机的分类置信度分数都是1.000，如图4(b)所示，这表明基准方法和本发明对飞机分类都有良好的性能表现。

三.仿真实验结果对比及分析

为验证本发明的有效性，设置3个现有方法，其中：现有方法1为RetinaNet检测模型；现有方法2为旋转不敏感和上下文增强的遥感影像目标检测模型；现有方法3为多模型决策融合的遥感影像目标检测模型。

采用均值平均精度作为对所有目标类别检测时的评价指标，平均精度作为对单类别目标检测时的评价指标，使用本发明和3种现有方法在NWPU VHR-10-v2测试数据集上的目标进行检测仿真，对其检测的评价指标数值结果作对比，如表1所示。

表1本发明和3种现有方法检测的评价指标数值结果对比

在表1本发明和3种现有方法检测的评价指标数值结果对比中，多目标检测的均值平均精度和各类别平均精度的结果均为小数，粗体表示上述四种方法中检测该类别目标的最高平均精度。

根据表1本发明和3种现有方法检测的评价指标数值结果对比中，得出以下3个结论：

1)现有方法1的均值平均精度为0.9150，本发明的均值平均精度为0.9551，本发明比现有方法1的均值平均精度提升了0.0401；

2)本发明中有6类目标的平均精度比现有方法1中8类目标的平均精度高，尤其对于桥梁，和篮球场这两个类别，其平均精度有较明显的提升，主要是因为桥梁，篮球场对于上下文信息依赖较强，引入的上下文特征增强模块，加强了上下文特征的表达，舰船的检测平均精度也有提升，主要是因为舰船的尺度变化大，引入的多尺度特征增强模块增强了目标多尺度特征的表达；

3)对于现有方法2和现有方法3，其都属于两步目标检测模型，本发明属于单步目标检测模型，通常情况下，两步目标检测模型的均值平均精度比单步目标检测模型的均值平均精度高，而从检测的评价指标数值结果对比可知，本发明的均值平均精度皆高于现有方法2和现有方法3。

综上，本发明在现有RetinaNet检测模型的基础上，引入多尺度特征增强模块，将高级特征图上的语义信息引导到低级特征图，丰富低级特征图的语义信息，再进一步，引入上下文特征增强模块，最后，将引入多尺度和上下文特征增强模块的RetinaNet检测模型用于目标检测，输出检测结果，提高了遥感影像目标检测的精度。

以上描述仅是本发明的一个具体实例，并未构成对本发明的任何限制，显然对于本领域内的专业人员来说，在了解了本发明内容和原理后，都可能在不背离本发明原理、结构的情况下，进行形式和细节上的各种修改和改变，但是这些基于本发明思想的修正和改变仍在本发明的权利要求保护范围之内。

Claims

(2)构建多尺度和上下文特征增强的RetinaNet检测模型：

(2c)构建一个由7个特征图组成的多尺度特征增强模块；

(2e)构建一个由5个特征图组成的上下文特征增强模块；

(3b)将现有Smooth L1 Loss函数设定为多尺度和上下文特征增强的RetinaNet检测模型中目标位置回归任务的损失函数，用L_reg表示：

L＝L({p_i},{t_i})，

2.根据权利要求1所述的方法，其特征在于，(2c)中所述的构建一个由7个特征图组成的多尺度特征增强模块，其实现如下：

(2c1)构建2个特征图，其中第一个是高级特征图T1，第二个是低级特征图T2；

(2c2)对第一个高级特征图采取并列的2个分支操作：

将第一个分支依次经过全局平均池化层、维度变换层、第一个步长为1的1×1卷积层和第一个上采样层，得到包含全局上下文信息的低级特征图T3；

(2c3)将第二个低级特征图T2输入到步长为1的3×3卷积层，输出得到通道变换后的低级特征图T5；

(2c4)将包含全局上下文信息的低级特征图T3和通道变换后的低级特征图T5输入到融合乘法层，得到融合相乘后的低级特征图T6，

(2c5)将融合相乘后的低级特征图T6和上采样后的低级特征图T4输入到融合加法层，得到多尺度增强后的特征图T7。

3.根据权利要求1或2所述的方法，其特征在于，(2d)中将3个卷积特征图C3，C4，C5和第四个金字塔特征图P6作为多尺度特征增强模块的输入，得到3个融合多尺度增强后的金字塔特征图F3，F4，F5，其实现如下：

(2d1)将第二个卷积特征图C4作为多尺度特征增强模块中的高级特征图T2输入，将第一个卷积特征图C3作为多尺度增强模块中的低级特征图T1输入，输出得到多尺度增强后的第一个特征图E3；

(2d2)将多尺度增强后的第一个特征图E3与第一个金字塔特征图P3相加融合，得到融合多尺度增强后的第一个金字塔特征图F3；

(2d3)将第三个卷积特征图C5作为多尺度特征增强模块中的高级特征图T2输入，将第二个卷积特征图C4作为多尺度特征增强模块中的低级特征图T1输入，输出得到多尺度增强后的第二个特征图E4；

(2d4)将多尺度增强后的第二个特征图E4与第二个金字塔特征图P4相加融合，得到融合多尺度增强后的第二个金字塔特征图F4；

(2d5)将第四个金字塔特征图P6作为多尺度特征增强模块中的高级特征图T2输入，将第三个卷积特征图C5作为多尺度特征增强模块中的低级特征图T1输入，输出得到多尺度增强后的第三个特征图E5；

(2d6)将多尺度增强后的第三个特征图E5与第三个金字塔特征图P5相加融合，得到融合多尺度增强后的第三个金字塔特征图F5。

4.根据权利要求1所述的方法，其特征在于，(2e)中构建一个由5个特征图组成的上下文特征增强模块，其实现如下：

(2e1)构建一个融合多尺度增强后的金字塔特征图S1，将其依次经过第一个步长为1的1×1卷积层和softmax层，得到激活后的金字塔特征图S2；

(2e2)将激活后的金字塔特征图S2与融合多尺度增强后的金字塔特征图S1输入到第一个融合相乘层，得到融合相乘后的金字塔特征图S3；

(2e3)将融合相乘后的金字塔特征图S3依次经过第二个步长为1的1×1卷积层、修正线性单元层和第三个步长为1的1×1卷积层，得到修正融合后的金字塔特征图S4；

(2e4)将修正融合后的金字塔特征图S4与融合多尺度增强后的金字塔特征图S1输入到第二个融合相乘层，得到融合上下文特征增强后的金字塔特征图S5。

5.根据权利要求1所述的方法，其特征在于，(2f)中将3个融合多尺度增强后的金字塔特征图F3，F4，F5作为上下文特征增强模块的输入，得到3个融合多尺度上下文特征增强后的金字塔特征图G3，G4，G5，其实现如下：

(2f1)将融合多尺度增强后的第一个金字塔特征图F3作为上下文特征增强模块的特征图S1输入，得到融合上下文特征增强后的第一个金字塔特征图G3；

(2f2)将融合多尺度增强后的第二个金字塔特征图F4作为上下文特征增强模块的特征图S1输入，得到融合上下文特征增强后的第二个金字塔特征图G4；

(2f3)将融合多尺度增强后的第三个金字塔特征图F5作为上下文特征增强模块的特征图S1输入，得到融合上下文特征增强后的第三个金字塔特征图G5。

6.根据权利要求1所述的方法，其特征在于，(3a)中将现有Focal Loss函数设定为多尺度和上下文特征增强的RetinaNet检测模型中目标分类任务的损失函数L_cls，其表示如下：

L_cls＝FL(p_i)，

其中，FL(p_i)＝-α(1-p_i)^γ×log(p_i)表示焦点损失函数，α表示正负样本的平衡参数，γ表示专注参数，p_i表示第i个锚框为预测目标的概率。

7.根据权利要求1所述的方法，其特征在于，(3b)中将现有Smooth L1 Loss函数设定为多尺度和上下文特征增强的RetinaNet检测模型中目标位置回归任务的损失函数L_reg，其表示如下：

L_reg＝Smooth_L1(x)，

其中，Smooth_L1(x)表示平滑L1平方损失函数，表示第i个锚框相对于预测目标边框的偏移量t_i与第i个锚框相对于真实目标边框的偏移量的差值。