CN113610069B

CN113610069B - 基于知识蒸馏的目标检测模型训练方法

Info

Publication number: CN113610069B
Application number: CN202111179182.XA
Authority: CN
Inventors: 张志嵩; 曹松; 任必为; 宋君; 陶海
Original assignee: Beijing Vion Intelligent Technology Co ltd
Current assignee: Beijing Vion Intelligent Technology Co ltd
Priority date: 2021-10-11
Filing date: 2021-10-11
Publication date: 2022-02-08
Anticipated expiration: 2041-10-11
Also published as: CN113610069A

Abstract

本发明提供了一种基于知识蒸馏的目标检测模型训练方法，包括：利用训练样本图像集训练目标检测教师模型，训练样本图像具有：第一标签：目标检测框中心点像素位置硬标签概率矩阵；第二标签：目标检测框的宽和高；第三标签：目标检测框中心点像素位置偏移量；目标检测教师模型的预测输出结果包括：目标检测框中心点像素位置概率热力图、目标检测框的宽和高、目标检测框中心点像素位置偏移量；以知识蒸馏的方式改进目标检测学生模型的损失函数后，训练生成目标检测学生模型。本发明的解决了利用现有的知识蒸馏方法训练获取的目标检测模型无法同时保证网络结构简单而满足终端设备使用需求，以及目标检测模型的识别率优良以确保模型检测精度的问题。

Description

基于知识蒸馏的目标检测模型训练方法

技术领域

本发明涉及人工智能模型训练技术领域，具体而言，涉及一种基于知识蒸馏的目标检测模型训练方法。

背景技术

知识蒸馏是通过引入教师模型的网络结构指导学生模型的网络结构的训练，进而实现知识迁移。具体的方法步骤是先训练教师模型，然后利用此教师模型的输出和数据的真实标签去训练学生模型，从而将教师模型的网络结构的知识转移到学生模型的网络结构中，在保证了学生模型的网络结构能够获得接近于教师模型的网络结构的性能的同时，还使得学生模型的网络结构尽可能小，参数量更少，从而更有利于降低对部署模型的算力需求，提升模型的推理效率。

实施目标检测任务的终端设备通常为摄像机、照相机或监控探头等小型设备，其所搭载的芯片的算力有限，因此，目标检测模型的网络结构的大小受到了严格的限制。利用传统的知识蒸馏方法训练得到的目标检测模型虽然在网络结构大小上能够匹配终端设备的算力要求；但却无法保证获得的目标检测模型实施目标检测任务时的精度。

这是因为，传统的知识蒸馏方法常用于实施单一的分类任务的模型的训练，而采用CenterNet网络结构的目标检测模型实施的目标检测任务同时包括分类任务和回归任务，这样目标检测模型的网络结构本身便较为复杂，传统的知识蒸馏方法直接将学生模型的损失函数中的真实标签部分替换成教师模型的输出，而没有做到对目标检测模型的损失函数分级分类指导优化，因此最终训练出的目标检测模型存在识别效果差、检测精度低的问题。

由此可知，如何利用知识蒸馏的方法使得训练出目标检测模型同时兼顾网络结构简单而满足终端设备使用需求，以及同时确保目标检测模型的识别率优良以保证模型检测精度，便成了现有技术中亟待解决的问题。

发明内容

本发明的主要目的在于提供一种基于知识蒸馏的目标检测模型训练方法，以解决利用现有技术中的知识蒸馏方法训练获取的目标检测模型无法同时保证网络结构简单而满足终端设备使用需求，以及目标检测模型的识别率优良以确保模型检测精度的问题。

为了实现上述目的，本发明提供了一种基于知识蒸馏的目标检测模型训练方法，包括：步骤S1，利用训练样本图像集训练生成目标检测教师模型，训练样本图像集中的各训练样本图像具有：第一标签：目标检测框中心点像素位置硬标签概率矩阵；第二标签：目标检测框的宽和高；第三标签：目标检测框中心点像素位置偏移量；目标检测教师模型的对应于三类标签的预测输出结果包括：目标检测框中心点像素位置概率热力图、目标检测框的宽和高、目标检测框中心点像素位置偏移量；步骤S2，以知识蒸馏的方式通过目标检测教师模型改进目标检测学生模型的损失函数后，利用训练样本图像集以及预测输出结果，训练生成目标检测学生模型。

进一步地，目标检测学生模型的损失函数Loss_total定义为：

…………………………（1），

其中，Loss_hm为目标检测学生模型预测输出的目标检测框中心点像素位置概率热力图对应的损失函数部分；Loss_wh为目标检测学生模型预测输出的目标检测框的宽和高对应的损失函数部分；Loss_reg为目标检测学生模型预测输出的目标检测框中心点像素位置偏移量对应的损失函数部分；λ_wh为目标检测框的宽和高对应的损失函数部分的权重比例系数；λ_reg为目标检测框中心点像素位置偏移量的损失函数部分的权重比例系数。

进一步地，目标检测学生模型预测输出的目标检测框中心点像素位置概率热力图对应的损失函数部分Loss_hm定义为：

…………………………（2），

其中，

为第一标签对应的目标检测框中心点像素位置硬标签概率矩阵转化后得到的目标检测框中心点像素位置软标签概率矩阵指导的子损失函数；

为目标检测教师模型和第一标签对应的目标检测框中心点像素位置软标签概率矩阵共同指导的子损失函数；λ_hm为目标检测教师模型和第一标签对应的目标检测框中心点像素位置软标签概率矩阵共同指导的子损失函数的权重比例系数。

进一步地，

为focalloss损失函数，子损失函数

的计算公式定义为：

…………………（3）

为基于知识蒸馏的损失函数，子损失函数

的计算公式定义为：

………（4），

其中，N为目标检测学生模型预测输出的目标检测框中心点像素位置概率热力图中像素点的个数；

为将目标检测框中心点像素位置硬标签概率矩阵进行坐标变换后得到的目标检测框中心点像素位置软标签概率矩阵中的数位坐标点（x，y）的概率值；

为目标检测教师模型预测输出的目标检测框中心点像素位置概率热力图中像素点（x，y）的概率值；

为目标检测学生模型预测输出的目标检测框中心点像素位置概率热力图中像素点（x，y）的概率值；

和

均为指数常数。

进一步地，目标检测框中心点像素位置硬标签概率矩阵通过高斯核函数坐标变换后得到目标检测框中心点像素位置软标签概率矩阵；目标检测框中心点像素位置软标签概率矩阵的数位坐标点（x，y）的概率值

为高斯核函数的结果值G；高斯核函数为：

…………………………（5）其中，m，n分别为目标检测框中心点像素位置硬标签概率矩阵中概率值为1的数位坐标点的横坐标和纵坐标；x，y分别为目标检测框中心点像素位置软标签概率矩阵中任意一个数位坐标点的横坐标和纵坐标；

为对应于目标检测框的尺度常数。

进一步地，当目标检测框中心点像素位置硬标签概率矩阵中概率值为1的数位坐标点为多个时，目标检测框中心点像素位置软标签概率矩阵中各数位坐标点（x，y）的概率值

取多个高斯核函数结果值G中的最大者。

进一步地，目标检测学生模型预测输出的目标检测框的宽和高对应的损失函数部分Loss_wh为；

……………………………………………（6），其中，

为第二标签对应的目标检测框的宽和高指导的子损失函数；

为目标检测教师模型以及第二标签对应的目标检测框的宽和高共同指导的子损失函数；

为目标检测教师模型以及第二标签对应的目标检测框的宽和高共同指导的子损失函数的权重比例系数。

进一步地，子损失函数

的计算公式定义为：

……………………………………………………（7）

子损失函数

的计算公式定义为：

……………（8），

其中，K为训练样本图像中第二标签对应的目标检测框的宽和高的个数；k指代训练样本图像中任意一个第二标签；

为训练样本图像中第二标签对应的目标检测框的宽和高的乘积；

为目标检测学生模型预测输出的目标检测框的宽和高的乘积；

为目标检测教师模型预测输出的目标检测框的宽和高的乘积；

为

和

之间的L1距离；

为

和

之间的L2距离；

为

和

之间的L2距离；

为第一间隔常数。

进一步地，目标检测学生模型预测输出的目标检测框中心点像素位置偏移量对应的损失函数部分Loss_reg 为：

…………………………………（9），

其中，

为第三标签对应的目标检测框中心点像素位置偏移量指导的子损失函数；

为目标检测教师模型以及第三标签对应的目标检测框中心点像素位置偏移量共同指导的子损失函数；

为目标检测教师模型以及第三标签对应的目标检测框中心点像素位置偏移量共同指导的子损失函数的权重比例系数。

进一步地，子损失函数

的计算公式定义为：

……………………………………………………（10）

子损失函数

的计算公式定义为：

……………（11）

其中，Z为训练样本图像中第三标签对应的目标检测框中心点像素位置偏移量的个数；z指代训练样本图像中任意一个第三标签；

为训练样本图像中第三标签对应的目标检测框中心点像素位置偏移量的横轴偏移量与纵轴偏移量乘积；

为目标检测学生模型预测输出的目标检测框中心点像素位置偏移量的横轴偏移量与纵轴偏移量的乘积；

为目标检测教师模型预测输出的目标检测框中心点像素位置偏移量的的横轴偏移量与纵轴偏移量乘积；

为

和

之间的L1距离；

为

和

之间的L2距离；

为

和

之间的L2距离；

为第二间隔常数。

应用本发明的技术方案，由于对训练样本图像集的训练样本图像进行了标签分类，训练完成的目标检测教师模型的目标检测任务根据分类后的标签能够得到清晰的区分，具体地，目标检测教师模型的预测输出结果中，获得目标检测框中心点像素位置概率热力图属于分类任务，获得目标检测框的宽和高以及获得目标检测框中心点像素位置偏移量均为回归任务。这样，在使用目标检测教师模型指导训练目标检测学生模型的过程中，目标检测学生模型的损失函数能够针根据目标检测任务的任务类型进行针对性地得到分级分类改进优化，从而在依托知识蒸馏确保得到的目标检测学生模型的网络结构足够简单以满足终端设备使用需求的同时，更能够确保目标检测学生模型更好地迁移获取目标检测教师模型的知识，遗传目标检测教师模型的性能，使得目标检测学生模型具有优良的识别效果和检测精度，具有良好的实用性。

附图说明

构成本申请的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1示出了根据本发明的基于知识蒸馏的目标检测模型训练方法的步骤流程图；

图2示出实施本发明的基于知识蒸馏的目标检测模型训练方法时，训练样本图像集中的一张可选实施例的训练样本图像的示意图，示意图中有一个目标行人，该目标行人的头部作为检测目标，使用目标检测框框选出；

图3示出了图2中的训练样本图像的第一标签，即目标检测框中心点像素位置硬标签概率矩阵；

图4示出了图3中的目标检测框中心点像素位置硬标签概率矩阵转化后的目标检测框中心点像素位置软标签概率矩阵。

其中，上述附图包括以下附图标记：

A、目标行人；B、目标行人的头部；C、目标检测框。

具体实施方式

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例。此外，术语“包括”、“和”、“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为了解决利用现有技术中的知识蒸馏方法训练获取的目标检测模型无法同时保证网络结构简单而满足终端设备使用需求，以及目标检测模型的识别率优良以确保模型检测精度的问题，本发明提供了一种基于知识蒸馏的目标检测模型训练方法。

图1是根据本发明一种可选实施例的基于知识蒸馏的目标检测模型训练方法的步骤流程图。如图1所示，该的目标检测模型训练方法包括：步骤S1，利用训练样本图像集训练生成目标检测教师模型，训练样本图像集中的各训练样本图像具有：第一标签：目标检测框中心点像素位置硬标签概率矩阵；第二标签：目标检测框的宽和高；第三标签：目标检测框中心点像素位置偏移量；目标检测教师模型的对应于三类标签的预测输出结果包括：目标检测框中心点像素位置概率热力图、目标检测框的宽和高、目标检测框中心点像素位置偏移量；步骤S2，以知识蒸馏的方式通过目标检测教师模型改进目标检测学生模型的损失函数后，利用训练样本图像集以及预测输出结果，训练生成目标检测学生模型。

由于对训练样本图像集的训练样本图像进行了标签分类，训练完成的目标检测教师模型的目标检测任务根据分类后的标签能够得到清晰的区分，具体地，目标检测教师模型的预测输出结果中，获得目标检测框中心点像素位置概率热力图属于分类任务，获得目标检测框的宽和高以及获得目标检测框中心点像素位置偏移量均为回归任务。这样，在使用目标检测教师模型指导训练目标检测学生模型的过程中，目标检测学生模型的损失函数能够针根据目标检测任务的任务类型进行针对性地得到分级分类改进优化，从而在依托知识蒸馏确保训练得到的目标检测学生模型的网络结构足够简单以满足终端设备使用需求的同时，更能够确保目标检测学生模型更好地迁移获取目标检测教师模型的知识，遗传目标检测教师模型的性能，使得目标检测学生模型具有优良的识别效果和检测精度，具有良好的实用性。

可选地，目标检测任务的获得目标检测框中心点像素位置概率热力图属于二分类任务。

需要解释说明的是，在使用训练样本图像集中的训练样本图像对目标检测教师模型或目标检测学生模型训练之前，需要对所有的训练样本图像进行三类标签的标注，以一张训练样本图像为例，如图2所示，该训练样本图像中仅有一个目标行人A，采用人工标注的方式使用目标检测框C框选出目标行人的头部B。

之后使用预设程序对该训练样本图像进行标签标注，标注的第一标签为目标检测框中心点像素位置硬标签概率矩阵（如图3所示），目标检测框中心点像素位置硬标签概率矩阵的各数位概率值一一对应于训练样本图像的各像素点为目标检测框中心点的概率值，其值为0或1，其中，数位概率值为1的数位坐标点即为目标检测框C框的几何中心点，其余数位概率值为0。当然，当训练样本图像中有多个目标行人时，数位概率值为1的数位坐标点也为对应的多个。为了保证目标检测教师模型以及目标检测学生模型可以更好地学习到练样本图像中第一标签的特征信息，以提高模型检测精度，需要将目标检测框中心点像素位置硬标签概率矩阵转化得到目标检测框中心点像素位置软标签概率矩阵；这是因为，虽然在训练样本图像中每个目标检测框的只有一个中心点，但是在该中心点附近周围的像素点仍然会表征目标行人的头部的特征，应该与头部之外的像素点以真实的区别，因此，采用目标检测框中心点像素位置软标签概率矩阵能够使得目标检测教师模型以及目标检测学生模型学习到训练样本图像中更真实的特征信息。图4为图3中的目标检测框中心点像素位置硬标签概率矩阵经过转化后获得的目标检测框中心点像素位置软标签概率矩阵；在该图中，与数位概率值为1的数位坐标点邻近的数位坐标点的数位概率值会更接近1（图未示），而远离数位概率值为1的数位坐标点邻近的数位坐标点的数位概率值更接近0。

在本实施例中，两者的转化方法为：目标检测框中心点像素位置硬标签概率矩阵通过高斯核函数坐标变换后得到目标检测框中心点像素位置软标签概率矩阵；目标检测框中心点像素位置软标签概率矩阵的数位坐标点（x，y）的概率值

为高斯核函数的结果值G；高斯核函数为：

…………………………（5）

其中，m，n分别为目标检测框中心点像素位置硬标签概率矩阵中概率值为1的数位坐标点的横坐标和纵坐标；即目标检测框中心点像素位置硬标签概率矩阵的第m列第n行；x，y分别为目标检测框中心点像素位置软标签概率矩阵中任意一个数位坐标点的横坐标和纵坐标；即目标检测框中心点像素位置软标签概率矩阵的第x列第y行；

为对应于目标检测框的尺度常数。可选地，目标检测框的尺度常数

的取值范围在10像素至80像素之间。

当然，当目标检测框中心点像素位置硬标签概率矩阵中概率值为1的数位坐标点为多个时，即当图2中的目标检测框C为多个时，目标检测框中心点像素位置软标签概率矩阵中各数位坐标点（x，y）的概率值

取多个高斯核函数结果值G中的最大者。

对训练样本图像标注的第二标签为目标检测框的宽和高（未图示），对训练样本图像标注的第三标签为目标检测框中心点像素位置偏移量（未图示）。

在本实施例中，目标检测学生模型的损失函数Loss_total定义为：

…………………………（1），其中，

Loss_hm为目标检测学生模型预测输出的目标检测框中心点像素位置概率热力图对应的损失函数部分；Loss_wh为目标检测学生模型预测输出的目标检测框的宽和高对应的损失函数部分；Loss_reg为目标检测学生模型预测输出的目标检测框中心点像素位置偏移量对应的损失函数部分；λ_wh为目标检测框的宽和高对应的损失函数部分的权重比例系数；λ_reg为目标检测框中心点像素位置偏移量的损失函数部分的权重比例系数。

可选地，目标检测框的宽和高对应的损失函数部分的权重比例系数λ_wh和目标检测框中心点像素位置偏移量的损失函数部分的权重比例系数λ_reg的取值范围均为[0.5，1），这说明目标检测学生模型预测输出的目标检测框中心点像素位置概率热力图所占权重最大，是影响目标检测学生模型后期检测精度的最关键因素。

可选地，目标检测框的宽和高对应的损失函数部分的权重比例系数λ_wh大于目标检测框中心点像素位置偏移量的损失函数部分的权重比例系数λ_reg。这是因为相比于目标检测框中心点像素位置偏移量，目标检测学生模型后期检测精度受到目标检测框的宽和高的影响更重。

具体而言，目标检测学生模型的损失函数Loss_total分级的第一部分为目标检测学生模型预测输出的目标检测框中心点像素位置概率热力图对应的损失函数部分Loss_hm，通过知识蒸馏对这部分分类任务的损失函数进行优化改进，其对应的损失函数部分Loss_hm定义为：

…………………………（2），

其中，

可选地，子损失函数

的权重比例系数λ_hm的取值范围为[0.5,1），确保其不超过目标检测框中心点像素位置软标签概率矩阵指导的子损失函数

的权重。

需要说明的是，本实施例没有给出目标检测教师模型预测输出的以及目标检测学生模型预测输出的目标检测框中心点像素位置概率热力图的图示，但是模型的理想训练状态是希望两者预测输出的目标检测框中心点像素位置概率热力图所对应的目标检测框中心点像素位置概率矩阵都学习靠近图4中的目标检测框中心点像素位置软标签概率矩阵，从而确保目标检测教师模型以及目标检测学生模型均具备良好的检测精度。

目标检测框中心点像素位置软标签概率矩阵指导的子损失函数

用于评价目标检测学生模型预测输出的目标检测框中心点像素位置概率热力图所对应的目标检测框中心点像素位置概率矩阵与目标检测框中心点像素位置软标签概率矩阵之间的差异。

本实施例中，

为focalloss损失函数，其主要是为了平衡检测任务中正负样本不均衡以及出现困难样本的问题，子损失函数

的计算公式定义为：

…………………（3）

为基于知识蒸馏的损失函数，用来评价目标检测学生模型的预测输出和目标检测教师模型的预测输出之间的分布差异，相比较于目标检测框中心点像素位置软标签概率矩阵指导的子损失函数

，子损失函数

增加了

和

，用于指导标检测学生模型的网络结构学习标检测教师模型的网络结构后的输出分布，子损失函数

的计算公式定义为：

………（4）

和

均为指数常数。

再上述公式（3）和公式（4）中，

和

是为了增加困难样本的权重系数，目标检测学生模型的预测输出偏差越大，两权重系数越大。

是用来调节负样本损失占比的权重系数，负样本越偏离目标，该权重系数越大。可选地，

和

的取值范围为[2,4]。

目标检测学生模型的损失函数Loss_total分级的第二部分为目标检测学生模型预测输出的目标检测框的宽和高对应的损失函数部分Loss_wh，通过知识蒸馏对这部分回归任务的损失函数进行优化改进，其对应的损失函数部分Loss_wh用L1损失函数和L2损失函数相结合的方式定义为：

……………………………………………（6），

其中，

为第二标签对应的目标检测框的宽和高指导的子损失函数；

可选地，子损失函数

的权重比例系数

的取值范围为[0.5，1），确保其不超过第二标签对应的目标检测框的宽和高的子损失函数

的权重。

进一步地，子损失函数

作为L1损失函数部分，其计算公式定义为：

……………………………………………………（7）

子损失函数

作为L2损失函数部分，其计算公式定义为：

……………（8）

为

和

之间的L1距离；

为

和

之间的L2距离；

为

和

之间的L2距离；

为第一间隔常数。

通过判断目标检测学生模型的预测输出与原始输入的训练样本图像的第二标签的差距

大于目标检测学生模型的预测输出与目标检测教师模型的预测输出的差距

，并且超第一间隔常数

时，会给添加目标检测学生模型添加第二标签的L2损失。

可选地，第一间隔常数

的取值范围为[10,20]。

目标检测学生模型的损失函数Loss_total分级的第三部分为目标检测学生模型预测输出的目标检测框中心点像素位置偏移量对应的损失函数部分Loss_reg，通过知识蒸馏对这部分回归任务的损失函数进行优化改进，其对应的损失函数部分Loss_reg用L1损失函数和L2损失函数相结合的方式定义为：

……………………………………………（9），

其中，

可选地，子损失函数

的权重比例系数

的取值范围为[0.5，1），确保其不超过第三标签对应的目标检测框中心点像素位置偏移量指导的子损失函数

的权重。需要说明的是，目标检测框中心点像素位置偏移量即为目标检测学生模型预测输出的目标检测框中心点的像素坐标位置与训练样本图像中的实际位置的差值。

进一步地，子损失函数

作为L1损失函数部分，其计算公式定义为：

…………………………………………………（10）

子损失函数

作为L2损失函数部分，其计算公式定义为：

……………（11）

为

和

之间的L1距离；

为

和

之间的L2距离；

为

和

之间的L2距离；

为第二间隔常数。

通过判断目标检测学生模型预测输出与原始输入的训练样本图像的第三标签的差距的差距

大于目标检测学生模型预测输出与目标检测教师模型的预测输出的差距

，并且超第二间隔常数

时，会给添加目标检测学生模型添加第三标签的L2损失。

可选地，第二间隔常数

的取值范围为[0.01,0.05]。

需要说明的是，本发明提供的，目标检测教师模型的网络结构和目标检测学生模型的网络结构均采用沙漏网络结构，区别在于目标检测教师模型的网络结构的网络深度和宽度都要比目标检测学生模型的网络结构的深度和宽度大，目标检测教师模型的网络结构的参数量是目标检测学生模型的网络结构的参数量的5-10倍。通过本发明提供的基于知识蒸馏的目标检测模型训练方法训练出来的目标检测学生模型的召回率和检测精度都要优于一般的知识蒸馏方式训练方式训练出来的目标检测学生模型。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在上述计算机可读取的存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在存储介质中，包括若干指令用以使得一台或多台计算机设备（可为个人计算机、服务器或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的客户端，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于知识蒸馏的目标检测模型训练方法，其特征在于，包括：

步骤S1，利用训练样本图像集训练生成目标检测教师模型，所述训练样本图像集中的各训练样本图像具有：第一标签：目标检测框中心点像素位置硬标签概率矩阵；第二标签：目标检测框的宽和高；第三标签：目标检测框中心点像素位置偏移量；所述目标检测教师模型的对应于三类标签的预测输出结果包括：目标检测框中心点像素位置概率热力图、目标检测框的宽和高、目标检测框中心点像素位置偏移量；

步骤S2，以知识蒸馏的方式通过所述目标检测教师模型改进所述目标检测学生模型的损失函数后，利用所述训练样本图像集以及所述预测输出结果，训练生成目标检测学生模型；

所述目标检测学生模型的损失函数Loss_total定义为：

Loss_total＝Loss_hm+λ_whLoss_wh+λ_regLoss_reg..................................(1)，其中，

Loss_hm为所述目标检测学生模型预测输出的目标检测框中心点像素位置概率热力图对应的损失函数部分；

Loss_wh为所述目标检测学生模型预测输出的目标检测框的宽和高对应的损失函数部分；

Loss_reg为所述目标检测学生模型预测输出的目标检测框中心点像素位置偏移量对应的损失函数部分；

λ_wh为所述目标检测框的宽和高对应的损失函数部分的权重比例系数；

λ_reg为所述目标检测框中心点像素位置偏移量的损失函数部分的权重比例系数；

所述目标检测学生模型预测输出的目标检测框中心点像素位置概率热力图对应的损失函数部分Loss_hm定义为：

其中，

为目标检测教师模型和第一标签对应的目标检测框中心点像素位置软标签概率矩阵共同指导的子损失函数；

λ_hm为目标检测教师模型和第一标签对应的目标检测框中心点像素位置软标签概率矩阵共同指导的子损失函数的权重比例系数。

2.根据权利要求1所述的基于知识蒸馏的目标检测模型训练方法，其特征在于，

为focalloss损失函数，所述子损失函数

的计算公式定义为：

为基于知识蒸馏的损失函数，所述子损失函数

的计算公式定义为：

其中，N为所述目标检测学生模型预测输出的目标检测框中心点像素位置概率热力图中像素点的个数；

H_xy为将所述目标检测框中心点像素位置硬标签概率矩阵进行坐标变换后得到的目标检测框中心点像素位置软标签概率矩阵中的数位坐标点(x，y)的概率值；

为目标检测教师模型预测输出的目标检测框中心点像素位置概率热力图中像素点(x，y)的概率值；

为目标检测学生模型预测输出的目标检测框中心点像素位置概率热力图中像素点(x，y)的概率值；

α和β均为指数常数。

3.根据权利要求1所述的基于知识蒸馏的目标检测模型训练方法，其特征在于，所述目标检测框中心点像素位置硬标签概率矩阵通过高斯核函数坐标变换后得到所述目标检测框中心点像素位置软标签概率矩阵；所述目标检测框中心点像素位置软标签概率矩阵的数位坐标点(x，y)的概率值H_xy为所述高斯核函数的结果值G；所述高斯核函数为：