CN111199175A

CN111199175A - 一种目标检测网络模型的训练方法及装置

Info

Publication number: CN111199175A
Application number: CN201811384930.6A
Authority: CN
Inventors: 沙浩; 戴依若
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2018-11-20
Filing date: 2018-11-20
Publication date: 2020-05-26

Abstract

本发明实施例提供了一种目标检测网络模型的训练方法及装置，该方法包括：获取第一训练样本集，第一训练样本集由多个标记有真实目标物体框的第一目标图像组成；采用目标检测算法对第一训练样本集进行训练，得到第一目标检测网络模型；获取第二训练样本集，第二训练样本集至少包括多个未标记真实目标物体框的背景图像；将第二训练样本集输入至第一目标检测网络模型进行训练，得到第二目标检测网络模型。即在进行目标检测网络模型的训练时，加入了多个背景图像，背景图像中的背景可作为训练目标检测网络模型的负样本，从而提高训练得到的目标检测网络模型的物体检出率和降低目标检测网络模型的误检率。

Description

一种目标检测网络模型的训练方法及装置

技术领域

本发明涉及目标检测技术领域，尤其涉及一种目标检测网络模型的训练方法及装置。

背景技术

深度学习即深度神经网络是近年来的研究和应用的热点之一。深度神经网络相比传统的神经网络，最大的区别是网络的层数加深，在获得更多数据的情况下同时具有更多的计算资源，从而获得了更好的效果。深度学习得以引起人们的广泛关注，依赖于2012年的ImageNet图片分类比赛中，由研究人员采用深度神经网络方法，获得了对于非深度学习方法取得压倒性优势。自2012年以来，深度学习方法在很多算法方面，比如图像，语音，自然语言处理等领域均取得了突破性发展。在图像领域，对于目标检测，深度神经网络已经能取得非常好的效果。

目标检测是计算机视觉中的经典问题之一，在多种应用场景例如视频安全监控***、自动驾驶等中有着重要的应用。目标检测技术是将图像输入至目标检测网络模型，目标检测网络模型检测到目标物体并用矩形框去标识出图像中目标物体的位置，并给出目标物体的类别。

现有技术中的目标检测网络模型是通过对大量的训练样本图像进行训练得到，训练样本图像是标记有真实目标物体框(ground truth box)的目标图像，即具有真实的目标物体的图像，可以理解的是，用于训练目标检测网络模型的训练样本图像越多，得到的目标检测网络模型的检测准确率越高，然而，在有些情况下，想要获得大量的标记有真实目标物体框的训练样本图像比较困难，即可用于训练目标检测网络模型的训练样本图像有限，从而使得训练得到的目标检测网络模型的检测准确率难以提高，在实际应用中，由于真实目标物体出现的背景情况各式各样，背景受到光线变化的影响，在训练样本中很难包含各种变化的背景情况，所以网络模型通常在复杂背景，新的没有训练过的背景图片具有比较差的泛化能力，容易出现误检。

发明内容

本发明实施例要解决的技术问题是提供一种目标检测网络模型的训练方法及装置，用于解决现有的目标检测网络模型在复杂背景和新场景下误检率测高的问题。

为解决上述技术问题，本发明实施例提供的一种目标检测网络模型的训练方法，包括：

获取第一训练样本集，所述第一训练样本集由多个第一目标图像组成，所述第一目标图像为标记有真实目标物体框的图像；

采用目标检测算法对所述第一训练样本集进行训练，得到第一目标检测网络模型；

获取第二训练样本集，所述第二训练样本集至少包括多个背景图像，所述背景图像为未标记真实目标物体框的图像；

将所述第二训练样本集输入至所述第一目标检测网络模型进行训练，得到第二目标检测网络模型。

可选的，所述采用目标检测算法对所述第一训练样本集进行训练，得到第一目标检测网络模型包括：

采用目标检测算法对所述第一目标图像进行卷积处理，得到所述第一目标图像的特征图；

获取所述特征图上的每一个锚点的候选框；

将所述候选框与所述第一目标图像的真实目标物体框进行匹配，根据匹配结果，从所述候选框中选取出正样本和负样本；

采用所述正样本和所述负样本进行训练，得到所述第一目标检测网络模型。

可选的，所述将所述第二训练样本集输入至所述第一目标检测网络模型进行训练，得到第二目标检测网络模型包括：

针对所述第二训练样本集中的所述背景图像，将所述背景图像输入至所述第一目标检测网络模型，得到所述背景图像的特征图；

获取所述特征图中的每一个锚点的候选框；

从所有所述候选框中选择部分候选框作为负样本；

更新所述负样本的置信度，所述置信度表示所述候选框内有目标物体存在的概率；

采用所述负样本对所述第一目标检测网络模型进行训练，以得到所述第二目标检测网络模型。

可选的，所述从所有所述候选框中选择部分候选框作为负样本包括：

从所有所述候选框中随机选择部分候选框作为负样本；或者

获取所述候选框的置信度，选择置信度大于指定阈值的候选框作为负样本；或者

获取所述候选框的置信度，对所有所述候选框的置信度按照从大到小或者从小到大的顺序进行排序，按照排序结果选择前n个或后n个候选框作为负样本，n为大于或等于1的正整数；或者

获取所述候选框的置信度，选择置信度大于指定阈值的候选框，对所述置信度大于指定阈值的候选框按照从大到小或者从小到大的顺序进行排序，按照排序结果，选择前n个或后n个候选框作为负样本，n为大于或等于1的正整数。

可选的，所述第二训练样本集还包括：多个第二目标图像组成，所述第二目标图像为标记有真实目标物体框的图像；所述将所述第二训练样本集输入至所述第一目标检测网络模型进行训练，得到第二目标检测网络模型包括：

针对所述第二训练样本集中的所述第二目标图像，将所述第二目标图像输入至所述第一目标检测网络模型，得到所述第二目标图像的特征图；

获取所述特征图中每一个锚点的候选框；

将所述候选框与所述第二目标图像的真实目标物体框进行匹配，根据匹配结果，从所述候选框中选取出正样本和负样本；

采用所述正样本和所述负样本对所述第一目标检测网络模型进行训练，以得到所述第二目标检测网络模型。

本发明实施例还提供一种目标检测网络模型的训练装置，包括：

第一获取模块，用于获取第一训练样本集，所述第一训练样本集由多个第一目标图像组成，所述第一目标图像为标记有真实目标物体框的图像；

第一训练模块，用于采用目标检测算法对所述第一训练样本集进行训练，得到第一目标检测网络模型；

第二获取模块，用于获取第二训练样本集，所述第二训练样本集至少包括多个背景图像，所述背景图像为未标记真实目标物体框的图像；

第二训练模块，用于将所述第二训练样本集输入至所述第一目标检测网络模型进行训练，得到第二目标检测网络模型。

可选的，所述第一训练模块包括：

第一获得子模块，用于采用目标检测算法对所述第一目标图像进行卷积处理，得到所述第一目标图像的特征图；

第一获取子模块，用于获取所述特征图上的每一个锚点的候选框；

第一匹配子模块，用于将所述候选框与所述第一目标图像的真实目标物体框进行匹配，用于根据匹配结果，从所述候选框中选取出正样本和负样本；

第一训练子模块，用于采用所述正样本和所述负样本进行训练，得到所述第一目标检测网络模型。

可选的，所述第二训练模块包括：

第二获得子模块，用于针对所述第二训练样本集中的所述背景图像，将所述背景图像输入至所述第一目标检测网络模型，得到所述背景图像的特征图；

第二获取子模块，用于获取所述特征图中的每一个锚点的候选框；

选择子模块，用于从所有所述候选框中选择部分候选框作为负样本；

更新子模块，用于更新所述负样本的置信度，所述置信度表示所述候选框内有目标物体存在的概率；

第二训练子模块，用于采用所述负样本对所述第一目标检测网络模型进行训练，以得到所述第二目标检测网络模型。

可选的，所述选择子模块具体用于从所有所述候选框中随机选择部分候选框作为负样本；或者，获取所述候选框的置信度，选择置信度大于指定阈值的候选框作为负样本；或者，获取所述候选框的置信度，对所有所述候选框的置信度按照从大到小或者从小到大的顺序进行排序，按照排序结果选择前n个或后n个候选框作为负样本，n为大于或等于1的正整数；或者，获取所述候选框的置信度，选择置信度大于指定阈值的候选框，对所述置信度大于指定阈值的候选框按照从大到小或者从小到大的顺序进行排序，按照排序结果，选择前n个或后n个候选框作为负样本，n为大于或等于1的正整数。

可选的，所述第二训练样本集还包括：多个第二目标图像组成，所述第二目标图像为标记有真实目标物体框的图像；所述第二训练模块包括：

第三获得子模块，用于针对所述第二训练样本集中的所述第二目标图像，将所述第二目标图像输入至所述第一目标检测网络模型，得到所述第二目标图像的特征图；

第三获取子模块，用于获取所述特征图中的每一个锚点的候选框；

第二匹配子模块，用于将所述候选框与所述第二目标图像的真实目标物体框进行匹配，根据匹配结果，从所述候选框中选取出正样本和负样本；

第三训练子模块，用于采用所述正样本和所述负样本对所述第一目标检测网络模型进行训练，以得到所述第二目标检测网络模型。

与现有技术相比，本发明实施例提供的目标检测网络模型的训练方法及装置，在进行目标检测网络模型的训练时，加入了未标记真实目标物体框的多个背景图像，背景图像中的背景可作为训练目标检测网络模型的负样本，从而提高训练得到的目标检测网络模型在复杂背景下的误检率，并且在有些情况下，背景图像与目标图像相比更为容易获得，可采用大量的背景图像进一步提高训练得到的目标检测网络模型的泛化能力。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一实施例的目标检测网络模型的训练方法的流程示意图；

图2为本发明实施例的目标图像的示意图；

图3为本发明实施例的第一目标检测网络模型的训练方法的流程示意图；

图4为本发明实施例的图像的特征图(feature map)的示意图；

图5为IOU(交并比)的计算方法示意图；

图6为本发明实施例的采用背景图像训练第二目标检测网络模型的训练方法的流程示意图；

图7为本发明实施例的采用第二目标图像训练第二目标检测网络模型的训练方法的流程示意图；

图8为本发明一实施例的目标检测网络模型的训练装置的结构示意图；

图9为本发明另一实施例的目标检测网络模型的训练装置的结构示意图。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述。在下面的描述中，提供诸如具体的配置和组件的特定细节仅仅是为了帮助全面理解本发明的实施例。因此，本领域技术人员应该清楚，可以对这里描述的实施例进行各种改变和修改而不脱离本发明的范围和精神。另外，为了清楚和简洁，省略了对已知功能和构造的描述。

应理解，说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此，在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外，这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。

在本发明的各种实施例中，应理解，下述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

请参考图1，图1为本发明一实施例的目标检测网络模型的训练方法的流程示意图，该训练方法包括：

步骤11：获取第一训练样本集，所述第一训练样本集由多个第一目标图像组成，所述第一目标图像为标记有真实目标物体框的图像；

本发明实施例中，每一所述第一目标图像中包括至少一个目标物体，举例来说，当汽车为目标对象，第一目标图像中可以只包括一个汽车或者包括多个汽车；当汽车和行人为目标对象，第一目标图像中可以包括汽车和行人。

第一目标图像的真实目标物体框(ground truth box)通过人为方式标记，标记目标物体在第一目标图像中所处区域，通常采用矩形框标记。请参考图2，图2中为汽车为目标对象，201所指矩形框为真实目标物体框，汽车位于真实目标物体框内。

步骤12：采用目标检测算法对所述第一训练样本集进行训练，得到第一目标检测网络模型；

所述目标检测算法可以为：fast R-CNN(Regions with CNN)，faster R-CNN，maskR-CNN或SSD(Spatial Pyramid Pooling，空间金字塔池化)等深度学习算法。

步骤13：获取第二训练样本集，所述第二训练样本集至少包括多个背景图像，所述背景图像为未标记真实目标物体框的图像；

本发明实施例中，所述背景图像为不具有目标物体的图像，优选地，所述背景图像中的背景为与所述目标物体具有关联的背景，举例来说，训练得到的目标检测网络模型应用于道路安全监控，目标物体为汽车，而背景图像可以是包含道路、交通标志和/或建筑物等背景的图像。

步骤14：将所述第二训练样本集输入至所述第一目标检测网络模型进行训练，得到第二目标检测网络模型。

本发明实施例中，在进行目标检测网络模型的训练时，加入了未标记真实目标物体框的多个背景图像，背景图像中的背景可作为训练目标检测网络模型的负样本，从而提高训练得到的目标检测网络模型在复杂背景下的误检率，并且在有些情况下，背景图像与目标图像相比更为容易获得，可采用大量的背景图像进一步提高训练得到的目标检测网络模型的泛化能力。

下面对如何采用目标检测算法对所述第一训练样本集进行训练，得到第一目标检测网络模型进行说明。

请参考图3，图3为本发明实施例的第一目标检测网络模型的训练方法的流程示意图，该训练方法包括：

步骤31：采用目标检测算法对所述第一目标图像进行卷积处理，得到所述第一目标图像的特征图；

步骤32：获取所述特征图上的每一个锚点的候选框；

下面对候选框的获取方法进行说明。

首先，目标检测算法采用不同卷积层对待处理图像(例如图2中的图像)进行卷积运算，得到对图像的不同特征的映射，即特征图(feature map)，如图4所示，图4中的feature map是一个8×8的feature map，feature map中的每一个小格子称为锚点，如图4中，feature map具有64个锚点。每个锚点具有多个固定大小的候选框(图4中的虚线框)，图4中，每个cell具有4个固定大小的候选框，因此，整个feature map具有8×8×4个候选框。

当然，目标检测算法中，feature map的数量不限于为一个，feature map的尺寸也不限于为8×8，也可以为4×4等，每个cell的候选框的个数也不限于为4个。

步骤33：将所述候选框与所述第一目标图像的真实目标物体框进行匹配，根据匹配结果，从所述候选框中选取出正样本和负样本；

在本发明的一些实施例中，可以通过候选框的IOU(Intersection over Union，交并比)来确定候选框是正样本还是负样本。

所谓IOU是指候选框与真实目标物体框的重叠度，如图5所示，矩形框A、B的IOU的计算公式为：IOU＝(A∩B)/(A∪B)，即矩形框A、B的重叠面积占A、B并集的面积比例。

在一些实施例中，可以选取IOU大于第一阈值的候选框作为正样本，选取IOU小于第二阈值的候选框作为负样本，第一阈值例如为0.7，第二阈值例如为0.3。

通过上述方法获得的负样本的数量通常远多于正样本的数量，为了保证正样本和负样本的比例的均衡，采用比如对负样本随机采样方法，比如选取干扰性比较大的负样本方法等方法，使正样本和负样本的比例保持在指定比例(例如1:3)。

当然，本发明实施例中，也不排除采用其他方式选择正样本和负样本，本发明并不进行限定。

步骤34：采用所述正样本和所述负样本进行训练，得到所述第一目标检测网络模型。

对于正样本训练来说，与真实目标物体框匹配成功说明这个候选框包含目标物体，训练的目的是保证候选框的分类confidence的同时，将候选框尽可能回归到真实目标物体框。

下面对如何将所述第二训练样本集输入至所述第一目标检测网络模型进行训练，得到第二目标检测网络模型进行说明。这一步训练的特点是，对于加入的背景图像，只选择负样本框进行训练，而且只更新被训练框的confidence值，坐标值和类别值不进行更新。对于第二训练样本集中包含目标物体的第二图像图像，训练方法可以与第一步训练过程(即第一目标图像的训练)一样，不同的是，此次训练的基础是第一目标检测网络模型。

请参考图6，图6为本发明实施例的第二目标检测网络模型的训练方法的流程示意图，该训练方法包括：

步骤61：针对所述第二训练样本集中的背景图像，将所述背景图像输入至第一目标检测网络模型，得到背景图像的特征图；

步骤62：获取所述特征图中的每一个锚点的候选框；

步骤63：从所有所述候选框中选择部分候选框作为负样本；

本发明实施例中，可以采用多种方式，从多个候选框中选择部分候选框作为负样本，下面举例进行说明。

在本发明的一些实施例中，可以从多个候选框中随机选择部分候选框作为负样本。

在本发明的另外一些实施例中，可以首先获取所述候选框的置信度，然后选择置信度大于指定阈值的候选框作为负样本。所述指定阈值可以根据需要设定。

在本发明的另外一些实施例中，可以首先获取所述候选框的置信度，然后对所有所述候选框的置信度按照从大到小或者从小到大的顺序进行排序，按照排序结果选择前n个或后n个候选框作为负样本，n为大于或等于1的正整数。

在本发明的另外一些实施例中，可以首先获取所述候选框的置信度，选择置信度大于指定阈值的候选框，然后对所述置信度大于指定阈值的候选框按照从大到小或者从小到大的顺序进行排序，按照排序结果，选择前n个或后n个候选框作为负样本，n为大于或等于1的正整数。

本发明实施例中，因为需要把置信度大的候选框进行调整，在进行排序时，优选地，按照从大到小的顺序排序，然后取序列前面的候选框作为负样本。

选择负样本的方式不限于上述方法，再次不再一一列举。

步骤64：更新所述负样本的置信度，所述置信度表示所述候选框内有目标物体存在的概率；

步骤65：采用所述负样本对所述第一目标检测网络模型进行训练，以得到所述第二目标检测网络模型。

本发明实施例中，通过从背景图像中选取负样本，对负样本的有物体存在的置信度进行更新，作为背景对目标检测网络模型进行训练，从而降低目标检测网络模型的误检测率。

在本发明的一些实施例中，所述第二训练样本集还可以包括：多个第二目标图像组成，所述第二目标图像为标记有真实目标物体框的图像；此时，请参考图7，针对第二目标图像，可以采用如第一目标图像相同的方法进行训练，即包括以下步骤：

步骤71：针对第二训练样本集中的第二目标图像，将所述第二目标图像输入至所述第一目标检测网络模型，得到所述第二目标图像的特征图；

步骤72：获取所述特征图中的每一个锚点的候选框；

步骤:73：将所述候选框与所述第二目标图像的真实目标物体框进行匹配，根据匹配结果，从所述候选框中选取出正样本和负样本；

步骤74：采用所述正样本和所述负样本对所述第一目标检测网络模型进行训练，以得到所述第二目标检测网络模型。

本发明实施例中，再次采用标记有真实目标物体框的目标图像对第一目标检测网络模型进行训练，能够进一步提高训练得到的第二目标检测网络模型的误检测率。

本发明实施例中，优选的，所述第二目标图像为所述第一目标图像不同的图像。

本发明实施例中，第二目标图像和背景图像的比例可以根据需要设定，例如，可以第二目标图像和背景图像的数量可以相同，即1:1。

基于同一发明构思，请参考图8，本发明实施例还提供一种目标检测网络模型的训练装置80，包括：

第一获取模块81，用于获取第一训练样本集，所述第一训练样本集由多个第一目标图像组成，所述第一目标图像为标记有真实目标物体框的图像；

第一训练模块82，用于采用目标检测算法对所述第一训练样本集进行训练，得到第一目标检测网络模型；

第二获取模块83，用于获取第二训练样本集，所述第二训练样本集至少包括多个背景图像，所述背景图像为未标记真实目标物体框的图像；

第二训练模块84，用于将所述第二训练样本集输入至所述第一目标检测网络模型进行训练，得到第二目标检测网络模型。

本发明实施例中，在进行目标检测网络模型的训练时，加入了未标记真实目标物体框的多个背景图像，背景图像中的背景可作为训练目标检测网络模型的负样本，提高训练得到的目标检测网络模型在复杂背景下的误检测率，并且在有些情况下，背景图像与目标图像相比更为容易获得，可采用大量的背景图像进一步提高训练得到的目标检测网络模型的泛化能力。

在本发明的一些实施例中，所述第一训练模块82包括：

第一匹配子模块，用于将所述候选框与所述第一目标图像的真实目标物体框进行匹配，根据匹配结果，从所述候选框中选取出正样本和负样本；

在本发明的一些实施例中，所述第二训练模块84包括：

在本发明的一些实施例中，所述选择子模块具体用于从所有所述候选框中随机选择部分候选框作为负样本。

在本发明的一些实施例中，所述选择子模块具体用于获取所述候选框的置信度，选择置信度大于指定阈值的候选框作为负样本；

在本发明的一些实施例中，所述选择子模块具体用于获取所述候选框的置信度，对所有所述候选框的置信度按照从大到小或者从小到大的顺序进行排序，按照排序结果选择前n个或后n个候选框作为负样本，n为大于或等于1的正整数。

在本发明的一些实施例中，所述选择子模块具体用于获取所述候选框的置信度，选择置信度大于指定阈值的候选框，对所述置信度大于指定阈值的候选框按照从大到小或者从小到大的顺序进行排序，按照排序结果，选择前n个或后n个候选框作为负样本，n为大于或等于1的正整数。

在本发明的一些实施例中，所述第二训练样本集还包括：多个第二目标图像组成，所述第二目标图像为标记有真实目标物体框的图像；所述第二训练模块84包括：

请参考图9，图9为本发明另一实施例的目标检测网络模型的训练装置的结构示意图，该目标检测网络模型的训练装置90包括：处理器91和存储器92。在本发明实施例中，目标检测网络模型的训练装置90还包括：存储在存储器92上并可在处理器91上运行的计算机程序，计算机程序被处理器91执行时实现如下步骤：

可选的，计算机程序被处理器91执行时还可实现如下步骤：所述采用目标检测算法对所述第一训练样本集进行训练，得到第一目标检测网络模型包括：

用于获取所述特征图上的每一个锚点的候选框；

可选的，计算机程序被处理器91执行时还可实现如下步骤：所述将所述第二训练样本集输入至所述第一目标检测网络模型进行训练，得到第二目标检测网络模型包括：

获取所述特征图中的每一个锚点的候选框；

从所有所述候选框中选择部分候选框作为负样本；

可选的，计算机程序被处理器91执行时还可实现如下步骤：所述从所有所述候选框中选择部分候选框作为负样本包括：

从所有所述候选框中随机选择部分候选框作为负样本；或者

可选的，所述第二训练样本集还包括：多个第二目标图像组成，所述第二目标图像为标记有真实目标物体框的图像；计算机程序被处理器91执行时还可实现如下步骤：

所述将所述第二训练样本集输入至所述第一目标检测网络模型进行训练，得到第二目标检测网络模型包括：

获取所述特征图中的每一个锚点的候选框；

本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现上述目标检测网络模型的训练方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。其中，所述的计算机可读存储介质，如只读存储器(Read-Only Memory，简称ROM)、随机存取存储器(RandomAccess Memory，简称RAM)、磁碟或者光盘等。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的***、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种目标检测网络模型的训练方法，其特征在于，包括：

2.如权利要求1所述的目标检测网络模型的训练方法，其特征在于，所述采用目标检测算法对所述第一训练样本集进行训练，得到第一目标检测网络模型包括：

获取所述特征图上的每一个锚点的候选框；

3.如权利要求1所述的目标检测网络模型的训练方法，其特征在于，所述将所述第二训练样本集输入至所述第一目标检测网络模型进行训练，得到第二目标检测网络模型包括：

获取所述特征图中的每一个锚点的候选框；

从所有所述候选框中选择部分候选框作为负样本；

4.如权利要求3所述的目标检测网络模型的训练方法，其特征在于，所述从所有所述候选框中选择部分候选框作为负样本包括：

从所有所述候选框中随机选择部分候选框作为负样本；或者

5.如权利要求1所述的目标检测网络模型的训练方法，其特征在于，所述第二训练样本集还包括：多个第二目标图像组成，所述第二目标图像为标记有真实目标物体框的图像；

获取所述特征图中的每一个锚点的候选框；

6.一种目标检测网络模型的训练装置，其特征在于，包括：

7.如权利要求6所述的目标检测网络模型的训练装置，其特征在于，所述第一训练模块包括：

8.如权利要求6所述的目标检测网络模型的训练装置，其特征在于，所述第二训练模块包括：

9.如权利要求8所述的目标检测网络模型的训练装置，其特征在于，所述选择子模块具体用于从所有所述候选框中随机选择部分候选框作为负样本；或者，获取所述候选框的置信度，选择置信度大于指定阈值的候选框作为负样本；或者，获取所述候选框的置信度，对所有所述候选框的置信度按照从大到小或者从小到大的顺序进行排序，按照排序结果选择前n个或后n个候选框作为负样本，n为大于或等于1的正整数；或者，获取所述候选框的置信度，选择置信度大于指定阈值的候选框，对所述置信度大于指定阈值的候选框按照从大到小或者从小到大的顺序进行排序，按照排序结果，选择前n个或后n个候选框作为负样本，n为大于或等于1的正整数。

10.如权利要求6所述的目标检测网络模型的训练装置，其特征在于，所述第二训练样本集还包括：多个第二目标图像组成，所述第二目标图像为标记有真实目标物体框的图像；所述第二训练模块包括：