CN106778867A

CN106778867A - 目标检测方法和装置、神经网络训练方法和装置

Info

Publication number: CN106778867A
Application number: CN201611161693.8A
Authority: CN
Inventors: 肖特特; 茅佳源
Original assignee: Beijing Megvii Technology Co Ltd; Beijing Aperture Science and Technology Ltd
Current assignee: Beijing Kuangshi Technology Co Ltd; Beijing Megvii Technology Co Ltd; Beijing Aperture Science and Technology Ltd
Priority date: 2016-12-15
Filing date: 2016-12-15
Publication date: 2017-05-31
Anticipated expiration: 2036-12-15
Also published as: US10671919B2; CN106778867B; US20180174046A1

Abstract

本公开提供了一种基于神经网络的目标检测方法和装置、以及用于目标检测的神经网络的训练方法和装置。所述目标检测方法，包括：获取包含目标的待检测图像；利用预先训练的第一神经网络获取所述待检测图像的第一特征信息，利用预先训练的第二神经网络获取所述待检测图像的第二特征信息；组合所述第一特征信息和所述第二特征信息，获取组合特征信息；以及利用所述第二神经网络，基于所述组合特征信息，获取目标检测结果，其中，所述第二神经网络的层数大于所述第一神经网络的层数，并且所述第一特征信息为热度图特征信息，所述第二特征信息为图片特征信息。

Description

目标检测方法和装置、神经网络训练方法和装置

技术领域

本公开涉及图像处理领域，更具体地，本公开涉及基于神经网络的目标检测方法和装置、以及用于目标检测的神经网络的训练方法和装置。

背景技术

目标检测是计算机视觉领域中一个基础性的研究课题，其在人脸识别、安全监控以及动态追踪等很多方面都有广泛的应用前景。目标检测是指对于任意一幅给定的图像，检测和识别其中特定的目标(例如行人)，并返回目标的位置、大小信息，例如输出包围目标的边界框。目标检测是一个复杂的具有挑战性的模式检测问题，一方面由于目标的细节变化、遮挡等内在的变化，另外一方面由于成像角度、光照影响、成像设备的焦距、成像距离、图像获得的途径不同等外在条件变化，都会导致目标检测的困难和精度降低。

神经网络是一种大规模、多参数优化的工具。依靠大量的训练数据，神经网络能够学习出数据中难以总结的隐藏特征，从而完成多项复杂的任务，如人脸检测，图片分类，物体检测，动作追踪，自然语言翻译等。神经网络已被人工智能界广泛应用。当前，诸如行人检测的目标检测中最广泛应用的是卷积神经网络。困扰现今行人目标检测方法的主要有两个问题：一是会产生大量的“假阳性”探测结果，即，将非目标区域标记为目标；二是由于光照、目标姿态等影响，部分目标无法被神经网络自动检测出。这是由于当前用于目标检测的神经网络的训练以及检测过程中，往往都直接生成目标在图片中的位置，没有充分考虑对这一过程的拆分和对网络的迭代式训练，也没有考虑其他能够辅助训练和提高检测精度的因素。

发明内容

鉴于上述问题而提出了本公开。本公开提供了一种基于神经网络的目标检测方法和装置、以及用于目标检测的神经网络的训练方法和装置，通过利用位置信息辅助生成热度图的第一神经网络训练，之后利用热度图辅助生成目标位置的第二神经网络训练，并且进一步迭代第一神经网络训练和第二神经网络训练直到获得训练好的神经网络，使得训练好的神经网络对于待检测的图像执行热度图和目标位置检测，从而实现更高的检测精度。

根据本公开的一个实施例，提供了一种目标检测方法，包括：获取包含目标的待检测图像；利用预先训练的第一神经网络获取所述待检测图像的第一特征信息，利用预先训练的第二神经网络获取所述待检测图像的第二特征信息；组合所述第一特征信息和所述第二特征信息，获取组合特征信息；以及利用所述第二神经网络，基于所述组合特征信息，获取目标检测结果，其中，所述第二神经网络的层数大于所述第一神经网络的层数，并且所述第一特征信息为热度图特征信息，所述第二特征信息为图片特征信息。

此外，根据本公开的一个实施例的目标检测方法，还包括：训练所述第一神经网络和所述第二神经网络。

此外，根据本公开的一个实施例的目标检测方法，其中所述训练所述第一神经网络和所述第二神经网络包括：利用标注有训练目标的训练图像，调整所述第一神经网络的第一网络参数以训练所述第一神经网络，直到所述第一神经网络的第一损失函数满足第一预定阈值条件，获得训练中的所述第一神经网络；利用所述训练图像、以及所述第一神经网络对于所述训练图像输出的训练用第一特征信息，调整所述第二神经网络的第二网络参数以训练所述第二神经网络，直到所述第二神经网络的第二损失函数满足第二预定阈值条件，获得训练中的所述第二神经网络。

此外，根据本公开的一个实施例的目标检测方法，其中所述训练所述第一神经网络和所述第二神经网络还包括重复执行以下训练：利用所述训练图像、以及所述训练中的第二神经网络对于所述训练图像输出的训练用第二特征信息，调整所述第一网络参数以训练所述第一神经网络；以及利用所述训练图像、以及所述训练中的第一神经网络对于所述训练图像输出的训练用第一特征信息，调整所述第二网络参数以训练所述第二神经网络，直到所述第一损失函数和所述第二损失函数都满足第三预定阈值条件，获得训练好的所述第一神经网络和所述第二神经网络。

此外，根据本公开的一个实施例的目标检测方法，其中，所述第一损失函数指示所述第一神经网络预测的所述训练图像中的像素点属于训练目标的预测置信度与真实置信度的差异，以及所述第二损失函数指示所述第二神经网络预测的所述训练图像中的目标的预测置信度与真实置信度的差异和包含所述目标的边界框的预测置信度与真实置信度的差异。

此外，根据本公开的一个实施例的目标检测方法，其中，所述第二神经网络包括：特征输入层，用于基于输入的所述待检测图像获取所述第二特征信息；第一特征组合层，用于组合所述第一特征信息和所述第二特征信息，获取所述组合特征信息；以及目标检测层，用于基于所述组合特征信息，获取目标检测结果；以及所述第一神经网络包括：特征转换层，用于基于所述第二特征信息，获取转换特征信息；以及热度检测层，用于基于所述转换特征信息，获取所述第一特征信息。

此外，根据本公开的一个实施例的目标检测方法，其中，所述第一神经网络还包括上采样层，用于上采样所述转换特征信息，以使得所述热度检测层接收到与所述待检测图像相同尺寸的所述上采样后的转换特征信息；其中，所述热度检测层包括：第二特征组合层，用于接收所述上采样后的转换特征信息，以生成初始第一特征信息；下采样层，用于下采样所述初始第一特征信息，以获取与所述第二特征信息相同尺度的所述第一特征信息；以及热度目标预测层，用于基于所述初始第一特征信息，获取热度目标预测结果。

根据本公开的另一个实施例，提供了一种目标检测装置，包括：图像获取模块，用于获取包含目标的待检测图像；以及目标检测模块，包括第一神经网络和第二神经网络，所述第一神经网络用于获取所述待检测图像的第一特征信息，所述第二神经网络用于获取所述待检测图像的第二特征信息，其中，所述第二神经网络还进一步组合所述第一特征信息和所述第二特征信息，获取组合特征信息，并且基于所述组合特征信息，获取目标检测结果，其中，所述第二神经网络的层数大于所述第一神经网络的层数，并且所述第一特征信息为热度图特征信息，所述第二特征信息为图片特征信息。

此外，根据本公开的另一个实施例的目标检测装置，还包括：训练模块，用于训练所述第一神经网络和所述第二神经网络。

此外，根据本公开的另一个实施例的目标检测装置，其中所述训练模块包括第一训练单元和第二训练单元，所述第一训练单元利用标注有训练目标的训练图像，调整所述第一神经网络的第一网络参数以训练所述第一神经网络，直到所述第一神经网络的第一损失函数满足第一预定阈值条件，获得训练中的所述第一神经网络；以及所述第二训练单元利用所述训练图像、以及所述第一神经网络对于所述训练图像输出的训练用第一特征信息，调整所述第二神经网络的第二网络参数以训练所述第二神经网络，直到所述第二神经网络的第二损失函数满足第二预定阈值条件，获得训练中的所述第二神经网络。

此外，根据本公开的另一个实施例的目标检测装置，其中所述第一训练单元和所述第二训练单元分别重复执行以下训练：所述第一训练单元利用所述训练图像、以及所述训练中的第二神经网络对于所述训练图像输出的训练用第二特征信息，调整所述第一网络参数以训练所述第一神经网络；以及所述第二训练单元利用所述训练图像、以及所述训练中的第一神经网络对于所述训练图像输出的训练用第一特征信息，调整所述第二网络参数以训练所述第二神经网络，直到所述第一损失函数和所述第二损失函数都满足第三预定阈值条件，获得训练好的所述第一神经网络和所述第二神经网络。

此外，根据本公开的另一个实施例的目标检测装置，其中，所述第一损失函数指示所述第一神经网络预测的所述训练图像中的像素点属于训练目标的预测置信度与真实置信度的差异，以及所述第二损失函数指示所述第二神经网络预测的所述训练图像中的目标的预测置信度与真实置信度的差异和包含所述目标的边界框的预测置信度与真实置信度的差异。

此外，根据本公开的另一个实施例的目标检测装置，其中，所述第二神经网络包括：特征输入层，用于基于输入的所述待检测图像获取所述第二特征信息；第一特征组合层，用于组合所述第一特征信息和所述第二特征信息，获取组合特征信息；目标检测层，用于基于所述组合特征信息，获取目标检测结果；所述第一神经网络包括：特征转换层，用于基于所述第二特征信息，获取转换特征信息；以及热度检测层，用于基于所述转换特征信息，获取所述第一特征信息。

此外，根据本公开的另一个实施例的目标检测装置，其中所述第一神经网络还包括上采样层，用于上采样所述转换特征信息，以使得所述热度检测层接收到与所述待检测图像相同尺寸的所述上采样后的转换特征信息；其中，所述热度检测层包括：第二特征组合层，用于接收所述上采样后的转换特征信息，以生成初始第一特征信息；下采样层，用于下采样所述初始第一特征信息，以获取与所述第二特征信息相同尺度的所述第一特征信息；以及热度目标预测层，用于基于所述初始第一特征信息，获取热度目标预测结果。

根据本公开的另一个实施例，提供了一种用于目标检测的神经网络的训练方法，所述用于目标检测的神经网络包括第一神经网络和第二神经网络，包括：利用标注有训练目标的训练图像，调整所述第一神经网络的第一网络参数以训练所述第一神经网络，直到所述第一神经网络的第一损失函数满足第一预定阈值条件，获得训练中的所述第一神经网络；以及利用所述训练图像、以及所述第一神经网络对于所述训练图像输出的训练用第一特征信息，调整所述第二神经网络的第二网络参数以训练所述第二神经网络，直到所述第二神经网络的第二损失函数满足第二预定阈值条件，获得训练中的所述第二神经网络。

此外，根据本公开的另一个实施例的训练方法，还包括重复执行以下训练：利用所述训练图像、以及所述训练中的第二神经网络对于所述训练图像输出的训练用第二特征信息，调整所述第一网络参数以训练所述第一神经网络；以及利用所述训练图像、以及所述训练中的第一神经网络对于所述训练图像输出的训练用第一特征信息，调整所述第二网络参数以训练所述第二神经网络，直到所述第一损失函数和所述第二损失函数都满足第三预定阈值条件，获得训练好的所述第一神经网络和所述第二神经网络。

此外，根据本公开的另一个实施例的训练方法，其中所述第一损失函数指示所述第一神经网络预测的所述训练图像中的像素点属于训练目标的预测置信度与真实置信度的差异，以及所述第二损失函数指示所述第二神经网络预测的所述训练图像中的目标的预测置信度与真实置信度的差异和包含所述目标的边界框的预测置信度与真实置信度的差异。

此外，根据本公开的另一个实施例的训练方法，其中，所述第一神经网络用于获取待检测图像的第一特征信息，所述第二神经网络用于获取所述待检测图像的第二特征信息，其中，所述第二神经网络还进一步组合所述第一特征信息和所述第二特征信息，获取组合特征信息，并且基于所述组合特征信息，获取目标检测结果，其中，所述第二神经网络的层数大于所述第一神经网络的层数，并且所述第一特征信息为热度图特征信息，所述第二特征信息为图片特征信息。

此外，根据本公开的另一个实施例的训练方法，其中，所述第二神经网络包括：特征输入层，用于基于输入的所述待检测图像获取所述第二特征信息；第一特征组合层，用于组合所述第一特征信息和所述第二特征信息，获取所述组合特征信息；以及目标检测层，用于基于所述组合特征信息，获取目标检测结果；以及所述第一神经网络包括：特征转换层，用于基于所述第二特征信息，获取转换特征信息；以及热度检测层，用于基于所述转换特征信息，获取所述第一特征信息。

此外，根据本公开的另一个实施例的训练方法，其中所述第一神经网络还包括上采样层，用于上采样所述转换特征信息，以使得所述热度检测层接收到与所述待检测图像相同尺寸的所述上采样后的转换特征信息；其中，所述热度检测层包括：第二特征组合层，用于接收所述上采样后的转换特征信息，以生成初始第一特征信息；下采样层，用于下采样所述初始第一特征信息，以获取与所述第二特征信息相同尺度的所述第一特征信息；以及热度目标预测层，用于基于所述初始第一特征信息，获取热度目标预测结果。

根据本公开的另一个实施例，提供了一种神经网络的训练装置，所述用于目标检测的神经网络包括第一神经网络和第二神经网络，包括：第一训练单元，用于利用标注有训练目标的训练图像，调整所述第一神经网络的第一网络参数以训练所述第一神经网络，直到所述第一神经网络的第一损失函数满足第一预定阈值条件，获得训练中的所述第一神经网络；以及第二训练单元，用于利用所述训练图像、以及所述第一神经网络对于所述训练图像输出的训练用第一特征信息，调整所述第二神经网络的第二网络参数以训练所述第二神经网络，直到所述第二神经网络的第二损失函数满足第二预定阈值条件，获得训练中的所述第二神经网络。

此外，根据本公开的另一个实施例的训练装置，其中所述第一训练单元和所述第二训练单元分别重复执行以下训练：所述第一训练单元利用所述训练图像、以及所述训练中的第二神经网络对于所述训练图像输出的训练用第二特征信息，调整所述第一网络参数以训练所述第一神经网络；以及所述第二训练单元利用所述训练图像、以及所述训练中的第一神经网络对于所述训练图像输出的训练用第一特征信息，调整所述第二网络参数以训练所述第二神经网络，直到所述第一损失函数和所述第二损失函数都满足第三预定阈值条件，获得训练好的所述第一神经网络和所述第二神经网络。

此外，根据本公开的另一个实施例的训练装置，其中所述第一损失函数指示所述第一神经网络预测的所述训练图像中的像素点属于训练目标的预测置信度与真实置信度的差异，以及所述第二损失函数指示所述第二神经网络预测的所述训练图像中的目标的预测置信度与真实置信度的差异和包含所述目标的边界框的预测置信度与真实置信度的差异。

此外，根据本公开的另一个实施例的训练装置，所述第一神经网络用于获取待检测图像的第一特征信息，所述第二神经网络用于获取所述待检测图像的第二特征信息，其中，所述第二神经网络还进一步组合所述第一特征信息和所述第二特征信息，获取组合特征信息，并且基于所述组合特征信息，获取目标检测结果，其中，所述第二神经网络的层数大于所述第一神经网络的层数，并且所述第一特征信息为热度图特征信息，所述第二特征信息为图片特征信息。

此外，根据本公开的另一个实施例的训练装置，其中所述第二神经网络包括：特征输入层，用于基于输入的所述待检测图像获取所述第二特征信息；第一特征组合层，用于组合所述第一特征信息和所述第二特征信息，获取所述组合特征信息；以及目标检测层，用于基于所述组合特征信息，获取目标检测结果；以及所述第一神经网络包括：特征转换层，用于基于所述第二特征信息，获取转换特征信息；以及热度检测层，用于基于所述转换特征信息，获取所述第一特征信息。

此外，根据本公开的另一个实施例的训练装置，其中所述第一神经网络还包括上采样层，用于上采样所述转换特征信息，以使得所述热度检测层接收到与所述待检测图像相同尺寸的所述上采样后的转换特征信息；其中，所述热度检测层包括：第二特征组合层，用于接收所述上采样后的转换特征信息，以生成初始第一特征信息；下采样层，用于下采样所述初始第一特征信息，以获取与所述第二特征信息相同尺度的所述第一特征信息；以及热度目标预测层，用于基于所述初始第一特征信息，获取热度目标预测结果。

根据本公开的另一个实施例，提供了一种目标检测装置，包括：处理器；存储器，其中存储计算机程序指令；其中，在所述计算机程序指令被所述处理器运行时执行以下步骤：获取包含目标的待检测图像；利用预先训练的第一神经网络获取所述待检测图像的第一特征信息，利用预先训练的第二神经网络获取所述待检测图像的第二特征信息；组合所述第一特征信息和所述第二特征信息，获取组合特征信息；以及利用所述第二神经网络，基于所述组合特征信息，获取目标检测结果，其中，所述第二神经网络的层数大于所述第一神经网络的层数，并且所述第一特征信息为热度图特征信息，所述第二特征信息为图片特征信息。

此外，根据本公开的另一个实施例的目标检测装置，其中在所述计算机程序指令被所述处理器运行时，还执行用于训练所述第一神经网络和所述第二神经网络的步骤。

此外，根据本公开的另一个实施例的目标检测装置，其中在所述计算机程序指令被所述处理器运行时，还执行用于训练所述第一神经网络和所述第二神经网络的步骤包括：利用标注有训练目标的训练图像，调整所述第一神经网络的第一网络参数以训练所述第一神经网络，直到所述第一神经网络的第一损失函数满足第一预定阈值条件，获得训练中的所述第一神经网络；以及利用所述训练图像、以及所述第一神经网络对于所述训练图像输出的训练用第一特征信息，调整所述第二神经网络的第二网络参数以训练所述第二神经网络，直到所述第二神经网络的第二损失函数满足第二预定阈值条件，获得训练中的所述第二神经网络。

此外，根据本公开的另一个实施例的目标检测装置，其中在所述计算机程序指令被所述处理器运行时，还执行用于训练所述第一神经网络和所述第二神经网络的步骤还包括：重复执行以下训练：利用所述训练图像、以及所述训练中的第二神经网络对于所述训练图像输出的训练用第二特征信息，调整所述第一网络参数以训练所述第一神经网络；以及利用所述训练图像、以及所述训练中的第一神经网络对于所述训练图像输出的训练用第一特征信息，调整所述第二网络参数以训练所述第二神经网络，直到所述第一损失函数和所述第二损失函数都满足第三预定阈值条件，获得训练好的所述第一神经网络和所述第二神经网络。

此外，根据本公开的另一个实施例的目标检测装置，其中，所述第二神经网络包括：特征输入层，用于基于输入的所述待检测图像获取所述第二特征信息；第一特征组合层，用于组合所述第一特征信息和所述第二特征信息，获取组合特征信息；以及目标检测层，用于基于所述组合特征信息，获取目标检测结果；以及所述第一神经网络包括：特征转换层，用于基于所述第二特征信息，获取转换特征信息；以及热度检测层，用于基于所述转换特征信息，获取所述第一特征信息。

根据本公开的另一个实施例，提供了一种用于目标检测的神经网络的训练装置，所述用于目标检测的神经网络包括第一神经网络和第二神经网络，所述训练装置包括：处理器；存储器，其中存储计算机程序指令；其中，在所述计算机程序指令被所述处理器运行时执行以下步骤：用于利用标注有训练目标的训练图像，调整所述第一神经网络的第一网络参数以训练所述第一神经网络，直到所述第一神经网络的第一损失函数满足第一预定阈值条件，获得训练中的所述第一神经网络；用于利用所述训练图像、以及所述第一神经网络对于所述训练图像输出的训练用第一特征信息，调整所述第二神经网络的第二网络参数以训练所述第二神经网络，直到所述第二神经网络的第二损失函数满足第二预定阈值条件，获得训练中的所述第二神经网络。

此外，根据本公开的另一个实施例的训练装置，其中在所述计算机程序指令被所述处理器运行时还执行以下步骤：重复执行以下训练：利用所述训练图像、以及所述训练中的第二神经网络对于所述训练图像输出的训练用第二特征信息，调整所述第一网络参数以训练所述第一神经网络；以及利用所述训练图像、以及所述训练中的第一神经网络对于所述训练图像输出的训练用第一特征信息，调整所述第二网络参数以训练所述第二神经网络，直到所述第一损失函数和所述第二损失函数都满足第三预定阈值条件，获得训练好的所述第一神经网络和所述第二神经网络。

要理解的是，前面的一般描述和下面的详细描述两者都是示例性的，并且意图在于提供要求保护的技术的进一步说明。

附图说明

通过结合附图对本公开实施例进行更详细的描述，本公开的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解，并且构成说明书的一部分，与本公开实施例一起用于解释本公开，并不构成对本公开的限制。在附图中，相同的参考标号通常代表相同部件或步骤。

图1是图示根据本公开实施例的目标检测方法的流程图。

图2是图示根据本公开实施例的目标检测装置的框图。

图3是图示根据本公开实施例的用于目标检测的神经网络的训练方法的流程图。

图4是图示根据本公开实施例的用于目标检测的神经网络的训练方法中初始训练的示意图。

图5是图示根据本公开实施例的用于目标检测的神经网络的训练方法中迭代训练的示意图。

图6是图示根据本公开实施例的用于目标检测的神经网络的结构示意图。

图7是图示根据本公开实施例的目标检测装置的示意图。

图8是图示根据本公开实施例的目标检测结果的示意图。

具体实施方式

为了使得本公开的目的、技术方案和优点更为明显，下面将参照附图详细描述根据本公开的示例实施例。显然，所描述的实施例仅仅是本公开的一部分实施例，而不是本公开的全部实施例，应理解，本公开不受这里描述的示例实施例的限制。基于本公开中描述的本公开实施例，本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本公开的保护范围之内。

本公开涉及基于神经网络的目标检测方法和装置、以及用于目标检测的神经网络的训练方法和装置。利用神经网络进行目标检测可以分为两个阶段，即训练阶段和检测阶段。所谓训练阶段是指首先需要利用训练目标对神经网络进行训练，以调整神经网络的参数；所谓检测阶段是指随后可以利用训练好的神经网络对包含检测目标的检测图像进行目标检测。以下，将参考附图详细描述本公开的各个实施例。

首先，参照图1概述根据本公开实施例的目标检测方法。

图1是图示根据本公开实施例的目标检测方法的流程图。如图1所示，根据本公开实施例的目标检测方包括以下步骤。

在步骤S101中，训练第一神经网络和第二神经网络。

如下将详细描述的，在本公开的第一神经网络和第二神经网络中，所述第一神经网络是相对浅层神经网络，而所述第二神经网络是相对深层神经网络。所述第二神经网络的层数大于所述第一神经网络的层数。进一步地，所述第一神经网络可用于获取待检测图像的第一特征信息，所述第二神经网络可用于获取待检测图像的第二特征信息。如下将详细描述的，所述第一特征信息为热度图特征信息，所述第二特征信息为图片特征信息。此外，以下将参照附图详细描述第一神经网络和第二神经网络的训练方法。需要理解的是，根据本公开实施例的目标检测方法当然可以不包括图1中的步骤S101，而是直接利用训练好的第一神经网络和第二神经网络来执行目标检测。此后，处理进到步骤S102。

在步骤S102中，获取包含目标的待检测图像。在本公开的一个实施例中，可以在监控场景中配置能够获取监控场景的图像数据的监控摄像头作为图像获取模块。获取包含目标的待检测图像包括但不限于，在由物理位置上分离配置的图像获取模块采集图像数据之后，经由有线或者无线方式，接收从所述图像获取模块发送的视频数据。可替代地，图像获取模块可以与目标检测装置中的其他模块或组件物理上位于同一位置甚至位于同一机壳内部，目标检测装置中的其他模块或组件经由内部总线接收从所述图像获取模块发送的视频数据。待检测图像可以是图像获取模块采集到的原始图像，也可以是对原始图像进行预处理之后获得的图像。此后，处理进到步骤S103。

在步骤S103中，利用预先训练的第一神经网络获取待检测图像的第一特征信息。如上所述，所述第一特征信息为热度图特征信息。更具体地，热度图用于指示每个像素点属于目标的概率。此后，处理进到步骤S104。

在步骤S104中，利用预先训练的第二神经网络获取待检测图像的第二特征信息。如上所述，所述第二特征信息为图片特征信息。例如，可以通过第二神经网络的卷积层对所述待检测图像进行卷积操作以提取图片特征信息。。容易理解的是，图1所示的步骤S103和步骤S104的执行顺序仅仅是示意性的。可替代地，步骤S103和步骤S104可以同时或者以相反顺序执行。此后，处理进到步骤S105。

在步骤S105中，组合第一特征信息和第二特征信息，获取组合特征信息。以下，将参照附图进一步详细描述第一神经网络和第二神经网络的结构以及由第一神经网络和第二神经网络获取并且组合第一特征信息和第二特征信息的过程。此后，处理进到步骤S106。

在步骤S106中，利用第二神经网络，基于组合特征信息，获取目标检测结果。在本公开的一个实施例中，在步骤S106中，利用第二神经网络，基于组合特征信息，可以得到包含目标的检测边界框，并将所述检测边界框作为目标检测结果。此外，目标检测结果还可以包括与每个检测边界框对应的置信度，用于表示该边界框中存在目标的概率。针对同一个检测目标，所得到的检测边界框可能不止一个。当对应同一个检测目标的检测边界框为多个时，可以将各个检测边界框进行合并，以使得对于同一个检测目标合并得到一个精确的检测边界框。例如，可以利用非最大抑制方法将各个检测边界框进行合并，以消除多余的边界框。当每个检测目标只对应一个检测边界框时，可以省略边界框合并。最终，以由包围检测目标的检测边界框形式输出最终目标检测结果。

图2是图示根据本公开实施例的目标检测装置的框图。如图2所示的根据本公开实施例的目标检测装置20可以用于执行如图1所示的根据本公开实施例的目标检测方法。如图2所示，根据本公开实施例的目标检测装置20包括图像获取模块21、训练模块22以及目标检测模块23。

具体地，所述图像获取模块21用于获取包含目标的待检测图像。在本公开的一个实施例中，所述图像获取模块21可以是在监控场景中配置的能够获取监控场景的图像数据的监控摄像头。所述图像获取模块21可以与其后的训练模块22以及目标检测模块23等物理位置上分离分配，并且经由有线或者无线方式，从所述图像获取模块21发送图像数据给其后的各模块。可替代地，所述图像获取模块21可以与目标检测装置20中的其他模块或组件物理上位于同一位置甚至位于同一机壳内部，目标检测装置20中的其他模块或组件经由内部总线接收从所述图像获取模块21发送的图像数据。此外，在用于执行神经网络训练的阶段，所述图像获取模块21还可以将已经标注有训练目标的训练图像提供给所述训练模块22以执行神经网络的训练。

所述训练模块22用于执行神经网络的训练。如图2所示，在本公开的一个实施例中，所述训练模块22包括第一训练单元221和第二训练单元222。所述第一训练单元221和第二训练单元222分别用于执行所述目标检测模块23中包括的第一神经网络231和第二神经网络232的训练。以下，将参照图3进一步详细描述由所述训练模块22执行的训练方法。

所述目标检测模块23中包括的所述第一神经网络231用于获取所述待检测图像的第一特征信息，并且所述目标检测模块23中包括的所述第二神经网络232用于获取所述待检测图像的第二特征信息。所述第一神经网络231是相对浅层神经网络，而所述第二神经网络232是相对深层神经网络。所述第二神经网络232的层数大于所述第一神经网络231的层数。具体地，所述第一特征信息为热度图特征信息，所述第二特征信息为图片特征信息。所述第一神经网络231生成的热度图用于指示每个像素点属于目标的概率。所述第二神经网络232可以通过卷积层对所述待检测图像进行卷积操作以提取图片特征信息。进一步地，所述第二神经网络232还进一步组合所述第一特征信息和所述第二特征信息，获取组合特征信息，并且基于所述组合特征信息，获取目标检测结果。例如，所述第二神经网络232可以基于所述组合特征信息，得到包含目标的检测边界框，并将所述检测边界框作为目标检测结果。此外，目标检测结果还可以包括与每个检测边界框对应的置信度，用于表示该边界框中存在目标的概率。。针对同一个检测目标，所得到的检测边界框可能不止一个。当对应同一个检测目标的检测边界框为多个时，可以将各个检测边界框进行合并，以使得对于同一个检测目标合并得到一个精确的检测边界框。例如，可以利用非最大抑制方法将各个检测边界框进行合并，以消除多余的边界框。当每个检测目标只对应一个检测边界框时，可以省略边界框合并。最终，以由包围检测目标的检测边界框形式输出最终目标检测结果。

如上所述，通过参照图1和图2描述的根据本公开实施例的目标检测方法和目标检测装置，通过用于生成热度图的第一神经网络以及用于生成目标位置的第二神经网络相互辅助和迭代训练，并且进一步迭代第一神经网络训练和第二神经网络训练直到获得训练好的神经网络，使得训练好的神经网络对于待检测的图像执行热度图和目标位置检测，实现了高精度的热度图和目标位置检测结果输出。

图3是图示根据本公开实施例的用于目标检测的神经网络的训练方法的流程图。如图3所示，用于目标检测的神经网络的训练方法总体包括第一神经网络和第二神经网络的初始训练阶段(步骤S301到步骤S306)以及第一神经网络和第二神经网络的迭代训练阶段(步骤S307到步骤S310)。具体地，用于目标检测的神经网络的训练方法包括以下步骤。

在步骤S301中，利用标注有训练目标的训练图像，训练第一神经网络。在本公开的一个实施例中，利用标注有训练目标的训练图像，调整所述第一神经网络的第一网络参数以训练所述第一神经网络。如前所述，第一神经网络是用于生成热度图的浅层神经网络。在训练过程中，获得对应于特定的第一网络参数的第一损失函数。所述第一损失函数指示所述第一神经网络预测的所述训练图像中的像素点属于训练目标的预测置信度与真实置信度的差异。此后，处理进到步骤S302。

在步骤S302中，判断第一损失函数是否满足第一预定阈值条件。在本公开的一个实施例中，所述第一预定阈值条件对应于在一定训练图像输入下第一损失函数的最小化。

如果在步骤S302中获得否定结果，即第一损失函数不满足第一预定阈值条件，则处理返回步骤S301，以便继续执行第一神经网络的初始训练。相反地，如果在步骤S302中获得肯定结果，即第一损失函数满足第一预定阈值条件，则处理进到步骤S303，获得训练中的所述第一神经网络。此后，处理进到步骤S304。

在步骤S304中，利用训练图像、以及第一神经网络对于训练图像输出的训练用第一特征信息，训练第二神经网络。在本公开的一个实施例中，利用第一神经网络对于训练图像输出的训练用第一特征信息(即，热度图信息)辅助训练第二神经网络。也就是说，利用所述训练图像、以及所述第一神经网络对于所述训练图像输出的训练用热度图信息，调整所述第二神经网络的第二网络参数以训练所述第二神经网络。如前所述，第二神经网络是用于执行目标检测的深层神经网络。在训练过程中，获得对应于特定的第二网络参数的第二损失函数。所述第二损失函数指示所述第二神经网络预测的所述训练图像中的目标的预测置信度与真实置信度的差异和包含所述目标的边界框的预测置信度与真实置信度的差异。此后，处理进到步骤S305。

在步骤S305中，判断第二损失函数是否满足第二预定阈值条件。在本公开的一个实施例中，所述第二预定阈值条件对应于在一定训练图像输入下第二损失函数的最小化。

如果在步骤S305中获得否定结果，即第二损失函数不满足第二预定阈值条件，则处理返回步骤S304，以便继续执行第二神经网络的初始训练。相反地，如果在步骤S305中获得肯定结果，即第二损失函数满足第二预定阈值条件，则处理进到步骤S306，获得训练中的所述第二神经网络。至此，第一神经网络和第二神经网络的初始训练阶段完成，获得初始训练后的所述第一神经网络和所述第二神经网络。此后，为了获得能够实现更精确的热度图预测和目标检测的神经网络，进一步执行此后的第一神经网络和第二神经网络的迭代训练阶段。

在步骤S307中，利用训练图像、以及训练中的第二神经网络对于训练图像输出的训练用第二特征信息，训练第一神经网络。在本公开的一个实施例中，在迭代训练过程中，利用第二神经网络对于训练图像输出的训练用第二特征信息(即，目标检测信息)辅助训练第一神经网络。也就是说，继续利用所述训练图像、以及所述训练中的第二神经网络对于所述训练图像输出的训练用目标检测信息，调整所述第一网络参数以训练所述第一神经网络，并且此时所述第二神经网络的所述第二网络参数固定(即，所述第二神经网络的学习率设置为零)。此后，处理进到步骤S308。

在步骤S308中，利用训练图像、以及训练中的第一神经网络对于训练图像输出的训练用第一特征信息，训练第二神经网络。在本公开的一个实施例中，在迭代训练过程中，利用第一神经网络对于训练图像输出的训练用第一特征信息(即，热度图信息)辅助训练第二神经网络。也就是说，继续利用所述训练图像、以及所述训练中的第一神经网络对于所述训练图像输出的训练用热度图信息，调整所述第二网络参数以训练所述第二神经网络，并且此时所述第一神经网络的所述第一网络参数固定(即，所述第一神经网络的学习率设置为零)。此后，处理进到步骤S309。

在步骤S309中，判断第一损失函数和第二损失函数是否都满足第三预定阈值条件。所述第三预定阈值条件即对于特定的训练图像，所述第一神经网络预测的所述训练图像中的像素点属于训练目标的预测置信度与真实置信度的差异、以及所述第二神经网络预测的所述训练图像中的目标的预测置信度与真实置信度的差异和包含所述目标的边界框的预测置信度与真实置信度的差异都实现最小化。

如果在步骤S309中获得否定结果，则处理返回步骤S307，以便进行下一轮迭代训练。相反地，如果在步骤S309中获得肯定结果，即所述第一损失函数和第二损失函数都满足第三预定阈值条件，则处理进到步骤S310，获得训练好的第一神经网络和第二神经网络。至此，第一神经网络和第二神经网络的迭代训练阶段完成，获得了对于检测图像可以同时分别精确输出热度图结果和目标检测结果的第一神经网络和第二神经网络。

为了便于理解，图4和图5分别示意性地示出根据本公开实施例的用于目标检测的神经网络的训练方法中初始训练以及迭代训练。

图4是图示根据本公开实施例的用于目标检测的神经网络的训练方法中初始训练的示意图。如图4所示，训练图像401首先用于第一神经网络初始训练402(即，对应于步骤S301-S303)。此后，在第一神经网络的辅助下，利用训练图像401进行第二神经网络初始训练403(即，对应于步骤S304-S306)。此后，进入第一神经网络和第二神经网络的迭代训练404，并且迭代训练好的第一神经网络和第二神经网络进一步用于目标检测405。图3和图4都示出了在初始训练过程中，首先执行第一神经网络的初始训练，此后由第一神经网络辅助第二神经网络的初始训练。容易理解的是，本公开不限于此，而是可以首先执行第二神经网络的初始训练，此后由第二神经网络辅助第一神经网络的初始训练。

图5是进一步图示根据本公开实施例的用于目标检测的神经网络的训练方法中迭代训练(即，图4中的迭代训练404)的示意图。在第一神经网络迭代训练(第N次训练)501以及第二神经网络迭代训练(第N次训练)502之后，进一步进入第N+1次迭代训练。在该第N+1次迭代训练中，利用第N次训练后的第二神经网络辅助执行第一神经网络的第N+1次迭代训练503(即，对应于步骤S307)；此后，利用第N+1次训练后的第一神经网络辅助执行第二神经网络的第N+1次迭代训练504(即，对应于步骤S308)。在该第N+1次迭代训练之后，如果第一神经网络和第二神经网络不满足预定的第三阈值条件，则进一步执行第N+2次迭代训练505。

通过参照图3到图5描述的根据本公开实施例的用于目标检测的神经网络的训练方法，通过利用位置信息辅助生成热度图的第一神经网络训练，之后利用热度图辅助生成目标位置的第二神经网络训练，并且进一步迭代第一神经网络训练和第二神经网络的相互辅助训练直到获得能够执行高精度热度图检测和目标检测的神经网络。

图6是图示根据本公开实施例的用于目标检测的神经网络的结构示意图。如上所述，根据本公开实施例的用于目标检测的神经网络包括第一神经网络231和第二神经网络232。

具体地，所述第二神经网络232包括特征输入层2321、第一特征组合层2322以及目标检测层2323。所述第一神经网络231包括特征转换层2311、上采样层2312以及热度检测层2313，其中热度检测层2313进一步包括第二特征组合层2313₁、下采样层2313₂以及热度目标预测层2313₃。

待检测的输入图像230首先进入所述第二神经网络232的特征输入层2321，用于由所述特征输入层2321基于输入的所述待检测图像230获取所述第二特征信息(即，图片特征信息)。所述第二特征信息进入第一神经网络231，由所述特征转换层2311基于所述第二特征信息，获取转换特征信息。此后，由所述上采样层2312上采样所述转换特征信息，以使得所述热度检测层231接收到与所述待检测图像相同尺寸的所述上采样后的转换特征信息。此后，所述上采样后的转换特征信息进入第一神经网络231中的所述热度检测层2313。

所述热度检测层2313中的第二特征组合层2313₁接收所述上采样后的的转换特征信息，以生成初始第一特征信息(即，热度图特征信息)。此后，所述热度目标预测层2313₃基于所述初始第一特征信息，获取热度目标预测结果234。

另一方面，所述下采样层2313₂下采样所述初始第一特征信息，以获取与所述第二特征信息相同尺度的所述第一特征信息，并且将与所述第二特征信息相同尺度的所述第一特征信息反馈回所述第二神经网络232中的第一特征组合层2322。所述第一特征组合层2322用于组合所述第一特征信息(即，热度图特征信息)和所述第二特征信息(即，图片特征信息)，获取所述组合特征信息。最后，由所述第二神经网络232中的目标检测层2323基于所述组合特征信息，获取目标检测结果233。

如上所述，采用根据本公开实施例的用于目标检测的神经网络(包括第一神经网络231和第二神经网络232)，实现了对于输入的待检测图像的目标检测，同时实现高精度的目标检测结果233和热度目标预测结果234输出。

图7是图示根据本公开实施例的目标检测装置的示意图。

如图7所示，根据本公开实施例的目标检测装置700包括一个或多个处理器702、存储器704、图像采集装置706和输出装置708，这些组件通过总线***710和/或其它形式的连接机构(未示出)互连。应当注意，图7所示的目标检测装置700的组件和结构只是示例性的，而非限制性的，根据需要，目标检测装置700也可以具有其他组件和结构。

处理器702可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元，并且可以控制目标检测装置700中的其它组件以执行期望的功能。

存储器704可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器702可以运行所述程序指令，以实现以下步骤：获取包含目标的待检测图像；利用预先训练的第一神经网络获取所述待检测图像的第一特征信息，利用预先训练的第二神经网络获取所述待检测图像的第二特征信息；组合所述第一特征信息和所述第二特征信息，获取组合特征信息；以及利用所述第二神经网络，基于所述组合特征信息，获取目标检测结果。此外，在所述计算机可读存储介质上存储的一个或多个计算机程序指令在由处理器702运行时还可以执行如上参照附图描述的根据本公开实施例的目标检测方法以及用于目标检测的神经网络的训练方法的所有步骤。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据，例如输入的训练图像、损失函数、各像素的预测置信度和真实置信度等等。

图像采集装置706可以用于采集带有训练目标的训练图像以及用于目标检测的待检测图像，并且将所拍摄的图像存储在存储器704中以供其它组件使用。当然，也可以利用其他图像采集设备采集所述训练图像和待检测图像，并且将采集的图像发送给目标检测装置700。

输出装置708可以向外部(例如用户)输出各种信息，例如图像信息、训练结果以及热度目标预测结果和目标检测结果。所述输出装置708可以包括显示器、扬声器、投影仪、网卡等中的一个或多个。

图8是图示根据本公开实施例的目标检测结果的示意图。

图8的上部801示出在没有利用热度图特征辅助进行目标检测的情况下，获得的目标检测框杂乱且存在大量伪目标。图8的中部802示出利用根据本公开的目标检测装置中的第一神经网络输出的热度目标预测结果，其中像素点的灰度越高，代表该像素点存在目标的置信度越高。图8的下部803示出利用根据本公开的目标检测装置中的第二神经网络输出的目标检测结果，与图8的上部801中没有利用本公开的目标检测装置输出的目标检测结果相比，利用热度图辅助训练和检测的第二神经网络输出更加精确的目标检测框。

以上，参照附图描述了基于神经网络的目标检测方法和装置、以及用于目标检测的神经网络的训练方法和装置，通过利用位置信息辅助生成热度图的第一神经网络训练，之后利用热度图辅助生成目标位置的第二神经网络训练，并且进一步迭代第一神经网络训练和第二神经网络训练直到获得训练好的神经网络，使得训练好的神经网络对于待检测的图像执行热度图和目标位置检测，从而实现更高的检测精度。

以上结合具体实施例描述了本公开的基本原理，但是，需要指出的是，在本公开中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本公开为必须采用上述具体的细节来实现。

本公开中涉及的器件、装置、设备、***的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、装置、设备、***。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。

另外，如在此使用的，在以“至少一个”开始的项的列举中使用的“或”指示分离的列举，以便例如“A、B或C的至少一个”的列举意味着A或B或C，或AB或AC或BC，或ABC(即A和B和C)。此外，措辞“示例的”不意味着描述的例子是优选的或者比其他例子更好。

还需要指出的是，在本公开的***和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。

可以不脱离由所附权利要求定义的教导的技术而进行对在此所述的技术的各种改变、替换和更改。此外，本公开的权利要求的范围不限于以上所述的处理、机器、制造、事件的组成、手段、方法和动作的具体方面。可以利用与在此所述的相应方面进行基本相同的功能或者实现基本相同的结果的当前存在的或者稍后要开发的处理、机器、制造、事件的组成、手段、方法或动作。因而，所附权利要求包括在其范围内的这样的处理、机器、制造、事件的组成、手段、方法或动作。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此，本公开不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims

1.一种目标检测方法，包括：

获取包含目标的待检测图像；

利用预先训练的第一神经网络获取所述待检测图像的第一特征信息，利用预先训练的第二神经网络获取所述待检测图像的第二特征信息；

组合所述第一特征信息和所述第二特征信息，获取组合特征信息；以及

利用所述第二神经网络，基于所述组合特征信息，获取目标检测结果，

其中，所述第二神经网络的层数大于所述第一神经网络的层数，并且所述第一特征信息为热度图特征信息，所述第二特征信息为图片特征信息。

2.如权利要求1所述的目标检测方法，还包括：

训练所述第一神经网络和所述第二神经网络。

3.如权利要求2所述的目标检测方法，其中所述训练所述第一神经网络和所述第二神经网络包括：

利用标注有训练目标的训练图像，调整所述第一神经网络的第一网络参数以训练所述第一神经网络，直到所述第一神经网络的第一损失函数满足第一预定阈值条件，获得训练中的所述第一神经网络；

利用所述训练图像、以及所述第一神经网络对于所述训练图像输出的训练用第一特征信息，调整所述第二神经网络的第二网络参数以训练所述第二神经网络，直到所述第二神经网络的第二损失函数满足第二预定阈值条件，获得训练中的所述第二神经网络。

4.如权利要求3所述的目标检测方法，其中所述训练所述第一神经网络和所述第二神经网络还包括：

重复执行以下训练：

利用所述训练图像、以及所述训练中的第二神经网络对于所述训练图像输出的训练用第二特征信息，调整所述第一网络参数以训练所述第一神经网络；以及

利用所述训练图像、以及所述训练中的第一神经网络对于所述训练图像输出的训练用第一特征信息，调整所述第二网络参数以训练所述第二神经网络，

直到所述第一损失函数和所述第二损失函数都满足第三预定阈值条件，获得训练好的所述第一神经网络和所述第二神经网络。

5.如权利要求3所述的目标检测方法，其中，

所述第一损失函数指示所述第一神经网络预测的所述训练图像中的像素点属于训练目标的预测置信度与真实置信度的差异，以及

所述第二损失函数指示所述第二神经网络预测的所述训练图像中的目标的预测置信度与真实置信度的差异和包含所述目标的边界框的预测置信度与真实置信度的差异。

6.如权利要求1所述的目标检测方法，其中，

所述第二神经网络包括：

特征输入层，用于基于输入的所述待检测图像获取所述第二特征信息；

第一特征组合层，用于组合所述第一特征信息和所述第二特征信息，获取所述组合特征信息；以及

目标检测层，用于基于所述组合特征信息，获取目标检测结果；以及

所述第一神经网络包括：

特征转换层，用于基于所述第二特征信息，获取转换特征信息；以及

热度检测层，用于基于所述转换特征信息，获取所述第一特征信息。

7.如权利要求6所述的目标检测方法，其中，

所述第一神经网络还包括

上采样层，用于上采样所述转换特征信息，以使得所述热度检测层接收到与所述待检测图像相同尺寸的所述上采样后的转换特征信息；

其中，所述热度检测层包括：

第二特征组合层，用于接收所述上采样后的转换特征信息，以生成初始第一特征信息；

下采样层，用于下采样所述初始第一特征信息，以获取与所述第二特征信息相同尺度的所述第一特征信息；以及

热度目标预测层，用于基于所述初始第一特征信息，获取热度目标预测结果。

8.一种目标检测装置，包括：

图像获取模块，用于获取包含目标的待检测图像；以及

目标检测模块，包括第一神经网络和第二神经网络，

所述第一神经网络用于获取所述待检测图像的第一特征信息，

所述第二神经网络用于获取所述待检测图像的第二特征信息，

其中，所述第二神经网络还进一步组合所述第一特征信息和所述第二特征信息，获取组合特征信息，并且基于所述组合特征信息，获取目标检测结果，

9.如权利要求8所述的目标检测装置，还包括：

训练模块，用于训练所述第一神经网络和所述第二神经网络。

10.如权利要求9所述的目标检测装置，其中所述训练模块包括第一训练单元和第二训练单元，

所述第一训练单元利用标注有训练目标的训练图像，调整所述第一神经网络的第一网络参数以训练所述第一神经网络，直到所述第一神经网络的第一损失函数满足第一预定阈值条件，获得训练中的所述第一神经网络；以及

所述第二训练单元利用所述训练图像、以及所述第一神经网络对于所述训练图像输出的训练用第一特征信息，调整所述第二神经网络的第二网络参数以训练所述第二神经网络，直到所述第二神经网络的第二损失函数满足第二预定阈值条件，获得训练中的所述第二神经网络。

11.如权利要求10所述的目标检测装置，其中所述第一训练单元和所述第二训练单元分别重复执行以下训练：

所述第一训练单元利用所述训练图像、以及所述训练中的第二神经网络对于所述训练图像输出的训练用第二特征信息，调整所述第一网络参数以训练所述第一神经网络；以及

所述第二训练单元利用所述训练图像、以及所述训练中的第一神经网络对于所述训练图像输出的训练用第一特征信息，调整所述第二网络参数以训练所述第二神经网络，

12.如权利要求10所述的目标检测装置，其中，

13.如权利要求8所述的目标检测装置，其中，

所述第二神经网络包括：

第一特征组合层，用于组合所述第一特征信息和所述第二特征信息，获取组合特征信息；

目标检测层，用于基于所述组合特征信息，获取目标检测结果；

所述第一神经网络包括：

14.如权利要求13所述的目标检测装置，其中，

所述第一神经网络还包括

其中，所述热度检测层包括：

15.一种用于目标检测的神经网络的训练方法，所述用于目标检测的神经网络包括第一神经网络和第二神经网络，包括：

利用标注有训练目标的训练图像，调整所述第一神经网络的第一网络参数以训练所述第一神经网络，直到所述第一神经网络的第一损失函数满足第一预定阈值条件，获得训练中的所述第一神经网络；以及

16.如权利要求15所述的训练方法，还包括：

重复执行以下训练：

17.如权利要求15所述的训练方法，其中，

18.如权利要求15所述的训练方法，其中，所述第一神经网络用于获取待检测图像的第一特征信息，所述第二神经网络用于获取所述待检测图像的第二特征信息，

19.如权利要求18所述的训练方法，其中，

所述第二神经网络包括：

所述第一神经网络包括：

20.如权利要求19所述的训练方法，其中，

所述第一神经网络还包括

其中，所述热度检测层包括：

21.一种用于目标检测的神经网络的训练装置，所述用于目标检测的神经网络包括第一神经网络和第二神经网络，包括：

第一训练单元，用于利用标注有训练目标的训练图像，调整所述第一神经网络的第一网络参数以训练所述第一神经网络，直到所述第一神经网络的第一损失函数满足第一预定阈值条件，获得训练中的所述第一神经网络；以及

第二训练单元，用于利用所述训练图像、以及所述第一神经网络对于所述训练图像输出的训练用第一特征信息，调整所述第二神经网络的第二网络参数以训练所述第二神经网络，直到所述第二神经网络的第二损失函数满足第二预定阈值条件，获得训练中的所述第二神经网络。

22.如权利要求21所述的训练装置，其中所述第一训练单元和所述第二训练单元分别重复执行以下训练：

23.如权利要求21所述的训练装置，其中，

24.如权利要求21所述的训练装置，所述第一神经网络用于获取待检测图像的第一特征信息，所述第二神经网络用于获取所述待检测图像的第二特征信息，

25.如权利要求24所述的训练装置，其中，

所述第二神经网络包括：

所述第一神经网络包括：

26.如权利要求25所述的训练方法，其中，

所述第一神经网络还包括

其中，所述热度检测层包括：

第二特征组合层，用于接收所述上采样后的的转换特征信息，以生成初始第一特征信息；