WO2021179498A1

WO2021179498A1 - 目标检测方法及其模型的训练方法、装置及电子设备

Info

Publication number: WO2021179498A1
Application number: PCT/CN2020/100704
Authority: WO
Inventors: 宋涛
Original assignee: 上海商汤智能科技有限公司
Priority date: 2020-03-11
Filing date: 2020-07-07
Publication date: 2021-09-16
Also published as: CN111508019A; KR20210141650A; TW202135006A; JP2022529838A

Abstract

本申请公开了一种目标检测方法及其模型的训练方法及相关装置、设备，其中，目标检测模型的训练方法包括：获取样本图像，其中，样本图像标注有目标所在的实际区域的实际位置信息；以样本图像中的若干点为检测点，基于每个检测点与实际区域的预设点之间的距离，选择至少一个检测点作为目标的正样本点；利用目标检测模型对样本图像进行目标检测，得到每个正样本点对应的预测区域信息，其中，每个正样本点对应的预测区域信息包括正样本点对应的预测区域的预测位置信息；利用实际位置信息与预测区域信息，确定目标检测模型的损失值；基于目标检测模型的损失值，调整目标检测模型的参数。

Description

目标检测方法及其模型的训练方法、装置及电子设备

相关申请的交叉引用

本申请基于申请号为202010167104.7、申请日为2020年03月11日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本申请作为参考。

技术领域

本申请涉及人工智能技术领域，特别是涉及一种目标检测方法及其模型的训练方法、装置及电子设备。

背景技术

随着神经网络、深度学习等人工智能技术的发展，对神经网络模型进行训练，并利用经训练的神经网络模型完成目标检测等任务的方式，逐渐受到人们的青睐。

目前，现有的神经网络模型一般是基于锚框(anchor)匹配或者无锚框(anchor free)策略，以实现目标检测，然而现有策略在实际使用中仍然存在误检率较高的问题。

发明内容

本申请实施例提供一种目标检测方法及其模型的训练方法、装置及电子设备。

本申请实施例提供了一种目标检测模型的训练方法，包括：获取样本图像，其中，样本图像标注有目标所在的实际区域的实际位置信息；以样本图像中的若干点为检测点，基于每个检测点与实际区域的预设点之间的距离，将至少一个检测点确定为目标的正样本点；利用目标检测模型对样本图像进行目标检测，确定每个正样本点对应的预测区域信息；利用实际位置信息与预测区域信息，确定目标检测模型的损失值；基于目标检测模型的损失值，调整目标检测模型的参数。

其中，样本图像中包含多个目标；以样本图像中的若干点为检测点，基于每个检测点与实际区域的预设点之间的距离，将至少一个检测点确定为目标的正样本点，包括：对样本图像进行降采样，得到对应不同分辨率的多个特征图；基于目标的实际区域的尺寸，将多个目标的实际区域与多个特征图进行分组；其中，尺寸越大的实际区域与分辨率越小的特征图作为同一分组；对于同一分组的特征图和目标的实际区域，确定特征图中的每个点为检测点；基于每个所述检测点与所述实际区域的预设点之间的距离，将至少一个所述检测点确定为所述目标的正样本点。

其中，特征图为m个；基于目标的实际区域的尺寸，将多个目标的实际区域与多个特征图进行分组，包括：计算每个目标的实际区域的面积，将面积的最大值和最小值之间的范围划分为从小到大排序的m个区间；将m个特征图按照分辨率从大到小排列，并将面积属于第i个区间的目标的实际区域与第i个特征图划分至同一分组；其中，i和m为正整数，且i为0至m之间的值。

其中，基于每个检测点与实际区域的预设点之间的距离，将至少一个检测点确定为目标的正样本点，包括：获得每个检测点与实际区域的预设点之间的距离；选择与预设点之间的距离满足预设条件的至少一个检测点作为目标的正样本点。

其中，将与预设点之间的距离满足预设条件的至少一个检测点确定为目标的正样本点，包括：将与预设点之间的距离最近的前若干个检测点确定为目标的正样本点。

其中，预测区域信息包括所述正样本点对应的预测区域的预测位置信息和所述预测区域的预测置信度；利用实际位置信息与预测区域信息，确定目标检测模型的损失值，包括：利用每个目标的实际位置信息与预测位置信息，得到位置损失值；利用预测置信度，得到置信度损失值；基于位置损失值和置信度损失值，确定目标检测模型的损失值。

其中，实际位置信息包括实际区域的实际区域尺寸，预测位置信息包括预测区域的预测区域尺寸；利用每个目标的实际位置信息与预测位置信息，得到位置损失值，包括：利用每个目标的实际区域尺寸和预测区域尺寸，得到区域尺寸损失值；基于区域尺寸损失值，确定位置损失值。

其中，实际位置信息还包括实际区域的预设点位置；预测位置信息还包括预测区域的正样本点与实际区域的预设点之间的预测偏移信息；利用每个目标的实际位置信息与预测位置信息，得到位置损失值，还包括：计算目标的实际区域的预设点位置与对应的正样本点位置之间的实际偏移信息；利用实际偏移信息和预测偏移信息，得到偏移损失值；基于区域尺寸损失值，确定位置损失值，包括：基于区域尺寸损失值和偏移损失值，确定位置损失值。

其中，在基于每个检测点与实际区域的预设点之间的距离，选择至少一个检测点作为目标的正样本点之后，还包括：将剩余的检测点作为负样本点；利用目标检测模型对样本图像进行目标检测，得到每个正样本点对应的预测区域信息，包括：利用目标检测模型对样本图像进行目标检测，得到每个正样本点对应的预测区域信息和每个负样本点对应的预测区域信息；利用预测置信度，得到置信度损失值，包括：利用正样本点对应的预测置信度和负样本点对应的预测置信度，得到置信度损失值。

其中，样本图像为二维图像或三维图像，实际区域为实际边界框，预测区域为预测边界框。

因此，将样本图像设置为二维图像，能够实现对二维图像进行目标检测，将样本图像设置为三维图像，能够实现对三维图像进行目标检测。

本申请实施例提供了一种目标检测方法，包括：获取待测图像；利用目标检测模型对待测图像进行目标检测，得到与待测图像中的目标对应的目标区域信息；其中，目标检测模型是通过上述第一方面中的目标检测模型的训练方法得到的。

本申请实施例提供了一种目标检测模型的训练装置，包括图像获取模块、样本选取模块、目标检测模块和损失确定模块、参数调整模块，图像获取模块配置为获取样本图像；样本选取模块配置为以样本图像中的若干点为检测点，基于每个检测点与实际区域的预设点之间的距离，将至少一个检测点确定为目标的正样本点；目标检测模块配置为利用目标检测模型对样本图像进行目标检测，得到每个正样本点对应的预测区域信息；损失确定模块配置为利用实际位置信息与预测区域信息，确定目标检测模型的损失值；参数调整模块配置为基于目标检测模型的损失值，调整目标检测模型的参数。

本申请实施例提供了一种目标检测装置，包括图像获取模块和目标检测模块，图像获取模块配置为获取待测图像；目标检测模块配置为利用目标检测模型对待测图像进行目标检测，得到与待测图像中的目标对应的目标区域信息；其中，目标检测模型是通过上述目标检测模型的训练装置得到的。

本申请实施例提供了一种电子设备，包括相互耦接的存储器和处理器，处理器配置为执行存储器中存储的程序指令，以实现上述目标检测模型的训练方法，或实现上述目标检测方法。

本申请实施例提供了一种计算机可读存储介质，计算机可读存储介质存储有程序指令，程序指令被处理器执行时实现上述目标检测模型的训练方法，或实现目标检测方法。

本申请实施例提供一种计算机程序，包括计算机可读代码，当所述计算机可读代码在电子设备中运行时，所述电子设备中的处理器执行配置为实现上述任一项所述的目标检测模型的训练方法，或者所述的目标检测方法。

本申请实施例提供的目标检测方法及其模型的训练方法、装置及电子设备，通过将样本图像中的若干点作为检测点，并基于每个检测点与实际区域的预设点之间的距离，将至少一个检测点确定为目标的正样本点，从而利用目标监测模型对样本图像进行目标检测，得到每个正样本点对应的预测区域信息，并利用样本图像中目标所在的实际区域的实际位置信息和预测区域信息所包括的预测位置信息，确定目标检测模型的损失值，从而基于目标检测模型的损失值，调整目标检测模型的参数，能够基于匹配得到的多个正样本点所对应的预测位置信息进行目标检测模型的训练，从而能够在无需设计锚框的前提下，确保召回率，此外，通过基于与位置信息相关的损失值调整目标检测模型的参数，能够确保准确率，进而能够提高目标检测的准确性。

附图说明

图1为本申请实施例提供一种目标检测模型的训练及其应用的网络架构的示意图；

图2为本申请实施例提供的一种目标检测模型的训练方法的流程示意图；

图3为本申请实施例提供的目标检测模型的训练方法中步骤S22的实现流程示意图；

图4为本申请实施例提供的目标检测方法的流程示意图；

图5为本申请实施例提供的目标检测方法得到的若干预测区域信息的示意图；

图6为本申请实施例提供的另一种目标检测方法的流程示意图；

图7为本申请实施例提供的目标检测模型的训练装置的结构示意图；

图8为本申请实施例提供的目标检测装置的结构示意图；

图9为本申请实施例提供的电子设备的结构示意图；

图10为本申请实施例提供的计算机可读存储介质的结构示意图。

具体实施方式

下面结合说明书附图，对本申请实施例的方案进行详细说明。

以下描述中，为了说明而不是为了限定，提出了诸如特定***结构、接口、技术之类的具体细节，以便透彻理解本申请。

本文中术语“***”和“网络”在本文中常被可互换使用。本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。此外，本文中的“多”表示两个或者多于两个。

图1为本申请实施例提供的一种网络架构的示意图，如图1所示，在该网络架构中包括CT机11、计算机设备12和服务器13，其中，CT机11用于采集原始图像。CT机11与计算机设备12建立有通信连接，CT机11可以将得到的原始图像发送给计算机设备12，计算机设备12对原始图像进行标记等处理得到样本图像。在一些实施例中，服务器13中存储有样本图像，计算机设备12与服务器13同样建立有通信连接，计算机设备12可以从服务器13处直接获取样本图像。当计算机设备12获取到样本图像后，基于样本图像调整目标检测模型的参数。本申请实施例中，当CT机11获取到待测图像后，计算机设备12接收到待测图像，计算机设备12基于目标检测模型得到与待测图像中的目标对应的目标区域信息。

在一些实施例中，也可以是服务器13获取到样本图像后，基于样本图像调整自身存储的目标检测模型的参数。本申请实施例中，CT机12采集到待测图像后，通过计算机设备12将待测图像发送给服务器13，以使服务器13基于目标检测模型得到与待测图像中的目标对应的目标区域信息，服务器13在得到目标区域信息后，将目标区域信息返回给计算机设备12。

结合图1所示的应用场景示意图，以下对目标检测方法及其模型的训练方法、装置及电子设备的各实施例进行说明。

本申请实施例提供的一种目标检测模型的训练方法，所述方法应用于目标检测模型的训练设备，所述目标检测模型的训练设备可以是如图1中的计算机设备12，在一些实施例中，也可以是如图1中的服务器13。本申请实施例提供的方法可以通过计算机程序来实现，该计算机程序在执行的时候，完成本申请实施例提供的目标检测模型的训练方法中各个步骤。在一些实施例中，该计算机程序可以被目标检测模型的训练设备的处理器执行。图2为本申请实施例提供的一种目标检测模型的训练方法的流程示意图，如图2所示，目标检测模型的训练方法可以包括如下步骤：

步骤S21：获取样本图像。

本申请实施例中，样本图像标注有目标所在的实际区域的实际位置信息。在本申请的一些实施例中，为了明确实际区域的具体范围，实际区域可以是实际边界框(Bounding Box)，例如，目标的实际边界框，实际边界框可以是矩形框，在此不做限定。在一个实施场景中，为了能够唯一表示一个实际边界框，实际位置信息可以包括实际区域的预设点(例如，实际区域的中心点)的位置信息和实际区域的尺寸(例如，实际边界框的长度和宽度)。

在本申请的一些实施例中，为了实现对二维图像进行目标检测，样本图像可以是二维图像。在另一些实施场景中，为了实现对三维图像进行目标检测，样本图像可以是三维图像，在此不做限定。

在本申请的一些实施例中，为了使目标检测应用于医学图像领域，样本图像可以是医学图像，医学图像可以是CT(Computed Tomography，计算机断层扫描)图像、MR(Magnetic Resonance，核磁共振)图像，在此不做限定。当所述样本图像时医学图像时，样本图像中的目标可以是生物器官等，例如，脑垂体、胰腺等；或者，样本图像中的目标还可以是病变组织等，例如，腔梗、血肿等，在此不做限定。当应用于其他领域时，可以以此类推，在此不再一一举例。

步骤S22：以样本图像中的若干点为检测点，基于每个检测点与实际区域的预设点之间的距离，将至少一个检测点确定为目标的正样本点。

在本申请的一些实施例中，为了提高目标检测模型的准确性，以及后续进行目标检测的准确性，可以获取每个检测点与实际区域的预设点之间的距离，从而将与预设点之间的距离满足预设条件的至少一个检测点确定为目标的正样本点。可以选取与预设点之间的距离小于一预设距离阈值的至少部分检测点，作为目标的正样本点，例如，将与预设点之间的距离小于5个像素点的至少部分检测点，或者，将与预设点之间的距离小于8个像素点的至少部分检测点，作为目标的正样本点，在此不做限定。在本申请的一些实施例中，为了确保不同大小的目标之间的梯度均衡，还可以将与预设点之间的距离最近的前若干个检测点确定为目标的正样本点，前若干个检测点可以是前10个检测点、前20个检测点、前30个检测点等等，在此不做限定，通过以样本图像中的若干点为检测点，基于每个检测点与实际区域的预设点之间的距离，将至少一个检测点确定为目标的正样本点，使得每个实际区域均匹配到数量相同的正样本点，从而能够有利于确保不同大小的目标之间的梯度均衡，进而能够有利于提高目标检测的准确性。

步骤S23：利用目标检测模型对样本图像进行目标检测，得到每个正样本点对应的预测区域信息。

本申请实施例中，每个正样本点对应的预测区域信息包括正样本点对应的预测区域的预测位置信息。在一些实施场景中，为了明确预测区域的范围，预测区域可以是预测边界框，预测边界框可以是矩形，在此不做限定。在一些实施场景中，为了能够唯一表示一个预测边界框，预测区域信息可以包括预测区域的预设点(例如，预测区域的中心点)的位置信息和预测区域的尺寸(例如，预测边界框的长度和宽度)。

步骤S24：利用实际位置信息与预测区域信息，确定目标检测模型的损失值。

在本申请的一些实施例中，为了提高损失计算的准确性，从而提高目标检测模型的准确性，进而提高后续目标检测的准确性，预测区域信息还可以包括预测区域的预测置信度，预测置信度可以表示预测区域的可信度，预测置信度越高，表明预测区域的可信度越高，从而利用每个目标的实际位置信息与预测位置信息，得到位置损失值，并利用预测置信度，得到置信度损失值，基于位置损失值和置信度损失值，得到目标检测模型的损失值。

在本申请的一些实施例中，可以采用二分类交叉熵损失函数、均方误差损失函数、L ₁损失函数中的至少一种计算损失值，在此不做限定。其中，L ₁损失函数，也被称为最小绝对值偏差(Least Absolute Deviation，LAD)或最小绝对值误差(Least Absolute Error，LAE)，总的来说就是把目标值y ⁽ⁱ⁾和估计值

的绝对差值的总和最小化，可以参见公式(1)：

在公式(1)中，m表示正样本点的数量，y ⁽ⁱ⁾为目标值，

为估计值，L ₁为损失函数。

此外，还可以采用L ₂损失函数，也被称为最小平方误差(Least Square Error，LSE)，总的来说，就是把m个正样本点的目标值y ⁽ⁱ⁾和估计值

的差值平方和最小化，可以参见公式(2)：

在公式(2)中，m表示正样本点的数量，y ⁽ⁱ⁾为目标值，

为估计值，L ₂为损失函数。

在本申请的一些实施例中，实际位置信息还可以包括实际区域的实际区域尺寸，预测区域信息还可以包括预测区域的预测区域尺寸，为了进一步提高后续区域尺寸预测的准确性，还可以利用每个目标的实际区域尺寸和预测区域尺寸，得到区域尺寸损失值，并基于区域尺寸损失值，确定位置损失值。

在本申请的一些实施例中，基于位置损失值和置信度损失值在计算目标检测模型的损失值时，可以预先设置与位置损失值对应的位置损失权重和与置信度损失值对应的置信度损失权重，并分别利用位置损失权重和置信度损失权重对位置损失值和置信度损失值进行加权处理，从而得到目标检测模型的损失值。

在本申请的一些实施例中，为了提高目标检测模型的准确性，特别是提高对于小目标的检测准确性，实际位置信息还可以包括实际区域的预设点位置，预测位置还可以包括预测区域的正样本点与实际区域的预设点之间的预测偏移信息，从而可以计算目标的实际区域的预设点位置与对应的正样本点位置之间的实际偏移信息，并利用实际偏移信息和预测偏移信息得到偏移损失值，进而可以基于区域尺寸损失值和偏移损失值，确定位置损失值。示例性地，可以利用IoU(Intersection over Union，交并比)损失函数或L ₁损失函数对每个目标的实际区域尺寸和预测区域尺寸进行计算，得到区域尺寸损失值，并利用L ₁损失函数对实际偏移信息和预测偏移信息进行计算，得到偏移损失值。其中，IoU为实际区域和预测区域之间的交集与并集之间的比值；利用L ₁损失函数，计算预测边界框的实际边界框之间的长度差，和/或，预测边界框和实际边界框之间的宽度差，可以参阅前述相关步骤。

以样本图像的尺寸是100*100为例，实际区域的预设点(如中心点)位置为(38，37.5)，类别为人，某一正样本点的位置为(37.5,37.5)，利用目标检测模型预测得到的预测区域的尺寸为10*15，预测偏移信息为(offset-x，offset-y)，类别为人的置信度为0.9，类别为猫的置信度为0.2，可以计算目标的实际区域的预设点位置与对应的正样本点位置之间的实际偏移信息为(0.5,0.1)，若目标为小目标，其对应的实际区域的尺寸为0.0.2*0.04，则上述偏移量大于实际区域的尺寸，从而导致目标检测的偏差很大，故对偏移量进行损失计算，并进行训练，能够使得预测出来的偏移量趋近于或等于实际的偏移量。

在本申请的一些实施例中，为了进一步提高置信度损失值的准确性，进而提高目标检测的准确性，还可以将除正样本点之外的检测点作为负样本点，并利用目标检测模型对样本图像进行目标检测，得到每个正样本点对应的预测区域信息和每个负样本点对应的预测区域信息，进而利用正样本点对应的预测置信度和负样本点对应的预测置信度，得到置信度损失值。

步骤S25：基于目标检测模型的损失值，调整目标检测模型的参数。

基于计算得到的目标检测模型的损失值，可以对目标检测模型的参数进行调整。目标检测模型的参数可以包括但不限于：目标检测模型的卷积层的权重。

在本申请的一些实施例中，在对目标检测模型的参数进行调整之后，还可以重新执行上述步骤S23以及后续步骤，直至损失值满足预设训练结束条件为止。在本申请的一些实施例中，预设训练结束条件可以包括：目标检测模型的损失值小于一预设损失阈值，且目标检测模型的损失值不再减小。

本申请实施例提供的目标检测模型的训练方法，通过将样本图像中的若干点作为检测点，并基于每个检测点与实际区域的预设点之间的距离，选择至少一个检测点作为目标的正样本点，从而利用目标监测模型对样本图像进行目标检测，得到每个正样本点对应的预测区域信息，并利用样本图像中目标所在的实际区域的实际位置信息和预测区域信息所包括的预测位置信息，确定目标检测模型的损失值，从而基于目标检测模型的损失值，调整目标检测模型的参数，能够基于匹配得到的多个正样本点所对应的预测位置信息进行目标检测模型的训练，从而能够在无需设计锚框的前提下，确保召回率，此外，通过基于与位置信息相关的损失值调整目标检测模型的参数，能够确保准确率，进而能够提高目标检测的准确性。

请参阅图3，图3为本申请实施例提供的目标检测模型的训练方法中步骤S22的流程示意图。本申请实施例中，样本图像中可以包括多个目标，步骤S22可以通过以下步骤实现：

步骤S221：对样本图像进行降采样，得到对应不同分辨率的多个特征图。

在本申请的一些实施例中，可以采用FPN(Feature Pyramid Networks，特征金字塔网络)对样本图像进行降采样，从而得到对应不同分辨率的多个特征图。在本申请的一些实施例中，上述FPN可以为目标检测模型的一部分，从而将样本图像输入目标检测模型即可得到对应不同分辨率的多个特征图。以128*128的样本图像为例，对其进行降采样可以得到对应4*4分辨率的特征图、对应8*8的特征图、对应16*16的特征图等等，在此不做限定。在此基础上，4*4分辨率的特征图中每个特征点对应样本图像的32*32像素区域，而8*8分辨率的特征图中每个特征点对应样本图像的16*16像素区域，而16*16分辨率的特征图中每个特征点对应样本图像的8*8像素区域。其他分辨率的特征图可以以此类推，在此不再一一举例。

步骤S222：基于目标的实际区域的尺寸，将多个目标的实际区域与多个特征图进行分组。

本申请实施例中，尺寸越大的实际区域与分辨率越小的特征图作为同一分组。实际区域的尺寸越大，说明目标越大，反之，说明目标越小，故可采用小分辨率的特征图负责检测大目标，而采用大分辨率的特征图负责检测小目标。仍以上述128*128的样本图像为例，样本图像中多个目标的实际区域的尺寸分别是16*32、11*22、10*20、5*10，故可以将尺寸为16*32的实际区域与分辨率为4*4的特征图分为同一分组，将尺寸为11*22的实际区域和尺寸为10*20的实际区域与分辨率为8*8的特征图分为同一分组，将尺寸为5*10的实际区域与分辨率为16*16的特征图分为同一分组，在此不做限定。

在本申请的一些实施例中，为了准确地将多个目标的实际区域与多个特征图进行分组，还可以计算每个目标的实际区域的面积，将面积的最大值和最小值间的范围划分为从小到大排序的m个区间，其中，m为特征图的数量，将m个特征图按照分辨率从大到小的顺序排列，并将面积属于第i个区间的目标的实际区域与第i个特征图划分至同一分组，其中，i和m为正整数，且i为0至m之间的值。仍以上述128*128的样本图像为例，不同分辨率的特征图的数量m为3，样本图像中多个目标的实际区域的尺寸分别是16*32、11*22、10*20、5*10，面积分别为512、242、200、50，其最大值512和最小值50之间划分3个区间，分别为50～204、204～358、358～512，将4*4分辨率的特征图、8*8的特征图、16*16的特征图按照分辨率从大到小排序为：16*16分辨率的特征图、8*8分辨率的特征图、4*4分辨率的特征图，面积属于第1个区间(即50～204)的目标的实际区域为10*20的实际区域和5*10的实际区域，故将两者与第1个特征图(即分辨率为16*16的特征图)划分至同一分组；面积属于第2个区间(即204～358)的目标的实际区域为11*22的实际区域，故将其与第2个特征图(即分辨率为8*8的特征图)划分至同一分组；面积属于第3个区间(即358～512)的目标的实际区域为16*32的实际区域，故将其与第3个特征图(即分辨率为4*4的特征图)划分至同一分组。其他样本图像可以以此类推，在此不再一一举例。

步骤S223：对于同一分组的特征图和目标的实际区域，以特征图中的每个点为检测点，基于每个检测点与实际区域的预设点之间的距离，选择至少一个检测点作为目标的正样本。

本申请实施例中，可以根据检测点在特征图中的位置坐标和特征图的分辨率，确定检测点在样本图像中的位置坐标，从而根据检测点在样本图像中的位置坐标计算检测点与实际区域的预设点之间的距离。以16*32的实际区域和分辨率为4*4的特征图为例，将4*4特征图中的每个特征点分别作为检测点，由于分辨率为4*4的特征图每个特征点对应128*128样本图像中的32*32，故检测点(1,1)对应于样本图像中的(16,16)，检测点(1,2)对应于样本图像中的(16,48)，检测点(1,3)对应于样本图像中的(16,80)，检测点(1,4)对应于样本图像中的(16,112)检测点 (2,1)对应于样本图像中的(48,16)，检测点(2,2)对应于样本图像中的(48,48)，检测点(2,3)对应于样本图像中的(48,80)，检测点(2,4)对应于样本图像中的(48,112)，若16*32的实际区域的预设点在样本图像中位置为(16,32)，利用欧氏距离，可以计算上述检测点距离实际区域的预设点的距离分别为：16、16、48、80、35.78、35.78、57.69、86.16，其他检测点以此类推，在此不再一一举例。当选择与预设点之间的距离最近的前若干个检测点作为目标的正样本点时，若上述前若干个检测点为4个检测点，则实际区域的尺寸为16*32的目标的正样本点可以是分辨率为4*4的特征图中的特征点(1,1)、(1,2)和(2,1)、(2,2)，其他情况可以以此类推，在此不再一一举例。

区别于前述实施例，通过对样本图像进行降采样，得到对应不同分辨率的多个特征图，从而基于目标的实际区域的尺寸，将多个目标的实际区域与多个特征图进行分组，且尺寸越大的实际区域和分辨率越小的特征图作为同一分组，从而对同一分组的特征图和目标的实际区域，以特征图的每个点为检测点，执行基于每个检测点与实际区域的预设点之间的距离，选择至少一个检测点作为目标的正样本点的步骤，一方面能够使得分辨率高的特征图对应于小尺寸的目标，而分辨率低的特征图对应于大尺寸的目标，从而有利于实现多尺度的目标检测，另一方面能够以每个分组的特征图的每个点为检测点进行正样本点的选取，从而能够有利于确保产生尽可能多的正样本点，进而有利于确保召回率，进而有利于提高目标检测的准确性。

本申请实施例提供的一种目标检测方法，所述方法应用于目标检测设备，所述目标检测设备可以是计算机设备，本申请实施例提供的方法可以通过计算机程序来实现，该计算机程序在执行的时候，完成本申请实施例提供的目标检测方法中各个步骤。在一些实施例中，该计算机程序可以被目标检测设备的处理器执行，图4为本申请实施例提供的目标检测方法的流程示意图，如图4所示，目标检测方法可以包括如下步骤：

步骤S41：获取待测图像。

在本申请的一些实施例中，为了实现对二维图像进行目标检测，待测图像可以是二维图像。在另一些实施场景中，为了实现对三维图像进行目标检测，待测图像可以是三维图像，在此不做限定。

在本申请的一些实施例中，为了使目标检测应用于医学图像领域，待测图像可以是医学图像，例如，CT(Computed Tomography，计算机断层扫描)图像、MR(Magnetic Resonance，核磁共振)图像，在此不做限定。对应的，待测图像中的目标可以是生物器官等，例如，脑垂体、胰腺等；或者，待测图像中的目标还可以是病变组织等，例如，腔梗、血肿等，在此不做限定。当应用于其他领域时，可以以此类推，在此不再一一举例。

步骤S42：利用目标检测模型对待测图像进行目标检测，得到与待测图像中的目标对应的目标区域信息。

本申请实施例中，目标检测模型是通过上述任一目标检测模型的训练方法实施例中的步骤得到的。可以参阅前述任一目标检测模型的训练方法实施例中的步骤。

在本申请的一些实施例中，为了提高目标检测的准确性，可以以待测图像中的若干点为检测点，并利用目标检测模型对待测图像进行目标检测，得到每个检测点对应的预测区域信息，其中，每个检测点对应的预测区域信息包括检测点对应的预测区域的预测置信度和预测区域位置信息，并基于每个检测点对应的预测区域的预测置信度和预测区域位置信息，采用非极大值抑制(Non-Maximum Suppression，NMS)得到与待测图像中的目标对应的目标区域信息。图5为本申请实施例提供的目标检测方法得到的若干预测区域信息的示意图，如图5所示，预测区域01～预测区域05分别是与每个检测点对应的预测区域，且检测得到预测区域01的预测置信度为0.6、预测区域02的预测置信度为0.9、预测区域03的预测置信度为0.8、预测区域04的置信度为0.9、预测区域05的置信度为0.8，将上述预测区域按照预测置信度从小到大排列为：预测区域01、预测区域03、预测区域05、预测区域02、预测区域04，选取预测置信度最大的预测区域04，利用预测位置信息，分别判断预测区域01、预测区域03、预测区域05、预测区域02与预测区域04的IoU是否大于一预设交并比阈值(例如，60％)，若是，则丢弃，如图5所示，预测区域05与预测区域04的交并比较大，假设为85％，则将预测区域05丢弃，而预测区域01～预测区域03与预测区域04的交并比为0，故保留，此时将预测区域04作为与目标对应的目标区域，从剩下的预测区域01～预测区域03中选取预测置信度最大的预测区域02，并基于预测位置信息，判断预测区域01和预测区域03与预测区域02的IoU是否大于一预设交并比阈值(例如，60％)，若是，则丢弃，假设预测区域01和预测区域03与预测区域02的IoU分别为65％、70％，则将预测区域01和预测区域03丢弃，并保留预测区域02作为与目标对应的目标区域。其他情况可以以此类推，在此不再一一举例。

在本申请的一些实施例中，为了实现对待测图像的多尺度检测，从而尽可能全面地检测出待测图像中的目标，特别是小目标，还可以对待测图像进行降采样，得到对应不同分辨率的多个特征图，并将多个特征图中的若干特征点作为检测点，并利用目标检测模型对待测图像进行目标检测，得到每个检测点对应的预测区域信息，并基于每个检测点对应的预测区域的预测置信度和预测区域位置信息，采用非极大值抑制(Non-Maximum Suppression，NMS)从若干检测点对应的预测区域信息中，确定得到与待测图像中的目标对应的目标区域信息。可以参阅前述相关步骤。

在本申请的一些实施例中，在目标检测模型的训练过程中，为了提高目标检测模型的准确性，特别是提高对于小目标的检测准确性，预测位置还可以包括预测区域的正样本点与实际区域的预设点之间的预测偏移信息，从而可以计算目标的实际区域的预设点位置与对应的正样本点位置之间的实际偏移信息，并利用实际偏移信息和预测偏移信息得到偏移损失值，进而可以基于区域尺寸损失值和偏移损失值，得到位置损失值，以利用位置损失值对目标检测模型的参数进行调整，故在对待测图像进行目标检测时所得到的目标区域信息还可以包括目标区域与检测点(x0，y0)之间的偏移信息(offset-x，offset-y)，故目标在待测图像中的位置可以表示为(x0+offset-x，y0+offset-y)，并基于检测得到的类别置信度确定目标的类别，例如，检测到目标为人的类别置信度为0.9，目标为猫的类别置信度为0.1，故可以确定检测到的目标为人。此外，目标区域信息还可以包括目标区域的尺寸(例如，长度和宽度)。

本申请实施例提供的目标检测方法，通过利用上述各个实施例中的目标检测模型的训练方法得到的目标检测模型对待测图像进行目标检测，能够提高目标检测的准确性。

基于前述的各个实施例，本申请实施例再提供一种目标检测方法，所述方法包括：

步骤S61，将获取的待测图像通过FPN网络得到不同分辨率的特征图。

步骤S62，将不同分辨率的特征图进行分组处理。

根据gt box(同上述各个实施例中的实际区域的面积)的大小和不同分辨率下的特征图进行分组，分辨率较高的特征图负责检测小目标，分辨率较低的特征图负责检测较大的目标。计算损失函数时，先对每一个gt box根据检测点到其gt box中心点的距离排序，选择前k个检测点作为该gt box的正样本点，其余点为该gt box的负样本点。根据相应的正样本利用IoU损失回归其gt box的高(H，High)和宽(W，Width)大小，并对相应的正样本点的偏移量用L1损失函数进行回归。

步骤S63，基于该分组在推断的过程中采用NMS操作去除重复的检出框。

本申请实施例提供的方法，具备了足够多的正样本来保证召回率(recall)，同时由于每个gt box匹配到相同的数量的正样本可以保证分类loss中不同大小的目标之间的梯度平衡。采用IOU loss来回归gt box的H和W，同时采用L1loss计算正样本点到实际gt box中心点的偏移值(offset)，得到更精确的位置信息。

对于医疗影像中的疾病位置检测，图6为本申请实施例基于医疗影像中待测图片处理过程示意图，如图6所示，将待侧图像601通过FPN网络得到不同分辨率的特征图，将不同分辨率的特征图进行分组处理得到各个分组602，基于各个分组602采用NMS操作去除重复的检出框，得到疾病位置的图像603。如此，提高了检测精度，降低假阳。

图7是本申请实施例提供的目标检测模型的训练装置的结构示意图，如图7所示，目标检测模型的训练装置70包括：图像获取模块71、样本选取模块72、目标检测模块73、损失确定模块74和参数调整模块75，图像获取模块71配置为获取样本图像，其中，样本图像标注有目标所在的实际区域的实际位置信息；样本选取模块72配置为以样本图像中的若干点为检测点，基于每个检测点与实际区域的预设点之间的距离，将至少一个检测点确定为目标的正样本点；目标检测模块73配置为利用目标检测模型对样本图像进行目标检测，得到每个正样本点对应的预测区域信息；损失确定模块74配置为利用实际位置信息与预测区域信息，确定目标检测模型的损失值；参数调整模块75配置为基于目标检测模型的损失值，调整目标检测模型的参数。

本申请实施例提供的目标检测模型的训练装置，通过将样本图像中的若干点作为检测点，并基于每个检测点与实际区域的预设点之间的距离，将至少一个检测点确定为目标的正样本点，从而利用目标监测模型对样本图像进行目标检测，得到每个正样本点对应的预测区域信息，并利用样本图像中目标所在的实际区域的实际位置信息和预测区域信息所包括的预测位置信息，确定目标检测模型的损失值，从而基于目标检测模型的损失值，调整目标检测模型的参数，能够基于匹配得到的多个正样本点所对应的预测位置信息进行目标检测模型的训练，从而能够在无需设计锚框的前提下，确保召回率，此外，通过基于与位置信息相关的损失值调整目标检测模型的参数，能够确保准确率，进而能够提高目标检测的准确性。

在本申请的一些实施例中，样本图像中包含多个目标，样本选取模块72包括降采样子模块，配置为对样本图像进行降采样，得到对应不同分辨率的多个特征图，样本选取模块72还包括分组子模块，配置为基于目标的实际区域的尺寸，将多个目标的实际区域与多个特征图进行分组；其中，尺寸越大的实际区域与分辨率越小的特征图作为同一分组，样本选取模块72还包括样本选取子模块，配置为对于同一分组的特征图和目标的实际区域，确定特征图中的每个点为检测点，基于每个检测点与实际区域的预设点之间的距离，将至少一个检测点确定为目标的正样本点的步骤。

区别于前述实施例，通过对样本图像进行降采样，得到对应不同分辨率的多个特征图，从而基于目标的实际区域的尺寸，将多个目标的实际区域与多个特征图进行分组，且尺寸越大的实际区域和分辨率越小的特征图作为同一分组，从而对同一分组的特征图和目标的实际区域，以特征图的每个点为检测点，执行基于每个检测点与实际区域的预设点之间的距离，选择至少一个检测点作为目标的正样本点的步骤，一方面能够使得分辨率高的特征图负责小尺寸的目标，而分辨率低的特征图负责大尺寸的目标，从而有利于实现多尺度的目标检测，另一方面能够以每个分组的特征图的每个点为检测点进行正样本点的选取，从而能够有利于确保产生尽可能多的正样本点，进而有利于确保召回率，进而有利于提高目标检测的准确性。

在本申请的一些实施例中，特征图为m个，分组子模块包括区间划分部分，配置为计算每个目标的实际区域的面积，将面积的最大值和最小值之间的范围划分为从小到大排序的m个区间，分组子模块包括分组划分部分，配置为将m个特征图按照分辨率从大到小排列，并将面积属于第i个区间的目标的实际区域与第i个特征图划分至同一分组；其中，i和m为正整数，且i为0至m之间的值。

区别于前述实施例，通过计算每个目标的实际区域的面积，将面积的最大值和最小值之间的范围划分为从小到大排序的m个区间，且m与特征图的数量相同，并将m个特征图按照分辨率从大到小排序，将面积属于第i个区间的目标的实际区域与第i个特征图划分至同一分组，能够使得尺寸越大的实际区域与分辨率越小的特征图作为同一分组，从而能够有利于实现多尺度的目标检测，进而能够有利于提高目标检测的准确性。

在本申请的一些实施例中，样本选取模块72还包括距离计算子模块，配置为获得每个检测点与实际区域的预设点之间的距离，样本选取模块72还包括距离判断子模块，配置为将与预设点之间的距离满足预设条件的至少一个检测点确定为目标的正样本点。

区别于前述实施例，通过获取每个检测点与实际区域的预设点之间的距离，并选择与预设点之间的距离满足预设条件的至少一个检测点作为目标的正样本点，能够有利于确保产生尽可能多的正样本点，进而有利于确保召回率，进而有利于提高目标检测的准确性。

在本申请的一些实施例中，距离判断子模块，配置为将与预设点之间的距离最近的前若干个检测点作为目标的正样本点。

区别于前述实施例，通过选择与预设点之间的距离最近的前若干个检测点作为目标的正样本点，能够使得每个实际区域均匹配到数量相同的正样本点，从而能够有利于确保不同大小的目标之间的梯度均衡，进而能够有利于提高目标检测的准确性。

在本申请的一些实施例中，预测区域信息包括所述正样本点对应的预测区域的预测位置信息和所述预测区域的预测置信度，损失确定模块74包括位置损失值计算子模块，配置为利用每个目标的实际位置信息与预测位置信息，得到位置损失值，损失确定模块74还包括置信度损失值计算子模块，配置为利用预测置信度，得到置信度损失值，损失确定模块74还包括模型损失值计算子模块，配置为基于位置损失值和置信度损失值，确定目标检测模型的损失值。

区别于前述实施例，通过每个目标的实际位置信息与预测位置信息，得到位置损失值，并利用预测置信度得到置信度损失值，从而基于位置损失值和置信度损失值，得到目标检测模型的损失值，能够确保训练过程中损失值计算的准确性，进而能够有利于提高目标检测的准确性。

在本申请的一些实施例中，实际位置信息包括实际区域的实际区域尺寸，预测位置信息包括预测区域的预测区域尺寸，位置损失值计算子模块包括区域尺寸损失值计算部分，配置为利用每个目标的实际区域尺寸和预测区域尺寸，得到区域尺寸损失值，位置损失值计算子模块包括位置损失值计算部分，配置为基于区域尺寸损失值，确定位置损失值。

区别于前述实施例，利用每个目标的实际区域尺寸和预测区域尺寸，得到区域尺寸损失值，并基于区域尺寸损失值，得到位置损失值，能够提高损失值的准确性，能够进一步确保训练过程中损失值计算的准确性，进而能够有利于提高目标检测的准确性。

在本申请的一些实施例中，实际位置信息还包括实际区域的预设点位置；预测位置信息还包括预测区域的正样本点与实际区域的预设点之间的预测偏移信息，区域尺寸损失值计算部分还配置为计算目标的实际区域的预设点位置与对应的正样本点位置之间的实际偏移信息，并利用实际偏移信息和预测偏移信息，得到偏移损失值，位置损失值计算部分还配置为基于区域尺寸损失值和偏移损失值，确定位置损失值。

区别于前述实施例，基于预测区域的正样本点与实际区域的预设点之间的预测偏移信息，以及实际区域的预设点位置与对应的正样本点位置之间的实际偏移信息，得到偏移损失值，并基于区域尺寸损失值和偏移损失值，确定位置损失值，能够提高位置损失值的准确性，进而能够提高目标检测的准确性，特别是能够提高小目标的检测准确性。

在本申请的一些实施例中，样本选取模块72还包括负样本选取子模块，配置为将剩余的检测点作为负样本点，目标检测模块73配置为利用目标检测模型对样本图像进行目标检测，得到每个正样本点对应的预测区域信息和每个负样本点对应的预测区域信息，置信度损失值计算子模块配置为利用正样本点对应的预测置信度和负样本点对应的预测置信度，得到置信度损失值。

区别于前述实施例，利用每个正样本点对应的预测区域信息和每个负样本点对应的预测区域信息，得到置信度损失值，能够有利于提高置信度损失值的准确性，进而能够有利于提高目标检测的准确性。

在本申请的一些实施例中，样本图像为二维图像或三维图像，实际区域为实际边界框，预测区域为预测边界框。

区别于前述实施例，将样本图像设置为二维图像，能够实现对二维图像进行目标检测，将样本图像设置为三维图像，能够实现对三维图像进行目标检测。

图8为本申请实施例提供的目标检测装置的结构示意图，如图8所示，目标检测装置80包括图像获取模块81和目标检测模块82，图像获取模块81配置为获取待测图像；目标检测模块82配置为利用目标检测模型对待测图像进行目标检测，得到与待测图像中的目标对应的目标区域信息；其中，目标检测模型是通过上述任一目标检测模型的训练装置实施例中的目标检测模型的训练装置得到的。

本申请实施例提供的目标检测装置，通过利用上述任一目标检测模型的训练装置实施例中的目标检测模型的训练装置得到的目标检测模型对待测图像进行目标检测，能够提高目标检测的准确性。

图9为本申请实施例提供的电子设备的结构示意图，如图9所示，电子设备90包括相互耦接的存储器91、处理器92和通信总线93，处理器92配置为执行存储器91中存储的程序指令，以实现上述任一目标检测模型的训练方法实施例的步骤，或实现上述任一目标检测方法实施例中的步骤。在一些实施场景中，电子设备90可以包括但不限于：微型计算机、服务器，此外，电子设备90还可以包括笔记本电脑、平板电脑等移动设备，在此不做限定。

处理器92配置为控制其自身以及存储器91以实现上述任一目标检测模型的训练方法实施例的步骤，或实现上述任一目标检测方法实施例中的步骤。通信总线93配置为连接存储器91和处理器92。处理器92还可以称为CPU(Central Processing Unit，中央处理单元)。处理器92可能是一种集成电路芯片，具有信号的处理能力。处理器92还可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外，处理器92可以由集成电路芯片共同实现。

上述方案，能够基于匹配得到的多个正样本点所对应的预测位置信息进行目标检测模型的训练，从而能够在无需设计锚框的前提下，确保召回率，此外，通过基于与位置信息相关的损失值调整目标检测模型的参数，能够确保准确率，进而能够提高目标检测的准确性。

图10为本申请实施例提供的计算机可读存储介质的结构示意图，如图10所示，计算机可读存储介质100存储有能够被处理器运行的程序指令101，程序指令101配置为实现上述任一目标检测模型的训练方法实施例的步骤，或实现上述任一目标检测方法实施例中的步骤。

在本申请所提供的几个实施例中，应该理解到，所揭露的方法和装置，可以通过其它的方式实现。例如，以上所描述的装置实施方式仅仅是示意性的，例如，模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性、机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

工业实用性

本申请实施例公开了一种目标检测方法及其模型的训练方法、装置及电子设备，其中，目标检测模型的训练方法包括：获取样本图像，其中，样本图像标注有目标所在的实际区域的实际位置信息；以样本图像中的若干点为检测点，基于每个检测点与实际区域的预设点之间的距离，选择至少一个检测点作为目标的正样本点；利用目标检测模型对样本图像进行目标检测，得到每个正样本点对应的预测区域信息，其中，每个正样本点对应的预测区域信息包括正样本点对应的预测区域的预测位置信息；利用实际位置信息与预测区域信息，确定目标检测模型的损失值；基于目标检测模型的损失值，调整目标检测模型的参数。在基于该模型进行目标检测是，能够提高目标检测的准确性。

Claims

一种目标检测模型的训练方法，包括：

获取样本图像，其中，所述样本图像标注有目标所在的实际区域的实际位置信息；

以所述样本图像中的若干点为检测点，基于每个所述检测点与所述实际区域的预设点之间的距离，将至少一个所述检测点确定为所述目标的正样本点；

利用目标检测模型对所述样本图像进行目标检测，确定每个所述正样本点对应的预测区域信息；

利用所述实际位置信息与所述预测区域信息，确定所述目标检测模型的损失值；

基于所述目标检测模型的损失值，调整所述目标检测模型的参数。
根据权利要求1所述的训练方法，所述样本图像中包含多个所述目标；

所述以所述样本图像中的若干点为检测点，基于每个所述检测点与所述实际区域的预设点之间的距离，将至少一个所述检测点确定为所述目标的正样本点，包括：

对所述样本图像进行降采样，得到对应不同分辨率的多个特征图；

基于所述目标的实际区域的尺寸，将所述多个目标的实际区域与所述多个特征图进行分组；其中，尺寸越大的所述实际区域与分辨率越小的所述特征图作为同一分组；

对于同一分组的特征图和所述目标的实际区域，将所述特征图中的每个点确定为检测点；

基于每个所述检测点与所述实际区域的预设点之间的距离，将至少一个所述检测点确定为所述目标的正样本点。
根据权利要求2所述的训练方法，所述特征图为m个；

所述基于所述目标的实际区域的尺寸，将所述多个目标的实际区域与所述多个特征图进行分组，包括：

计算每个所述目标的实际区域的面积，将所述面积的最大值和最小值之间的范围划分为从小到大排序的m个区间；

将所述m个特征图按照分辨率从大到小排列，并将面积属于第i个区间的所述目标的实际区域与第i个特征图划分至同一分组；其中，i和m为正整数，且i为0至m之间的值。
根据权利要求1至3任一项所述的训练方法，所述基于每个所述检测点与所述实际区域的预设点之间的距离，将至少一个所述检测点确定为所述目标的正样本点，包括：

获得每个所述检测点与所述实际区域的预设点之间的距离；

将与所述预设点之间的距离满足预设条件的至少一个所述检测点确定为所述目标的正样本点。
根据权利要求4所述的训练方法，所述将与所述预设点之间的距离满足预设条件的至少一个所述检测点确定为所述目标的正样本点，包括：

将与所述预设点之间的距离最近的前若干个检测点确定为所述目标的正样本点。
根据权利要求1所述的训练方法，预测区域信息包括所述正样本点对应的预测区域的预测位置信息和所述预测区域的预测置信度，

所述利用所述实际位置信息与所述预测区域信息，确定所述目标检测模型的损失值，包括：

利用每个目标的所述实际位置信息与所述预测位置信息，得到位置损失值；

利用所述预测置信度，得到置信度损失值；

基于所述位置损失值和所述置信度损失值，确定所述目标检测模型的损失值。
根据权利要求6所述的训练方法，所述实际位置信息包括所述实际区域的实际区域尺寸，所述预测位置信息包括所述预测区域的预测区域尺寸；

所述利用每个目标的所述实际位置信息与所述预测位置信息，得到位置损失值，包括：

利用每个所述目标的实际区域尺寸和预测区域尺寸，得到区域尺寸损失值；

基于所述区域尺寸损失值，确定位置损失值。
根据权利要求7所述的训练方法，所述实际位置信息还包括所述实际区域的预设点位置；所述预测位置信息还包括所述预测区域的正样本点与所述实际区域的预设点之间的预测偏移信息；

所述利用每个目标的所述实际位置信息与所述预测位置信息，得到位置损失值，还包括：

计算所述目标的实际区域的预设点位置与对应的所述正样本点位置之间的实际偏移信息；

利用所述实际偏移信息和所述预测偏移信息，得到偏移损失值；

所述基于所述区域尺寸损失值，确定位置损失值，包括：

基于所述区域尺寸损失值和所述偏移损失值，确定位置损失值。
根据权利要求6所述的训练方法，在所述基于每个所述检测点与所述实际区域的预设点之间的距离，选择至少一个所述检测点作为所述目标的正样本点之后，还包括：

将剩余的所述检测点作为负样本点；

所述利用目标检测模型对所述样本图像进行目标检测，得到每个所述正样本点对应的预测区域信息，包括：

利用目标检测模型对所述样本图像进行目标检测，得到每个所述正样本点对应的预测区域信息和每个所述负样本点对应的预测区域信息；

所述利用所述预测置信度，得到置信度损失值，包括：

利用所述正样本点对应的预测置信度和所述负样本点对应的预测置信度，得到置信度损失值。
根据权利要求1所述的训练方法，所述样本图像为二维图像或三维图像，所述实际区域为实际边界框，所述预测区域为预测边界框。
一种目标检测方法，包括：

获取待测图像；

利用目标检测模型对所述待测图像进行目标检测，得到与所述待测图像中的目标对应的目标区域信息；

其中，所述目标检测模型是通过权利要求1至10任一项所述的目标检测模型的训练方法得到的。
一种目标检测模型的训练装置，包括：

图像获取模块，配置为获取样本图像，其中，所述样本图像标注有目标所在的实际区域的实际位置信息；

样本选取模块，配置为以所述样本图像中的若干点为检测点，基于每个所述检测点与所述实际区域的预设点之间的距离，将至少一个所述检测点确定为所述目标的正样本点；

目标检测模块，配置为利用目标检测模型对所述样本图像进行目标检测，确定每个所述正样本点对应的预测区域信息；

损失确定模块，配置为利用所述实际位置信息与所述预测区域信息，确定所述目标检测模型的损失值；

参数调整模块，配置为基于所述目标检测模型的损失值，调整所述目标检测模型的参数。
根据权利要求12所述的目标检测模型的训练装置，所述样本图像中包含多个所述目标；所述样本选取模块包括：

降采样子模块，配置为对所述样本图像进行降采样，得到对应不同分辨率的多个特征图；

分组子模块，配置为基于所述目标的实际区域的尺寸，将所述多个目标的实际区域与所述多个特征图进行分组；其中，尺寸越大的所述实际区域与分辨率越小的所述特征图作为同一分组；

选取子模块，配置为对于同一分组的特征图和所述目标的实际区域，将所述特征图中的每个点确定为检测点；基于每个所述检测点与所述实际区域的预设点之间的距离，将至少一个所述检测点确定为所述目标的正样本点。
根据权利要求13所述的目标检测模型的训练装置，所述特征图为m个；分组子模块包括：

区间划分部分，配置为计算每个所述目标的实际区域的面积，将所述面积的最大值和最小值之间的范围划分为从小到大排序的m个区间；

分组划分部分，配置为将所述m个特征图按照分辨率从大到小排列，并将面积属于第i个区间的所述目标的实际区域与第i个特征图划分至同一分组；其中，i和m为正整数，且i为0至m之间的值。
根据权利要求12至14任一项所述的目标检测模型的训练装置，所述样本选取模块还包括：

距离计算子模块，配置为获得每个所述检测点与所述实际区域的预设点之间的距离；

距离判断子模块，配置为将与所述预设点之间的距离满足预设条件的至少一个所述检测点确定为所述目标的正样本点。
根据权利要求15所述的目标检测模型的训练装置，所述距离判断子模块还配置为将与所述预设点之间的距离最近的前若干个检测点确定为所述目标的正样本点。
根据权利要求12所述的目标检测模型的训练装置，预测区域信息包括所述正样本点对应的预测区域的预测位置信息和所述预测区域的预测置信度，所述损失确定模块，包括：

位置损失值计算子模块，配置为利用每个目标的所述实际位置信息与所述预测位置信息，得到位置损失值；

置信度损失值计算子模块，配置为利用所述预测置信度，得到置信度损失值；

模型损失值计算子模块，配置为基于所述位置损失值和所述置信度损失值，确定所述目标检测模型的损失值。
根据权利要求17所述的目标检测模型的训练装置，所述实际位置信息包括所述实际区域的实际区域尺寸，所述预测位置信息包括所述预测区域的预测区域尺寸；所述位置损失值计算子模块，包括：

区域尺寸损失值计算部分，配置为利用每个所述目标的实际区域尺寸和预测区域尺寸，得到区域尺寸损失值；

位置损失值计算部分，配置为基于所述区域尺寸损失值，确定位置损失值。
根据权利要求18所述的目标检测模型的训练装置，所述实际位置信息还包括所述实际区域的预设点位置；所述预测位置信息还包括所述预测区域的正样本点与所述实际区域的预设点之间的预测偏移信息；

区域尺寸损失值计算部分，还配置为计算所述目标的实际区域的预设点位置与对应的所述正样本点位置之间的实际偏移信息；利用所述实际偏移信息和所述预测偏移信息，得到偏移损失值；

位置损失值计算部分，还配置为基于所述区域尺寸损失值和所述偏移损失值，确定位置损失值。
根据权利要求19所述的目标检测模型的训练装置，样本选取模块还包括：

负样本选取子模块，配置为将剩余的所述检测点作为负样本点；

目标检测模块配置为利用目标检测模型对所述样本图像进行目标检测，得到每个所述正样本点对应的预测区域信息和每个所述负样本点对应的预测区域信息；

置信度损失值计算子模块，配置为利用所述正样本点对应的预测置信度和所述负样本点对应的预测置信度，得到置信度损失值。
根据权利要求12所述的目标检测模型的训练装置，所述样本图像为二维图像或三维图像，所述实际区域为实际边界框，所述预测区域为预测边界框。
一种目标检测装置，包括：

图像获取模块，配置为获取待测图像；

目标检测模块，配置为利用目标检测模型对所述待测图像进行目标检测，得到与所述待测图像中的目标对应的目标区域信息；

其中，所述目标检测模型是通过权利要求12所述的目标检测模型的训练装置得到的。
一种电子设备，包括相互耦接的存储器和处理器，所述处理器配置为执行所述存储器中存储的程序指令，以实现权利要求1至10任一项所述的目标检测模型的训练方法，或实现权利要求11所述的目标检测方法。
一种计算机可读存储介质，其上存储有程序指令，所述程序指令被处理器执行时实现权利要求1至10任一项所述的目标检测模型的训练方法，或实现权利要求11所述的目标检测方法。
一种计算机程序，包括计算机可读代码，当所述计算机可读代码在电子设备中运行时，所述电子设备中的处理器执行配置为实现权利要求1至10任一项所述的目标检测模型的训练方法，或者权利要求11所述的目标检测方法。