WO2021143865A1

WO2021143865A1 - 定位方法及装置、电子设备、计算机可读存储介质

Info

Publication number: WO2021143865A1
Application number: PCT/CN2021/072210
Authority: WO
Inventors: 战赓; 欧阳万里
Original assignee: 北京市商汤科技开发有限公司
Priority date: 2020-01-18
Filing date: 2021-01-15
Publication date: 2021-07-22
Also published as: KR20220093187A; CN111275040A; JP2022540101A; CN111275040B

Abstract

本公开提供了一种定位方法及装置、电子设备、计算机可读存储介质，本公开基于目标图像的图像特征图为图像特征图中的每个特征点确定了一个锚框，即对象边框信息对应的对象边框，锚框及对应预测的锚框存在互斥性，减少了对象定位过程中使用的锚框的数量，降低了计算量。同时基于目标图像的图像特征图还能够确定图像特征图中的每个特征点所属对象的对象类型信息、对象边框信息的置信度、对象类型信息的置信度，继而基于确定的两个置信度确定对象边框信息的最终的置信度，有效增强了对象边框的信息表达能力，有利于提高基于对象边框进行对象定位的准确度。

Description

定位方法及装置、电子设备、计算机可读存储介质

相关申请的交叉引用

本公开要求于2020年1月18日提交的、申请号为202010058788.7、发明名称为“定位方法及装置、电子设备和计算机可读存储介质”的中国专利申请的优先权，该中国专利申请公开的全部内容以引用的方式并入本文中。

技术领域

本公开涉及计算机技术、图像处理领域，具体而言，涉及一种定位方法及装置、电子设备、计算机可读存储介质。

背景技术

对象检测或对象定位是计算机视觉中重要的基础技术，可应用于实例分割、对象追踪、人物识别、人脸识别等场景。

对象检测或对象定位通常会利用锚框，然而，如果使用的锚框数量多、锚框表达能力弱等，会导致对象定位计算量大、定位不准确等缺陷。

发明内容

有鉴于此，本公开至少提供一种定位方法及装置。

第一方面，本公开提供了一种定位方法，包括：

获取目标图像，其中所述目标图像包括至少一个待定位的对象；

基于所述目标图像的图像特征图，确定所述图像特征图中每个特征点所属对象的对象类型信息、每个特征点所属对象的对象边框信息、所述对象类型信息的第一置信度和所述对象边框信息的第二置信度；

基于所述第一置信度和所述第二置信度，分别确定每个特征点所属对象的对象边框信息的目标置信度；

基于每个特征点所属对象的对象边框信息和所述对象边框信息的目标置信度，确定所述目标图像中对象的定位信息。

上述实施方式中，基于目标图像的图像特征图能够为图像特征图中的每个特征点仅确定一个锚框，即对象边框信息对应的对象边框，减少了对象定位过程中使用的锚框的数量，降低了计算量，提高了对象定位的效率。同时基于目标图像的图像特征图还能够确定图像特征图中的每个特征点所属对象的对象类型信息、对象边框信息的置信度、对象类型信息的置信度，继而基于确定的两个置信度确定对象边框信息的最终的置信度，有效增强了对象边框或对象边框信息的信息表达能力，不仅能够表达对象边框信息对应的对象边框的定位信息、对象类型信息，还能表达对象边框信息的置信度信息，从而有利于提高基于对象边框进行对象定位的准确度。

在一种可能的实施方式中，所述图像特征图包括用于对所述图像特征图中的特征点所属的对象进行分类的分类特征图和用于对所述图像特征图中的特征点所属的对象进行定位的定位特征图。

基于所述目标图像的图像特征图，确定所述图像特征图中每个特征点所属对象的对象类型信息、每个特征点所属对象的对象边框信息、所述对象类型信息的第一置信度和所述对象边框信息的第二置信度，包括：

针对所述图像特征图中每个特征点，基于所述分类特征图，确定该特征点所属对象的对象类型信息，和所述对象类型信息的第一置信度；

基于所述定位特征图，确定该特征点所属对象的对象边框信息，和所述对象边框信息的第二置信度。

上述实施方式，基于目标图像的分类特征图和定位特征图，不仅确定了图像特征图中每个特征点所属对象的对象边框信息，还确定了图像特征图中每个特征点所属对象的对象类型信息，以及，对象类型信息和对象边框信息各自的置信度，提高了对象边框的信息表达能力，从而有利于提高基于对象边框进行对象定位的准确度。

在一种可能的实施方式中，针对所述图像特征图中每个特征点，基于所述定位特征图，确定该特征点所属对象的对象边框信息，包括：

针对所述图像特征图中的每个特征点，基于所述定位特征图，分别确定该特征点与该特征点所属对象的对象边框中的每条边界的距离各自所位于的目标距离范围；

基于所述目标距离范围和所述定位特征图，分别确定该特征点与该特征点所属对象的对象边框中的每条边界的目标距离；

基于该特征点在所述图像特征图中的位置信息，和该特征点与每条边界的目标距离，确定该特征点所属对象的对象边框信息。

上述实施方式，首先确定特征点与该特征点所属对象的对象边框中的每条边界的距离所位于的目标距离范围，之后，基于确定的目标距离范围，确定特征点与每条边界的目标距离，经过该两步处理能够提高确定的目标距离的准确度。之后，基于确定的该精确的目标距离，能够为特征点确定一个位置精确的对象边框，提高了确定的对象边框的准确度。

在一种可能的实施方式中，确定该特征点与该特征点所属对象的对象边框中的每条边界的距离各自所位于的目标距离范围，包括：

针对该特征点所属对象的对象边框中的每条边界，基于所述定位特征图，确定该特征点与该条边界的最大距离；

将所述最大距离进行分段处理，得到多个距离范围；

基于所述定位特征图，确定该特征点与该条边界的距离位于每个距离范围内的第一概率值；

基于确定的所述第一概率值，从所述多个距离范围中，选取该特征点与该条边界的距离所位于的目标距离范围。

上述实施方式，可以选取最大概率值对应的距离范围作为特征点与某一边框的距离所位于的目标距离范围，提高了确定的目标距离范围的准确度，从而有利于提高基于该目标距离范围确定的特征点与某一条边界的距离的准确度。

在一种可能的实施方式中，基于确定的所述第一概率值，从所述多个距离范围中，选取该特征点与该条边界的距离所位于的目标距离范围，包括：

将最大的所述第一概率值对应的距离范围作为所述目标距离范围。

基于所述定位特征图，确定该特征点与该条边界的距离的距离不确定参数值；

基于所述距离不确定参数值和每个第一概率值，确定该特征点与该条边界的距离位于每个距离范围内的目标概率值；

将最大的所述目标概率值对应的距离范围，作为该特征点与该条边界的距离所位于的目标距离范围。

上述实施方式，在确定特征点与某条边框的距离位于每个距离范围内的第一概率值的同时，还确定了一个不确定参数值，基于该不确定参数值能够对第一概率进行修正或校正，得到特征点与某条边框的距离位于每个距离范围内的目标概率值，提高了确定的特征点与某条边框的距离位于每个距离范围内的概率值的准确度，从而有利于提高基于该概率值确定的目标距离范围的准确度。

在一种可能的实施方式中，确定所述对象边框信息的第二置信度，包括：

基于该特征点与该特征点所属对象的对象边框中每条边界的距离各自所位于的目标距离范围对应的第一概率值，确定该特征点所属对象的对象边框信息的第二置信度。

在一种可能的实施方式中，确定该特征点所属对象的对象边框信息的第二置信度，包括：

获取该特征点与该特征点所属对象的对象边框中每条边界的距离各自所位于的目标距离范围对应的第一概率值的均值；

确定该均值作为所述第二置信度。

上述实施方式，利用特征点与每条边界的距离所位于的距离范围对应的的第一概率值，能够确定该特征点所属对象的对象边框信息的置信度，增强了对象边框的信息表达能力。

在一种可能的实施方式中，针对所述图像特征图中每个特征点，基于所述分类特征图，确定该特征点所属对象的对象类型信息，包括：

针对所述图像特征图中每个特征点，基于所述分类特征图，确定该特征点所属的对象为每种预设对象类型的第二概率值；

基于最大的所述第二概率值对应的预设对象类型，确定该特征点所属对象的对象类型信息。

上述实施方式，选取最大第二概率值对应的预设对象类型作为该特征点所属对象的对象类型信息，提高了确定的对象类型信息的准确度。

在一种可能的实施方式中，基于每个特征点所属对象的对象边框信息和所述对象边框信息的目标置信度，确定所述目标图像中对象的定位信息，包括：

从所述图像特征图中筛选出多个目标特征点，其中，所述多个目标特征点彼此之间的距离小于预设阈值，并且各个目标特征点所属对象的对象类型信息相同；

从每个目标特征点所属对象的对象边框信息中，选取具有最高目标置信度的对象边框信息，作为目标边框信息；

基于选取的所述目标边框信息，以及所述目标边框信息的目标置信度，确定所述目标图像中对象的定位信息。

上述实施方式，从距离比较近的、对象类型信息相同的特征点中选取目标置信度最高的对象边框信息，来进行对象的定位，能够有效减少用于进行对象定位的对象边框信息的数量，有利于提高对象定位的时效性。

第二方面，本公开提供了一种定位装置，包括：

图像获取模块，用于获取目标图像，其中所述目标图像包括至少一个待定位的对象；

图像处理模块，用于基于所述目标图像的图像特征图，确定所述图像特征图中每个特征点所属对象的对象类型信息、每个特征点所属对象的对象边框信息、所述对象类型信息的第一置信度和所述对象边框信息的第二置信度；

置信度处理模块，用于基于所述第一置信度和所述第二置信度，分别确定每个特征点所属对象的对象边框信息的目标置信度；

定位模块，用于基于每个特征点所属对象的对象边框信息和所述对象边框信息的目标置信度，确定所述目标图像中对象的定位信息。

所述图像处理模块用于：

在一种可能的实施方式中，所述图像处理模块在针对所述图像特征图中每个特征点，基于所述定位特征图，确定该特征点所属对象的对象边框信息时，用于：

在一种可能的实施方式中，所述图像处理模块在确定该特征点与该特征点所属对象的对象边框中的每条边界的距离各自所位于的目标距离范围时，用于：

将所述最大距离进行分段处理，得到多个距离范围；

在一种可能的实施方式中，所述图像处理模块在基于确定的所述第一概率值，从所述多个距离范围中，选取该特征点与该条边界的距离所位于的目标距离范围时，用于：

将最大的目标概率值对应的距离范围作为该特征点与该条边界的距离所位于的目标距离范围。

在一种可能的实施方式中，所述图像处理模块在确定所述对象边框信息的第二置信度时，用于：

在一种可能的实施方式中，所述图像处理模块在确定该特征点所属对象的对象边框信息的第二置信度时，用于：

确定该均值作为所述第二置信度。

在一种可能的实施方式中，所述图像处理模块在针对所述图像特征图中每个特征点，基于所述分类特征图，确定该特征点所属对象的对象类型信息时，用于：

在一种可能的实施方式中，所述定位模块用于：

第三方面，本公开提供了一种电子设备，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行如上所述定位方法的步骤。

第四方面，本公开还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如上所述定位方法的步骤。

本公开所述装置、电子设备、和计算机可读存储介质，至少包含与本公开所述方法的任一方面或任一方面的任一实施方式的技术特征实质相同或相似的技术特征，因此关于所述装置、电子设备、和计算机可读存储介质的效果描述，可以参见所述方法内容的效果描述，这里不再赘述。

附图说明

为了更清楚地说明本公开实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本公开的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本公开实施例提供的一种定位方法的流程图；

图2示出了本公开实施例提供的一种定位方法的流程图；

图3示出了本公开实施例提供的一种定位方法的流程图；

图4示出了本公开实施例提供的一种定位方法的流程图；

图5示出了本公开实施例提供的一种定位方法的流程图；

图6示出了本公开实施例提供的一种定位装置的结构示意图；

图7示出了本公开实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本公开实施例的目的和优点更加清楚，下面将结合本公开实施例中的附图，对本公开实施例进行清楚地描述，应当理解，本公开中附图仅起到说明和描述的目的，并不用于限定本公开的保护范围。另外，应当理解，示意性的附图并未按实物比例绘制。本公开中使用的流程图示出了根据本公开的一些实施例实现的操作。应该理解，流程图的操作可以不按顺序实现，没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外，本领域技术人员在本公开内容的指引下，可以向流程图添加一个或多个其他操作，也可以从流程图中移除一个或多个操作。

另外，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此，以下对参照附图提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围，而是仅仅表示本公开的选定实施例。基于本公开的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本公开保护的范围。

需要说明的是，本公开实施例中将会用到术语“包括”，用于指出其后所声明的特征的存在，但并不排除增加其它的特征。

针对在利用锚框进行对象定位过程中，如何减少定位所用的锚框的数量，提高锚框的信息表达能力，以提高对象定位的准确度，本公开提供了一种定位方法及装置、电子设备、计算机可读存储介质。其中，本公开基于目标图像的图像特征图为图像特征图中的每个特征点仅确定一个锚框，即对象边框信息对应的对象边框，减少了对象定位过程中使用的锚框的数量，降低了计算量。同时基于目标图像的图像特征图还能够确定图像特征图中的每个特征点所属对象的对象类型信息、对象边框信息的置信度、对象类型信息的置信度，继而基于确定的两个置信度确定对象边框信息的最终的置信度，有效增强了对象边框的信息表达能力，有利于提高基于对象边框进行对象定位的准确度。

下面通过具体的实施例对本公开的定位方法及装置、电子设备、计算机可读存储介质进行说明。

本公开实施例提供了一种定位方法，该方法应用于对图像中的对象进行定位的终端设备。该终端设备可以是摄像机、手机、可穿戴设备、个人电脑等，在本公开实施例中并不进行限制。具体地，如图1所示，本公开实施例提供的定位方法包括步骤S110至S140。

S110、获取目标图像。

这里，目标图像可以是在对象追踪过程中拍摄的包括目标对象的图像，也可以是在人脸检测中拍摄的包括人脸的图像，本公开对目标图像的用途并不进行限定。

目标图像中包括至少一个待定位的对象。这里的对象可以是物体，也可以是人、动物等。

目标图像可以由执行本实施例的定位方法的终端设备拍摄，也可以由其他设备拍摄后，传输给执行本实施例的定位方法的终端设备，本公开对目标图像的获得方式并不进行限定。

S120、基于所述目标图像的图像特征图，确定所述图像特征图中每个特征点所属对象的对象类型信息、每个特征点所属对象的对象边框信息、所述对象类型信息的第一置信度和所述对象边框信息的第二置信度。

在执行此步骤之前，首先需要对目标图像进行处理，得到目标图像的图像特征图。在具体实施时，可以利用卷积神经网络对目标图像进行图像特征提取，得到图像特征图。

在确定了目标图像的图像特征图之后，对图像特征图进行处理。由此，能够针对图像特征图中每个特征点，确定该特征点所属对象的对象类型信息、该特征点所属对象的对象边框信息、所述对象类型信息的第一置信度和所述对象边框信息的第二置信度。在具体实施时，可以利用卷积神经网络对图像特征图进行进一步地图像特征提取，来得到所述对象类型信息、对象边框信息、第一置信度和第二置信度。

所述对象类型信息包括特征点所属的对象的对象类别。所述对象边框信息包括特征点与该对象边框信息对应的对象边框中每条边界的距离。其中，所述对象边框也可以称为锚框。

所述第一置信度用于表征基于图像特征图确定的对象类型信息的准确度或可信度。所述第二置信度用于表征基于图像特征图确定的对象边框信息的准确度或可信度。

S130、基于所述第一置信度和所述第二置信度，分别确定每个特征点所属对象的对象边框信息的目标置信度。

这里，可以将第一置信度和第二置信度的乘积作为对象边框信息的目标置信度。该目标置信度用于综合表征对象边框信息对应的对象边框的定位准确度和分类准确度。

当然，还可以利用其他方法确定目标置信度，例如，可以结合第一置信度的预设权重、第二置信度的预设权重、第一置信度和第二置信度来确定目标置信度，本公开对基于第一置信度和第二置信度确定目标置信度的具体的实现方案并不进行限定。

S140、基于每个特征点所属对象的对象边框信息和所述对象边框信息的目标置信度，确定所述目标图像中对象的定位信息。

这里，可以将特征点所属对象的对象边框信息和对象边框信息的目标置信度作为特征点所属对象在目标图像中的定位信息，之后，基于每个特征点所属对象在目标图像中的定位信息，确定目标图像中每个对象的定位信息。

这里，不仅确定了特征点所属对象的对象边框信息，还确定了对象边框信息的目标置信度，有效增强了对象边框或对象边框信息的信息表达能力，不仅能够表达对象边框信息对应的对象边框的定位信息、对象类型信息，还能表达对象边框信息的置信度信息，从而有利于提高基于对象边框进行对象定位的准确度。

另外，上述实施例基于目标图像的图像特征图能够为图像特征图中的每个特征点确定一个锚框，即对象边框信息对应的对象边框，减少了对象定位过程中使用的锚框的数量，降低了计算量，提高了对象定位的效率。

在一些实例中，如图2所示，所述图像特征图包括用于对所述图像特征图中的特征点所属的对象进行分类的分类特征图和用于对所述图像特征图中的特征点所属的对象进行定位的定位特征图。

在具体实施时，如图2所示，可以利用卷积神经网络对目标图像进行图像特征提取，得到初始的特征图，之后分别利用4个3×3、输入输出都是256的卷积层对初始的特征图进行处理，得到所述分类特征图和定位特征图。

在得到分类特征图和定位特征图之后，基于所述目标图像的图像特征图，确定所述图像特征图中每个特征点所属对象的对象类型信息、每个特征点所属对象的对象边框信息、所述对象类型信息的第一置信度和所述对象边框信息的第二置信度，可以利用如下步骤实现：

基于所述分类特征图，确定所述图像特征图中每个特征点所属对象的对象类型信息，和所述对象类型信息的第一置信度；基于所述定位特征图，确定所述图像特征图中每个特征点所属对象的对象边框信息，和所述对象边框信息的第二置信度。

在具体实施时，可以利用卷积神经网络或卷积层对分类特征图进行图像特征提取，得到每个特征点所属对象的对象类型信息，和所述对象类型信息的第一置信度。利用卷积神经网络或卷积层对定位特征图进行图像特征提取，得到每个特征点所属对象的对象边框信息，和所述对象边框信息的第二置信度。

上述实施例，基于目标图像的分类特征图和定位特征图，不仅确定了图像特征图中每个特征点所属对象的对象边框信息，还确定了图像特征图中每个特征点所属对象的对象类型信息，以及，对象类型信息和对象边框信息分别对应的置信度，提高了对象边框的信息表达能力，从而有利于提高基于对象边框进行对象定位的准确度。

在一些实施例中，如图3所示，基于所述定位特征图，确定所述图像特征图中每个特征点所属对象的对象边框信息，可以利用步骤S310至S330实现。

S310、针对所述图像特征图中的每个特征点，基于所述定位特征图，分别确定该特征点与该特征点所属对象的对象边框中的每条边界的距离所位于的目标距离范围，其中，对象边框中的每条边界可以为对象边框在各个方向上的边界，例如，对象边框中的上边界、下边界、左边界和右边界。

这里，可以利用卷积神经网络或卷积层对定位特征图进行图像特征提取，以确定特征点与该特征点所属对象的对象边框中的每条边界的距离所位于的目标距离范围。

在具体实施时，可以首先基于定位特征图，确定该特征点与某条边界的最大距离；之后，将所述最大距离进行分段处理，得到多个距离范围；并利用卷积神经网络或卷积层对定位特征图进行图像特征提取，以确定该特征点与该条边界的距离位于每个距离范围内的第一概率值；最后，基于确定的所述第一概率值，从所述多个距离范围中，选取该特征点与该条边界的距离所位于的目标距离范围。具体地，可以将最大的第一概率值对应的距离范围作为所述目标距离范围。

如图2所示，对象边框可以包括例如上边界、下边界、左边界和右边界，基于所述方法确定了左边界对应的五个距离范围的五个第一概率值a，b，c，d，e，并选取最大的第一概率值b对应的距离范围作为目标距离范围。

上述，选取最大概率值对应的距离范围作为特征点与该条边界的距离所位于的目标距离范围，提高了确定的目标距离范围的准确度，从而有利于提高基于该目标距离范围确定的特征点与某一条边界的距离的准确度。

S320、基于所述目标距离范围和所述定位特征图，分别确定该特征点与该特征点所属对象的对象边框中的每条边界的目标距离。

在确定了目标距离范围之后，选取与目标距离范围匹配的回归网络，例如卷积神经网络，对定位特征图进行图像特征提取，以得到特征点与该特征点所属对象的对象边框中的每条边界的目标距离。

这里在确定了目标距离范围的基础上，进一步利用卷积神经网络确定了一个精确的距离，能够有效提高确定的距离的准确度。

另外，如图2所示，在确定了目标距离之后，可以利用一个预设的或训练好的参数或权重N对确定的目标距离进行校正，得到最终的目标距离。

如图2所示，利用本步骤确定了特征点与左边界的精确的目标距离，该目标距离标注在图2中，用f表示。如图2所示，确定的目标距离位于确定的目标距离范围内。

S330、基于该特征点在所述图像特征图中的位置信息，和该特征点与每条边界的目标距离，确定该特征点所属对象的对象边框信息。

这里利用特征点在图像特征图中的位置信息和该特征点与每条边界的目标距离，能够确定对象边框信息对应的对象边框中每条边界在图像特征图中的位置信息。最后可以将对象边框中所有边界在图像特征图中的位置信息，作为特征点所属对象的对象边框信息。

上述实施例，首先确定特征点与对象边框中的每条边界的距离所位于的目标距离范围，之后，基于确定的目标距离范围，确定特征点与每条边界的目标距离，经过该两步处理能够提高确定的目标距离的准确度。之后，基于确定的该精确的目标距离，能够为特征点确定一个位置精确的对象边框，提高了确定的对象边框的准确度。

在一些实施例中，如图4所示，基于确定的所述第一概率值，从所述多个距离范围中，选取特征点与某条边界的距离所位于的目标距离范围，还可以利用步骤S410至S430实现。

S410、基于所述定位特征图，确定该特征点与某条边界的距离的距离不确定参数(distance uncertainty parameter)值。

这里，可以利用卷积神经网络，在确定特征点与某条边界的距离位于每个距离范围内的第一概率值的同时，确定该特征点与该条边界的距离的距离不确定参数值。这里的距离不确定参数值可以用于表征确定的各个第一概率的可信度。

S420、基于所述距离不确定参数值和每个第一概率值，确定该特征点与该条边界的距离位于每个距离范围内的目标概率值。

这里，利用距离不确定参数值对每个第一概率值进行修正，得到对应的目标概率值。

在具体实施时，可以利用如下公式确定目标概率值：

式中，p _x，n表示特征点与边界x的距离位于第n个距离范围内的目标概率值，N表示距离范围的数量，σ _x表示与边界x对应的距离不确定参数值，s _x，n表示特征点与边界x的距离位于第n个距离范围内的第一概率值；s _x，m表示特征点与边界x的距离位于第m个距离范围内的第一概率值。

S430、基于确定的所述目标概率值，从所述多个距离范围中，选取该特征点与该条边界的距离所位于的目标距离范围。

这里，具体地可以选取最大的目标概率值对应的距离范围作为目标距离范围。

上述实施例，在确定特征点与某条边界的距离位于每个距离范围内的第一概率值的同时，还确定了一个距离不确定参数值，基于该参数值能够对第一概率进行修正或校正，得到特征点与某条边界的距离位于每个距离范围内的目标概率值，提高了确定的特征点与某条边界的距离位于每个距离范围内的概率值的准确度，从而有利于提高基于该概率值确定的目标距离范围的准确度。

在确定特征点与对应的对象边框中每条边界的目标距离之后，可以利用如下步骤确定对应的对象边框信息的置信度，即所述第二置信度：基于所述图像特征图中的特征点与该特征点所属对象的对象边框中每条边界的距离所位于的目标距离范围对应的第一概率值，确定该特征点所属对象的对象边框信息的第二置信度。

在具体实施时，可以将特征点与特征点所属对象的对象边框中所有边界的距离所位于的目标距离范围对应的第一概率值的均值作为所述第二置信度。

当然，还可以利用其他方法确定第二置信度，本公开对基于目标距离范围对应的第一概率值确定第二置信度的方法并不进行限定。

上述实施方式，利用特征点与每条边界的距离所位于的距离范围对应的第一概率值，能够确定该特征点所属对象的对象边框信息的置信度，即所述第二置信度，增强了对象边框的信息表达能力。

在一些实施例中，基于所述分类特征图，确定所述图像特征图中每个特征点所属对象的对象类型信息，可以利用如下步骤实现：基于所述分类特征图，确定所述图像特征图中每个特征点所属的对象为每种预设对象类型的第二概率值；基于最大的所述第二概率值对应的预设对象类型，确定该特征点所属对象的对象类型信息。

在具体实施时，可以利用卷积神经网络或卷积层对分类特征图进行图像特征提取，得到特征点所属的对象为每种预设对象类型的第二概率值。之后，选取最大的第二概率值对应的预设对象类型，来确定该特征点所属对象的对象类型信息。如图2所示，利用本实施例确定的预设对象类型“猫”对应的第二概率值最大，因此确定对象类型信息与猫对应。应注意，在本文中，不同操作可使用同一卷积神经网络的不同部分。

在一些实施例中，如图5所示，基于每个特征点所属对象的对象边框信息和所述对象边框信息的目标置信度，确定所述目标图像中对象的定位信息，可以利用步骤S510至S530实现。

S510、从所述图像特征图中筛选出多个目标特征点，其中，所述多个目标特征点彼此之间的距离小于预设阈值，并且各个目标特征点所属对象的对象类型信息相同。

这里，筛选得到的多个目标特征点为属于同一个对象的特征点。

S520、从每个目标特征点所属对象的对象边框信息中，选取具有最高目标置信度的对象边框信息，作为目标边框信息。

对于属于同一对象的特征点，可以选取最高的目标置信度对应的对象边框信息对对象进行定位，其他目标置信度较低的对象边框信息可以剔除，以降低对象定位过程中的计算量。

S530、基于选取的所述目标边框信息，以及所述目标边框信息的目标置信度，确定所述目标图像中对象的定位信息。

上述实施方式，从距离比较近的、对象类型信息相同的特征点对应的对象边框信息中选取目标置信度最高的对象边框信息，来进行对象的定位，能够有效减少用于进行对象定位的对象边框信息的数量，有利于提高对象定位的时效性。

对应于所述定位方法，本公开实施例还提供了一种定位装置，该装置对图像中的对象进行定位的终端设备上，并且该装置及其各个模块能够执行与所述定位方法相同的方法步骤，并且能够达到相同或相似的有益效果，因此对于重复的部分不再赘述。

如图6所示，本公开提供的定位装置包括：

图像获取模块610，用于获取目标图像，其中所述目标图像包括至少一个待定位的对象。

图像处理模块620，用于基于所述目标图像的图像特征图，确定所述图像特征图中每个特征点所属对象的对象类型信息、每个特征点所属对象的对象边框信息、所述对象类型信息的第一置信度和所述对象边框信息的第二置信度。

置信度处理模块630，用于基于所述第一置信度和所述第二置信度，分别确定每个特征点所属对象的对象边框信息的目标置信度。

定位模块640，用于基于每个特征点所属对象的对象边框信息和所述对象边框信息的目标置信度，确定所述目标图像中对象的定位信息。

在一些实施例中，所述图像特征图包括用于对所述图像特征图中的特征点所属的对象进行分类的分类特征图和用于对所述图像特征图中的特征点所属的对象进行定位的定位特征图。

所述图像处理模块620用于：

基于所述分类特征图，确定所述图像特征图中每个特征点所属对象的对象类型信息，和所述对象类型信息的第一置信度；

基于所述定位特征图，确定所述图像特征图中每个特征点所属对象的对象边框信息，和所述对象边框信息的第二置信度。

在一些实施例中，所述图像处理模块620在基于所述定位特征图，确定所述图像特征图中每个特征点所属对象的对象边框信息时，用于：

在一些实施例中，所述图像处理模块620在确定一个特征点与该特征点所属对象的对象边框中的每条边界的距离各自所位于的目标距离范围时，用于：

将所述最大距离进行分段处理，得到多个距离范围；

在一些实施例中，所述图像处理模块在基于确定的所述第一概率值，从所述多个距离范围中，选取该特征点与该条边界的距离所位于的目标距离范围时，用于：

在一些实施例中，所述图像处理模块620在基于确定的所述第一概率值，从所述多个距离范围中，选取该特征点与该条边界的距离所位于的目标距离范围时，用于：

在一些实施例中，所述图像处理模块620在确定所述对象边框信息的第二置信度时，用于：

基于所述图像特征图中的一个特征点与该特征点所属对象的对象边框中每条边界的距离各自所位于的目标距离范围对应的第一概率值，确定该特征点所属对象的对象边框信息的第二置信度。

在一些实施例中，所述图像处理模块在确定该特征点所属对象的对象边框信息的第二置信度时，用于：

确定该均值作为所述第二置信度。

在一些实施例中，所述图像处理模块620在基于所述分类特征图，确定所述图像特征图中每个特征点所属对象的对象类型信息时，用于：

基于所述分类特征图，确定所述图像特征图中每个特征点所属的对象为每种预设对象类型的第二概率值；

在一些实施例中，所述定位模块640用于：

本公开实施例公开了一种电子设备，如图7所示，包括：处理器701、存储器702和总线703，所述存储器702存储有所述处理器701可执行的机器可读指令，当电子设备运行时，所述处理器701与所述存储器702之间通过总线703通信。

所述机器可读指令被所述处理器701执行时执行以下定位方法的步骤：

除此之外，机器可读指令被处理器701执行时，还可以执行所述方法部分描述的任一实施方式中的方法内容，这里不再赘述。

本公开实施例还提供的一种对应于所述方法及装置的计算机程序产品，包括存储了程序代码的计算机可读存储介质，程序代码包括的指令可用于执行前面方法实施例中的方法，具体实现可参见方法实施例，在此不再赘述。

上文对各个实施例的描述倾向于强调各个实施例之间的不同之处，其相同或相似之处可以相互参考，为了简洁，本文不再赘述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的***和装置的具体工作过程，可以参考方法实施例中的对应过程，本公开中不再赘述。在本公开所提供的几个实施例中，应该理解到，所揭露的***、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个模块或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本公开各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅为本公开的具体实施方式，但本公开的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应以权利要求的保护范围为准。

Claims

一种定位方法，其特征在于，包括：

获取目标图像，其中所述目标图像包括至少一个待定位的对象；

基于所述目标图像的图像特征图，确定所述图像特征图中每个特征点所属对象的对象类型信息、每个特征点所属对象的对象边框信息、所述对象类型信息的第一置信度和所述对象边框信息的第二置信度；

基于所述第一置信度和所述第二置信度，分别确定每个特征点所属对象的对象边框信息的目标置信度；

基于每个特征点所属对象的对象边框信息和所述对象边框信息的目标置信度，确定所述目标图像中对象的定位信息。
根据权利要求1所述的定位方法，其特征在于，所述图像特征图包括用于对所述图像特征图中的特征点所属的对象进行分类的分类特征图和用于对所述图像特征图中的特征点所属的对象进行定位的定位特征图，

基于所述目标图像的图像特征图，确定所述图像特征图中每个特征点所属对象的对象类型信息、每个特征点所属对象的对象边框信息、所述对象类型信息的第一置信度和所述对象边框信息的第二置信度，包括：

针对所述图像特征图中每个特征点，

基于所述分类特征图，确定该特征点所属对象的对象类型信息，和所述对象类型信息的第一置信度；

基于所述定位特征图，确定该特征点所属对象的对象边框信息，和所述对象边框信息的第二置信度。
根据权利要求2所述的定位方法，其特征在于，针对所述图像特征图中每个特征点，基于所述定位特征图，确定该特征点所属对象的对象边框信息，包括：

针对所述图像特征图中的每个特征点，

基于所述定位特征图，分别确定该特征点与该特征点所属对象的对象边框中的每条边界的距离各自所位于的目标距离范围；

基于所述目标距离范围和所述定位特征图，分别确定该特征点与该特征点所属对象的对象边框中的每条边界的目标距离；

基于该特征点在所述图像特征图中的位置信息，和该特征点与每条边界的目标距离，确定该特征点所属对象的对象边框信息。
根据权利要求3所述的定位方法，其特征在于，确定该特征点与该特征点所属对象的对象边框中的每条边界的距离各自所位于的目标距离范围，包括：

针对该特征点所属对象的对象边框中的每条边界，

基于所述定位特征图，确定该特征点与该条边界的最大距离；

将所述最大距离进行分段处理，得到多个距离范围；

基于所述定位特征图，确定该特征点与该条边界的距离位于每个距离范围内的第一概率值；

基于确定的所述第一概率值，从所述多个距离范围中，选取该特征点与该条边界的距离所位于的目标距离范围。
根据权利要求4所述的定位方法，其特征在于，基于确定的所述第一概率值，从所述多个距离范围中，选取该特征点与该条边界的距离所位于的目标距离范围，包括：

将最大的所述第一概率值对应的距离范围作为所述目标距离范围。
根据权利要求4所述的定位方法，其特征在于，基于确定的所述第一概率值，从所述多个距离范围中，选取该特征点与该条边界的距离所位于的目标距离范围，包括：

基于所述定位特征图，确定该特征点与该条边界的距离的距离不确定参数值；

基于所述距离不确定参数值和每个第一概率值，确定该特征点与该条边界的距离位于每个距离范围内的目标概率值；

将最大的所述目标概率值对应的距离范围，作为该特征点与该条边界的距离所位于的目标距离范围。
根据权利要求4所述的定位方法，其特征在于，确定所述对象边框信息的第二置信度，包括：

基于该特征点与该特征点所属对象的对象边框中每条边界的距离各自所位于的目标距离范围对应的第一概率值，确定该特征点所属对象的对象边框信息的第二置信度。
根据权利要求7所述的定位方法，其特征在于，确定该特征点所属对象的对象边框信息的第二置信度，包括：

获取该特征点与该特征点所属对象的对象边框中每条边界的距离各自所位于的目标距离范围对应的第一概率值的均值；

确定该均值作为所述第二置信度。
根据权利要求2至8任一项所述的定位方法，其特征在于，针对所述图像特征图中每个特征点，基于所述分类特征图，确定该特征点所属对象的对象类型信息，包括：

针对所述图像特征图中每个特征点，

基于所述分类特征图，确定该特征点所属的对象为每种预设对象类型的第二概率值；

基于最大的所述第二概率值对应的预设对象类型，确定该特征点所属对象的对象类型信息。
根据权利要求1至9任一项所述的定位方法，其特征在于，基于每个特征点所属对象的对象边框信息和所述对象边框信息的目标置信度，确定所述目标图像中对象的定位信息，包括：

从所述图像特征图中筛选出多个目标特征点，其中，所述多个目标特征点彼此之间的距离小于预设阈值，并且各个目标特征点所属对象的对象类型信息相同；

从每个目标特征点所属对象的对象边框信息中，选取具有最高目标置信度的对象边框信息，作为目标边框信息；

基于选取的所述目标边框信息，以及所述目标边框信息的目标置信度，确定所述目标图像中对象的定位信息。
一种定位装置，其特征在于，包括：

图像获取模块，用于获取目标图像，其中所述目标图像包括至少一个待定位的对象；

图像处理模块，用于基于所述目标图像的图像特征图，确定所述图像特征图中每个特征点所属对象的对象类型信息、每个特征点所属对象的对象边框信息、所述对象类型信息的第一置信度和所述对象边框信息的第二置信度；

置信度处理模块，用于基于所述第一置信度和所述第二置信度，分别确定每个特征点所属对象的对象边框信息的目标置信度；

定位模块，用于基于每个特征点所属对象的对象边框信息和所述对象边框信息的目标置信度，确定所述目标图像中对象的定位信息。
根据权利要求11所述的定位装置，其特征在于，所述图像特征图包括用于对所述图像特征图中的特征点所属的对象进行分类的分类特征图和用于对所述图像特征图中的特征点所属的对象进行定位的定位特征图，

所述图像处理模块用于：

针对所述图像特征图中每个特征点，

基于所述分类特征图，确定该特征点所属对象的对象类型信息，和所述对象类型信息的第一置信度；

基于所述定位特征图，确定该特征点所属对象的对象边框信息，和所述对象边框信息的第二置信度。
根据权利要求12所述的定位装置，其特征在于，所述图像处理模块在针对所述图像特征图中每个特征点，基于所述定位特征图，确定该特征点所属对象的对象边框信息时，用于：

针对所述图像特征图中的每个特征点，

基于所述定位特征图，分别确定该特征点与该特征点所属对象的对象边框中的每条边界的距离各自所位于的目标距离范围；

基于所述目标距离范围和所述定位特征图，分别确定该特征点与该特征点所属对象的对象边框中的每条边界的目标距离；

基于该特征点在所述图像特征图中的位置信息，和该特征点与每条边界的目标距离，确定该特征点所属对象的对象边框信息。
根据权利要求13所述的定位装置，其特征在于，所述图像处理模块在确定该特征点与该特征点所属对象的对象边框中的每条边界的距离各自所位于的目标距离范围时，用于：

针对该特征点所属对象的对象边框中的每条边界，基于所述定位特征图，确定该特征点与该条边界的最大距离；

将所述最大距离进行分段处理，得到多个距离范围；

基于所述定位特征图，确定该特征点与该条边界的距离位于每个距离范围内的第一概率值；

基于确定的所述第一概率值，从所述多个距离范围中，选取该特征点与该条边界的距离所位于的目标距离范围。
根据权利要求14所述的定位装置，其特征在于，所述图像处理模块在基于确定的所述第一概率值，从所述多个距离范围中，选取该特征点与该条边界的距离所位于的目标距离范围时，用于：

将最大的所述第一概率值对应的距离范围作为所述目标距离范围。
根据权利要求14所述的定位装置，其特征在于，所述图像处理模块在基于确定的所述第一概率值，从所述多个距离范围中，选取该特征点与该条边界的距离所位于的目标距离范围时，用于：

基于所述定位特征图，确定该特征点与该条边界的距离的距离不确定参数值；

基于所述距离不确定参数值和每个第一概率值，确定该特征点与该条边界的距离位于每个距离范围内的目标概率值；

将最大的目标概率值对应的距离范围作为该特征点与该条边界的距离所位于的目标距离范围。
根据权利要求14所述的定位装置，其特征在于，所述图像处理模块在确定所述对象边框信息的第二置信度时，用于：

基于该特征点与该特征点所属对象的对象边框中每条边界的距离各自所位于的目标距离范围对应的第一概率值，确定该特征点所属对象的对象边框信息的第二置信度。
根据权利要求17所述的定位装置，其特征在于，所述图像处理模块在确定该特征点所属对象的对象边框信息的第二置信度时，用于：

获取该特征点与该特征点所属对象的对象边框中每条边界的距离各自所位于的目标距离范围对应的第一概率值的均值；

确定该均值作为所述第二置信度。
根据权利要求12至18任一项所述的定位装置，其特征在于，所述图像处理模块在针对所述图像特征图中每个特征点，基于所述分类特征图，确定该特征点所属对象的对象类型信息时，用于：

针对所述图像特征图中每个特征点，

基于所述分类特征图，确定该特征点所属的对象为每种预设对象类型的第二概率值；

基于最大的所述第二概率值对应的预设对象类型，确定该特征点所属对象的对象类型信息。
根据权利要求11至19任一项所述的定位装置，其特征在于，所述定位模块用于：

从所述图像特征图中筛选出多个目标特征点，其中，所述多个目标特征点彼此之间的距离小于预设阈值，并且各个目标特征点所属对象的对象类型信息相同；

从每个目标特征点所属对象的对象边框信息中，选取具有最高目标置信度的对象边框信息，作为目标边框信息；

基于选取的所述目标边框信息，以及所述目标边框信息的目标置信度，确定所述目标图像中对象的定位信息。
一种电子设备，其特征在于，包括：处理器、存储介质和总线，所述存储介质存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储介质之间通过总线通信，所述处理器执行所述机器可读指令，以执行如权利要求1至10任一所述的定位方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行如权利要求1至10任一所述的定位方法。