CN113705279A

CN113705279A - 目标对象的位置识别的方法及装置

Info

Publication number: CN113705279A
Application number: CN202010435949.XA
Authority: CN
Inventors: 刘毅; 周志鹏
Original assignee: Apollo Intelligent Connectivity Beijing Technology Co Ltd
Current assignee: Apollo Intelligent Connectivity Beijing Technology Co Ltd
Priority date: 2020-05-21
Filing date: 2020-05-21
Publication date: 2021-11-26
Anticipated expiration: 2040-05-21
Also published as: CN113705279B

Abstract

本申请实施例提供一种目标对象的位置识别的方法及装置，涉及智能交通领域，具体包括：将车辆的前置摄像头采集的图像输入检测模型；检测模型包括特征提取网络层和检测头；利用特征提取网络层在图像中提取目标对象的特征，得到第一特征图；从第一特征图中获取第二特征图，第二特征图包括目标对象的部分或全部特征，第二特征图小于第一特征图；利用检测头计算第二特征图，得到目标对象的位置信息。本申请实施例可以避免因为图像裁剪导致的目标对象特征提取准确度低的现象，且因为对特征图进行了裁剪，后续对裁剪后的包含目标对象特征的目标特征图计算时，可以减少运算量，适于低算力芯片。

Description

目标对象的位置识别的方法及装置

技术领域

本申请涉及数据处理技术领域的智能交通，尤其涉及一种目标对象的位置识别的方法及装置。

背景技术

高级驾驶辅助***(advanced driving assistance system，简称ADAS)是自动驾驶领域中的重要技术。ADAS利用安装在车辆上的各种传感器，收集车辆运行时的数据，并结合导航仪地图数据等进行运算与分析，以完成车辆控制。例如，行人碰撞预警是ADAS中的一项核心功能，行人碰撞预警通过进行行人检测，在检测到行人时及时发出预警信息。在进行行人检测时，精确复杂的算法能够得到较高的检测准确率。但是，由于一些车辆内置的芯片为低算力芯片，无法运行精确复杂的算法。因此，如何在内置的芯片为低算力芯片的前提下进行行人检测，是值得探讨的问题。

现有技术中，提出了一种适用于低算力芯片的行人检测方法。该方法将车载摄像头采集的图像进行裁剪，并将裁剪后的图像输入至深度学习网络中，由深度学习网络进行特征提取以及回归目标中心的坐标点，以得到行人检测的结果。

但是，现有技术的方法会导致行人检测的准确率低。

发明内容

本申请实施例提供一种目标对象的位置识别的方法及装置，以解决现有技术中行人检测的准确率低的技术问题。

本申请实施例第一方面提供一种目标对象的位置识别的方法，包括：

将车辆的前置摄像头采集的图像输入检测模型；所述检测模型包括特征提取网络层和检测头；利用所述特征提取网络层在所述图像中提取目标对象的特征，得到第一特征图；从所述第一特征图中获取第二特征图，所述第二特征图包括所述目标对象的部分或全部特征，所述第二特征图小于所述第一特征图；利用所述检测头计算所述第二特征图，得到所述目标对象的位置信息。这样，在图像中提取得到目标对象的特征图后，对特征图进行裁剪，从而可以避免因为图像裁剪导致的目标对象特征提取准确度低的现象，且因为对特征图进行了裁剪，后续对裁剪后的包含目标对象特征的目标特征图计算时，可以减少运算量，适于低算力芯片。

一种可能的实现方式中，所述从所述第一特征图中获取第二特征图，包括：在所述第一特征图中提取所述第一特征图下半区的区域，得到第二特征图。这样，不仅能保证检测精度，也能大幅度降低计算开销。

一种可能的实现方式中，所述从所述第一特征图中获取第二特征图，包括：在所述第一特征图中提取所述第一特征图中在车道线内的区域，得到第二特征图。从而可以在为车辆提供准确警示的情况下，减少计算量。

一种可能的实现方式中，所述从所述第一特征图中获取第二特征图，包括：在所述第一特征图中提取所述第一特征图下半区的、且在车道线内的区域，得到第二特征图。从而可以在为车辆提供准确警示的情况下，较大程度减少计算量。

一种可能的实现方式中，所述利用所述特征提取网络层在所述图像中提取目标对象的特征，得到特征图，包括：利用所述特征提取网络层在所述图像中提取目标对象的特征，得到三层第一特征图；其中，每一层所述第一特征图的下采样倍数不同；所述从所述第一特征图中获取第二特征图，包括：利用所述检测头分别在所述三层第一特征图中获取三个第二特征图。

一种可能的实现方式中，所述利用所述检测头计算所述第二特征图，得到所述目标对象的位置信息，包括：利用所述检测头融合所述三个第二特征图，输出所述目标对象的位置信息。可以理解，在一般的检测网络中backbone和detection head将各占整个计算量的一半，而后分离将降低detection head的一半计算量，因此整个网络计算量会减少25％，这样的方式可以使得小检测模型能够在低性能车机上运行。

一种可能的实现方式中，在所述目标对象距离所述车辆的距离低于阈值的情况下，执行用于表明所述目标对象过近的警示。从而可以较好的辅助驾驶员驾驶。

一种可能的实现方式中，所述三层第一特征图的下采样倍数分别为：8倍、16倍和32倍。

本申请实施例第二方面提供一种目标对象的位置识别的装置，包括：

输入模块，用于将车辆的前置摄像头采集的图像输入检测模型；所述检测模型包括特征提取网络层和检测头；

特征提取模块，用于利用所述特征提取网络层在所述图像中提取目标对象的特征，得到第一特征图；

获取模块，用于从所述第一特征图中获取第二特征图，所述第二特征图包括所述目标对象的部分或全部特征，所述第二特征图小于所述第一特征图；

计算模块，用于利用所述检测头计算所述第二特征图，得到所述目标对象的位置信息。

一种可能的实现方式中，所述获取模块，具体用于：

在所述第一特征图中提取所述第一特征图下半区的区域，得到第二特征图。

一种可能的实现方式中，所述获取模块，具体用于：

在所述第一特征图中提取所述第一特征图中在车道线内的区域，得到第二特征图。

一种可能的实现方式中，所述获取模块，具体用于：

在所述第一特征图中提取所述第一特征图下半区的、且在车道线内的区域，得到第二特征图。

一种可能的实现方式中，所述特征提取模块，具体用于：

利用所述特征提取网络层在所述图像中提取目标对象的特征，得到三层第一特征图；其中，每一层所述第一特征图的下采样倍数不同；

所述获取模块，具体用于：

利用所述检测头分别在所述三层第一特征图中获取三个第二特征图。

一种可能的实现方式中，所述计算模块，具体用于：

利用所述检测头融合所述三个第二特征图，输出所述目标对象的位置信息。

一种可能的实现方式中，还包括：

警示模块，用于在所述目标对象距离所述车辆的距离低于阈值的情况下，执行用于表明所述目标对象过近的警示。

本申请实施例第三方面提供一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如前述第一方面任一项所述的方法。

本申请实施例第四方面提供一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行如前述第一方面中任一项所述的方法。

综上所述，本申请实施例相对于现有技术的有益效果：

本申请实施例中提供了一种目标对象的位置识别的方法及装置，不是对图像进行裁剪，而是在图像中提取得到目标对象的特征图后，对特征图进行裁剪，从而可以避免因为图像裁剪导致的目标对象特征提取准确度低的现象，且因为对特征图进行了裁剪，后续对裁剪后的包含目标对象特征的目标特征图计算时，可以减少运算量，适于低算力芯片。具体的，可以将车辆的前置摄像头采集的图像输入检测模型；检测模型包括特征提取网络层和检测头；利用特征提取网络层在图像中提取目标对象的特征，得到第一特征图；从第一特征图中获取第二特征图，第二特征图包括目标对象的部分或全部特征，第二特征图小于第一特征图；利用检测头计算第二特征图，得到目标对象的位置信息。

附图说明

图1为本申请实施例提供的目标对象的位置识别的方法适用的***架构示意图；

图2为本申请实施例提供的目标对象的位置识别的方法的流程示意图；

图3为本申请实施例提供的一种检测模型的架构示意图；

图4为本申请实施例提供的另一种检测模型的架构示意图；

图5为本申请实施例提供的目标对象的位置识别装置的结构示意图；

图6是用来实现本申请实施例的目标对象的位置识别的方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。在不冲突的情况下，下述的实施例及实施例中的特征可以相互组合。

本申请实施例的目标对象的位置识别方法可以应用于车辆，车辆可以是无人驾驶的车辆，也可以是有人驾驶且有辅助驾驶功能的车辆，车辆具体可以包括轿车、越野车、货车等，本申请实施例对车辆不作具体限定。

车辆中可以设置前置摄像头，例如，前置摄像头可以设置在车辆内的后视镜与前车窗之间，前置摄像头可以采集车辆前方的图像，示例性的，摄像头可以是鱼眼摄像头或其他任意形式的摄像头。

本申请实施例所描述的检测模型可以是基于深度学习的神经网络模型等，检测模型可以是基于包含目标对象的样本图像训练得到的，利用检测模型可以识别目标对象以及输出目标对象的位置信息，目标对象的位置信息例如可以是目标对象的中心点坐标等。

本申请实施例的检测模型可以运行在车辆中较为通用的车载终端等成本低廉的芯片上，部署容易、对芯片计算能力要求不高，使得低端车辆也可以实现对目标对象的位置的识别。

本申请实施例所描述的目标对象可以是行人、自行车、电动车、摩托车等任意可能影响车辆行驶的对象。在目标对象为行人时，可以对应于ADAS中的行人碰撞预警功能，例如，在检测到行人的位置距离车辆的位置较近时，可以采用语音、文字或图片、影像等对驾驶员警示，提示驾驶员注意行人。

本申请实施例所描述第二特征图可以是对第一特征图裁剪后得到的，在裁剪第一特征图时，可以以目标对象作为依据，裁剪包含部分或全部目标对象的特征的第二特征图。也可以不以目标对象作为依据，而是基于一定的规则，例如从高度方向上裁掉第一特征特的上半区，等，得到包含部分或全部目标对象的特征的第二特征图。具体的裁剪方法将在后续实施例中详细说明，在此不再赘述。第二特征图的大小小于第一特征图，使得后续采用第二特征图计算目标对象的位置信息时，计算量减少。

如图1所示，图1为本申请实施例提供的方法所适用的应用场景架构示意图。

如图1所示的车辆1为了进行车联网通信，可以在车辆上设置车载终端(或称为：车联网终端或者车辆到一切(vehicle to everything，简称：V2X)通信装置等)，通过所设置的车载终端，图中的车辆1可以与其他车辆进行车与车(vehicle to vehicle，简称：V2V)通信，与其他行人进行车与行人(vehicle to pedestrian，简称：V2P)通信，与其他路侧基础设备进行车与基础设施(vehicle to infrastructure，简称：V2I)通信，或者通信网络进行车与网络(vehicle to network，简称：V2N)通信等。车载终端能够实现车辆与行人、其他车辆、路侧设备、网络之间的全方位连接和高效信息交互，实现信息服务、交通安全、交通效率等车联网功能。例如，车载终端可以与驾驶员的手机连接后，驾驶员可以使用车载终端播放音乐、地图导航、接打电话等。

随着电子技术以及智能车辆技术的发展，车载终端能够实现的功能也越来越丰富，车载终端需要将更多的功能通过可视化的显示页面呈现给驾驶员，使得驾驶员通过选择页面中的图标控件，来控制车载终端实现图标控件对应的功能。例如，在如图1所示的车辆1内部中控台上设置有车载终端2，该车载终端2在显示界面21所显示的页面上，通过图标控件的方式，向用户展示其能够提供的功能。如图1中以页面中包括打电话、发信息、地图导航、看新闻、看电视和设置功能对应的图标控件作为示例。则对于车辆1的驾驶员，只需要通过旋转中控台22上的旋钮、或者点击中控台22上的按键即可实现对可能的功能的选择。

本申请实施例的车载终端中可以设置有检测模型。车辆1中还可以设置前置摄像头11，例如，如图1所示，前置摄像头11可以设置在车辆内的后视镜与前车窗之间。

在车辆1行驶中，前置摄像头11可以拍摄图像，车载终端可以将图像输入到检测模型中，基于该检测模型识别目标对象并输出目标对象的位置，在目标对象与车辆的距离过近时，可以在显示界面21中通过警示图像或影音提示驾驶员注意，从而可以辅助驾驶员驾驶。

如图2所示，图2为本申请实施例提供的目标对象的位置识别的方法的流程示意图。该方法具体可以包括：

S101：将车辆的前置摄像头采集的图像输入检测模型；所述检测模型包括特征提取网络层(backbone)和检测头(detection head)。

本申请实施例中，backbone用于自动提取图像的复杂特征，detection head用于回归目标对象中心的坐标点。

示例性的，车辆在行驶过程中，可以利用前置摄像头周期性的拍摄图像，车载终端可以将图像输入检测模型。

S102：利用所述特征提取网络层在所述图像中提取目标对象的特征，得到第一特征图。

本申请实施例中，检测模型的特征提取网络层可以基于通常的任意方法在图像中提取目标图像的特征。

示例性的，以目标对象为行人为例，特征提取网络层可以提取图像中的行人的特征，得到第一特征图，第一特征图的数量可以为多个，与检测模型的具体设置有关，本申请实施例对第一特征图的数量不作具体限定。

S103：从所述第一特征图中获取第二特征图，所述第二特征图包括所述目标对象的部分或全部特征，所述第二特征图小于所述第一特征图。

本申请实施例中，一种可能的实现方式中，从第一特征图中获取第二特征图时，可以以目标对象作为依据，从第一特征图中获取包含部分或全部目标对象的特征的第二特征图。

另一种可能的实现方式中，从第一特征图中获取第二特征图时，可以不以目标对象作为依据，而是基于一定的规则，例如从高度方向上裁掉第一特征特的上半区，等，得到包含部分或全部目标对象的特征的第二特征图。

在第一特征图的数量为多个时，可以分别在每一个第一特征图中获取一个第二特征图。第二特征图的大小小于第一特征图，使得后续采用第二特征图计算目标对象的位置信息时，计算量减少。

且，因为本申请实施例在S102中是对完整的图像进行特征提取，能够实现对目标对象的特征的准确提取，实现对目标对象的准确识别，在后续对第一特征图进行剪裁得到第二特征图时，即使裁剪的第二特征图中只是包含部分目标对象的特征，也不会导致错误的识别目标对象。

S104：利用所述检测头计算所述第二特征图，得到所述目标对象的位置信息。

本申请实施例中，检测头可以采用通常的任意方式计算第二特征图，得到目标对象的位置信息，本申请实施例对此不作具体限定。

综上所述，本申请实施例中提供了一种目标对象的位置识别的方法及装置，不是对图像进行裁剪，而是在图像中提取得到目标对象的特征图后，对特征图进行裁剪，从而可以避免因为图像裁剪导致的目标对象特征提取准确度低的现象，且因为对特征图进行了裁剪，后续对裁剪后的包含目标对象特征的目标特征图计算时，可以减少运算量，适于低算力芯片。具体的，可以将车辆的前置摄像头采集的图像输入检测模型；检测模型包括特征提取网络层和检测头；利用特征提取网络层在图像中提取目标对象的特征，得到第一特征图；从第一特征图中获取第二特征图，第二特征图包括目标对象的部分或全部特征，第二特征图小于第一特征图；利用检测头计算第二特征图，得到目标对象的位置信息。

在图2对应的实施例的基础上，一种可能的实现方式中，所述利用所述特征提取网络层在所述图像中提取目标对象的特征，得到特征图，包括：利用所述特征提取网络层在所述图像中提取目标对象的特征，得到三层第一特征图；其中，每一层所述第一特征图的下采样倍数不同；所述从所述第一特征图中获取第二特征图，包括：利用所述检测头分别在所述三层第一特征图中获取三个第二特征图。所述利用所述检测头计算所述第二特征图，得到所述目标对象的位置信息，包括：利用所述检测头融合所述三个第二特征图，输出所述目标对象的位置信息。

示例性的，图3示出了本申请实施例的一种检测模型的架构示意图。

例如，可以向检测模型输入448*256大小的图像，经过backbone后可以有三层第一特征图输出，三层第一特征图分别为下采样8倍的56*32，下采样16倍的28*16，下采样32倍的14*8，对三层第一特征图做高度方向上的分离(可以称为后分离(post-splitting))，得到特征图下半区针对行人中心点的特征区域，称为第二特征图，三个第二特征图分别对应为56*16，28*8，14*4，将三个第二特征图输入到detection head部分融合(ADD)后输出行人的目标中心点坐标28*16*n。

需要说明的是，本申请实施例的后分离的方式与在原图中做前分离(pre-splitting)不同，如图4示出了一种前分离的方式，与后分离不同的是，前分离是将原始图像直接裁剪保留下半区，因为图像裁剪后，可能会直接去掉包含行人上半身，从而严重影响行人特征提取。而本申请实施例的后分离并不影响整体行人特征的获取，只是在backbone之后将描述行人中心点的特征区域提取，因此能得到准确的行人中心坐标，实现在检测准确率不变的情况下减少计算量。

可以理解，在一般的检测网络中backbone和detection head将各占整个计算量的一半，而后分离将降低detection head的一半计算量，因此整个网络计算量会减少25％，这样的方式可以使得小检测模型能够在低性能车机上运行。

在图2对应的实施例的基础上，一种可能的实现方式中，S103的从所述第一特征图中获取第二特征图，包括：在所述第一特征图中提取所述第一特征图下半区的区域，得到第二特征图。

本申请实施例中，发现了下述事实：以车载前置摄像头拍摄到的驾驶场景为图像，一般调整摄像头水平，让路面消失点水平线大致位于离图片顶部的二分之一至三分之二处，此时行人的中心几乎不可能高于图片二分之一处，车内摄像头离地面高度在1.5米，若摄像头平行于地面，即使2米高的行人的中心点也在1.5米以下。基于这个行人在路面上的成像事实，可以认为检测模型中负责估计行人中心点的特征区域在特征图的下半区。

可以理解，对于与行人高度类似的自行车、电动车、摩托车等目标对象，也适用于上述事实。

基于上述事实，本申请实施例使用检测模型从第一特征图中提取所述第一特征图下半区的区域进行行人位置检测，不仅能保证检测精度，也能大幅度降低计算开销。

本申请实施例中，下半区可以是第一特征图的下面的1/3至3/4的区域，本申请实施例对下半区不作具体限定。

在图2对应的实施例的基础上，一种可能的实现方式中，S103的从所述第一特征图中获取第二特征图，包括：在所述第一特征图中提取所述第一特征图中在车道线内的区域，得到第二特征图。

本申请实施例中，发现车道线外区域的目标对象对车辆的行驶影响不大，因此，可以将第一特征图中裁剪掉车道线以外的部分，得到车道线内的区域，作为第二特征图，示例性的，可以在第一特征图中识别车道线，并将第一特征图中车道线外的部分裁减掉，得到第二特征图。从而可以在为车辆提供准确警示的情况下，减少计算量。

在图2对应的实施例的基础上，一种可能的实现方式中，S103的从所述第一特征图中获取第二特征图，包括：在所述第一特征图中提取所述第一特征图下半区的、且在车道线内的区域，得到第二特征图。

本申请实施例中，在第一特征图下半区内进一步提取车道线内的区域，从而可以进一步缩小第二特征图，计算量进一步减少。

在图2对应的实施例的基础上，一种可能的实现方式中，在所述目标对象距离所述车辆的距离低于阈值的情况下，执行用于表明所述目标对象过近的警示。

本申请实施例中，阈值可以根据实际应用场景设定，例如可以为1米至50米之间的任意值，本申请实施例对阈值不作具体限定。

在目标对象距离车辆的距离低于阈值时，如果驾驶员没有注意到目标对象，可能造成碰撞事故，因此，可以执行用于表明目标对象过近的警示。例如，可以在车辆的中控屏中通过警示图像或影音提示驾驶员注意，从而可以较好的辅助驾驶员驾驶。

图5为本申请提供的目标对象的位置识别的装置一实施例的结构示意图。如图5所示，本实施例提供的目标对象的位置识别的装置包括：

输入模块31，用于将车辆的前置摄像头采集的图像输入检测模型；所述检测模型包括特征提取网络层和检测头；

特征提取模块32，用于利用所述特征提取网络层在所述图像中提取目标对象的特征，得到第一特征图；

获取模块33，用于从所述第一特征图中获取第二特征图，所述第二特征图包括所述目标对象的部分或全部特征，所述第二特征图小于所述第一特征图；

计算模块34，用于利用所述检测头计算所述第二特征图，得到所述目标对象的位置信息。

一种可能的实现方式中，所述获取模块，具体用于：

一种可能的实现方式中，所述特征提取模块，具体用于：

所述获取模块，具体用于：

一种可能的实现方式中，所述计算模块，具体用于：

一种可能的实现方式中，还包括：

本申请各实施例提供的目标对象的位置识别的装置可用于执行如前述各对应的实施例所示的方法，其实现方式与原理相同，不再赘述。

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

如图6所示，是根据本申请实施例的目标对象的位置识别的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图6所示，该电子设备包括：一个或多个处理器601、存储器602，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器***)。图6中以一个处理器601为例。

存储器602即为本申请所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本申请所提供的目标对象的位置识别的方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的目标对象的位置识别的方法。

存储器602作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的目标对象的位置识别的方法对应的程序指令/模块(例如，附图5所示的输入模块31、特征提取模块32、获取模块33和计算模块34)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的目标对象的位置识别的方法。

存储器602可以包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需要的应用程序；存储数据区可存储根据目标对象的位置识别的电子设备的使用所创建的数据等。此外，存储器602可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器602可选包括相对于处理器601远程设置的存储器，这些远程存储器可以通过网络连接至目标对象的位置识别的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

目标对象的位置识别的方法的电子设备还可以包括：输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接，图6中以通过总线连接为例。

输入装置603可接收输入的数字或字符信息，以及产生与目标对象的位置识别的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的***和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的***和技术实施在包括后台部件的计算***(例如，作为数据服务器)、或者包括中间件部件的计算***(例如，应用服务器)、或者包括前端部件的计算***(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将***的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

根据本申请实施例的技术方案，不是对图像进行裁剪，而是在图像中提取得到目标对象的特征图后，对特征图进行裁剪，从而可以避免因为图像裁剪导致的目标对象特征提取准确度低的现象，且因为对特征图进行了裁剪，后续对裁剪后的包含目标对象特征的目标特征图计算时，可以减少运算量，适于低算力芯片。具体的，可以将车辆的前置摄像头采集的图像输入检测模型；检测模型包括特征提取网络层和检测头；利用特征提取网络层在图像中提取目标对象的特征，得到第一特征图；从第一特征图中获取第二特征图，第二特征图包括目标对象的部分或全部特征，第二特征图小于第一特征图；利用检测头计算第二特征图，得到目标对象的位置信息。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种目标对象的位置识别的方法，其特征在于，所述方法包括：

将车辆的前置摄像头采集的图像输入检测模型；所述检测模型包括特征提取网络层和检测头；

利用所述特征提取网络层在所述图像中提取目标对象的特征，得到第一特征图；

从所述第一特征图中获取第二特征图，所述第二特征图包括所述目标对象的部分或全部特征，所述第二特征图小于所述第一特征图；

利用所述检测头计算所述第二特征图，得到所述目标对象的位置信息。

2.根据权利要求1所述的方法，其特征在于，所述从所述第一特征图中获取第二特征图，包括：

3.根据权利要求1所述的方法，其特征在于，所述从所述第一特征图中获取第二特征图，包括：

4.根据权利要求1所述的方法，其特征在于，所述从所述第一特征图中获取第二特征图，包括：

5.根据权利要求1-4任一项所述的方法，其特征在于，所述利用所述特征提取网络层在所述图像中提取目标对象的特征，得到特征图，包括：

所述从所述第一特征图中获取第二特征图，包括：

6.根据权利要求5所述的方法，其特征在于，所述利用所述检测头计算所述第二特征图，得到所述目标对象的位置信息，包括：

7.根据权利要求6所述的方法，其特征在于，还包括：

在所述目标对象距离所述车辆的距离低于阈值的情况下，执行用于表明所述目标对象过近的警示。

8.根据权利要求5所述的方法，其特征在于，所述三层第一特征图的下采样倍数分别为：8倍、16倍和32倍。

9.一种目标对象的位置识别的装置，其特征在于，包括：

10.根据权利要求9所述的装置，其特征在于，所述获取模块，具体用于：

11.根据权利要求9所述的装置，其特征在于，所述获取模块，具体用于：

12.根据权利要求9所述的装置，其特征在于，所述获取模块，具体用于：

13.根据权利要求9-12任一项所述的装置，其特征在于，所述特征提取模块，具体用于：

所述获取模块，具体用于：

14.根据权利要求13所述的装置，其特征在于，所述计算模块，具体用于：

15.根据权利要求14所述的装置，其特征在于，还包括：

16.根据权利要求13所述的装置，其特征在于，所述三层第一特征图的下采样倍数分别为：8倍、16倍和32倍。

17.一种电子设备，其特征在于，包括：

至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如权利要求1-8任一项所述的方法的指令。

18.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，计算机指令用于使所述计算机执行如权利要求1-8任一项所述的方法。