CN115205848A - 目标检测方法、装置、车辆、存储介质及芯片 - Google Patents
目标检测方法、装置、车辆、存储介质及芯片 Download PDFInfo
- Publication number
- CN115205848A CN115205848A CN202210822745.0A CN202210822745A CN115205848A CN 115205848 A CN115205848 A CN 115205848A CN 202210822745 A CN202210822745 A CN 202210822745A CN 115205848 A CN115205848 A CN 115205848A
- Authority
- CN
- China
- Prior art keywords
- sample
- parameter information
- target
- dimensional
- detection model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 239
- 238000000034 method Methods 0.000 claims abstract description 46
- 238000012549 training Methods 0.000 claims abstract description 44
- 230000008569 process Effects 0.000 claims abstract description 11
- 238000003062 neural network model Methods 0.000 claims description 16
- 238000007689 inspection Methods 0.000 claims description 15
- 230000015654 memory Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 6
- 238000004891 communication Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 230000007613 environmental effect Effects 0.000 description 7
- 238000002372 labelling Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000008447 perception Effects 0.000 description 6
- 230000006399 behavior Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000010267 cellular communication Effects 0.000 description 3
- 239000000446 fuel Substances 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- ATUOYWHBWRKTHZ-UHFFFAOYSA-N Propane Chemical compound CCC ATUOYWHBWRKTHZ-UHFFFAOYSA-N 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 2
- 238000002485 combustion reaction Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- SAZUGELZHZOXHB-UHFFFAOYSA-N acecarbromal Chemical compound CCC(Br)(CC)C(=O)NC(=O)NC(C)=O SAZUGELZHZOXHB-UHFFFAOYSA-N 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 239000001294 propane Substances 0.000 description 1
- 230000000979 retarding effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/64—Three-dimensional objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/70—Labelling scene content, e.g. deriving syntactic or semantic representations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
- Traffic Control Systems (AREA)
Abstract
本公开涉及一种目标检测方法、装置、车辆、存储介质及芯片,所述方法包括:采集所述车辆行驶过程中周围环境的环境图像;将所述环境图像输入三维目标检测模型,以获取所述三维目标检测模型输出的目标参数信息,其中,所述三维目标检测模型通过多个第一样本图像和每个所述第一样本图像对应的目标样本参数信息预先训练得到,所述目标样本参数信息通过预先训练的三维检测模型和二维检测模型确定,三维检测模型通过第二样本图像训练得到,所述第二样本图像中的第二样本对象与所述车辆之间的距离小于或等于预设距离阈值,二维检测模型用于获取所述第一样本对象的二维参数信息。这样,提高了三维目标检测模型的准确率,从而提高车辆自动驾驶的安全性。
Description
技术领域
本公开涉及车辆技术领域,尤其涉及一种目标检测方法、装置、车辆、存储介质及芯片。
背景技术
随着人工智能技术的进步,自动驾驶技术获得了极其快速的发展。在自动驾驶技术领域,准确地进行环境感知,对于提高自动驾驶车辆移动的安全性是至关重要的,基于单目视觉的三维目标检测技术应运而生。通常情况下,单目视觉的三维目标检测技术是基于深度学习方法进行的,需要大批量、高精度标注的样本数据。
相关技术中,通过车辆上安装的激光雷达和相机同步采集图像数据和点云数据,根据点云数据对图像数据进行标注后得到样本数据。但是,由于激光雷达照射距离的限制,针对远距离的小目标,采集到的点云数量非常有限,无法进行标注,使得样本数据比较少,从而使得训练得到的三维目标检测模型的准确率比较低,影响车辆自动驾驶的安全性。
发明内容
为克服相关技术中存在的问题,本公开提供一种目标检测方法、装置、车辆、存储介质及芯片。
根据本公开实施例的第一方面,提供一种目标检测方法,应用于车辆,包括:
采集所述车辆行驶过程中周围环境的环境图像;
将所述环境图像输入三维目标检测模型,以获取所述三维目标检测模型输出的目标参数信息,所述目标参数信息包括所述环境图像中的目标对象的目标位置信息、目标尺寸信息以及目标角度信息;
其中,所述三维目标检测模型通过多个第一样本图像和每个所述第一样本图像对应的目标样本参数信息预先训练得到,所述目标样本参数信息包括所述第一样本图像中的第一样本对象的目标样本位置信息、目标样本尺寸信息以及目标样本角度信息,所述目标样本参数信息通过预先训练的三维检测模型和二维检测模型确定,所述三维检测模型通过第二样本图像训练得到,所述第二样本图像中的第二样本对象与所述车辆之间的距离小于或等于预设距离阈值,所述二维检测模型用于获取所述第一样本对象的二维参数信息。
可选地,所述三维目标检测模型通过以下方式训练得到:
获取多个所述第一样本图像;
针对每个所述第一样本图像,将所述第一样本图像输入所述三维检测模型,以获取所述三维检测模型输出的第一样本参数信息,将所述样本图像输入所述二维检测模型,以获取所述二维检测模型输出的二维参数信息,所述第一样本参数信息包括所述第一样本对象的第一样本位置信息、第一样本尺寸信息以及第一样本角度信息;
根据多个所述第一样本参数信息和多个所述二维参数信息,确定每个所述第一样本图像对应的目标样本参数信息;
通过多个所述第一样本图像和每个所述第一样本图像对应的目标样本参数信息,对第一目标神经网络模型进行训练,得到所述三维目标检测模型。
可选地,
所述根据多个所述第一样本参数信息和多个所述二维参数信息,确定每个所述第一样本图像对应的目标样本参数信息包括:
针对每个所述二维参数信息,在确定多个所述第一样本参数信息中存在所述二维参数信息对应的第一目标样本参数信息的情况下,将所述第一目标样本参数信息作为所述目标样本参数信息,在确定多个所述第一样本参数信息中不存在所述第一目标样本参数信息的情况下,通过所述三维检测模型,确定第一目标样本图像对应的多个特征图,并根据所述二维参数信息和多个所述特征图,确定所述第一目标样本图像对应的目标样本参数信息,所述第一目标样本参数信息对应的第一样本对象与所述二维参数信息对应的第一样本对象相同,所述第一目标样本图像为所述二维参数信息对应的第一样本图像。
可选地,
所述确定多个所述第一样本参数信息中存在所述二维参数信息对应的第一目标样本参数信息包括:
针对每个所述第一样本参数信息,确定所述第一样本参数信息对应的第一检测框,确定所述二维参数信息对应的第二检测框与所述第一检测框的交并比,在确定所述交并比大于或等于预设交并比阈值的情况下,确定多个所述第一样本参数信息中存在所述二维参数信息对应的第一目标样本参数信息,并将所述第一样本参数信息作为所述第一目标样本参数信息。
可选地,
所述确定所述第一样本参数信息对应的第一检测框包括:
根据拍摄所述第一样本图像的相机的内参信息和所述第一样本位置信息,确定所述第一样本参数信息对应的第一检测框的中心点的位置信息;
根据所述第一检测框的中心点的位置信息和所述第一样本尺寸信息,确定所述第一检测框。
可选地,
所述三维检测模型包括多个检测模块,所述检测模块包括第一卷积层、第二卷积层以及预测卷积层,所述第一卷积层的输出与所述第二卷积层的输入耦合,所述第二卷积层的输出与所述预测卷积层的输入耦合;所述通过所述三维检测模型,确定第一目标样本图像对应的多个特征图包括:
将所述第一目标样本图像输入所述三维检测模型,以获取所述三维检测模型的预测卷积层输出的多个所述特征图;
所述根据所述二维参数信息和多个所述特征图,确定所述第一目标样本图像对应的目标样本参数信息包括:
确定所述二维参数信息对应的第二检测框的中心点在每个所述特征图上的特征位置信息;
根据多个所述特征位置信息和所述二维参数信息,确定所述第一目标样本图像对应的目标样本参数信息。
可选地,所述三维检测模型通过以下方式预先训练得到:
获取多个所述第二样本图像和每个所述第二样本图像对应的第二样本参数信息,所述第二样本参数信息包括所述第二样本对象的第二样本位置信息、第二样本尺寸信息以及第二样本角度信息,所述第二样本参数信息根据所述第二样本图像对应的点云数据确定;
通过多个所述第二样本图像和每个所述第二样本图像对应的第二样本参数信息,对第二目标神经网络模型进行训练,得到所述三维检测模型。
可选地,所述方法还包括:
根据所述目标参数信息,确定所述车辆的行驶路线;
按照所述行驶路线,控制所述车辆自动行驶。
根据本公开实施例的第二方面,提供一种目标检测装置,应用于车辆,包括:
采集模块,被配置为采集所述车辆行驶过程中周围环境的环境图像;
信息获取模块,被配置为将所述环境图像输入三维目标检测模型,以获取所述三维目标检测模型输出的目标参数信息,所述目标参数信息包括所述环境图像中的目标对象的目标位置信息、目标尺寸信息以及目标角度信息;
其中,所述三维目标检测模型通过多个第一样本图像和每个所述第一样本图像对应的目标样本参数信息预先训练得到,所述目标样本参数信息包括所述第一样本图像中的第一样本对象的目标样本位置信息、目标样本尺寸信息以及目标样本角度信息,所述目标样本参数信息通过预先训练的三维检测模型和二维检测模型确定,所述三维检测模型通过第二样本图像训练得到,所述第二样本图像中的第二样本对象与所述车辆之间的距离小于或等于预设距离阈值,所述二维检测模型用于获取所述第一样本对象的二维参数信息。
可选地,所述三维目标检测模型通过以下方式训练得到:
获取多个所述第一样本图像;
针对每个所述第一样本图像,将所述第一样本图像输入所述三维检测模型,以获取所述三维检测模型输出的第一样本参数信息,将所述样本图像输入所述二维检测模型,以获取所述二维检测模型输出的二维参数信息,所述第一样本参数信息包括所述第一样本对象的第一样本位置信息、第一样本尺寸信息以及第一样本角度信息;
根据多个所述第一样本参数信息和多个所述二维参数信息,确定每个所述第一样本图像对应的目标样本参数信息;
通过多个所述第一样本图像和每个所述第一样本图像对应的目标样本参数信息,对第一目标神经网络模型进行训练,得到所述三维目标检测模型。
可选地,所述根据多个所述第一样本参数信息和多个所述二维参数信息,确定每个所述第一样本图像对应的目标样本参数信息包括:
针对每个所述二维参数信息,在确定多个所述第一样本参数信息中存在所述二维参数信息对应的第一目标样本参数信息的情况下,将所述第一目标样本参数信息作为所述目标样本参数信息,在确定多个所述第一样本参数信息中不存在所述第一目标样本参数信息的情况下,通过所述三维检测模型,确定第一目标样本图像对应的多个特征图,并根据所述二维参数信息和多个所述特征图,确定所述第一目标样本图像对应的目标样本参数信息,所述第一目标样本参数信息对应的第一样本对象与所述二维参数信息对应的第一样本对象相同,所述第一目标样本图像为所述二维参数信息对应的第一样本图像。
可选地,所述确定多个所述第一样本参数信息中存在所述二维参数信息对应的第一目标样本参数信息包括:
针对每个所述第一样本参数信息,确定所述第一样本参数信息对应的第一检测框,确定所述二维参数信息对应的第二检测框与所述第一检测框的交并比,在确定所述交并比大于或等于预设交并比阈值的情况下,确定多个所述第一样本参数信息中存在所述二维参数信息对应的第一目标样本参数信息,并将所述第一样本参数信息作为所述第一目标样本参数信息。
可选地,所述确定所述第一样本参数信息对应的第一检测框包括:
根据拍摄所述第一样本图像的相机的内参信息和所述第一样本位置信息,确定所述第一样本参数信息对应的第一检测框的中心点的位置信息;
根据所述第一检测框的中心点的位置信息和所述第一样本尺寸信息,确定所述第一检测框。
可选地,所述三维检测模型包括多个检测模块,所述检测模块包括第一卷积层、第二卷积层以及预测卷积层,所述第一卷积层的输出与所述第二卷积层的输入耦合,所述第二卷积层的输出与所述预测卷积层的输入耦合;所述通过所述三维检测模型,确定第一目标样本图像对应的多个特征图包括:
将所述第一目标样本图像输入所述三维检测模型,以获取所述三维检测模型的预测卷积层输出的多个所述特征图;
所述根据所述二维参数信息和多个所述特征图,确定所述第一目标样本图像对应的目标样本参数信息包括:
确定所述二维参数信息对应的第二检测框的中心点在每个所述特征图上的特征位置信息;
根据多个所述特征位置信息和所述二维参数信息,确定所述第一目标样本图像对应的目标样本参数信息。
可选地,所述三维检测模型通过以下方式预先训练得到:
获取多个所述第二样本图像和每个所述第二样本图像对应的第二样本参数信息,所述第二样本参数信息包括所述第二样本对象的第二样本位置信息、第二样本尺寸信息以及第二样本角度信息,所述第二样本参数信息根据所述第二样本图像对应的点云数据确定;
通过多个所述第二样本图像和每个所述第二样本图像对应的第二样本参数信息,对第二目标神经网络模型进行训练,得到所述三维检测模型。
可选地,所述装置还包括:
路线确定模块,被配置为根据所述目标参数信息,确定所述车辆的行驶路线;
控制模块,被配置为按照所述行驶路线,控制所述车辆自动行驶。
根据本公开实施例的第三方面,提供一种车辆,包括:
第一处理器;
用于存储处理器可执行指令的存储器;
其中,所述第一处理器被配置为:
实现本公开第一方面所述方法的步骤。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开第一方面所述方法的步骤。
根据本公开实施例的第五方面,提供一种芯片,包括第二处理器和接口;所述第二处理器用于读取指令以执行本公开第一方面所述的方法。
本公开的实施例提供的技术方案可以包括以下有益效果:采集所述车辆行驶过程中周围环境的环境图像;将所述环境图像输入三维目标检测模型,以获取所述三维目标检测模型输出的目标参数信息,所述目标参数信息包括所述环境图像中的目标对象的目标位置信息、目标尺寸信息以及目标角度信息;其中,所述三维目标检测模型通过多个第一样本图像和每个所述第一样本图像对应的目标样本参数信息预先训练得到,所述目标样本参数信息包括所述第一样本图像中的第一样本对象的目标样本位置信息、目标样本尺寸信息以及目标样本角度信息,所述目标样本参数信息通过预先训练的三维检测模型和二维检测模型确定,所述三维检测模型通过第二样本图像训练得到,所述第二样本图像中的第二样本对象与所述车辆之间的距离小于或等于预设距离阈值,所述二维检测模型用于获取所述第一样本对象的二维参数信息。也就是说,本公开可以通过预先训练的三维检测模型和二维检测模型确定样本图像对应的目标样本参数信息,对远距离的小目标也可以进行标注,使得标注得到的样本数据更加丰富,提高了三维目标检测模型的准确率,从而提高车辆自动驾驶的安全性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种目标检测方法的流程图;
图2是根据一示例性实施例示出的一种三维目标检测模型的训练方法的流程图;
图3是根据一示例性实施例示出的一种三维检测模型的训练方法的流程图;
图4是根据一示例性实施例示出的另一种目标检测方法的流程图;
图5是根据一示例性实施例示出的一种目标检测装置的框图;
图6是根据一示例性实施例示出的另一种目标检测装置的框图;
图7是一示例性实施例示出的一种车辆的功能框图示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
需要说明的是,本申请中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。
首先,对本公开的应用场景进行说明。在采集训练三维目标检测模型的样本数据时,对车辆上安装的激光雷达、相机的内外参以及时间同步都有非常高的要求,导致样本数据采集的难度比较大,并且,目前样本数据的标注过程需要人工操作,导致样本数据标注的效率比较低,从而在样本数据比较少的情况下,训练得到的三维目标检测模型的准确率也比较低。另外,激光雷达的远距离照射效果比较差,针对远距离的小目标,通过激光雷达采集到的点云数据比较少,导致无法对目标进行标注,从而无法获取远距离小目标对应的样本数据,也会导致三维目标检测模型的准确率也比较低,影响车辆自动驾驶的安全性。
为了解决以上技术问题,本公开提供了一种目标检测方法、装置、车辆、存储介质及芯片,通过预先训练的三维检测模型和二维检测模型确定样本图像对应的目标样本参数信息,对远距离的小目标也可以进行标注,使得标注得到的样本数据更加丰富,提高了三维目标检测模型的准确率,从而提高车辆自动驾驶的安全性。
图1是根据一示例性实施例示出的一种目标检测方法的流程图,该方法应用于车辆,如图1所示,可以包括:
S101、采集车辆行驶过程中周围环境的环境图像。
在本步骤中,在车辆行驶过程中,可以通过该车辆上安装的摄像头采集该车辆周围环境的环境图像。
S102、将该环境图像输入三维目标检测模型,以获取该三维目标检测模型输出的目标参数信息。
其中,该目标参数信息可以包括该环境图像中的目标对象的目标位置信息、目标尺寸信息以及目标角度信息。该目标位置信息可以是该目标对象在该车辆的车体坐标系中的三维坐标信息,例如,该目标位置信息可以是(x,y,z),该目标尺寸信息可以是该目标对象对应的三维检测框的尺寸,例如,该目标尺寸信息可以是(w,h,l),该目标角度信息可以是该目标对象相对于拍摄该环境图像的摄像头的角度。
该三维目标检测模型可以通过多个第一样本图像和每个该第一样本图像对应的目标样本参数信息预先训练得到,该目标样本参数信息包括该第一样本图像中的第一样本对象的目标样本位置信息、目标样本尺寸信息以及目标样本角度信息,该目标样本参数信息通过预先训练的三维检测模型和二维检测模型确定,该三维检测模型通过第二样本图像训练得到,该第二样本图像中的第二样本对象与该车辆之间的距离小于或等于预设距离阈值,该二维检测模型用于获取该第一样本对象的二维参数信息。
在本步骤中,在采集到该环境图像后,可以将该环境图像输入该三维目标检测模型,通过该三维目标检测模型对该环境图像进行检测,确定该环境图像对应的目标参数信息。
采用上述方法,通过预先训练的三维检测模型和二维检测模型确定样本图像对应的目标样本参数信息,对远距离的小目标也可以进行标注,使得标注得到的样本数据更加丰富,提高了三维目标检测模型的准确率,从而提高车辆自动驾驶的安全性。
图2是根据一示例性实施例示出的一种三维目标检测模型的训练方法的流程图,如图2所示,该方法可以包括:
S21、获取多个该第一样本图像。
在本步骤中,可以将该车辆历史时间段内行驶过程中采集的历史环境图像,作为该第一样本图像。该历史环境图像可以包括在不同路况、不同时间段采集的环境图像,不同的历史环境图像所拍摄的对象距离该车辆的距离也可以不同,示例地,该历史环境图像可以是拍摄距离该车辆10米的对象的图像,也可以是拍摄距离该车辆30米的对象的图像,本公开对该第一样本图像的采集方式不作限定。
S22、针对每个该第一样本图像,将该第一样本图像输入该三维检测模型,以获取该三维检测模型输出的第一样本参数信息,将该样本图像输入该二维检测模型,以获取该二维检测模型输出的二维参数信息。
其中,该第一样本参数信息可以包括该第一样本对象的第一样本位置信息、第一样本尺寸信息以及第一样本角度信息,需要说明的是,该第一样本位置信息、第一样本尺寸信息以及第一样本角度信息,与步骤S102中目标位置信息、目标尺寸信息以及目标角度信息的定义相同,此处不再赘述。
在本步骤中,在采集到多个第一样本图像后,可以分别将该第一样本图像输入该三维检测模型和该二维检测模型,通过该三维检测模型确定该第一样本图像对应的第一样本参数信息,通过该二维检测模型确定该第一样本图像对应的二维参数信息。之后,可以结合该第一样本参数信息和该二维参数信息,确定该第一样本图像对应的目标样本参数信息。需要说明的是,本公开对确定该第一样本参数信息和该二维参数信息的顺序不作限定。
S23、根据多个该第一样本参数信息和多个该二维参数信息,确定每个该第一样本图像对应的目标样本参数信息。
在一种可能的实现方式中,针对每个该二维参数信息,在确定多个该第一样本参数信息中存在该二维参数信息对应的第一目标样本参数信息的情况下,将该第一目标样本参数信息作为该目标样本参数信息,在确定多个该第一样本参数信息中不存在该第一目标样本参数信息的情况下,通过该三维检测模型,确定第一目标样本图像对应的多个特征图,并根据该二维参数信息和多个该特征图,确定该第一目标样本图像对应的目标样本参数信息,该第一目标样本参数信息对应的第一样本对象与该二维参数信息对应的第一样本对象相同,该第一目标样本图像为该二维参数信息对应的第一样本图像。
其中,针对每个该第一样本参数信息,确定该第一样本参数信息对应的第一检测框,确定该二维参数信息对应的第二检测框与该第一检测框的交并比,在确定该交并比大于或等于预设交并比阈值的情况下,确定多个该第一样本参数信息中存在该二维参数信息对应的第一目标样本参数信息,并将该第一样本参数信息作为该第一目标样本参数信息。
示例地,以任一第一样本参数信息为例,可以根据拍摄该第一样本图像的相机的内参信息和该第一样本位置信息,确定该第一样本参数信息对应的第一检测框的中心点的位置信息;根据该第一检测框的中心点的位置信息和该第一样本尺寸信息,确定该第一检测框。其中,该内参信息可以包括相机x轴和y轴的焦距,该相机的光心位置。
例如,可以通过公式(1)计算得到该第一检测框的中心点的位置信息:
其中,(ximg,yimg)为该第一检测框的中心点的位置信息,fx为该相机x轴的焦距,fy为该相机y轴的焦距,(cx,cy)为该相机的光心位置,(xi,yi,zi)为该第一样本位置信息。
在计算得到该第一检测框的中心点的位置信息后,可以结合该第一样本尺寸信息,确定x轴、y轴以及z轴三个方向的边界线,得到该第一检测框。
在确定该第一样本参数信息对应的第一检测框后,可以通过公式(2)计算得到该二维参数信息对应的第二检测框与该第一检测框的交并比:
其中,scoreiou为该交并比,bboxa为该第一检测框,bboxb为该第二检测框。
在计算得到该第一检测框与该第二检测框的交并比后,获取该预设交并比阈值,在该交并比大于或等于该预设交并比阈值的情况下,确定多个该第一样本参数信息中存在该二维参数信息对应的第一目标样本参数信息,并将该第一样本参数信息作为该第一目标样本参数信息,将该第一目标样本参数信息作为该目标样本参数信息。
在该交并比小于该预设交并比阈值的情况下,确定多个该第一样本参数信息中不存在该二维参数信息对应的第一目标样本参数信息,在这种情况下,可以通过该三维检测模型,确定第一目标样本图像对应的多个特征图,并根据该二维参数信息和多个该特征图,确定该第一目标样本图像对应的目标样本参数信息。
在一种可能的实现方式中,该三维检测模型可以包括多个检测模块,该检测模块包括第一卷积层、第二卷积层以及预测卷积层,该第一卷积层的输出与该第二卷积层的输入耦合,该第二卷积层的输出与该预测卷积层的输入耦合,可以将该第一目标样本图像输入该三维检测模型,以获取该三维检测模型的预测卷积层输出的多个该特征图;确定该二维参数信息对应的第二检测框的中心点在每个该特征图上的特征位置信息;根据多个该特征位置信息和该二维参数信息,确定该第一目标样本图像对应的目标样本参数信息。
示例地,若该三维检测模型包括位置估计模块、深度估计模块、角度估计模块以及大小估计模块,则将该第一目标样本图像输入该三维检测模型后,可以获取该三维检测模型的四个预测卷积层输出的四个特征图,之后,可以确定该第二检测框的中心点在每个特征图上的特征位置信息,结合多个特征位置信息和该二维参数信息,确定该第一目标样本图像对应的目标样本参数信息。例如,可以根据该深度估计模块输出的特征图和该二维参数信息,确定该目标样本参数信息中的目标样本尺寸信息。
S24、通过多个该第一样本图像和每个该第一样本图像对应的目标样本参数信息,对第一目标神经网络模型进行训练,得到该三维目标检测模型。
在本步骤中,在确定每个第一样本图像对应的目标样本参数信息后,可以参照现有技术的模型训练方法,通过多个该第一样本图像和每个该第一样本图像对应的目标样本参数信息,对第一目标神经网络模型进行训练,得到该三维目标检测模型,此处不再赘述。
其中,该第一目标神经网络模型可以与该第二目标神经网络模型相同,该第一目标神经网络模型也可以是基于该第二目标神经网络模型训练得到的该三维检测模型,本公开对此不作限定。
采用上述模型训练方法,在确定多个第一样本参数信息中存在二维参数信息对应的第一目标样本参数信息的情况下,即针对近距离目标,可以直接通过预先训练的三维检测模型确定样本图像对应的目标样本参数信息,在确定多个第一样本参数信息中不存在第一目标样本参数信息的情况下,即针对远距离的小目标,可以通过二维检测模型对激光雷达无法感知的目标进行补充,确定样本图像对应的目标样本参数信息,使得标注得到的样本数据更加丰富,可以训练出能够感知远距离小目标的三维目标检测模型,从而提高了三维目标检测模型的准确率。
图3是根据一示例性实施例示出的一种三维检测模型的训练方法的流程图,如图3所示,该方法可以包括:
S31、获取多个该第二样本图像和每个该第二样本图像对应的第二样本参数信息。
其中,该第二样本参数信息可以包括该第二样本对象的第二样本位置信息、第二样本尺寸信息以及第二样本角度信息,该第二样本参数信息根据该第二样本图像对应的点云数据确定。
在本步骤中,可以参照步骤S21中采集该第一样本图像的方法,采集该车辆周围预设距离内的环境图像,得到该第二样本图像,在采集该第二样本图像的同时,可以通过该车辆上安装的激光雷达采集点云数据,之后,根据该点云数据,对每个第二样本图像进行标注,得到每个第二样本图像对应的第二样本参数信息。
S32、通过多个该第二样本图像和每个该第二样本图像对应的第二样本参数信息,对第二目标神经网络模型进行训练,得到该三维检测模型。
在本步骤中,在确定每个第二样本图像对应的第二样本参数信息后,可以参照现有技术的模型训练方法,通过多个该第二样本图像和每个该第二样本图像对应的第二样本参数信息,对第二目标神经网络模型进行训练,得到该三维检测模型,此处不再赘述。
采用上述模型训练方法,可以通过采集的近距离的第二样本图像训练得到该三维检测模型,通过该三维检测模型可以实现近距离目标的自动化标注,从而节省了大量的标注成本。
图4是根据一示例性实施例示出的另一种目标检测方法的流程图,如图4所示,该方法还可以包括:
S103、根据该目标参数信息,确定该车辆的行驶路线。
在本步骤中,在确定该目标参数信息后,可以参照现有技术的方法,对该目标对象进行避障处理,规划行驶路线。
S104、按照该行驶路线,控制该车辆自动行驶。
在本步骤中,在确定该行驶路线后,可以将该行驶路线发送至该车辆的自动驾驶***,通过该自动驾驶***控制该车辆自动行驶。
综上所述,本公开仅依赖于激光雷达采集的近距离的环境图像和点云数据即可训练得到三维检测模型,通过该三维检测模型对近距离的第一样本图像进行自动标注,通过二维检测模型检测到的远距离的小目标对样本数据进行补充,从而实现大量样本数据的标注,且标注的样本数据更加丰富,从而可以训练出能够识别远距离小目标的三维目标检测模型,提高了该三维目标检测模型的准确率,进一步提高了车辆自动行驶的安全性。
图5是根据一示例性实施例示出的一种目标检测装置的框图,该装置应用于车辆,如图5所示,该装置可以包括:
采集模块501,被配置为采集该车辆行驶过程中周围环境的环境图像;
信息获取模块502,被配置为将该环境图像输入三维目标检测模型,以获取该三维目标检测模型输出的目标参数信息,该目标参数信息包括该环境图像中的目标对象的目标位置信息、目标尺寸信息以及目标角度信息;
其中,该三维目标检测模型通过多个第一样本图像和每个该第一样本图像对应的目标样本参数信息预先训练得到,该目标样本参数信息包括该第一样本图像中的第一样本对象的目标样本位置信息、目标样本尺寸信息以及目标样本角度信息,该目标样本参数信息通过预先训练的三维检测模型和二维检测模型确定,该三维检测模型通过第二样本图像训练得到,该第二样本图像中的第二样本对象与该车辆之间的距离小于或等于预设距离阈值,该二维检测模型用于获取该第一样本对象的二维参数信息。
可选地,该三维目标检测模型通过以下方式训练得到:
获取多个该第一样本图像;
针对每个该第一样本图像,将该第一样本图像输入该三维检测模型,以获取该三维检测模型输出的第一样本参数信息,将该样本图像输入该二维检测模型,以获取该二维检测模型输出的二维参数信息,该第一样本参数信息包括该第一样本对象的第一样本位置信息、第一样本尺寸信息以及第一样本角度信息;
根据多个该第一样本参数信息和多个该二维参数信息,确定每个该第一样本图像对应的目标样本参数信息;
通过多个该第一样本图像和每个该第一样本图像对应的目标样本参数信息,对第一目标神经网络模型进行训练,得到该三维目标检测模型。
可选地,该根据多个该第一样本参数信息和多个该二维参数信息,确定每个该第一样本图像对应的目标样本参数信息包括:
针对每个该二维参数信息,在确定多个该第一样本参数信息中存在该二维参数信息对应的第一目标样本参数信息的情况下,将该第一目标样本参数信息作为该目标样本参数信息,在确定多个该第一样本参数信息中不存在该第一目标样本参数信息的情况下,通过该三维检测模型,确定第一目标样本图像对应的多个特征图,并根据该二维参数信息和多个该特征图,确定该第一目标样本图像对应的目标样本参数信息,该第一目标样本参数信息对应的第一样本对象与该二维参数信息对应的第一样本对象相同,该第一目标样本图像为该二维参数信息对应的第一样本图像。
可选地,该确定多个该第一样本参数信息中存在该二维参数信息对应的第一目标样本参数信息包括:
针对每个该第一样本参数信息,确定该第一样本参数信息对应的第一检测框,确定该二维参数信息对应的第二检测框与该第一检测框的交并比,在确定该交并比大于或等于预设交并比阈值的情况下,确定多个该第一样本参数信息中存在该二维参数信息对应的第一目标样本参数信息,并将该第一样本参数信息作为该第一目标样本参数信息。
可选地,该确定该第一样本参数信息对应的第一检测框包括:
根据拍摄该第一样本图像的相机的内参信息和该第一样本位置信息,确定该第一样本参数信息对应的第一检测框的中心点的位置信息;
根据该第一检测框的中心点的位置信息和该第一样本尺寸信息,确定该第一检测框。
可选地,该三维检测模型包括多个检测模块,该检测模块包括第一卷积层、第二卷积层以及预测卷积层,该第一卷积层的输出与该第二卷积层的输入耦合,该第二卷积层的输出与该预测卷积层的输入耦合;该通过该三维检测模型,确定第一目标样本图像对应的多个特征图包括:
将该第一目标样本图像输入该三维检测模型,以获取该三维检测模型的预测卷积层输出的多个该特征图;
该根据该二维参数信息和多个该特征图,确定该第一目标样本图像对应的目标样本参数信息包括:
确定该二维参数信息对应的第二检测框的中心点在每个该特征图上的特征位置信息;
根据多个该特征位置信息和该二维参数信息,确定该第一目标样本图像对应的目标样本参数信息。
可选地,该三维检测模型通过以下方式预先训练得到:
获取多个该第二样本图像和每个该第二样本图像对应的第二样本参数信息,该第二样本参数信息包括该第二样本对象的第二样本位置信息、第二样本尺寸信息以及第二样本角度信息,该第二样本参数信息根据该第二样本图像对应的点云数据确定;
通过多个该第二样本图像和每个该第二样本图像对应的第二样本参数信息,对第二目标神经网络模型进行训练,得到该三维检测模型。
可选地,图6是根据一示例性实施例示出的另一种目标检测装置的框图,如图6所示,该装置还包括:
路线确定模块503,被配置为根据该目标参数信息,确定该车辆的行驶路线;
控制模块504,被配置为按照该行驶路线,控制该车辆自动行驶。
通过上述装置,通过预先训练的三维检测模型和二维检测模型确定样本图像对应的目标样本参数信息,对远距离的小目标也可以进行标注,使得标注得到的样本数据更加丰富,提高了三维目标检测模型的准确率,从而提高车辆自动驾驶的安全性。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本公开还提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开提供的目标检测方法的步骤。
上述装置除了可以是独立的电子设备外,也可是独立电子设备的一部分,例如在一种实施例中,该装置可以是集成电路(Integrated Circuit,IC)或芯片,其中该集成电路可以是一个IC,也可以是多个IC的集合;该芯片可以包括但不限于以下种类:GPU(GraphicsProcessing Unit,图形处理器)、CPU(Central Processing Unit,中央处理器)、FPGA(Field Programmable Gate Array,可编程逻辑阵列)、DSP(Digital Signal Processor,数字信号处理器)、ASIC(Application Specific Integrated Circuit,专用集成电路)、SOC(System on Chip,SoC,片上***或***级芯片)等。上述的集成电路或芯片中可以用于执行可执行指令(或代码),以实现上述的目标检测方法。其中该可执行指令可以存储在该集成电路或芯片中,也可以从其他的装置或设备获取,例如该集成电路或芯片中包括第二处理器、存储器,以及用于与其他的装置通信的接口。该可执行指令可以存储于该存储器中,当该可执行指令被处理器执行时实现上述的目标检测方法;或者,该集成电路或芯片可以通过该接口接收可执行指令并传输给该第二处理器执行,以实现上述的目标检测方法。
参阅图7,图7是一示例性实施例示出的一种车辆600的功能框图示意图。车辆600可以被配置为完全或部分自动驾驶模式。例如,车辆600可以通过感知***620获取其周围的环境信息,并基于对周边环境信息的分析得到自动驾驶策略以实现完全自动驾驶,或者将分析结果呈现给用户以实现部分自动驾驶。
车辆600可包括各种子***,例如,信息娱乐***610、感知***620、决策控制***630、驱动***640以及计算平台650。可选的,车辆600可包括更多或更少的子***,并且每个子***都可包括多个部件。另外,车辆600的每个子***和部件可以通过有线或者无线的方式实现互连。
在一些实施例中,信息娱乐***610可以包括通信***611,娱乐***612以及导航***613。
通信***611可以包括无线通信***,无线通信***可以直接地或者经由通信网络来与一个或多个设备无线通信。例如,无线通信***可使用3G蜂窝通信,例如CDMA、EVD0、GSM/GPRS,或者4G蜂窝通信,例如LTE。或者5G蜂窝通信。无线通信***可利用WiFi与无线局域网(wireless local area network,WLAN)通信。在一些实施例中,无线通信***可利用红外链路、蓝牙或ZigBee与设备直接通信。其他无线协议,例如各种车辆通信***,例如,无线通信***可包括一个或多个专用短程通信(dedicated short range communications,DSRC)设备,这些设备可包括车辆和/或路边台站之间的公共和/或私有数据通信。
娱乐***612可以包括显示设备,麦克风和音响,用户可以基于娱乐***在车内收听广播,播放音乐;或者将手机和车辆联通,在显示设备上实现手机的投屏,显示设备可以为触控式,用户可以通过触摸屏幕进行操作。
在一些情况下,可以通过麦克风获取用户的语音信号,并依据对用户的语音信号的分析实现用户对车辆600的某些控制,例如调节车内温度等。在另一些情况下,可以通过音响向用户播放音乐。
导航***613可以包括由地图供应商所提供的地图服务,从而为车辆600提供行驶路线的导航,导航***613可以和车辆的全球定位***621、惯性测量单元622配合使用。地图供应商所提供的地图服务可以为二维地图,也可以是高精地图。
感知***620可包括感测关于车辆600周边的环境的信息的若干种传感器。例如,感知***620可包括全球定位***621(全球定位***可以是GPS***,也可以是北斗***或者其他定位***)、惯性测量单元(inertial measurement unit,IMU)622、激光雷达623、毫米波雷达624、超声雷达625以及摄像装置626。感知***620还可包括被监视车辆600的内部***的传感器(例如,车内空气质量监测器、燃油量表、机油温度表等)。来自这些传感器中的一个或多个的传感器数据可用于检测对象及其相应特性(位置、形状、方向、速度等)。这种检测和识别是车辆600的安全操作的关键功能。
全球定位***621用于估计车辆600的地理位置。
惯性测量单元622用于基于惯性加速度来感测车辆600的位姿变化。在一些实施例中,惯性测量单元622可以是加速度计和陀螺仪的组合。
激光雷达623利用激光来感测车辆600所位于的环境中的物体。在一些实施例中,激光雷达623可包括一个或多个激光源、激光扫描器以及一个或多个检测器,以及其他***组件。
毫米波雷达624利用无线电信号来感测车辆600的周边环境内的物体。在一些实施例中,除了感测物体以外,毫米波雷达624还可用于感测物体的速度和/或前进方向。
超声雷达625可以利用超声波信号来感测车辆600周围的物体。
摄像装置626用于捕捉车辆600的周边环境的图像信息。摄像装置626可以包括单目相机、双目相机、结构光相机以及全景相机等,摄像装置626获取的图像信息可以包括静态图像,也可以包括视频流信息。
决策控制***630包括基于感知***620所获取的信息进行分析决策的计算***631,决策控制***630还包括对车辆600的动力***进行控制的整车控制器632,以及用于控制车辆600的转向***633、油门634和制动***635。
计算***631可以操作来处理和分析由感知***620所获取的各种信息以便识别车辆600周边环境中的目标、物体和/或特征。目标可以包括行人或者动物,物体和/或特征可包括交通信号、道路边界和障碍物。计算***631可使用物体识别算法、运动中恢复结构(Structure from Motion,SFM)算法、视频跟踪等技术。在一些实施例中,计算***631可以用于为环境绘制地图、跟踪物体、估计物体的速度等等。计算***631可以将所获取的各种信息进行分析并得出对车辆的控制策略。
整车控制器632可以用于对车辆的动力电池和引擎641进行协调控制,以提升车辆600的动力性能。
转向***633可操作来调整车辆600的前进方向。例如在一个实施例中可以为方向盘***。
油门634用于控制引擎641的操作速度并进而控制车辆600的速度。
制动***635用于控制车辆600减速。制动***635可使用摩擦力来减慢车轮644。在一些实施例中,制动***635可将车轮644的动能转换为电流。制动***635也可采取其他形式来减慢车轮644转速从而控制车辆600的速度。
驱动***640可包括为车辆600提供动力运动的组件。在一个实施例中,驱动***640可包括引擎641、能量源642、传动***643和车轮644。引擎641可以是内燃机、电动机、空气压缩引擎或其他类型的引擎组合,例如汽油发动机和电动机组成的混动引擎,内燃引擎和空气压缩引擎组成的混动引擎。引擎641将能量源642转换成机械能量。
能量源642的示例包括汽油、柴油、其他基于石油的燃料、丙烷、其他基于压缩气体的燃料、乙醇、太阳能电池板、电池和其他电力来源。能量源642也可以为车辆600的其他***提供能量。
传动***643可以将来自引擎641的机械动力传送到车轮644。传动***643可包括变速箱、差速器和驱动轴。在一个实施例中,传动***643还可以包括其他器件,比如离合器。其中,驱动轴可包括可耦合到一个或多个车轮644的一个或多个轴。
车辆600的部分或所有功能受计算平台650控制。计算平台650可包括至少一个第一处理器651,第一处理器651可以执行存储在例如存储器652这样的非暂态计算机可读介质中的指令653。在一些实施例中,计算平台650还可以是采用分布式方式控制车辆600的个体组件或子***的多个计算设备。
第一处理器651可以是任何常规的处理器,诸如商业可获得的CPU。可替换地,第一处理器651还可以包括诸如图像处理器(Graphic Process Unit,GPU),现场可编程门阵列(Field Programmable Gate Array,FPGA)、片上***(System on Chip,SOC)、专用集成芯片(Application Specific Integrated Circuit,ASIC)或它们的组合。尽管图7功能性地图示了处理器、存储器、和在相同块中的计算机的其它元件,但是本领域的普通技术人员应该理解该处理器、计算机、或存储器实际上可以包括可以或者可以不存储在相同的物理外壳内的多个处理器、计算机、或存储器。例如,存储器可以是硬盘驱动器或位于不同于计算机的外壳内的其它存储介质。因此,对处理器或计算机的引用将被理解为包括对可以或者可以不并行操作的处理器或计算机或存储器的集合的引用。不同于使用单一的处理器来执行此处所描述的步骤,诸如转向组件和减速组件的一些组件每个都可以具有其自己的处理器,处理器只执行与特定于组件的功能相关的计算。
在本公开实施方式中,第一处理器651可以执行上述的目标检测方法。
在此处所描述的各个方面中,第一处理器651可以位于远离该车辆并且与该车辆进行无线通信。在其它方面中,此处所描述的过程中的一些在布置于车辆内的处理器上执行而其它则由远程处理器执行,包括采取执行单一操纵的必要步骤。
在一些实施例中,存储器652可包含指令653(例如,程序逻辑),指令653可被第一处理器651执行来执行车辆600的各种功能。存储器652也可包含额外的指令,包括向信息娱乐***610、感知***620、决策控制***630、驱动***640中的一个或多个发送数据、从其接收数据、与其交互和/或对其进行控制的指令。
除了指令653以外,存储器652还可存储数据,例如道路地图、路线信息,车辆的位置、方向、速度以及其它这样的车辆数据,以及其他信息。这种信息可在车辆600在自主、半自主和/或手动模式中操作期间被车辆600和计算平台650使用。
计算平台650可基于从各种子***(例如,驱动***640、感知***620和决策控制***630)接收的输入来控制车辆600的功能。例如,计算平台650可利用来自决策控制***630的输入以便控制转向***633来避免由感知***620检测到的障碍物。在一些实施例中,计算平台650可操作来对车辆600及其子***的许多方面提供控制。
可选地,上述这些组件中的一个或多个可与车辆600分开安装或关联。例如,存储器652可以部分或完全地与车辆600分开存在。上述组件可以按有线和/或无线方式来通信地耦合在一起。
可选地,上述组件只是一个示例,实际应用中,上述各个模块中的组件有可能根据实际需要增添或者删除,图7不应理解为对本公开实施例的限制。
在道路行进的自动驾驶汽车,如上面的车辆600,可以识别其周围环境内的物体以确定对当前速度的调整。物体可以是其它车辆、交通控制设备、或者其它类型的物体。在一些示例中,可以独立地考虑每个识别的物体,并且基于物体的各自的特性,诸如它的当前速度、加速度、与车辆的间距等,可以用来确定自动驾驶汽车所要调整的速度。
可选地,车辆600或者与车辆600相关联的感知和计算设备(例如计算***631、计算平台650)可以基于所识别的物体的特性和周围环境的状态(例如,交通、雨、道路上的冰、等等)来预测识别的物体的行为。可选地,每一个所识别的物体都依赖于彼此的行为,因此还可以将所识别的所有物体全部一起考虑来预测单个识别的物体的行为。车辆600能够基于预测的识别的物体的行为来调整它的速度。换句话说,自动驾驶汽车能够基于所预测的物体的行为来确定车辆将需要调整到(例如,加速、减速、或者停止)何种稳定状态。在这个过程中,也可以考虑其它因素来确定车辆600的速度,诸如,车辆600在行驶的道路中的横向位置、道路的曲率、静态和动态物体的接近度等等。
除了提供调整自动驾驶汽车的速度的指令之外,计算设备还可以提供修改车辆600的转向角的指令,以使得自动驾驶汽车遵循给定的轨迹和/或维持与自动驾驶汽车附近的物体(例如,道路上的相邻车道中的车辆)的安全横向和纵向距离。
上述车辆600可以为各种类型的行驶工具,例如,轿车、卡车、摩托车、公共汽车、船、飞机、直升飞机、娱乐车、火车等等,本公开实施例不做特别的限定。
在另一示例性实施例中,还提供一种计算机程序产品,该计算机程序产品包含能够由可编程的装置执行的计算机程序,该计算机程序具有当由该可编程的装置执行时用于执行上述的目标检测方法的代码部分。
本领域技术人员在考虑说明书及实践本公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (12)
1.一种目标检测方法,其特征在于,应用于车辆,包括:
采集所述车辆行驶过程中周围环境的环境图像;
将所述环境图像输入三维目标检测模型,以获取所述三维目标检测模型输出的目标参数信息,所述目标参数信息包括所述环境图像中的目标对象的目标位置信息、目标尺寸信息以及目标角度信息;
其中,所述三维目标检测模型通过多个第一样本图像和每个所述第一样本图像对应的目标样本参数信息预先训练得到,所述目标样本参数信息包括所述第一样本图像中的第一样本对象的目标样本位置信息、目标样本尺寸信息以及目标样本角度信息,所述目标样本参数信息通过预先训练的三维检测模型和二维检测模型确定,所述三维检测模型通过第二样本图像训练得到,所述第二样本图像中的第二样本对象与所述车辆之间的距离小于或等于预设距离阈值,所述二维检测模型用于获取所述第一样本对象的二维参数信息。
2.根据权利要求1所述的方法,其特征在于,所述三维目标检测模型通过以下方式训练得到:
获取多个所述第一样本图像;
针对每个所述第一样本图像,将所述第一样本图像输入所述三维检测模型,以获取所述三维检测模型输出的第一样本参数信息,将所述样本图像输入所述二维检测模型,以获取所述二维检测模型输出的二维参数信息,所述第一样本参数信息包括所述第一样本对象的第一样本位置信息、第一样本尺寸信息以及第一样本角度信息;
根据多个所述第一样本参数信息和多个所述二维参数信息,确定每个所述第一样本图像对应的目标样本参数信息;
通过多个所述第一样本图像和每个所述第一样本图像对应的目标样本参数信息,对第一目标神经网络模型进行训练,得到所述三维目标检测模型。
3.根据权利要求2所述的方法,其特征在于,所述根据多个所述第一样本参数信息和多个所述二维参数信息,确定每个所述第一样本图像对应的目标样本参数信息包括:
针对每个所述二维参数信息,在确定多个所述第一样本参数信息中存在所述二维参数信息对应的第一目标样本参数信息的情况下,将所述第一目标样本参数信息作为所述目标样本参数信息,在确定多个所述第一样本参数信息中不存在所述第一目标样本参数信息的情况下,通过所述三维检测模型,确定第一目标样本图像对应的多个特征图,并根据所述二维参数信息和多个所述特征图,确定所述第一目标样本图像对应的目标样本参数信息,所述第一目标样本参数信息对应的第一样本对象与所述二维参数信息对应的第一样本对象相同,所述第一目标样本图像为所述二维参数信息对应的第一样本图像。
4.根据权利要求3所述的方法,其特征在于,所述确定多个所述第一样本参数信息中存在所述二维参数信息对应的第一目标样本参数信息包括:
针对每个所述第一样本参数信息,确定所述第一样本参数信息对应的第一检测框,确定所述二维参数信息对应的第二检测框与所述第一检测框的交并比,在确定所述交并比大于或等于预设交并比阈值的情况下,确定多个所述第一样本参数信息中存在所述二维参数信息对应的第一目标样本参数信息,并将所述第一样本参数信息作为所述第一目标样本参数信息。
5.根据权利要求4所述的方法,其特征在于,所述确定所述第一样本参数信息对应的第一检测框包括:
根据拍摄所述第一样本图像的相机的内参信息和所述第一样本位置信息,确定所述第一样本参数信息对应的第一检测框的中心点的位置信息;
根据所述第一检测框的中心点的位置信息和所述第一样本尺寸信息,确定所述第一检测框。
6.根据权利要求3所述的方法,其特征在于,所述三维检测模型包括多个检测模块,所述检测模块包括第一卷积层、第二卷积层以及预测卷积层,所述第一卷积层的输出与所述第二卷积层的输入耦合,所述第二卷积层的输出与所述预测卷积层的输入耦合;所述通过所述三维检测模型,确定第一目标样本图像对应的多个特征图包括:
将所述第一目标样本图像输入所述三维检测模型,以获取所述三维检测模型的预测卷积层输出的多个所述特征图;
所述根据所述二维参数信息和多个所述特征图,确定所述第一目标样本图像对应的目标样本参数信息包括:
确定所述二维参数信息对应的第二检测框的中心点在每个所述特征图上的特征位置信息;
根据多个所述特征位置信息和所述二维参数信息,确定所述第一目标样本图像对应的目标样本参数信息。
7.根据权利要求1所述的方法,其特征在于,所述三维检测模型通过以下方式预先训练得到:
获取多个所述第二样本图像和每个所述第二样本图像对应的第二样本参数信息,所述第二样本参数信息包括所述第二样本对象的第二样本位置信息、第二样本尺寸信息以及第二样本角度信息,所述第二样本参数信息根据所述第二样本图像对应的点云数据确定;
通过多个所述第二样本图像和每个所述第二样本图像对应的第二样本参数信息,对第二目标神经网络模型进行训练,得到所述三维检测模型。
8.根据权利要求1-7任一项所述的方法,其特征在于,所述方法还包括:
根据所述目标参数信息,确定所述车辆的行驶路线;
按照所述行驶路线,控制所述车辆自动行驶。
9.一种目标检测装置,其特征在于,应用于车辆,包括:
采集模块,被配置为采集所述车辆行驶过程中周围环境的环境图像;
信息获取模块,被配置为将所述环境图像输入三维目标检测模型,以获取所述三维目标检测模型输出的目标参数信息,所述目标参数信息包括所述环境图像中的目标对象的目标位置信息、目标尺寸信息以及目标角度信息;
其中,所述三维目标检测模型通过多个第一样本图像和每个所述第一样本图像对应的目标样本参数信息预先训练得到,所述目标样本参数信息包括所述第一样本图像中的第一样本对象的目标样本位置信息、目标样本尺寸信息以及目标样本角度信息,所述目标样本参数信息通过预先训练的三维检测模型和二维检测模型确定,所述三维检测模型通过第二样本图像训练得到,所述第二样本图像中的第二样本对象与所述车辆之间的距离小于或等于预设距离阈值,所述二维检测模型用于获取所述第一样本对象的二维参数信息。
10.一种车辆,其特征在于,包括:
第一处理器;
用于存储处理器可执行指令的存储器;
其中,所述第一处理器被配置为:
实现权利要求1-8中任一项所述方法的步骤。
11.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,该程序指令被处理器执行时实现权利要求1-8中任一项所述方法的步骤。
12.一种芯片,其特征在于,包括第二处理器和接口;所述第二处理器用于读取指令以执行权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210822745.0A CN115205848A (zh) | 2022-07-12 | 2022-07-12 | 目标检测方法、装置、车辆、存储介质及芯片 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210822745.0A CN115205848A (zh) | 2022-07-12 | 2022-07-12 | 目标检测方法、装置、车辆、存储介质及芯片 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115205848A true CN115205848A (zh) | 2022-10-18 |
Family
ID=83580533
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210822745.0A Pending CN115205848A (zh) | 2022-07-12 | 2022-07-12 | 目标检测方法、装置、车辆、存储介质及芯片 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115205848A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115631478A (zh) * | 2022-12-02 | 2023-01-20 | 广汽埃安新能源汽车股份有限公司 | 道路图像检测方法、装置、设备、计算机可读介质 |
-
2022
- 2022-07-12 CN CN202210822745.0A patent/CN115205848A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115631478A (zh) * | 2022-12-02 | 2023-01-20 | 广汽埃安新能源汽车股份有限公司 | 道路图像检测方法、装置、设备、计算机可读介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115042821B (zh) | 车辆控制方法、装置、车辆及存储介质 | |
CN115100377B (zh) | 地图构建方法、装置、车辆、可读存储介质及芯片 | |
CN115220449B (zh) | 路径规划的方法、装置、存储介质、芯片及车辆 | |
CN115123257A (zh) | 路面减速带位置识别方法、装置、车辆、存储介质及芯片 | |
CN115205365A (zh) | 车辆距离检测方法、装置、车辆、可读存储介质及芯片 | |
CN115330923A (zh) | 点云数据渲染方法、装置、车辆、可读存储介质及芯片 | |
CN115035494A (zh) | 图像处理方法、装置、车辆、存储介质及芯片 | |
CN114842075A (zh) | 数据标注方法、装置、存储介质及车辆 | |
CN114782638B (zh) | 生成车道线的方法、装置、车辆、存储介质及芯片 | |
CN114842440B (zh) | 自动驾驶环境感知方法、装置、车辆及可读存储介质 | |
CN115205848A (zh) | 目标检测方法、装置、车辆、存储介质及芯片 | |
CN115056784B (zh) | 车辆控制方法、装置、车辆、存储介质及芯片 | |
CN115203457B (zh) | 图像检索方法、装置、车辆、存储介质及芯片 | |
CN115100630B (zh) | 障碍物检测方法、装置、车辆、介质及芯片 | |
CN115205311B (zh) | 图像处理方法、装置、车辆、介质及芯片 | |
CN115202234B (zh) | 仿真测试方法、装置、存储介质和车辆 | |
CN115042814A (zh) | 交通灯状态识别方法、装置、车辆及存储介质 | |
CN115222791A (zh) | 目标关联方法、装置、可读存储介质及芯片 | |
CN115221151A (zh) | 车辆数据的传输方法、装置、车辆、存储介质及芯片 | |
CN115082886B (zh) | 目标检测的方法、装置、存储介质、芯片及车辆 | |
CN114877911B (zh) | 路径规划方法、装置、车辆及存储介质 | |
CN115063639B (zh) | 生成模型的方法、图像语义分割方法、装置、车辆及介质 | |
CN115139946B (zh) | 车辆落水检测方法、车辆、计算机可读存储介质及芯片 | |
CN115407344B (zh) | 栅格地图创建方法、装置、车辆及可读存储介质 | |
CN114822216B (zh) | 生成车位地图的方法、装置、车辆、存储介质及芯片 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |