CN112258610B

CN112258610B - 图像标注方法、装置、存储介质及电子设备

Info

Publication number: CN112258610B
Application number: CN202011080635.9A
Authority: CN
Inventors: 张安春; 鲍世强
Original assignee: Everything Mirror Beijing Computer System Co ltd
Current assignee: Everything Mirror Beijing Computer System Co ltd
Priority date: 2020-10-10
Filing date: 2020-10-10
Publication date: 2023-12-01
Anticipated expiration: 2040-10-10
Also published as: CN112258610A

Abstract

本公开涉及一种图像标注方法、装置、存储介质及电子设备，包括：创建三维仿真场景；根据预先设置的仿真摄像头确定目标图像中所包括的目标分割对象；根据目标图像中的目标分割对象的个数对目标图像进行渲染；通过渲染结果获取目标图像中每个像素点的标注信息，以对目标图像进行标注。能够通过对三维仿真场景中的仿真摄像头所拍摄得到的图像进行渲染的方式来实现自动化标注的功能，还能根据该图像中的目标分割对象的个数来对该目标图像进行渲染，从而避免由于该目标图像中的目标分割对象的个数过多而导致的标注信息不全或者标注信息不准确的问题，提高了标注信息获取的准确性，使得自动化标注更加智能。

Description

图像标注方法、装置、存储介质及电子设备

技术领域

本公开涉及图像处理领域，具体地，涉及一种图像标注方法、装置、存储介质及电子设备。

背景技术

计算机视觉算法需要大量的数据来训练深度学习模型。但真实数据的采集和标注成本较高，一些像素级分割算法的标注更加复杂。比如语义分割需要标注每个像素的类别；实例分割需要标注出关注类别的每个像素对应的实例；而全景分割则是语义分割和实例分割的结合，需要同时标注出两者。目前一般只能够通过人工标注的方式来生成能够满足深度学习模型训练所需的所有类型的带标注真值的训练数据，例如用于训练语义分割的训练数据、用于训练实例分割的训练数据，或者用于训练全景分割的训练数据。但是这种像素级的标注如果采用人工，在物体边缘处误差会比较大，精确度不足，从而也会影响模型的训练效果。

发明内容

本公开的目的是提供一种图像标注方法、装置、存储介质及电子设备，能够根据在三维仿真场景中的仿真摄像头在仿真过程中获取到的目标图像中的需要进行分割的该目标分割对象的个数来分别对该目标图像进行不同的渲染，从而能够更加精准地从该渲染结果中获取到该目标图像中的每个像素点的标注信息。

为了实现上述目的，本公开提供一种图像标注方法，上述方法包括：

创建三维仿真场景；

根据预先设置的仿真摄像头确定目标图像中所包括的目标分割对象，上述目标图像为上述仿真摄像头在上述三维仿真场景中能够拍摄到的图像；

根据上述目标图像中的上述目标分割对象的个数对上述目标图像进行渲染；

通过渲染结果获取上述目标图像中每个像素点的标注信息，以对上述目标图像进行标注。

可选地，上述根据预先设置的仿真摄像头确定目标图像中所包括的目标分割对象包括：

根据上述仿真摄像头的位姿信息、上述仿真摄像头的预设工作范围、以及预设感兴趣范围确定上述目标图像中所包括的上述目标分割对象。

可选地，上述仿真摄像头的上述预设工作范围中包括上述仿真摄像头的水平视场角和垂直视场角，上述根据上述仿真摄像头的位姿信息、上述仿真摄像头的预设工作范围、以及预设感兴趣范围确定上述目标图像中所包括的上述目标分割对象包括：

根据上述仿真摄像头的位姿信息和上述仿真摄像头的预设工作范围确定上述仿真摄像头的预设工作范围在上述三维仿真场景中所构成的目标视锥体，其中，上述目标视锥体的顶点为上述仿真摄像头的中心位置，上述中心位置通过上述位姿信息确定；

将上述预设感兴趣范围作为上述目标视锥体上下两面所构成的扇形的半径，以及上述目标视锥体左右两面所构成的等腰三角形的腰长，以得到目标感兴趣体，其中，上述目标视锥体的上下两面之间的夹角为上述仿真摄像头的上述垂直视场角，上述目标视锥体的左右两面之间的夹角为上述仿真摄像头的上述水平视场角；

根据上述三维仿真场景中处于上述目标感兴趣体内的仿真对象，确定上述目标图像中所包括的上述目标分割对象。

可选地，上述根据上述三维仿真场景中处于上述目标感兴趣体内的仿真对象，确定上述目标图像中所包括的上述目标分割对象包括：

根据上述三维仿真场景中处于上述目标感兴趣体内的仿真对象的语义，确定上述目标图像中所包括的上述目标分割对象；和/或

根据上述三维仿真场景中处于上述目标感兴趣体内的仿真对象的实例，确定上述目标图像中所包括的上述目标分割对象。

可选地，上述根据上述目标图像中的上述目标分割对象的个数对上述目标图像进行渲染包括：

在上述目标分割对象的个数不大于预设数量的情况下，通过模板缓冲区保存上述目标图像中的分割信息，以对上述目标图像进行渲染；

在上述目标分割对象的个数大于上述预设数量的情况下，通过颜色缓冲区保存上述目标图像中的分割信息，以对上述目标图像进行渲染。

可选地，上述在上述目标分割对象的个数不大于预设数量的情况下，通过模板缓冲区保存上述目标图像中的分割信息，以对上述目标图像进行渲染包括：

根据上述目标分割对象距离上述仿真摄像头的距离，按照由近到远的顺序为上述目标分割对象分配分割标识符；

确定上述分割标识符与上述目标分割对象所对应的全局标识符之间的对应关系，其中，上述全局标识符为上述三维仿真场景的创建过程中为上述目标分割对象预先设置好的；

将上述分割标识符作为上述分割信息保存在上述模板缓冲区中，以对上述目标图像进行渲染。

可选地，上述在上述目标分割对象的个数不大于预设数量的情况下，通过模板缓冲区保存上述目标图像中的分割信息，以对上述目标图像进行渲染还包括：

根据上述目标分割对象在上述目标图像前后预设时长内的图像帧中出现的频率回收上述目标分割对象的上述分割标识符。

可选地，上述在上述目标分割对象的个数大于上述预设数量的情况下，通过颜色缓冲区保存上述目标图像中的分割信息，以对上述目标图像进行渲染包括：

将上述目标分割对象所对应的全局标识符转换为24位十六进制的颜色表示，上述全局标识符为上述三维仿真场景的创建过程中为上述目标分割对象预先设置好的；

确定上述全局标识符与上述颜色表示之间的对应关系；

将上述颜色表示作为上述分割信息保存在上述颜色缓冲区中，以对上述目标图像进行渲染。

可选地，上述通过渲染结果获取上述目标图像中每个像素点的标注信息，以对上述目标图像进行标注包括：

在通过模板缓冲区保存上述目标图像中的分割信息的情况下，通过读取上述渲染结果中的上述模板缓冲区中的数据，确定上述目标图像中每一个像素点所对应的上述分割标识符；

根据上述分割标识符确定上述目标图像中的每一个像素点所对应的上述全局标识符；

通过上述全局标识符获取上述目标图像中每个像素点所对应的上述标注信息，上述标注信息为上述三维仿真场景的创建过程中为上述目标分割对象预先设置好的。

在通过颜色缓冲区保存上述目标图像中的分割信息的情况下，通过读取上述渲染结果中的上述颜色缓冲区中的数据，确定上述目标图像中每一个像素点所对应的上述颜色表示；

根据上述颜色表示确定上述目标图像中的每一个像素点所对应的上述全局标识符；

本公开还提供一种图像标注装置，上述装置包括：

创建模块，用于创建三维仿真场景；

确定模块，用于根据预先设置的仿真摄像头确定目标图像中所包括的目标分割对象，上述目标图像为上述仿真摄像头在上述三维仿真场景中能够拍摄到的图像；

渲染模块，用于根据上述目标图像中的上述目标分割对象的个数对上述目标图像进行渲染；

标注模块，用于通过渲染结果获取上述目标图像中每个像素点的标注信息，以对上述目标图像进行标注。

本公开还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现以上上述方法的步骤。

本公开还提供一种电子设备，包括：

存储器，其上存储有计算机程序；

处理器，用于执行上述存储器中的上述计算机程序，以实现以上上述方法的步骤。

通过上述技术方案，能够通过对三维仿真场景中的仿真摄像头所拍摄得到的图像进行渲染的方式来实现自动化标注的功能，并且，还能够根据该仿真摄像头所拍摄到的目标图像中的目标分割对象的个数来对该目标图像进行渲染，从而避免由于该目标图像中的目标分割对象的个数过多而导致的标注信息不全或者标注信息不准确的问题，提高了标注信息获取的准确性，使得自动化标注更加智能。

本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

附图是用来提供对本公开的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本公开，但并不构成对本公开的限制。在附图中：

图1是根据本公开一示例性实施例示出的一种图像标注方法的流程图。

图2是根据本公开又一示例性实施例示出的一种图像标注方法的流程图。

图3a是根据本公开一示例性实施例示出的一种图像标注方法中的目标感兴趣体的结构示意图。

图3b是根据本公开一示例性实施例示出的一种图像标注方法中的目标感兴趣体的截面示意图。

图4是根据本公开又一示例性实施例示出的一种图像标注方法的流程图。

图5是根据本公开又一示例性实施例示出的一种图像标注方法的流程图。

图6是根据本公开又一示例性实施例示出的一种图像标注方法的流程图。

图7是根据本公开一示例性实施例示出的一种图像标注装置的结构框图。

图8是根据一示例性实施例示出的一种电子设备的框图。

图9是根据一示例性实施例示出的一种电子设备的框图。

具体实施方式

以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是，此处所描述的具体实施方式仅用于说明和解释本公开，并不用于限制本公开。

图1是根据本公开一示例性实施例示出的一种图像标注方法的流程图。如图1所示，所述方法包括步骤101至步骤104。

在步骤101中，创建三维仿真场景。该三维仿真场景可以为任意位置的场景，例如可以是根据真实道路数据所生成的仿真场景，或者也可以是根据虚构出来的场景数据所生成的仿真场景。

在步骤102中，根据预先设置的仿真摄像头确定目标图像中所包括的目标分割对象，所述目标图像为所述仿真摄像头在所述三维仿真场景中能够拍摄到的图像。

该仿真摄像头还可以被作为仿真雷达来对雷达进行仿真，例如可以通过该仿真摄像头先获取该三维仿真场景中的点云数据，然后再根据该仿真雷达的雷达射线在该仿真摄像头中对应的平面像素坐标，来在该仿真摄像头中获取到的该点云数据中进行采样，作为该仿真雷达的仿真结果。

该仿真摄像头在仿真过程中可以获取单张特定位置或任意位置的图像，也可以获取特定区域或者任意区域的场景的视频等等。该目标图像可以为该仿真摄像头获取到的任意图像中的一张图像，或该仿真摄像头获取到的任意视频中的任一视频帧。

在确定了该目标图像之后，该目标图像中所包括的目标分割对象可以根据实际标注需求来确定。例如，在仅需要多个语义分割的真值标注图像的情况下，可以将该目标图像中的相同语义的物体作为一个目标分割对象，例如交通工具中的小汽车可以作为一种语义，则即使该目标图像中包括多个不同颜色、不同大小、不同车型的小汽车，这些小汽车也都将被确定为一个目标分割对象；在需要多个实例分割的真值标注图像的情况下，可以将该目标图像中的各个不同实例分别作为一个目标分割对象，例如上述交通工具中的小汽车，若目标图像中包括多个不同颜色、不同大小、不同车型的小汽车，则每一个小汽车都可以作为一个目标分割对象。

在步骤103中，根据所述目标图像中的所述目标分割对象的个数对所述目标图像进行渲染。

在确定了该目标图像中的目标分割对象的个数之后，就能够根据该目标分割对象的个数来分别对该目标图像进行渲染。例如，在该目标分割对象的个数较少的情况下，能够通过GPU的模板缓冲区来对该目标图像进行渲染，也即可以将该目标分割对象的标注信息保存在该模板缓冲区中。然而，由于GPU的模板缓冲区的模板值的限制，该模板缓冲区能够表示的类型有一定限制，例如GPU的该模板缓冲区的模板值通常为8位，仅能表示256种类型，因此，在该目标分割对象的个数较多的情况下，直接使用该模板缓冲区在渲染该目标图像时保存该目标图像中的所有目标分割对象的标注信息可能会出现标注信息保存不全的情况，从而无法对该目标图像中的每个像素点进行准确的标注。

因此，在该目标图像中的目标分割对象的个数较多，例如大于该GPU的模板缓冲区能够表示的类型的最大数量的情况下，可以先将该目标图像划分为多个子图像，从而减少每个子图像中所包括的目标分割对象的个数，进而实现在渲染的过程中通过GPU的模板缓冲区来保存该目标分割对象的标注信息的目的；或者还可以通过其他方式来根据该目标图像中的目标分割对象的个数来对该目标图像分别进行渲染，例如，可以在该目标图像中的目标分割对象的个数过多的情况下，使用该GPU的颜色缓冲区来保存该目标分割对象的标注信息，具体实现方式将在下文中进行描述。

在步骤104中，通过渲染结果获取所述目标图像中每个像素点的标注信息，以对所述目标图像进行标注。

在成功对该目标图像进行渲染之后，根据具体的渲染方式可以分别获取到该目标图像对应的渲染结果，例如在基于模板缓冲区来对该目标图像进行渲染的情况下，从该渲染结果中的模板缓冲区中即可获取到该目标图像中的每一个像素点所对应的标注信息；在先将该目标图像划分为多个子图像，再分别对多个子图像分别进行渲染的情况下，从该多个子图像分别对应的多个渲染结果中的模板缓冲区中获取该目标图像所对应的完整的标注信息；在根据该颜色缓冲区对该目标图像进行渲染的情况下，从该渲染结果中的颜色缓冲区中可以获取到该目标图像中的每一个像素点所对应的标注信息。

该标注信息可以为该目标图像中的每一个像素点所属的目标分割对象。

或者，在一种可能的实施方式中，该标注信息中还可以包括例如该三维仿真场景中的目标分割对象的轮廓关键点投影在该目标图像中的位置信息，该轮廓关键点可以为例如凸包关键点，只要是能够表示出该目标分割对象的在该目标图像中的2D包围盒即可，该2D包围盒可以为AABB包围盒，也可以为OBB包围盒等等。其中，由于在渲染的过程中能够考虑到该目标图像中各个目标分割对象之间的遮挡情况，因此该目标分割对象中的在渲染过程中被遮挡的轮廓关键点不会作为该标注信息保存在渲染结果中。

在一种可能的实施方式中，该标注信息还可以包括该GPU的深度缓冲区中所保存的每一个像素点的深度信息。

通过上述技术方案，能够在通过对三维仿真场景中的仿真摄像头所拍摄得到的图像进行渲染的方式来实现自动化标注的功能，并且，还能够根据该仿真摄像头所拍摄到的目标图像中的目标分割对象的个数来对该目标图像进行渲染，从而避免由于该目标图像中的目标分割对象的个数过多而导致的标注信息不全或者标注信息不准确的问题，提高了标注信息获取的准确性，使得自动化标注更加智能。

图2是根据本公开又一示例性实施例示出的一种图像标注方法的流程图，如图2所示，所述方法还包括步骤201。

在步骤201中，根据所述仿真摄像头的位姿信息、所述仿真摄像头的预设工作范围、以及预设感兴趣范围确定所述目标图像中所包括的所述目标分割对象。

其中，该仿真摄像头的位姿信息确定了该仿真摄像头在该三维仿真场景中所处的位置以及可能拍摄到的场景区域，该仿真摄像头的预设工作范围可以包括例如水平视场角和垂直视场角，该水平视场角和该垂直视场角可以是以该仿真摄像头的自身的坐标轴来表示的。该预设感兴趣范围可以是视觉算法中常用的感兴趣范围，例如可以是距离该仿真摄像头200米以内的范围等等。

其中，若将所述仿真摄像头的中心位置作为该仿真摄像头的预设工作范围能够在所述三维仿真场景中构成的目标视锥体的顶点，则可以根据该预设感兴趣范围来将该目标视锥体构建为一个封闭的目标感兴趣体，如图3a所示。图3a示出了一种目标感兴趣体的结构示意图，其中，可以将所述预设感兴趣范围作为所述目标视锥体上下两面所构成的扇形的半径，该目标视锥体上下两面所构成的扇形的半径可以为例如图3a中所示的第一边1、第二边2和虚线3，以及，还可以将所述预设感兴趣范围作为所述目标视锥体左右两面所构成的等腰三角形的腰长，所述目标视锥体左右两面所构成的等腰三角形可以为如图3a中所示的第一等腰三角形4和第二等腰三角形5，该第一等腰三角形4的腰可以为如图3a所示的第一边1和第三边6，该第二等腰三角形5的腰可以为如图3a所示的第二边2和第四边7。所述目标视锥体的上下两面之间的夹角为所述仿真摄像头的所述垂直视场角，所述目标视锥体的左右两面之间的夹角为所述仿真摄像头的所述水平视场角。另外，图3b中示出了从该目标感兴趣体截面示意图。

在确定了该目标感兴趣体之后，就可以快速地根据所述三维仿真场景中处于所述目标感兴趣体内的仿真对象，确定所述目标图像中所包括的所述目标分割对象。

在一种可能的实施方式中，根据所述三维仿真场景中处于所述目标感兴趣体内的仿真对象，确定所述目标图像中所包括的所述目标分割对象可以是根据所述三维仿真场景中处于所述目标感兴趣体内的仿真对象的语义来确定，也可以是根据所述三维仿真场景中处于所述目标感兴趣体内的仿真对象的实例来确定，或者，还可以同时根据语义和实例来进行确定，也即可以将根据语义确定的目标分割对象的个数和根据实例确定的目标分割对象个数之和作为最终确定的该目标图像中所包括的所述目标分割对象的总个数。在此情况下，同一个实例，例如上述例子中的小汽车，在该目标图像中所对应的像素的标注信息中可以既包括该实例的标注(与其他小汽车不同的实例标注)，也包括该实例所属的语义的标注(小汽车的统一标注)。

图4是根据本公开又一示例性实施例示出的一种图像标注方法的流程图，如图4所示，所述方法还包括步骤401和步骤402。

在步骤401中，判断所述目标分割对象的个数是否不大于预设数量，若是，则转至步骤403，若否，则转至步骤402。

在步骤402中，通过颜色缓冲区保存所述目标图像中的分割信息，以对所述目标图像进行渲染。

在步骤402中，通过模板缓冲区保存所述目标图像中的分割信息，以对所述目标图像进行渲染。

该预设数量可以是根据该模板缓冲区中的模板值所能表示的类型个数来确定，例如，在该模板缓冲区中的模板值为8位，能表示256种类型的情况下，该预设数量可以确定为256。

也即，如前文所述，在该目标图像中的目标分割对象数量过多的情况下，能够基于该颜色缓冲区来对该目标图像进行渲染，将该目标图像中的分割信息保存在该颜色缓冲区中即可。由于颜色缓冲区中的颜色值的类型数量级较高，例如可以为24位，在使用一种颜色表示一种目标分割对象的情况下，颜色缓冲区中的颜色值的可用数量完全能够满足大多数仿真场景中的目标图像中可能出现的目标分割对象的个数。

其中，在通过该模板缓冲区保存该目标图像中的分割信息的情况下，该分割信息可以为该目标图像中的每个目标分割对象分别被分配得到的分割标识符，也即该模板缓冲区中的模板值。例如，在实际应用场景中需要获取示例分割标注信息的情况下，可以为每一个实例的目标分割对象分别分配一个模板值作为该分割标识符，然后在该目标图像渲染的过程中将该分割标识符作为像素级的分割信息保存在该目标图像对应的模板缓冲区中，渲染完成之后通过读取该模板缓冲区中的结果，就可以得到与该目标图像中的每个像素点所对应的分割标识符，进而就可以根据该分割标识符确定每个像素点的标注信息，以对该目标图像进行标注。

图5是根据本公开又一示例性实施例示出的一种图像标注方法的流程图。如图5所示，所述方法还包括步骤501至步骤503。

在步骤501中，根据所述目标分割对象距离所述仿真摄像头的距离，按照由近到远的顺序为所述目标分割对象分配分割标识符。

在步骤502中，确定所述分割标识符与所述目标分割对象所对应的全局标识符之间的对应关系，其中，所述全局标识符为所述三维仿真场景的创建过程中为所述目标分割对象预先设置好的。

在步骤503中，将所述分割标识符作为所述分割信息保存在所述模板缓冲区中，以对所述目标图像进行渲染。

在确定了该目标分割对象的情况下，在为每一个目标图像中的目标分割对象分配该分割标识符时，考虑到不同距离的目标分割对象的优先级，可以优先对距离该仿真摄像头距离较近的目标分割对象来分配该分割标识符。这样，能够确保该目标图像中更加重要的目标分割对象能够分配到该分割标识符来进行标注。

其中，该全局标识符是在该三维仿真场景创建的过程中分别为每一个目标分割对象预先设置的，在该目标分割对象被分配了分割标识符之后，可以将该目标分割对象与该全局标识符之间建立对应关系，这样，在该目标图像进行渲染之后，从该渲染结果中读取该分割标识符之后，能够根据该分割标识符所对应的全局标识符来获取该目标图像中的每个像素点的标注信息，也即真值信息。

在一种可能的实施方式中，在需要语义分割的标注信息应用场景中，也可以直接将各个目标分割对象的语义信息作为该分割信息保存在模板缓冲区中来进行渲染。

在一种可能的实施方式中，根据所述目标分割对象在所述目标图像前后预设时长内的图像帧中出现的频率回收所述目标分割对象的所述分割标识符。

也即，在该目标图像为一段连续的视频中的一帧图像帧的情况下，该目标图像中的目标分割对象可能会发生变化，部分目标分割对象可能会从该目标图像中消失，也可能会出现部分新的目标分割对象，而又由于模板缓冲区的模板值的类型有限，因此需要将已经不在目标图像中的目标分割对象的分割标识符回收，然后分配给新出现的目标分割对象。

但是，由于运动和遮挡的原因，也会出现部分目标分割对象在该目标图像所在的视频中的连续几帧图像帧中闪烁出现的情况，例如在第一帧目标图像中出现并渲染、而在第二帧目标图像中由于被遮挡所以不再渲染、第三帧目标图像中不再被遮挡，又出现之后再次被渲染。因此在该目标分割对象从该目标图像中消失时，并不会立即将其分割标识符收回，而是会根据所述目标分割对象在所述目标图像前后预设时长内的图像帧中出现的频率回收所述目标分割对象的所述分割标识符。在该目标分割对象在该目标图像前后有较长一段时间内都没有被渲染的情况下，才会将其分割标识符收回。

在一种可能的实施方式中，如图5所示，所述方法还包括步骤504至步骤506。

在步骤504中，将所述目标分割对象所对应的全局标识符转换为24位十六进制的颜色表示，所述全局标识符为所述三维仿真场景的创建过程中为所述目标分割对象预先设置好的。

在步骤505中，确定所述全局标识符与所述颜色表示之间的对应关系。

在步骤506中，将所述颜色表示作为所述分割信息保存在所述颜色缓冲区中，以对所述目标图像进行渲染。

通过颜色缓冲区来保存该分割信息的方法能够突破基于模板缓冲区的模板值能表示的类型的数量的限制。能够将该目标分割对象的全局标识符直接转换为颜色表示，然后使用该颜色表示来对该目标图像进行渲染。

其中，使用该颜色表示进行渲染的过程中，可以将该目标分割对象所对应的物理材质中的粗糙度和金属度设置为默认值，例如粗糙度可以为1，金属度可以为0。

另外，在使用该颜色表示进行渲染的过程中，该目标图像中不设置任何光照信息，从而确保能够将该颜色表示不会受到任何光照影响，能够准确地渲染到颜色缓冲区中。

将该全局标识符转换为24位十六进制的颜色表示的方法可以为哈希算法，例如，利用哈希算法将该全局标识符先转换为Integer类型的数字，并截断到24位可用颜色表示(R、G、B各8位)。其中，在需要同时对多个目标图像进行渲染以进行标注的情况下，对于每一个图像所采用的哈希算法可以相同，从而就能够保证同一个目标分割对象在不同的目标图像中的颜色表示一致。

在一种可能的实施方式中，对于该三维仿真场景中部分无需创建实例的物体，例如道路，可以无需对其分配分割标识符，或进行颜色表示的转换，直接根据该目标分割对象对应的语义信息进行渲染即可，该语义信息中可以包括该语义信息对应的标识符和该语义信息对应的颜色表示。

其中，由于在通过颜色缓冲区对该目标图像进行渲染的过程中，改变了该目标分割物体的物理材质，因此包括该分割信息的图像无法与该目标图像同时进行渲染，因此可以利用同步技术将其二者分开渲染。但由于GPU渲染的速度很快，该目标图像对应的两次渲染并不会造成严重的延迟。

在一种可能的实施方式中，无论是在利用该颜色缓冲区进行渲染或利于模板缓冲区进行渲染，该目标图像在渲染的过程中，GPU的深度缓冲区都会根据该三维仿真场景中的数据保存该目标图像中的深度缓冲区中。

图6是根据本公开又一示例性实施例示出的一种图像标注方法的流程图。如图6所示，所述方法还包括步骤601至步骤606。

在步骤601中，在通过模板缓冲区保存所述目标图像中的分割信息的情况下，通过读取所述渲染结果中的所述模板缓冲区中的数据，确定所述目标图像中每一个像素点所对应的所述分割标识符。

在步骤602中，根据所述分割标识符确定所述目标图像中的每一个像素点所对应的所述全局标识符。

在步骤603中，通过所述全局标识符获取所述目标图像中每个像素点所对应的所述标注信息，所述标注信息为所述三维仿真场景的创建过程中为所述目标分割对象预先设置好的。

在步骤604中，在通过颜色缓冲区保存所述目标图像中的分割信息的情况下，通过读取所述渲染结果中的所述颜色缓冲区中的数据，确定所述目标图像中每一个像素点所对应的所述颜色表示。

在步骤605中，根据所述颜色表示确定所述目标图像中的每一个像素点所对应的所述全局标识符。

在步骤606中，通过所述全局标识符获取所述目标图像中每个像素点所对应的所述标注信息，所述标注信息为所述三维仿真场景的创建过程中为所述目标分割对象预先设置好的。

也即，在对该目标图像渲染完成之后，能够分别根据不同的渲染方式来分别从渲染结果中获取每个像素所对应的标注信息。

其中，在根据该渲染结果获取到该分割信息的情况下，还可以根据该分割结果进行一定的后处理，从而生成新的标注信息以对该目标图像进行标注。例如，可以通过所述该分割信息计算每一个被遮挡的目标分割对象遮挡后的包围盒信息，进而还可以根据该目标分割对象遮挡前的包围盒信息以及遮挡后的包围盒信息，计算被遮挡的目标分割对象被遮挡范围占该目标分割对象总范围的百分比等等。

另外，在确定了该目标图像所对应的标注信息的情况下，还能够将该标注信息进行存储，例如，可以以二维矩阵图的形式进行存储，其中：在根据该分割信息确定了该目标图像中每个像素点所对应的该目标分割对象的全局标识符之后，在存储时可以存储该全局标识符转换后的RGB颜色信息，以方便该存储信息在其他视觉算法应用中的使用。

图7是根据本公开一示例性实施例示出的一种图像标注装置的结构框图。如图7所示，所述装置包括：创建模块10，用于创建三维仿真场景；确定模块20，用于根据预先设置的仿真摄像头确定目标图像中所包括的目标分割对象，所述目标图像为所述仿真摄像头在所述三维仿真场景中能够拍摄到的图像；渲染模块30，用于根据所述目标图像中的所述目标分割对象的个数对所述目标图像进行渲染；标注模块40，用于通过渲染结果获取所述目标图像中每个像素点的标注信息，以对所述目标图像进行标注。

在一种可能的实施方式中，所述确定模块20还用于：根据所述仿真摄像头的位姿信息、所述仿真摄像头的预设工作范围、以及预设感兴趣范围确定所述目标图像中所包括的所述目标分割对象。

在一种可能的实施方式中，所述仿真摄像头的所述预设工作范围中包括所述仿真摄像头的水平视场角和垂直视场角，所述确定模块20还用于：根据所述仿真摄像头的位姿信息和所述仿真摄像头的预设工作范围确定所述仿真摄像头的预设工作范围在所述三维仿真场景中所构成的目标视锥体，其中，所述目标视锥体的顶点为所述仿真摄像头的中心位置，所述中心位置通过所述位姿信息确定；将所述预设感兴趣范围作为所述目标视锥体上下两面所构成的扇形的半径，以及所述目标视锥体左右两面所构成的等腰三角形的腰长，以得到目标感兴趣体，其中，所述目标视锥体的上下两面之间的夹角为所述仿真摄像头的所述垂直视场角，所述目标视锥体的左右两面之间的夹角为所述仿真摄像头的所述水平视场角；根据所述三维仿真场景中处于所述目标感兴趣体内的仿真对象，确定所述目标图像中所包括的所述目标分割对象。

在一种可能的实施方式中，所述确定模块20还用于：根据所述三维仿真场景中处于所述目标感兴趣体内的仿真对象的语义，确定所述目标图像中所包括的所述目标分割对象；和/或根据所述三维仿真场景中处于所述目标感兴趣体内的仿真对象的实例，确定所述目标图像中所包括的所述目标分割对象。

在一种可能的实施方式中，所述渲染模块30还用于：在所述目标分割对象的个数不大于预设数量的情况下，通过模板缓冲区保存所述目标图像中的分割信息，以对所述目标图像进行渲染；在所述目标分割对象的个数大于所述预设数量的情况下，通过颜色缓冲区保存所述目标图像中的分割信息，以对所述目标图像进行渲染。

在一种可能的实施方式中，在所述目标分割对象的个数不大于预设数量的情况下，所述渲染模块30还用于：根据所述目标分割对象距离所述仿真摄像头的距离，按照由近到远的顺序为所述目标分割对象分配分割标识符；确定所述分割标识符与所述目标分割对象所对应的全局标识符之间的对应关系，其中，所述全局标识符为所述三维仿真场景的创建过程中为所述目标分割对象预先设置好的；将所述分割标识符作为所述分割信息保存在所述模板缓冲区中，以对所述目标图像进行渲染。

在一种可能的实施方式中，在所述目标分割对象的个数不大于预设数量的情况下，所述渲染模块30还用于：根据所述目标分割对象在所述目标图像前后预设时长内的图像帧中出现的频率回收所述目标分割对象的所述分割标识符。

在一种可能的实施方式中，在所述目标分割对象的个数大于所述预设数量的情况下，所述渲染模块30还用于：将所述目标分割对象所对应的全局标识符转换为24位十六进制的颜色表示，所述全局标识符为所述三维仿真场景的创建过程中为所述目标分割对象预先设置好的；确定所述全局标识符与所述颜色表示之间的对应关系；将所述颜色表示作为所述分割信息保存在所述颜色缓冲区中，以对所述目标图像进行渲染。

在一种可能的实施方式中，在通过模板缓冲区保存所述目标图像中的分割信息的情况下，所述标注模块40还用于：通过读取所述渲染结果中的所述模板缓冲区中的数据，确定所述目标图像中每一个像素点所对应的所述分割标识符；根据所述分割标识符确定所述目标图像中的每一个像素点所对应的所述全局标识符；通过所述全局标识符获取所述目标图像中每个像素点所对应的所述标注信息，所述标注信息为所述三维仿真场景的创建过程中为所述目标分割对象预先设置好的。

在一种可能的实施方式中，在通过颜色缓冲区保存所述目标图像中的分割信息的情况下，所述标注模块40还用于：通过读取所述渲染结果中的所述颜色缓冲区中的数据，确定所述目标图像中每一个像素点所对应的所述颜色表示；根据所述颜色表示确定所述目标图像中的每一个像素点所对应的所述全局标识符；通过所述全局标识符获取所述目标图像中每个像素点所对应的所述标注信息，所述标注信息为所述三维仿真场景的创建过程中为所述目标分割对象预先设置好的。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图8是根据一示例性实施例示出的一种电子设备800的框图。如图8所示，该电子设备800可以包括：处理器801，存储器802。该电子设备800还可以包括多媒体组件803，输入/输出(I/O)接口804，以及通信组件805中的一者或多者。

其中，处理器801用于控制该电子设备800的整体操作，以完成上述的图像标注方法中的全部或部分步骤。存储器802用于存储各种类型的数据以支持在该电子设备800的操作，这些数据例如可以包括用于在该电子设备800上操作的任何应用程序或方法的指令，以及应用程序相关的数据，例如联系人数据、收发的消息、图片、音频、视频等等。该存储器802可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，例如静态随机存取存储器(Static Random Access Memory，简称SRAM)，电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，简称EEPROM)，可擦除可编程只读存储器(Erasable Programmable Read-Only Memory，简称EPROM)，可编程只读存储器(Programmable Read-Only Memory，简称PROM)，只读存储器(Read-Only Memory，简称ROM)，磁存储器，快闪存储器，磁盘或光盘。多媒体组件803可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏，音频组件用于输出和/或输入音频信号。例如，音频组件可以包括一个麦克风，麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器802或通过通信组件805发送。音频组件还包括至少一个扬声器，用于输出音频信号。I/O接口804为处理器801和其他接口模块之间提供接口，上述其他接口模块可以是键盘，鼠标，按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件805用于该电子设备800与其他设备之间进行有线或无线通信。无线通信，例如Wi-Fi，蓝牙，近场通信(Near FieldCommunication，简称NFC)，2G、3G、4G、NB-IOT、eMTC、或其他5G等等，或它们中的一种或几种的组合，在此不做限定。因此相应的该通信组件805可以包括：Wi-Fi模块，蓝牙模块，NFC模块等等。

在一示例性实施例中，电子设备800可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit，简称ASIC)、数字信号处理器(DigitalSignal Processor，简称DSP)、数字信号处理设备(Digital Signal Processing Device，简称DSPD)、可编程逻辑器件(Programmable Logic Device，简称PLD)、现场可编程门阵列(Field Programmable Gate Array，简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述的图像标注方法。

在另一示例性实施例中，还提供了一种包括程序指令的计算机可读存储介质，该程序指令被处理器执行时实现上述的图像标注方法的步骤。例如，该计算机可读存储介质可以为上述包括程序指令的存储器802，上述程序指令可由电子设备800的处理器801执行以完成上述的图像标注方法。

图9是根据一示例性实施例示出的一种电子设备900的框图。例如，电子设备900可以被提供为一服务器。参照图9，电子设备900包括处理器922，其数量可以为一个或多个，以及存储器932，用于存储可由处理器922执行的计算机程序。存储器932中存储的计算机程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理器922可以被配置为执行该计算机程序，以执行上述的图像标注方法。

另外，电子设备900还可以包括电源组件926和通信组件950，该电源组件926可以被配置为执行电子设备900的电源管理，该通信组件950可以被配置为实现电子设备900的通信，例如，有线或无线通信。此外，该电子设备900还可以包括输入/输出(I/O)接口958。电子设备900可以操作基于存储在存储器932的操作***，例如Windows Server^TM，Mac OSX^TM，Unix^TM，Linux^TM等等。

在另一示例性实施例中，还提供了一种包括程序指令的计算机可读存储介质，该程序指令被处理器执行时实现上述的图像标注方法的步骤。例如，该计算机可读存储介质可以为上述包括程序指令的存储器932，上述程序指令可由电子设备900的处理器922执行以完成上述的图像标注方法。

在另一示例性实施例中，还提供一种计算机程序产品，该计算机程序产品包含能够由可编程的装置执行的计算机程序，该计算机程序具有当由该可编程的装置执行时用于执行上述的图像标注方法的代码部分。

以上结合附图详细描述了本公开的优选实施方式，但是，本公开并不限于上述实施方式中的具体细节，在本公开的技术构思范围内，可以对本公开的技术方案进行多种简单变型，这些简单变型均属于本公开的保护范围。

另外需要说明的是，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合。为了避免不必要的重复，本公开对各种可能的组合方式不再另行说明。

此外，本公开的各种不同的实施方式之间也可以进行任意组合，只要其不违背本公开的思想，其同样应当视为本公开所公开的内容。

Claims

1.一种图像标注方法，其特征在于，所述方法包括：

创建三维仿真场景；

根据预先设置的仿真摄像头确定目标图像中所包括的目标分割对象，所述目标图像为所述仿真摄像头在所述三维仿真场景中能够拍摄到的图像；

根据所述目标图像中的所述目标分割对象的个数对所述目标图像进行渲染；

通过渲染结果获取所述目标图像中每个像素点的标注信息，以对所述目标图像进行标注；

其中，所述根据所述目标图像中的所述目标分割对象的个数对所述目标图像进行渲染包括：

在所述目标分割对象的个数不大于预设数量的情况下，通过模板缓冲区保存所述目标图像中的分割信息，以对所述目标图像进行渲染；

在所述目标分割对象的个数大于所述预设数量的情况下，通过颜色缓冲区保存所述目标图像中的分割信息，以对所述目标图像进行渲染；

其中，所述在所述目标分割对象的个数不大于预设数量的情况下，通过模板缓冲区保存所述目标图像中的分割信息，以对所述目标图像进行渲染包括：

根据所述目标分割对象距离所述仿真摄像头的距离，按照由近到远的顺序为所述目标分割对象分配分割标识符；

确定所述分割标识符与所述目标分割对象所对应的全局标识符之间的对应关系，其中，所述全局标识符为所述三维仿真场景的创建过程中为所述目标分割对象预先设置好的；

将所述分割标识符作为所述分割信息保存在所述模板缓冲区中，以对所述目标图像进行渲染；

其中，所述在所述目标分割对象的个数大于所述预设数量的情况下，通过颜色缓冲区保存所述目标图像中的分割信息，以对所述目标图像进行渲染包括：

将所述目标分割对象所对应的全局标识符转换为24位十六进制的颜色表示，所述全局标识符为所述三维仿真场景的创建过程中为所述目标分割对象预先设置好的；

确定所述全局标识符与所述颜色表示之间的对应关系；

将所述颜色表示作为所述分割信息保存在所述颜色缓冲区中，以对所述目标图像进行渲染。

2.根据权利要求1所述的方法，其特征在于，所述根据预先设置的仿真摄像头确定目标图像中所包括的目标分割对象包括：

根据所述仿真摄像头的位姿信息、所述仿真摄像头的预设工作范围、以及预设感兴趣范围确定所述目标图像中所包括的所述目标分割对象。

3.根据权利要求2所述的方法，其特征在于，所述仿真摄像头的所述预设工作范围中包括所述仿真摄像头的水平视场角和垂直视场角，所述根据所述仿真摄像头的位姿信息、所述仿真摄像头的预设工作范围、以及预设感兴趣范围确定所述目标图像中所包括的所述目标分割对象包括：

根据所述仿真摄像头的位姿信息和所述仿真摄像头的预设工作范围确定所述仿真摄像头的预设工作范围在所述三维仿真场景中所构成的目标视锥体，其中，所述目标视锥体的顶点为所述仿真摄像头的中心位置，所述中心位置通过所述位姿信息确定；

将所述预设感兴趣范围作为所述目标视锥体上下两面所构成的扇形的半径，以及所述目标视锥体左右两面所构成的等腰三角形的腰长，以得到目标感兴趣体，其中，所述目标视锥体的上下两面之间的夹角为所述仿真摄像头的所述垂直视场角，所述目标视锥体的左右两面之间的夹角为所述仿真摄像头的所述水平视场角；

根据所述三维仿真场景中处于所述目标感兴趣体内的仿真对象，确定所述目标图像中所包括的所述目标分割对象。

4.根据权利要求3所述的方法，其特征在于，所述根据所述三维仿真场景中处于所述目标感兴趣体内的仿真对象，确定所述目标图像中所包括的所述目标分割对象包括：

根据所述三维仿真场景中处于所述目标感兴趣体内的仿真对象的语义，确定所述目标图像中所包括的所述目标分割对象；和/或

根据所述三维仿真场景中处于所述目标感兴趣体内的仿真对象的实例，确定所述目标图像中所包括的所述目标分割对象。

5.根据权利要求1所述的方法，其特征在于，所述在所述目标分割对象的个数不大于预设数量的情况下，通过模板缓冲区保存所述目标图像中的分割信息，以对所述目标图像进行渲染还包括：

根据所述目标分割对象在所述目标图像前后预设时长内的图像帧中出现的频率回收所述目标分割对象的所述分割标识符。

6.根据权利要求1或5所述方法，其特征在于，所述通过渲染结果获取所述目标图像中每个像素点的标注信息，以对所述目标图像进行标注包括：

在通过模板缓冲区保存所述目标图像中的分割信息的情况下，通过读取所述渲染结果中的所述模板缓冲区中的数据，确定所述目标图像中每一个像素点所对应的所述分割标识符；

根据所述分割标识符确定所述目标图像中的每一个像素点所对应的所述全局标识符；

通过所述全局标识符获取所述目标图像中每个像素点所对应的所述标注信息，所述标注信息为所述三维仿真场景的创建过程中为所述目标分割对象预先设置好的。

7.根据权利要求1所述的方法，其特征在于，所述通过渲染结果获取所述目标图像中每个像素点的标注信息，以对所述目标图像进行标注包括：

在通过颜色缓冲区保存所述目标图像中的分割信息的情况下，通过读取所述渲染结果中的所述颜色缓冲区中的数据，确定所述目标图像中每一个像素点所对应的所述颜色表示；

根据所述颜色表示确定所述目标图像中的每一个像素点所对应的所述全局标识符；

8.一种图像标注装置，其特征在于，所述装置包括：

创建模块，用于创建三维仿真场景；

确定模块，用于根据预先设置的仿真摄像头确定目标图像中所包括的目标分割对象，所述目标图像为所述仿真摄像头在所述三维仿真场景中能够拍摄到的图像；

渲染模块，用于根据所述目标图像中的所述目标分割对象的个数对所述目标图像进行渲染；

标注模块，用于通过渲染结果获取所述目标图像中每个像素点的标注信息，以对所述目标图像进行标注；

确定所述全局标识符与所述颜色表示之间的对应关系；

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1至7中任一项所述方法的步骤。

10.一种电子设备，其特征在于，包括：

存储器，其上存储有计算机程序；

处理器，用于执行所述存储器中的所述计算机程序，以实现权利要求1至7中任一项所述方法的步骤。