CN112884060A

CN112884060A - 图像标注方法、装置、电子设备及存储介质

Info

Publication number: CN112884060A
Application number: CN202110256676.7A
Authority: CN
Inventors: 尹芳; 段翔; 马杰; 张晓璐; ***
Original assignee: Lianren Healthcare Big Data Technology Co Ltd
Current assignee: Lianren Healthcare Big Data Technology Co Ltd
Priority date: 2021-03-09
Filing date: 2021-03-09
Publication date: 2021-06-01
Anticipated expiration: 2041-03-09
Also published as: CN112884060B

Abstract

本发明实施例公开了一种图像标注方法、装置、电子设备及存储介质。该方法包括：通过预先训练出的预标注模型生成待标注图像的预标注结果，无需人工手动对图像进行轮廓勾画、区域信息的输入等，实现了图像的预标注结果的快速生成，提高了标注数据集的生成效率；并通过预先训练出的标签分类模型生成预标注结果的标签分类结果，实现将预标注结果的标注修订问题降维为标注分类问题，进一步的提高了标注数据集的生成效率。并且，形成的标注数据集还包括预标注结果的标签分类结果，从而提高了标注数据集的准确度。本实施例的预标注结果以及预标注结果的标签分类结果还可用于辅助后续其它模型的训练，进而实现提高训练模型的输出精度的技术效果。

Description

图像标注方法、装置、电子设备及存储介质

技术领域

本发明实施例涉及计算机技术领域，尤其涉及一种图像标注方法、装置、电子设备及存储介质。

背景技术

医学影像的标注是医学专家对诸如计算机断层扫描(Computed Tomography，CT)影像、磁共振(Magnetic Resonance，MR)影像、心电图、病理切片图像等医学影像进行分类判断、病灶检测或病灶分割，以形成医学影像的医学语料标注。

在医学影像标注过程中，影像标注往往需要经验丰富的放射科医生进行标注，放射科医生数量短缺，人力标注成本较高。当面临大量医学影像复杂标注时，在标注人力短缺的情况下，会带来一系列问题。因此，人工智能(Artificial Intelligence，AI)医疗数据标注就显得尤其重要。AI技术绝大多数计算都属于有监督学习计算，尤其是医疗业务场景中，需要将资深医疗专家通过多年积累的医疗业务知识融入到人工智能应用中，就更需要将医疗数据和专家知识进行深度结合。然而，AI训练过程需要大量标准的医学影像标注数据。

医学影像的标注包括分类和检测(分割)两大类型，分类是标注有病或无病等，检测任务是标注影像中某个病变区域的边界范围。检测任务需要用多边形工具、套索工具等标注出病灶范围，往往需要经验丰富的放射科医生判断及圈画数个小时，相比于分类问题更为复杂。在现有技术中，医学影像标注方法主要分类如下两类：传统的人工标注方法以及预标注下的人工修订方法。其中，传统的人工标注方法是医学影像专家利用多边形、套索、自动填充等标注工具，手动对待标注影像的数据异常体征的轮廓进行勾画，或选择或输入标签的名称，完成病灶区域的检测；预标注下的人工修订方法是医学影像专家对模型输出的预标注结果进行边缘调整，在模型输出效果差的情况下，专家甚至要删除输出模型的结果，重新进行手工标注。

影像中病灶的形状往往是不规则的，手动标注需要耗费大量时间，通过人工智能学习的自动标注的方法在准确性上往往存在问题，不能保障每一张影像都正确标注，单独使用以上方法都不能缩短形成一定数量标准数据集的时间。因此，现有技术存在费时、费力等技术缺陷，不能快速生成标准的标注数据集；并且，人工标注方法容易因主观因素形成错误的标注，预标注下的人工修订方法的标注效果较差，不能保障每一张影像都被正确标注，进而无法保证标准的标注数据集的正确性。

发明内容

本发明实施例提供了一种图像标注方法、装置、电子设备及存储介质，以提高标注数据集的生成效率；同时，提高标准的标注数据集的准确性。

第一方面，本发明实施例提供了一种图像标注方法，包括：

获取待标注图像；

基于所述待标注图像和预先训练出的预标注模型，生成所述待标注图像对应的预标注结果；其中，所述预标注结果包括所述待标注图像的目标标注区域以及所述目标标注区域对应的区域标识；

基于所述待标注图像对应的预标注结果以及预先训练出的标签分类模型，生成所述预标注结果对应的标签分类结果；

基于所述预标注结果和所述标签分类结果确定所述待标注图像的标注信息。

可选的，所述方法还包括：

获取各样本预标注结果，并确定各所述样本预标注结果的并交比值；

基于各所述样本预标注结果的并交比值确定各所述样本预标注结果对应的标准标签分类结果；

基于各所述样本预标注结果以及各所述样本预标注结果对应的标准标签分类结果确定标签分类样本数据；

基于标签分类样本数据对预先构建的标签分类模型进行训练，得到预先训练出的标签分类模型。

可选的，所述获取各样本预标注结果，包括：

获取用户输入的各样本标注图像的样本预标注信息，基于所述各样本标注图像的样本预标注信息确定各样本预标注结果；或者，

基于所述预先训练出的预标注模型输出的各待标注图像的预标注结果，确定各样本预标注结果。

可选的，所述基于所述预先训练出的预标注模型输出的各待标注图像的预标注结果，确定各样本预标注结果，包括：

对所述预先训练出的预标注模型输出的各待标注图像的预标注结果进行筛选，得到样本预标注结果。

可选的，在所述生成所述预标注结果对应的标签分类结果之后，还包括：

获取所述标签分类结果对应的验证结果；

相应的，所述基于所述预标注结果和所述标签分类结果确定所述待标注图像的标注信息，包括：

基于所述预标注结果、所述标签分类结果以及所述标签分类结果对应的验证结果，确定所述待标注图像的标注信息。

可选的，所述方法还包括：

基于所述待标注图像的标注信息中的所述验证结果，将所述待标注图像以及所述待标注图像的标注信息存储至数据库。

可选的，所述方法还包括：

基于所述待标注图像的标注信息中的所述验证结果、所述标签分类结果以及所述预标注结果，确定分类模型优化样本数据；

基于所述分类模型优化样本数据对所述预先训练出的标签分类模型进行优化迭代训练。

第二方面，本发明实施例还提供了一种图像标注装置，该装置包括：

图像获取模块，用于获取待标注图像；

预标注生成模块，用于基于所述待标注图像和预先训练出的预标注模型，生成所述待标注图像对应的预标注结果；其中，所述预标注结果包括所述待标注图像的目标标注区域以及所述目标标注区域对应的区域标识；

标签分类模块，用于基于所述待标注图像对应的预标注结果以及预先训练出的标签分类模型，生成所述预标注结果对应的标签分类结果；

标注生成模块，用于基于所述预标注结果和所述标签分类结果确定所述待标注图像的标注信息。

第三方面，本发明实施例还提供了一种电子设备，所述电子设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如本发明任意实施例提供的图像标注方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明任意实施例提供的图像标注方法。

上述发明中的实施例具有如下优点或有益效果：

本实施例的技术方案，通过预先训练出的预标注模型生成待标注图像的预标注结果，无需人工手动对图像进行轮廓勾画、区域信息的输入等，从而实现了大量图像的预标注结果的快速生成，提高了标注数据集的生成效率；并通过预先训练出的标签分类模型生成预标注结果的标签分类结果，实现将预标注结果的标注修订问题降维为标注分类问题，无需人工手动对预标注结果进行边缘调整等，进一步的提高了标注数据集的生成效率。并且，形成的标注数据集还包括预标注结果的标签分类结果，从而提高了标注数据集的准确度。本实施例的预标注结果以及预标注结果的标签分类结果还可用于辅助后续其它模型的训练，进而实现提高训练模型的输出精度的技术效果。

附图说明

为了更加清楚地说明本发明示例性实施例的技术方案，下面对描述实施例中所需要用到的附图做一简单介绍。显然，所介绍的附图只是本发明所要描述的一部分实施例的附图，而不是全部的附图，对于本领域普通技术人员，在不付出创造性劳动的前提下，还可以根据这些附图得到其他的附图。

图1A为本发明实施例一所提供的一种图像标注方法的流程示意图；

图1B为本发明实施例一所提供的一种预先训练出的预标注模型的训练流程示意图；

图2A为本发明实施例二所提供的一种图像标注方法的流程示意图；

图2B为本发明实施例二所提供的一种预先训练出的标签分类模型的训练流程示意图；

图3A为本发明实施例三所提供的一种图像标注方法的流程示意图；

图3B为本发明实施例三所提供的一种优化迭代训练流程示意图；

图4为本发明实施例四所提供的一种图像标注装置的结构示意图；

图5为本发明实施例五所提供的一种电子设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1A为本发明实施例一提供的一种图像标注方法的流程示意图，本实施例可适用于对待标注图像进行标注的情况，尤其适用于对待标注图像进行预标注，并对预标注的结果进行标签分类，以基于预标注的结果和标签分类的结果生成待标注图像的标注信息的情形，该方法可以由图像标注装置来执行，该装置可以由硬件和/或软件来实现，该方法具体包括如下步骤：

S110、获取待标注图像。

其中，待标注图像可以是任意需要进行标注的图像，包括但不限于医学影像、航天遥感图像、卫星遥感图像以及交通图像。在本实施例中，以医学影像为例，待标注图像可以是诸如CT影像、MR影像、超声检查影像、X射线影像、心电图或病理切片图像等。需要说明的是，待标注图像的数量可以是一个或多个。在一种实施方式中，可以将数据库中未进行标注的图像均确定为待标注图像，并获取数据库中的待标注图像。

S120、基于待标注图像和预先训练出的预标注模型，生成待标注图像对应的预标注结果；其中，预标注结果包括待标注图像的目标标注区域以及目标标注区域对应的区域标识。

其中，预标注结果中的目标标注区域可以是待标注图像中需要标注的区域。以交通图像为例，目标标注区域可以包括某个车辆；以卫星遥感图像为例，目标标注区域可以包括某颗星球；以医学影像为例，目标标注区域可以是目标组织中与标准图像存在差异的区域，或，医生的感兴趣区域，可用于辅助医生进行疾病诊断。可选的，预标注结果中的目标标注区域可以以轮廓勾画的方式呈现。示例性的，目标标注区域为某个车辆，则预标注结果中的目标标注区域为勾画出的该车辆轮廓。目标标注区域对应的区域标识包括但不限于目标标注区域的位置信息和标签信息。其中，目标标注区域的位置信息可以是目标标注区域的具***置信息，以交通图像为例，目标标注区域的位置信息可以是北京市；以医学图像为例，位置信息可以是目标标注区域所处的目标组织的相关位置描述。。目标标注区域的标签信息可以是与目标标注区域相关联的标签信息，以交通图像为例，标签信息可以是正常行驶、闯红灯、遮挡车牌号等；以医学影像为例，标签信息可以是目标区域所处的目标组织、区域尺寸和/或区域相对于组织的结构描述(如，目标区域位于组织的哪个位置或区域，目标区域的数量等)等。

在本实施例中，预先训练出的预标注模型的训练过程如下：将预标注样本数据输入至预先构建的预标注模型；其中，预标注样本数据包括：样本待标注图像和样本待标注图像对应的标准预标注结果；基于预先构建的预标注模型输出的预测预标注结果和标准预标注结果，计算损失函数；基于损失函数的计算结果对预先构建的预标注模型的网络参数进行反向调整，直至满足训练结束条件，得到预先训练出的预标注模型。其中，预先构建的预标注模型可以是深度学习卷积神经网络模型、注意力模型、迁移学习模型等。

可选的，可以获取数据库中少量未标注的图像作为样本待标注图像，并将样本待标注图像的人工标注结果作为样本待标注图像对应的标准预标注结果，以预先训练出预标注模型，并根据预先训练出的预标注模型对数据库中剩余的未标注图像进行预标注。如图1B所示，展示了预先训练出的预标注模型的训练过程：选取样本待标注图像，对样本待标注图像进行人工标注，得到样本待标注图像的人工标注结果(标准预标注结果)，基于样本待标注图像和其对应的标准预标注结果对预先构建的预标注模型进行训练，得到预先训练出的预标注模型，利用预先训练出的预标注模型预测其余的待标注图像的预标注结果。

示例性的，获取数据库中20％未标注的图像作为样本待标注图像，并对样本待标注图像进行人工标注，基于样本待标注图像以及人工标注的结果得到预先训练出的预标注模型，根据预先训练出的预标注模型对剩余80％未标注的图像进行预标注。需要说明的是，本申请对从数据库中获取的样本待标注图像的数量不进行限定，可以根据预标注模型的精度要求进行调整。

需要说明的是，训练结束条件可以是损失函数的计算结果收敛，和/或，预先构建的预标注模型的预测准确度高于设定阈值。本申请对设定阈值的具体数值不进行限定，例如，设定阈值可以是0.8。

具体的，在得到预先训练出的预标注模型后，将待标注图像输入至预先训练出的预标注模型中，即可得到预先训练出的预标注模型输出的待标注图像对应的预标注结果。

在一种实施方式中，可以基于Docker镜像完成预先训练出的预标注模型的训练过程，即，启动提供预测计算服务的Docker镜像，基于启动的各Docker镜像得到预先训练出的预标注模型。在一种实施方式中，还可以基于Docker镜像实现基于待标注图像和预先训练出的预标注模型，生成待标注图像对应的预标注结果。其中，各Docker镜像启动后输入与输出的格式与平台提供的标准一致。

S130、基于待标注图像对应的预标注结果以及预先训练出的标签分类模型，生成预标注结果对应的标签分类结果。

在基于上述步骤得到待标注图像对应的预标注结果后，根据预标注结果以及预先训练出的标签分类模型，得到预标注结果对应的标签分类结果。其中，标签分类结果包括预标注结果的准确程度的分类结果。示例性的，标签分类结果包括但不限于正确、接近正确、部分正确以及错误。预标注结果的准确程度由预标注结果中的目标标注区域与期望标注区域之间的差异大小确定。如，预标注结果中的目标标注区域与期望标注区域之间的差异非常小，则标签分类结果为正确；预标注结果中的目标标注区域与期望标注区域之间的差异非常大，则标签分类结果为错误。

可选的，标签分类结果还包括预标注结果的准确程度对应的权重。示例性的，标签分类结果为正确对应的权重为1；接近正确对应的权重为0.8；部分正确对应的权重为0.6；错误对应的权重为0。需要说明的是，上述准确程度的分类以及其对应的权重仅为示例，本申请对此不作限定，具体的权重数值可以根据实际需求进行调整。

在本实施例中，预先训练出的标签分类模型的训练过程如下：将标签分类样本数据输入至预先构建的标签分类模型；其中，标签分类样本数据包括：样本预标注结果和样本预标注结果对应的标准标签分类结果；基于预先构建的标签分类模型输出的预测标签分类结果以及标准标签分类结果，计算损失函数；基于损失函数的计算结果对预先构建的标签分类模型的网络参数进行反向调整，直至满足训练结束条件，得到预先训练出的标签分类模型。其中，预先构建的标签分类模型可以是最邻近结点模型、贝叶斯模型、决策树模型、支持向量回归模型、神经网络模型等。训练结束条件可以是损失函数的计算结果收敛。

S140、基于预标注结果和标签分类结果确定待标注图像的标注信息。

具体的，根据待标注图像对应的预标注结果，以及标签分类结果，生成待标注图像的标注信息。示例性的，以交通图像为例，待标注图像的标注信息包括轮廓勾画的某个车辆、该车辆对应的位置信息(北京市海淀区)、该车辆对应标签信息(闯红灯)以及轮廓勾画的该车辆的标签分类结果(正确、1)；以医学影像为例，待标注图像的标注信息包括轮廓勾画的肺部区域、轮廓勾画的肺部区域对应的位置信息(肺部)以及标签信息(囊状含气透亮区)、以及轮廓勾画的肺部区域的标签分类结果(接近正确、0.8)。

在本实施例中，待标注图像的标注信息在提供各待标注图像的预标注结果的同时，还一并提供了预标注结果的准确程度。待标注图像的标注信息可以存储于标注数据集中，标注数据集可以用于后续其它标注模型的训练。与仅含有标准标注的数据集相比，存储本实施例中各待标注图像的标注信息的标注数据集的数据量更多。因此，标注数据集的应用范围更广，标注数据集可以支持各种标注模型的训练。同时，标注数据集标注信息中的标签分类结果还可以用于辅助其它模型的训练，进一步提高训练出的模型的准确度。

实施例二

图2A为本发明实施例二提供的一种图像标注方法的流程示意图，本实施例在上述各实施例的基础上，可选的，还包括：获取各样本预标注结果，并确定各样本预标注结果的并交比值；基于各样本预标注结果的并交比值确定各样本预标注结果对应的标准标签分类结果；基于各样本预标注结果以及各样本预标注结果对应的标准标签分类结果确定标签分类样本数据；基于标签分类样本数据对预先构建的标签分类模型进行训练，得到预先训练出的标签分类模型。

其中与上述各实施例相同或相应的术语的解释在此不再赘述。参见图2A，本实施例提供的图像标注方法包括以下步骤：

S210、获取待标注图像；

S220、基于待标注图像和预先训练出的预标注模型，生成待标注图像对应的预标注结果；其中，预标注结果包括待标注图像的目标标注区域以及目标标注区域对应的区域标识。

S230、获取各样本预标注结果，并确定各样本预标注结果的并交比值。

其中，样本预标注结果的并交比值(Intersection over Union，IOU)可以反映出样本预标注结果的准确度。并交比值可以是样本预标注结果与期望预标注结果之间的并交比。示例性的，IOU可以基于如下公式确定：

其中，A和B分别是样本预标注结果与期望预标注结果。可选的，A和B可以分别是样本预标注结果中的目标标注区域，以及期望预标注结果中的期望标注区域。

在一种实施方式中，样本预标注结果的IOU可以由用户根据上述公式判断得出，即，用户根据观察确定大致的期望标注区域，并确定出IOU。在另一种实时方式中，样本预标注结果的IOU可以通过计算得出，其中，期望标注区域可以通过选择性搜索(selectivesearch，SS)算法确定。

需要说明的是，获取样本预标注结果的目的在于：选取用于进行标签分类模型训练的样本。样本预标注结果可以是预先训练出的预标注模型输出的预标注结果，也可以是人工预标注结果。可选的，获取各样本预标注结果，包括：获取用户输入的各样本标注图像的样本预标注信息，基于各样本标注图像的样本预标注信息确定各样本预标注结果；或者，基于预先训练出的预标注模型输出的各待标注图像的预标注结果，确定各样本预标注结果。

具体的，将用户输入的各样本标注图像的样本预标注信息作为各样本预标注结果，或者，将预先训练出的预标注模型输出的预标注结果作为各样本预标注结果。可选的，基于预先训练出的预标注模型输出的各待标注图像的预标注结果，确定各样本预标注结果，包括：对预先训练出的预标注模型输出的各待标注图像的预标注结果进行筛选，得到样本预标注结果。

即，从预先训练出的预标注模型输出的所有预标注结果中筛选出部分预标注结果，作为各样本预标注结果。示例性的，筛选出20％的预标注结果作为样本预标注结果。

S240、基于各样本预标注结果的并交比值确定各样本预标注结果对应的标准标签分类结果。

其中，不同的并交比值具备对应的标签分类结果。示例性的，在并交比值大于0.75时，标签分类结果为正确；在并交比值大于0.5且小于等于0.75时，标签分类结果为接近正确；在并交比值大于0.1且小于等于0.5时，标签分类结果为部分正确；在并交比值小于等于0.1时，标签分类结果为错误。

S250、基于各样本预标注结果以及各样本预标注结果对应的标准标签分类结果确定标签分类样本数据；基于标签分类样本数据对预先构建的标签分类模型进行训练，得到预先训练出的标签分类模型。

具体的，根据各样本预标注结果，以及各样本预标注结果对应的标准标签分类结果，形成标签分类样本数据；并利用标签分类样本数据对预先构建的标签分类模型进行训练。

在一种优选的实施方式中，样本预标注结果来源于预先训练出的预标注模型输出的预标注结果，即，基于预先训练出的预标注模型输出的部分预标注结果，得到预先训练出的标签分类模型。如图2B所示，展示了一种预先训练出的标签分类模型的训练流程，包括：

基于样本待标注图像以及样本待标注图像的人工标注结果进行模型训练，得到预先训练出的预标注模型，基于预先训练出的预标注模型预测出其余待标注图像的预标注结果；

从预先训练出的预标注模型输出的全部预标注结果中选取样本预标注结果，计算样本预标注结果的并交比值，并基于并交比值确定样本预标注结果对应的样本标签分类结果；实现将预标注的修订降维成预标注的分类，即，用户仅需设置少量样本预标注结果的并交比值即可，无需对各预标注结果进行人工修订；

根据样本预标注结果以及样本预标注结果对应的样本标签分类结果形成样本标签分类数据，利用样本标签分类数据进行模型训练，得到预先训练出的标签分类模型。其中，样本预标注结果以及样本预标注结果对应的样本标签分类结果可以存储至标注数据集，训练后的标签分类模型输出的其余预标注结果的标签分类结果以及预标注结果也可以存储至标注数据集。

S260、基于待标注图像对应的预标注结果以及预先训练出的标签分类模型，生成预标注结果对应的标签分类结果。

S270、基于预标注结果和标签分类结果确定待标注图像的标注信息。

需要说明的是，S230-S250可以在S220之后执行，也可以在S210之前执行。即，当样本预标注结果取自预先训练出的预标注模型输出的各预标注结果时，S230-S250在S220之后执行，先得到预先训练出的预标注模型，根据预先训练出的预标注模型输出的各预标注结果得到预先训练出的标签分类模型；当样本预标注结果取自用户录入的各样本标注图像的样本预标注信息时，S230-S250可以在S210之前执行，预标注模型和标签分类模型的训练不分先后顺序。

本实施例的技术方案，根据样本预标注结果以及样本预标注结果对应的标准标签分类结果得到预先训练出的标签分类模型，将预标注结果的修订问题降维成标签分类问题，无需用户手动对预标注结果进行边缘调整或重新勾画轮廓，在图像数据相对丰富的场景下，将复杂的图像修订任务变为自动分类任务，降低人工修订的难度，进而提高了标注数据集的生成效率。此外，用于训练出标签分类模型的样本预标注结果可以是预先训练出的预标注模型输出的，进而实现了通过预标注模型对应的数据集，自动完成预标注模型和标签分类模型的依次训练，提高了标签分类模型的训练效率，进一步的，提高了待标注图像的标注信息的生成效率。

实施例三

图3A为本发明实施例三提供的一种图像标注方法的流程示意图，本实施例在上述各实施例的基础上，可选的，在生成所述预标注结果对应的标签分类结果之后，还包括：获取标签分类结果对应的验证结果；相应的，基于预标注结果和标签分类结果确定待标注图像的标注信息，包括：基于预标注结果、标签分类结果以及标签分类结果对应的验证结果，确定待标注图像的标注信息。

其中与上述各实施例相同或相应的术语的解释在此不再赘述。参见图3A，本实施例提供的图像标注方法包括以下步骤：

S310、获取待标注图像。

S320、基于待标注图像和预先训练出的预标注模型，生成待标注图像对应的预标注结果；其中，预标注结果包括待标注图像的目标标注区域以及目标标注区域对应的区域标识。

S330、基于待标注图像对应的预标注结果以及预先训练出的标签分类模型，生成预标注结果对应的标签分类结果。

S340、获取标签分类结果对应的验证结果。

其中，验证结果可以是用户针对预标注结果对应的标签分类结果的验证结果。验证结果可以包括验证通过和验证失败。示例性的，在用户判断出预标注结果对应的标签分类结果无误时，例如某一预标注结果对应的标签分类结果为部分正确，用户判断出该标签分类结果无误，验证结果为验证通过；在用户判断出预标注结果对应的标签分类结果有误时，验证结果为验证失败。

获取标签分类结果对应的验证结果的方式可以有多种，在一种实施方式中，可以通过接收用户在预标注结果与标签分类结果的展示界面中基于预设的选择标签所选择的信息得到。

S350、基于预标注结果、标签分类结果以及标签分类结果对应的验证结果，确定待标注图像的标注信息。

具体的，本实施例中待标注图像的标注信息包括预标注结果、标签分类结果，以及标签分类结果对应的验证结果。在本实施例中，用户仅需反馈标签分类结果对应的验证结果，实现了将用户的标注与修订任务降维为验收任务，用户仅需抽样验收标签分类结果即可。

在一种实施方式中，可以将待标注图像的标注信息以及待标注图像对应存储至数据库；或者，将验证通过的待标注图像的标注信息以及待标注图像存储至第一数据库，将验证失败的待标注图像的标注信息以及待标注图像存储至第二数据库，以实现验证通过和验证失败的标注信息的分别存储。

可选的，还可以仅将验证通过的待标注图像的标注信息以及待标注图像存储至数据库。即，所述方法还包括：基于待标注图像的标注信息中的验证结果，将待标注图像以及待标注图像的标注信息存储至数据库。具体的，若待标注图像的标注信息中的验证结果为验证通过，则将该待标注图像以及待标注图像的标注信息存储至数据库。在一种实施方式中，可以对验证失败的标签分类结果对应的待标注图像进行人工标注，将人工标注结果以及对应的待标注图像存储至数据库中。

在该可选的实施方式中，仅存储验证通过的待标注图像以及待标注图像的标注信息的目的在于：通过仅存储人工确定过的验证通过的标注信息，以得到准确无误的标注数据集，进而可供精准医疗、交通检测等模型进行有监督学习的训练。

需要说明的是，在得到标签分类结果的验证结果后，可以根据验证结果进一步对预先训练出的标签分类模型进行优化训练。可选的，还包括：基于待标注图像的标注信息中的验证结果、标签分类结果以及预标注结果，确定分类模型优化样本数据；基于分类模型优化样本数据对预先训练出的标签分类模型进行优化迭代训练。

具体的，若待标注图像的标注信息中的验证结果为验证通过，则根据该待标注图像的标注信息中的标签分类结果以及预标注结果形成分类模型优化样本数据。示例性的，如图3B所示，展示了一种优化迭代训练流程，在得到验证结果后，还可以基于验证结果返回对预先训练出的标签分类模型进行优化迭代训练。

需要说明的是，还可以根据标签分类结果以及验证结果，进一步对预先训练出的预标注模型进行优化训练。可选的，还包括：基于待标注图像的标注信息中的标签分类结果以及验证结果，确定预标注模型优化样本数据；基于预标注模型优化样本数据对所述预先训练出的预标注模型进行优化迭代训练。

具体的，若待标注图像的标注信息中的验证结果为验证通过，且标签分类结果为正确，则根据该待标注图像以及该待标注图像对应的预标注结果形成预标注模型优化样本数据。示例性的，如图3B所示，在得到验证结果后，还可以基于验证结果返回对预先训练出的预标注模型进行优化迭代训练。

本实施例的技术方案，在预先训练出的预标注模型自动输出预标注结果，以及预先训练出的标签分类模型自动对预标注结果进行标签分类后，由用户判断是否合格，保障图像的标签分类的准确性。用户判断合格的标签分类以预标注结果还可以用于优化迭代训练预标注模型和标签分类模型，进一步的提高了预标注模型和标签分类模型的输出精度，进而显著提高了标注数据集的准确性。

实施例四

图4为本发明实施例四提供的一种图像标注装置的结构示意图，本实施例可适用于对待标注图像进行标注的情况，尤其适用于对待标注图像进行预标注，并对预标注的结果进行标签分类，以基于预标注的结果和标签分类的结果生成待标注图像的标注信息的情形，该装置具体包括：图像获取模块410、预标注生成模块420、标签分类模块430以及标注生成模块440。

图像获取模块410，用于获取待标注图像；

预标注生成模块420，用于基于待标注图像和预先训练出的预标注模型，生成待标注图像对应的预标注结果；其中，预标注结果包括待标注图像的目标标注区域以及目标标注区域对应的区域标识；

标签分类模块430，用于基于待标注图像对应的预标注结果以及预先训练出的标签分类模型，生成预标注结果对应的标签分类结果；

标注生成模块440，用于基于预标注结果和标签分类结果确定待标注图像的标注信息。

可选的，图像标注装置还包括分类模型训练模块，用于获取各样本预标注结果，并确定各样本预标注结果的并交比值；基于各样本预标注结果的并交比值确定各样本预标注结果对应的标准标签分类结果；基于各样本预标注结果以及各样本预标注结果对应的标准标签分类结果确定标签分类样本数据；基于标签分类样本数据对预先构建的标签分类模型进行训练，得到预先训练出的标签分类模型。

可选的，分类模型训练模块包括样本获取单元，样本获取单元用于获取各样本预标注结果。可选的，样本获取单元用于获取用户输入的各样本标注图像的样本预标注信息，基于各样本标注图像的样本预标注信息确定各样本预标注结果；或者，基于预先训练出的预标注模型输出的各待标注图像的预标注结果，确定各样本预标注结果。

可选的，样本获取单元具体用于对预先训练出的预标注模型输出的各待标注图像的预标注结果进行筛选，得到样本预标注结果。

可选的，图像标注装置还包括验证生成模块，用于在生成预标注结果对应的标签分类结果之后，获取标签分类结果对应的验证结果；相应的，标注生成模块440用于基于预标注结果、标签分类结果以及标签分类结果对应的验证结果，确定待标注图像的标注信息。

可选的，图像标注装置还包括存储模块，用于基于待标注图像的标注信息中的验证结果，将待标注图像以及待标注图像的标注信息存储至数据库。

可选的，图像标注装置还包括分类模型优化模块，用于基于待标注图像的标注信息中的验证结果、标签分类结果以及预标注结果，确定分类模型优化样本数据；基于分类模型优化样本数据对预先训练出的标签分类模型进行优化迭代训练。

可选的，图像标注装置还包括预标注模型优化模块，用于基于待标注图像的标注信息中的标签分类结果以及验证结果，确定预标注模型优化样本数据；基于预标注模型优化样本数据对所述预先训练出的预标注模型进行优化迭代训练。

在本实施例中，通过预先训练出的预标注模型生成待标注图像的预标注结果，无需人工手动对图像进行轮廓勾画、区域信息的输入等，从而实现了大量图像的预标注结果的快速生成，提高了标注数据集的生成效率；并通过预先训练出的标签分类模型生成预标注结果的标签分类结果，实现将预标注结果的标注修订问题降维为标注分类问题，无需人工手动对预标注结果进行边缘调整等，进一步的提高了标注数据集的生成效率。并且，形成的标注数据集还包括预标注结果的标签分类结果，从而提高了标注数据集的准确度。本实施例的预标注结果以及预标注结果的标签分类结果还可用于辅助后续其它模型的训练，进而实现提高训练模型的输出精度的技术效果。

本发明实施例所提供的图像标注装置可执行本发明任意实施例所提供的图像标注方法，具备执行方法相应的功能模块和有益效果。

值得注意的是，上述***所包括的各个单元和模块只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的具体名称也只是为了便于相互区分，并不用于限制本发明实施例的保护范围。

实施例五

图5是本发明实施例五提供的一种电子设备的结构示意图。图5示出了适于用来实现本发明实施方式的示例性电子设备12的框图。图5显示的电子设备12仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。设备12典型的是承担生成图像标注功能的电子设备。

如图5所示，电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于：一个或者多个处理器或者处理单元16，存储器28，连接不同组件(包括存储器28和处理单元16)的总线18。

总线18表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，***总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture，ISA)总线，微通道体系结构(Micro Channel Architecture，MCA)总线，增强型ISA总线、视频电子标准协会(Video Electronics Standards Association，VESA)局域总线以及***组件互连(Peripheral Component Interconnect，PCI)总线。

电子设备12典型地包括多种计算机可读介质。这些介质可以是任何能够被电子设备12访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

存储器28可以包括易失性存储器形式的计算机装置可读介质，例如随机存取存储器(Random Access Memory，RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机存储介质。仅作为举例，存储装置34可以用于读写不可移动的、非易失性磁介质(图5未显示，通常称为“硬盘驱动器”)。尽管图5中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如只读光盘(Compact Disc-Read Only Memory，CD-ROM)、数字视盘(Digital Video Disc-Read Only Memory，DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品40，该程序产品40具有一组程序模块42，这些程序模块被配置以执行本发明各实施例的功能。程序产品40，可以存储在例如存储器28中，这样的程序模块42包括但不限于一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。

电子设备12也可以与一个或多个外部设备14(例如键盘、鼠标、摄像头等和显示器)通信，还可与一个或者多个使得用户能与该电子设备12交互的设备通信，和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且，电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local Area Network，LAN)，广域网WideArea Network，WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器20通过总线18与电子设备12的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备12使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of Independent Disks，RAID)装置、磁带驱动器以及数据备份存储装置等。

处理器16通过运行存储在存储器28中的程序，从而执行各种功能应用以及数据处理，例如实现本发明上述实施例所提供的图像标注方法，包括：

获取待标注图像；

基于待标注图像和预先训练出的预标注模型，生成待标注图像对应的预标注结果；其中，预标注结果包括待标注图像的目标标注区域以及目标标注区域对应的区域标识；

基于待标注图像对应的预标注结果以及预先训练出的标签分类模型，生成预标注结果对应的标签分类结果；

基于预标注结果和标签分类结果确定待标注图像的标注信息。

当然，本领域技术人员可以理解，处理器还可以实现本发明任意实施例所提供的图像标注方法的技术方案。

实施例六

本发明实施例六还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明任意实施例所提供的图像标注方法步骤，该方法包括：

获取待标注图像；

本发明实施例的计算机存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明实施例操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种图像标注方法，其特征在于，包括：

获取待标注图像；

2.根据权利要求1所述的方法，其特征在于，还包括：

3.根据权利要求2所述的方法，其特征在于，所述获取各样本预标注结果，包括：

4.根据权利要求3所述的方法，其特征在于，所述基于所述预先训练出的预标注模型输出的各待标注图像的预标注结果，确定各样本预标注结果，包括：

5.根据权利要求1所述的方法，其特征在于，在所述生成所述预标注结果对应的标签分类结果之后，还包括：

获取所述标签分类结果对应的验证结果；

基于所述预标注结果、所述标签分类结果以及所述标签分类结果的验证结果，确定所述待标注图像对应的标注信息。

6.根据权利要求5所述的方法，其特征在于，还包括：

7.根据权利要求5所述的方法，其特征在于，还包括：

8.一种图像标注装置，其特征在于，包括：

图像获取模块，用于获取待标注图像；

9.一种电子设备，其特征在于，所述电子设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-7中任一所述的图像标注方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任一所述的图像标注方法。