CN112861959B - 一种目标检测图像的自动标注方法 - Google Patents

一种目标检测图像的自动标注方法 Download PDF

Info

Publication number
CN112861959B
CN112861959B CN202110145617.2A CN202110145617A CN112861959B CN 112861959 B CN112861959 B CN 112861959B CN 202110145617 A CN202110145617 A CN 202110145617A CN 112861959 B CN112861959 B CN 112861959B
Authority
CN
China
Prior art keywords
data
model
training
labeled
target detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110145617.2A
Other languages
English (en)
Other versions
CN112861959A (zh
Inventor
雷丽君
刘爽
闵济海
叶增军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Tetra Electronic Technology Co ltd
Original Assignee
Nanjing Tetra Electronic Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Tetra Electronic Technology Co ltd filed Critical Nanjing Tetra Electronic Technology Co ltd
Priority to CN202110145617.2A priority Critical patent/CN112861959B/zh
Publication of CN112861959A publication Critical patent/CN112861959A/zh
Application granted granted Critical
Publication of CN112861959B publication Critical patent/CN112861959B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开一种目标检测图像的自动标注方法,包括以下步骤:获取待标注原始数据集,区分已标注数据集B和待标注数据集,将已标注数据集中的数据分别训练集和测试集;对训练集中的每个数据进行数据增强,利用增强训练集训练目标检测模型,将测试集Te中的图片输入目标检测模型,计算在测试集上的检测平均精度均值,将待标注数据集中的图片输入目标检测模型得到自动预标注结果,并将对其筛选所得正样本集合加入增强训练集。本发明将自学***均精度均值作为预标注数据质量评估反馈指标,替代人工评分机制,大大减少人工参与,提高图像自动标注的自动化水平。

Description

一种目标检测图像的自动标注方法
技术领域
本发明属于图像检测技术,具体涉及一种目标检测图像的自动标注方法。
背景技术
图像的自动标注是利用人工智能或模式识别等计算机方法对数字图像的低层视觉特征进行分析,从而对图像打上特定语义标签的一个过程。传统图像标注方法通过手工标注,尤其是目标检测问题的标注工作量巨大,标注效率低,所以目标检测图像自动标注是目前亟需解决的问题。
现有技术,已有类似自动标注方法,但是这些自动标注方法在实施过程中人需要专业人员进行对大量中间结果进行人工评分、奖励等操作,有的需要全程人工参与标注,甚至对最终的自动标注结果进行人工复核,并没有真正实现图像标注的自动化。简言之,现有的图像自动标注方法其过程仍然充满人员的主观判断性以及不确定性,最终的结果仍不够精确。
发明内容
发明目的:本发明的目的在于解决现有技术中存在的不足,提供一种目标检测图像的自动标注方法。
技术方案:本发明的一种目标检测图像的自动标注方法,包括以下步骤:
步骤S1、获取待标注的目标检测图像生成对应原始数据集,确定原始数据集中的待检测物体的类别和最小正外接矩形锚框;
步骤S2、根据上述物体类别和最小正外接矩形锚框,对步骤S1所得原始数据集中a%的数据进行人工标注形成已标注数据集B,剩余数据则形成待标注数据集W,将已标注数据集B中的数据分为训练集Tr和测试集Te;
步骤S3、对训练集Tr中的每个数据进行数据增强,得到增强训练集Tr_a;增强训练集Tr_a中的每个标注也随之增强;
步骤S4、利用增强训练集Tr_a训练YOLOv4目标检测模型,训练过程中当训练总体损失total_loss趋于稳定时则结束训练,将该训练完成的目标检测模型记为Model_base;total_loss=回归框loss+分类loss+置信度loss;
回归框
Figure GDA0003518271710000011
Figure GDA0003518271710000021
Figure GDA0003518271710000022
其中:IoU为真实框与预测框的交并比;d为真实框与预测框两个中心点的欧式距离;L为同时包含预测框和真实框的最小闭包区域的对角线距离;wgt为真实框的宽;hgt为真实框的高;w为预测框的宽;h为预测框的高;
分类
Figure GDA0003518271710000023
Figure GDA0003518271710000024
其中:K为特征层网格的尺寸;
Figure GDA0003518271710000025
表示第i个网格的第j个锚框是否负责这个object,如果负责那么
Figure GDA0003518271710000026
否则为0;
Figure GDA0003518271710000027
表示第i个网格的第j个锚框为c类物体的概率真实值;
Figure GDA0003518271710000028
表示第i个网格的第j个锚框为c物体的概率预测值;
置信度
Figure GDA0003518271710000029
Figure GDA00035182717100000210
其中:K为特征层网格的尺寸;M为物体类别数;
Figure GDA00035182717100000211
表示第i个网格的第j个锚框是否负责这个object,如果负责那么
Figure GDA00035182717100000212
否则为0;
Figure GDA00035182717100000213
表示第i个网格的第j个锚框是否负责这个object,如果不负责,则
Figure GDA00035182717100000214
若负责,则
Figure GDA00035182717100000215
Figure GDA00035182717100000216
表示参数置信度真实值,如果第i个网格的第j个锚框负责预测某个object,则
Figure GDA00035182717100000217
否则
Figure GDA00035182717100000218
Figure GDA00035182717100000219
表示参数置信度预测值;
步骤S5、
将测试集Te中的图片输入目标检测模型Model_base,计算Model_base在测试集Te上的检测平均精度均值mAP,作为基准平均精度均值,记为mAP_base;IoU阈值取0.5计算mAP的值;
Figure GDA0003518271710000031
Figure GDA0003518271710000032
其中:
Figure GDA0003518271710000033
为Precision-Recall平滑曲线;rc为IoU的阈值为0.5时的c类物体召回率;c为待检测目标物体中的某类;APc为c类物体的平均检测精度;N(classes)为全部待检测目标物体类别数量;
步骤S6、将待标注数据集W中的图片输入目标检测模型Modelbase,得到自动预标注结果;
步骤S7、对步骤S6所得自动预标注结果进行筛选,筛选过程如下:
步骤S7.1、对于步骤S6目标检测模型Model_base中置信度高于b的预标注和图片,均纳入预标注集Y中,预标注集Y中最小单位为(标注,图片),对于置信度低于或等于b的预标注则删除,对于置信度低于或等于b的图片则仍放入待标注数据集W;
步骤S7.2、从预标注集Y中选取某个预标注Yi,对Yi中的图片和标注执行步骤3中的数据增强处理;
步骤S7.3、将Yi经过数据增强后生成的2048个标注Yi_a加入训练集,执行步骤4得到模型Model_Yi;
步骤S7.4、将测试集Te的图片输入Model_Yi,计算Model_Yi在测试集上的检测平均精度均值mAP_Yi;
步骤S7.5、判断mAP_Yi是否不小于mAP_base,若成立,则将Yi_a加入正样本集合Y_P,并将Yi从Y中移除;若不成立,则直接将Yi从Y中移除,回归待标注数据集W;
步骤S7.6、判断集合Y是否为空,若为空,则返回正样本集合Y_P;若为不为空,则重复步骤S7.2至步骤S7.5;
步骤S8、将正样本集合Y_P加入增强训练集Tr_a;
步骤S9、使用步骤S8所得最新的增强训练集Tr_a中的数据在步骤S4中Model_base基础上训练模型,并更新Model_base;
步骤S10、判断待标注数据集W是否为空:
若为空,则返回已标注数据集B=Tr_a+Te和最终的模型Model_base,并结束整个标注过程;
若不为空,则重复步骤S5至步骤S9。
进一步地,所述步骤S2中对原始数据集中a%进行人工标注时,须包含步骤S1中所有待检测物体类别,且各类标签数量相近;训练集Tr和测试集Te中的数据数量为1:1。
进一步地,所述步骤S3中的数据增强处理方法共N种,经过数据增强处理后训练集Tr中1个标注将增强为
Figure GDA0003518271710000041
也就是训练集Tr_a数据量增强为Tr的
Figure GDA0003518271710000042
倍。
进一步地,所述步骤S3中的数据增强处理方法共11种,依次为随机改变亮度、随机改变对比度、随机改变色度、随机改变饱和度、随机改变颜色通道、随机水平翻转、随机裁剪、随机缩放、随机拉伸、随机旋转和随机高斯模糊;根据排列组合原理,经过数据增强后训练集Tr中1个标注将增强为
Figure GDA0003518271710000043
Figure GDA0003518271710000044
即训练集Tr_a数据量增强为Tr的2048倍,以此能将有限的数据产生等价于更多数据的价值。
有益效果:本发明将自学***,并且实现同步完成数据集自动标注和目标检测模型的训练。
附图说明
图1为本发明的整体流程示意图;
图2为本发明中预标注筛选的流程图。
具体实施方式
下面对本发明技术方案进行详细说明,但是本发明的保护范围不局限于所述实施例。
如图1和图2所示,本发明的一种目标检测图像的自动标注方法,包括以下步骤:
步骤S1、获取待标注的目标检测图像生成对应原始数据集,确定原始数据集中的待检测物体的类别和最小正外接矩形锚框;
步骤S2、根据上述物体类别和最小正外接矩形锚框,对步骤S1所得原始数据集中a%的数据进行人工标注形成已标注数据集B,剩余数据则形成待标注数据集W,将已标注数据集B中的数据分为训练集Tr和测试集Te;
步骤S3、对训练集Tr中的每个数据进行数据增强,得到增强训练集Tr_a;增强训练集Tr_a中的每个标注也随之增强;
步骤S4、利用增强训练集Tr_a训练目标检测模型,训练过程中当训练总体损失total_loss趋于稳定时则结束训练,将该训练完成的目标检测模型记为Model_base;total_loss=回归框loss+分类loss+置信度loss;
回归框
Figure GDA0003518271710000051
Figure GDA0003518271710000052
Figure GDA0003518271710000053
其中:IoU为真实框与预测框的交并比;d为真实框与预测框两个中心点的欧式距离;L为同时包含预测框和真实框的最小闭包区域的对角线距离;wgt为真实框的宽;hgt为真实框的高;w为预测框的宽;h为预测框的高;
分类
Figure GDA0003518271710000054
Figure GDA0003518271710000055
其中:K为特征层网格的尺寸;
Figure GDA0003518271710000056
表示第i个网格的第j个锚框是否负责这个object,如果负责那么
Figure GDA0003518271710000057
否则为0;
Figure GDA0003518271710000058
表示第i个网格的第j个锚框为c类物体的概率真实值;
Figure GDA0003518271710000059
表示第i个网格的第j个锚框为c物体的概率预测值;
置信度
Figure GDA00035182717100000510
Figure GDA00035182717100000511
其中:K为特征层网格的尺寸;M为物体类别数;
Figure GDA0003518271710000061
表示第i个网格的第j个锚框是否负责这个object,如果负责那么
Figure GDA0003518271710000062
否则为0;
Figure GDA0003518271710000063
表示第i个网格的第j个锚框是否负责这个object,如果不负责,则
Figure GDA0003518271710000064
若负责,则
Figure GDA0003518271710000065
Figure GDA0003518271710000066
表示参数置信度真实值,如果第i个网格的第j个锚框负责预测某个object,则
Figure GDA0003518271710000067
否则
Figure GDA0003518271710000068
Figure GDA0003518271710000069
表示参数置信度预测值;
步骤S5、将测试集Te中的图片输入目标检测模型Model_base,计算Model_base在测试集Te上的检测平均精度均值mAP,作为基准平均精度均值,记为mAP_base;IoU阈值取0.5计算mAP的值;
Figure GDA00035182717100000610
Figure GDA00035182717100000611
其中:
Figure GDA00035182717100000612
为Precision-Recall平滑曲线;rc为IoU阈值为0.5时的c类物体召回率;c为待检测目标物体中的某类;APc为c类物体的平均检测精度;N(classes)为全部待检测目标物体类别数量;
步骤S6、将待标注数据集W中的图片输入目标检测模型Model_base,得到自动预标注结果;
步骤S7、对步骤S6所得自动预标注结果进行筛选,筛选过程如下:
步骤S7.1、对于步骤S6目标检测模型Model_base中置信度高于b的预标注和图片,均纳入预标注集Y中,预标注集Y中最小单位为(标注,图片),对于置信度低于或等于b的预标注则删除,对于置信度低于或等于b的图片则仍放入待标注数据集W;
步骤S7.2、从预标注集Y中选取某个预标注Yi,对Yi中的图片和标注执行步骤3中的数据增强处理;
步骤S7.3、将Yi经过数据增强后生成的2048个标注Yi_a加入训练集,执行步骤4得到模型Model_Yi;
步骤S7.4、将测试集Te的图片输入Model_Yi,计算Model_Yi在测试集上的检测平均精度均值mAP_Yi;
步骤S7.5、判断mAP_Yi是否不小于mAP_base,若成立,则将Yi_a加入正样本集合Y_P,并将Yi从Y中移除;若不成立,则直接将Yi从Y中移除,回归待标注数据集W;
步骤S7.6、判断集合Y是否为空,若为空,则返回正样本集合Y_P;若不为空,则重复步骤S7.2至步骤S7.5;
步骤S8、将正样本集合Y_P加入增强训练集Tr_a;
步骤S9、使用步骤S8所得最新的增强训练集Tr_a中的数据在步骤S4中Model_base基础上训练模型,并更新Model_base;
步骤S10、判断待标注数据集W是否为空:
若为空,则返回已标注数据集B=Tr_a+Te和最终的模型Model_base,并结束整个标注过程;
若不为空,则重复步骤S5至步骤S9。
实施例1:以配电房仪表检测任务为实施例。
步骤1、采集配电房可见光图像共10000张,作为原始数据集,配电房中需要检测的目标仪表类型包括电流电压表、压板、指示灯、旋钮、SF6压力表共5种,标注时应采用最小正外接矩形框标注目标;
步骤2、根据上述物体类别和最小正外接矩形锚框,对10000张原始数据集中10%的数据,即1000张图片进行人工标注形成已标注数据集B,需要保证这1000张图片中包含全部5种目标物体(电流电压表、压板、指示灯、旋钮、SF6压力表),且每个物体的标注数量相近,剩余9000张图片则形成待标注数据集W,将已标注数据集B中的数据分别训练集Tr和测试集Te各500张;
本实施例中的a取值10,即对10000张原始数据集中10%的数据,使得最后的自动标注效率极大的提高。
步骤3、对训练集Tr中的每个数据进行数据增强,采用随机改变亮度、随机改变对比度、随机改变色度、随机改变饱和度、随机改变颜色通道、随机水平翻转、随机裁剪、随机缩放、随机拉伸、随机旋转和随机高斯模糊11种数据增强处理方法,根据排列组合原理,经过数据增强后训练集Tr中1个标注将增强为
Figure GDA0003518271710000081
得到增强训练集Tr_a;
步骤4、利用增强训练集Tr_a训练YOLOv4目标检测模型,训练过程中当训练总体损失total_loss趋于稳定时则结束训练,将该训练完成的目标检测模型记为Model_base;
步骤5、将测试集Te中的图片输入目标检测模型Model_base,计算Model_base在测试集Te上的检测平均精度均值mAP,作为基准平均精度均值,记为mAP_base;IoU阈值取0.5计算mAP的值。
步骤6、将待标注数据集W中的图片输入目标检测模型Model_base,得到自动预标注结果;
步骤7、对步骤S6所得自动预标注结果进行筛选,筛选过程如下:
步骤7.1、对于步骤S6目标检测模型Model_base中置信度高于0.4的预标注和图片,均纳入预标注集Y中,预标注集Y中最小单位为(标注,图片);
步骤7.2、从预标注集Y中选取某个预标注Yi,对Yi中的图片和标注执行步骤3中的数据增强处理;
步骤7.3、将Yi经过数据增强后生成的2048个标注Yi_a加入训练集,执行步骤4得到模型Model_Yi;
步骤7.4、将测试集Te的图片输入Model_Yi,计算Model_Yi在测试集上的检测平均精度均值mAP_Yi;
步骤7.5、判断mAP_Yi是否不小于mAP_base,若成立,则将Yi_a加入正样本集合Y_P,并将Yi从Y中移除;若不成立,则直接将Yi从Y中移除,回归待标注数据集W;
步骤7.6、判断集合Y是否为空,若为空,则返回正样本集合Y_P;若为不为空,则重复步骤S7.2至步骤S7.5;
步骤8、将正样本集合Y_P加入增强训练集Tr_a;
步骤9、使用步骤8所得最新的增强训练集Tr_a中的数据在步骤S4中Model_base基础上训练模型,并更新Model_base;
步骤10、判断待标注数据集W是否为空:
若为空,则返回已标注数据集B=Tr_a+Te和最终的模型Model_base,并结束整个标注过程;
若不为空,则重复步骤5至步骤9。

Claims (4)

1.一种目标检测图像的自动标注方法,其特征在于:包括以下步骤:
步骤S1、获取待标注的目标检测图像生成对应原始数据集,确定原始数据集中的待检测物体的类别和最小正外接矩形锚框;
步骤S2、根据上述物体类别和最小正外接矩形锚框,对步骤S1所得原始数据集中a%的数据进行人工标注形成已标注数据集B,剩余数据则形成待标注数据集W,将已标注数据集B中的数据分为训练集Tr和测试集Te;
步骤S3、对训练集Tr中的每个数据进行数据增强,得到增强训练集Tr_a;增强训练集Tr_a中的每个标注也随之增强;
步骤S4、利用增强训练集Tr_a训练YOLOv4目标检测模型,训练过程中当训练总体损失total_loss趋于稳定时则结束训练,将该训练完成的目标检测模型记为Model_base;total_loss=回归框loss+分类loss+置信度loss;
回归框loss=
Figure DEST_PATH_IMAGE002
Figure DEST_PATH_IMAGE004
Figure DEST_PATH_IMAGE006
其中:IoU为真实框与预测框的交并比;d为真实框与预测框两个中心点的欧式距离;L为同时包含预测框和真实框的最小闭包区域的对角线距离;
Figure DEST_PATH_IMAGE008
为真实框的宽;
Figure DEST_PATH_IMAGE010
为真实框的高;
Figure DEST_PATH_IMAGE012
为预测框的宽;
Figure DEST_PATH_IMAGE014
为预测框的高;
分类loss=
Figure DEST_PATH_IMAGE016
其中:K为特征层网格的尺寸;
Figure DEST_PATH_IMAGE018
表示第i个网格的第j个锚框是否负责这个object,如果负责那么
Figure DEST_PATH_IMAGE020
,否则为0;
Figure DEST_PATH_IMAGE022
表示第i个网格的第j个锚框为c类物体的概率真实值;
Figure DEST_PATH_IMAGE024
表示第i个网格的第j个锚框为c物体的概率预测值;
置信度loss=
Figure DEST_PATH_IMAGE026
其中:K为特征层网格的尺寸;M为物体类别数;
Figure 962444DEST_PATH_IMAGE018
表示第i个网格的第j个锚框是否负责这个object,如果负责那么
Figure 145164DEST_PATH_IMAGE020
,否则为0;
Figure DEST_PATH_IMAGE028
表示第i个网格的第j个锚框是否负责这个object,如果不负责,则
Figure 393743DEST_PATH_IMAGE028
=1,若负责,则
Figure DEST_PATH_IMAGE030
Figure DEST_PATH_IMAGE032
表示参数置信度真实值,如果第i个网格的第j个锚框负责预测某个object,则
Figure DEST_PATH_IMAGE034
,否则
Figure DEST_PATH_IMAGE036
Figure DEST_PATH_IMAGE038
表示参数置信度预测值;
步骤S5、将测试集Te中的图片输入目标检测模型Model_base,计算Model_base在测试集Te上的检测平均精度均值mAP,作为基准平均精度均值,记为mAP_base;IoU阈值取0.5计算mAP的值;
Figure DEST_PATH_IMAGE040
Figure DEST_PATH_IMAGE042
其中:
Figure DEST_PATH_IMAGE044
为Precision-Recall平滑曲线;
Figure DEST_PATH_IMAGE046
为IoU的阈值为0.5时的c类物体召回率;c为待检测目标物体中的某类;
Figure DEST_PATH_IMAGE048
为c类物体的平均检测精度;
Figure DEST_PATH_IMAGE050
为全部待检测目标物体类别数量;
步骤S6、将待标注数据集W中的图片输入目标检测模型Model_base,得到自动预标注结果;
步骤S7、对步骤S6所得自动预标注结果进行筛选,筛选过程如下:
步骤S7.1、对于步骤S6目标检测模型Model_base中置信度高于b的预标注和图片,均纳入预标注集Y中,预标注集Y中最小单位为(标注,图片),对于置信度低于或等于b的预标注则删除,对于置信度低于或等于b的图片则仍放入待标注数据集W;
步骤S7.2、从预标注集Y中选取某个预标注Yi,对Yi中的图片和标注执行步骤S3中的数据增强处理;
步骤S7.3、将Yi经过数据增强后生成的2048个标注Yi_a加入训练集,执行步骤S4得到模型Model_Yi;
步骤S7.4、将测试集Te的图片输入Model_Yi,计算Model_Yi在测试集上的检测平均精度均值mAP_Yi;
步骤S7.5、判断mAP_Yi是否不小于mAP_base,若成立,则将Yi_a加入正样本集合Y_P,并将Yi从Y中移除;若不成立,则直接将Yi从Y中移除,回归待标注数据集W;
步骤S7.6、判断集合Y是否为空,若为空,则返回正样本集合Y_P;若不为空,则重复步骤S7.2至步骤S7.5;
步骤S8、将正样本集合Y_P加入增强训练集Tr_a;
步骤S9、使用步骤S8所得最新的增强训练集Tr_a中的数据在步骤S4中Model_base基础上训练模型,并更新Model_base;
步骤S10、判断待标注数据集W是否为空:
若为空,则返回已标注数据集B=Tr_a+Te和最终的模型Model_base,并结束整个标注过程;
若不为空,则重复步骤S5至步骤S9。
2.根据权利要求1所述的目标检测图像的自动标注方法,其特征在于:所述步骤S2中对原始数据集中a%进行人工标注时,须包含步骤S1中所有待检测物体类别,且各类标签数量相近;训练集Tr和测试集Te中的数据数量为1:1。
3.根据权利要求1所述的目标检测图像的自动标注方法,其特征在于:所述步骤S3中的数据增强处理方法共N种,经过数据增强处理后训练集Tr中1个标注将增强为
Figure DEST_PATH_IMAGE052
,也就是训练集Tr_a数据量增强为Tr的
Figure 274105DEST_PATH_IMAGE052
倍。
4.根据权利要求3所述的目标检测图像的自动标注方法,其特征在于:所述步骤S3中的数据增强处理方法共11种,为随机改变亮度、随机改变对比度、随机改变色度、随机改变饱和度、随机改变颜色通道、随机水平翻转、随机裁剪、随机缩放、随机拉伸、随机旋转和随机高斯模糊;根据排列组合原理,经过数据增强后训练集Tr中1个标注将增强为
Figure DEST_PATH_IMAGE054
,即训练集Tr_a数据量增强为Tr的2048倍。
CN202110145617.2A 2021-02-02 2021-02-02 一种目标检测图像的自动标注方法 Active CN112861959B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110145617.2A CN112861959B (zh) 2021-02-02 2021-02-02 一种目标检测图像的自动标注方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110145617.2A CN112861959B (zh) 2021-02-02 2021-02-02 一种目标检测图像的自动标注方法

Publications (2)

Publication Number Publication Date
CN112861959A CN112861959A (zh) 2021-05-28
CN112861959B true CN112861959B (zh) 2022-04-08

Family

ID=75986359

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110145617.2A Active CN112861959B (zh) 2021-02-02 2021-02-02 一种目标检测图像的自动标注方法

Country Status (1)

Country Link
CN (1) CN112861959B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113095444B (zh) * 2021-06-07 2021-09-17 北京智芯微电子科技有限公司 图像标注方法、装置及存储介质
CN113362330B (zh) * 2021-08-11 2021-11-30 昆山高新轨道交通智能装备有限公司 受电弓羊角实时检测方法、装置、计算机设备及存储介质
CN113807424B (zh) * 2021-09-10 2024-04-16 华侨大学 一种基于离线数据增强的固废数据集生成方法
CN113869211B (zh) * 2021-09-28 2024-07-02 杭州福柜科技有限公司 图像自动标注和标注质量自动评价方法及***
CN117372813A (zh) * 2023-10-30 2024-01-09 上海鼎格信息科技有限公司 一种基于预标注的目标检测方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324937B (zh) * 2012-03-21 2016-08-03 日电(中国)有限公司 标注目标的方法和装置
CN110866476B (zh) * 2019-11-06 2023-09-01 南京信息职业技术学院 一种基于自动标注和迁移学习的密集堆垛目标检测方法
CN110837870B (zh) * 2019-11-12 2023-05-12 东南大学 基于主动学习的声呐图像目标识别方法
CN110889463A (zh) * 2019-12-10 2020-03-17 北京奇艺世纪科技有限公司 一种样本标注方法、装置、服务器及机器可读存储介质
CN111191732B (zh) * 2020-01-03 2021-05-14 天津大学 一种基于全自动学习的目标检测方法
US10902290B1 (en) * 2020-08-04 2021-01-26 Superb Ai Co., Ltd. Methods for training auto labeling device and performing auto labeling related to object detection while performing automatic verification by using uncertainty scores and devices using the same

Also Published As

Publication number Publication date
CN112861959A (zh) 2021-05-28

Similar Documents

Publication Publication Date Title
CN112861959B (zh) 一种目标检测图像的自动标注方法
CN103518224B (zh) 用于分析微生物生长的方法
JP7217589B2 (ja) 画像解析方法、画像解析装置、プログラム、学習済み深層学習アルゴリズムの製造方法および学習済み深層学習アルゴリズム
CN101498592B (zh) 指针式仪表的读数方法及装置
CN109948522B (zh) 一种基于深度神经网络的x光片手骨成熟度判读方法
CN108830332A (zh) 一种视觉车辆检测方法及***
CN107004123A (zh) 迭代式缺陷滤除工艺
CN108074243A (zh) 一种细胞定位方法以及细胞分割方法
CN110853005A (zh) 一种免疫组化膜染色切片诊断方法及装置
CN111339902B (zh) 一种数显仪表的液晶屏示数识别方法及装置
CN103745454B (zh) 一种基于排序学习的图像处理算法或***的评价方法
CN112651989B (zh) 基于Mask RCNN实例分割的SEM图像分子筛粒径统计方法和***
CN110175519B (zh) 一种变电站的分合标识仪表识别方法、装置与存储介质
CN111312023B (zh) 一种中学物理电路实验电路图自动绘制的装置及方法
CN113836850A (zh) 模型获得方法及***及装置及介质及产品缺陷检测方法
CN114581432A (zh) 一种基于深度学习的舌象仪舌象分割方法
CN113298780A (zh) 一种基于深度学习的儿童骨龄评估方法及***
CN113222913A (zh) 一种电路板缺陷检测定位方法、装置和存储介质
CN110648323A (zh) 一种缺陷检测分类***及其方法
CN111626358A (zh) 一种基于bim图片识别的隧道围岩分级方法
CN112102250A (zh) 训练数据为缺失标注的病理图像检测模型建立、检测方法
CN110595401A (zh) 一种使用X-ray射线检测电池四角的检测方法
CN110188662A (zh) 一种水表数字的ai智能识别方法
CN109376619B (zh) 一种细胞检测方法
CN115953836A (zh) 线下课堂学生课堂行为智能识别和认知状态关联方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: An automatic annotation method for object detection images

Granted publication date: 20220408

Pledgee: Bank of Hangzhou Limited by Share Ltd. Nanjing branch

Pledgor: NANJING TETRA ELECTRONIC TECHNOLOGY CO.,LTD.

Registration number: Y2024980027381