CN114820679A - 图像标注方法、装置、电子设备和存储介质 - Google Patents
图像标注方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN114820679A CN114820679A CN202210768430.2A CN202210768430A CN114820679A CN 114820679 A CN114820679 A CN 114820679A CN 202210768430 A CN202210768430 A CN 202210768430A CN 114820679 A CN114820679 A CN 114820679A
- Authority
- CN
- China
- Prior art keywords
- image
- slice image
- area
- region
- labeling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 100
- 238000003860 storage Methods 0.000 title claims abstract description 14
- 238000002372 labelling Methods 0.000 claims abstract description 226
- 238000012545 processing Methods 0.000 claims description 56
- 239000000126 substance Substances 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 41
- 230000000694 effects Effects 0.000 description 10
- 238000012549 training Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 6
- 238000003062 neural network model Methods 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 238000007639 printing Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000007499 fusion processing Methods 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000012407 engineering method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30204—Marker
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本公开提出一种图像标注方法、装置、电子设备和存储介质,该方法包括:根据待标注图像,获取对象的切片图像,根据切片图像,获取待标注图像中对象的参考标注区域,根据切片图像,确定参考标注区域的区域调整信息,根据区域调整信息调整参考标注区域,得到目标标注区域,其中,目标标注区域用于标注待标注图像,由此,能够有效提升图像标注过程的自动化程度,降低图像标注的时间成本,从而有效提升图像标注效率。
Description
技术领域
本公开涉及自动驾驶技术领域,具体涉及一种图像标注方法、装置、电子设备和存储介质。
背景技术
随着人工智能技术和汽车制造业的发展,以及人们对未来生活智能化的美好向往,基于人工智能技术的自动驾驶方法已经成为学术界和工业界的研究热点。在目前的大数据时代,各项智能化技术的发展都离不开数据的大量数据的支撑,而自动驾驶技术正处于发展初期,其对于海量数据的需求往往更大。
相关技术中,在进行各项道路场景中图像数据的标记任务时,对人工标注的依赖程度较高,导致标注效率较低且成本较高,不适用于大数据量的图像标记任务。
发明内容
本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本公开的目的在于提出一种图像标注方法、装置、电子设备和存储介质,能够有效提升图像标注过程的自动化程度,降低图像标注的时间成本,从而有效提升图像标注效率。
本公开第一方面实施例提出的图像标注方法,包括:根据待标注图像,获取对象的切片图像;根据所述切片图像,获取所述待标注图像中对象的参考标注区域;根据所述切片图像,确定所述参考标注区域的区域调整信息;根据所述区域调整信息调整所述参考标注区域,得到目标标注区域,其中,所述目标标注区域用于标注所述待标注图像。
本公开第一方面实施例提出的图像标注方法,通过根据待标注图像,获取对象的切片图像,根据切片图像,获取待标注图像中对象的参考标注区域,根据切片图像,确定参考标注区域的区域调整信息,根据区域调整信息调整参考标注区域,得到目标标注区域,其中,目标标注区域用于标注待标注图像,由此,能够有效提升图像标注过程的自动化程度,降低图像标注的时间成本,从而有效提升图像标注效率。
本公开第二方面实施例提出的图像标注装置,包括:第一获取模块,用于根据待标注图像,获取对象的切片图像;第二获取模块,用于根据所述切片图像,获取所述待标注图像中对象的参考标注区域;确定模块,用于根据所述切片图像,确定所述参考标注区域的区域调整信息;第一处理模块,用于根据所述区域调整信息调整所述参考标注区域,得到目标标注区域,其中,所述目标标注区域用于标注所述待标注图像。
本公开第二方面实施例提出的图像标注装置,通过根据待标注图像,获取对象的切片图像,根据切片图像,获取待标注图像中对象的参考标注区域,根据切片图像,确定参考标注区域的区域调整信息,根据区域调整信息调整参考标注区域,得到目标标注区域,其中,目标标注区域用于标注待标注图像,由此,能够有效提升图像标注过程的自动化程度,降低图像标注的时间成本,从而有效提升图像标注效率。
本公开第三方面实施例提出的电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本公开第一方面实施例提出的图像标注方法。
本公开第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开第一方面实施例提出的图像标注方法。
本公开第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行如本公开第一方面实施例提出的图像标注方法。
本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
本公开上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本公开一实施例提出的图像标注方法的流程示意图;
图2是本公开另一实施例提出的图像标注方法的流程示意图;
图3是本公开实施例提出的一应用场景示意图;
图4是本公开另一实施例提出的图像标注方法的流程示意图;
图5是本公开另一实施例提出的图像标注方法的流程示意图;
图6是本公开实施例提出的一图像标注流程示意图;
图7是本公开一实施例提出的图像标注装置的结构示意图;
图8是本公开另一实施例提出的图像标注装置的结构示意图;
图9示出了适于用来实现本公开实施方式的示例性电子设备的框图。
具体实施方式
下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本公开,而不能理解为对本公开的限制。相反,本公开的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
图1是本公开一实施例提出的图像标注方法的流程示意图。
其中,需要说明的是,本实施例的图像标注方法的执行主体为图像标注装置,该装置可以由软件和/或硬件的方式实现,该装置可以配置在电子设备中,电子设备可以包括但不限于终端、服务器端等,如终端可为手机、掌上电脑、车载控制器等。
如图1所示,该图像标注方法,包括:
S101:根据待标注图像,获取对象的切片图像。
其中,待标注图像,是指待进行标记处理的图像,该待标记图像的数量可以是一个或多个,对此不做限制。
本公开实施例中,可以预先在本公开实施例的执行主体中配置图像获取装置,以获取待标注图像,例如在智能汽车中配置摄像装置,以获取该智能汽车所在场景中的交通图像,并将该交通图像作为待标记图像,或者,还可以是可以针对图像标注装置预先配置数据接口,经由该数据接口接收图像标注请求,而后从图像标注请求中解析得到待标注图像,对此不做限制。
其中,对象,可以是指待标记图像中待进行标记处理的物体,如人物、汽车、自行车、交通灯等,对此不做限制。该对象的数量可以是一个或多个。
其中,切片图像,是指待标注图像经过切片处理,所得到的图像,例如,可以是待标注图像中的人物图像、汽车图像、交通灯图像等。该切片图像的数量可以对应于上述对象的数量。
一些实施例中,在根据待标注图像,获取对象的切片图像时,可以是二值化处理待标注图像以得到二值化图像,并创建圆形打印区域,将二值化图像引入圆形打印区域,并以圆形打印区域的圆心为旋转中心,以圆形打印区域的半径线为遍历线,对二值化图像进行遍历,以得到遍历数组,而后对遍历数组的各行数据逐行进行数据对比,输出对比后的二值化数值,根据二值化数值得到转换后的切片图像。
另一些实施例中,在根据待标注图像,获取对象的切片图像时,还可以是对待标注图像进行纹理特征增强处理,而后基于增强处理后的纹理特征对待标注图像中的对象进行切片处理,以得到对象的切片图像。
或者,一些实施例中,还可以采用其他任意可能的方法,根据待标注图像,获取对象的切片图像,如工程学或机器学习模型等,对此不做限制。
可以理解的是,待标注图像中可能包括多个对象以及其他因素的图像数据,本公开实施例通过根据待标注图像,获取对象的切片图像,可以实现针对各个对象的独立分割,从而为后续图像标注过程提供可靠的分析对象,同时有效降低其他因素对图像标注过程的干扰,从而有效提升图像标注效果。
S102:根据切片图像,获取待标注图像中对象的参考标注区域。
其中,标注区域,是指各个对象对应被用于标注处理待标注图像的区域。而参考标注区域,是指基于切片图像所获取的待标注图像中对象的参考标注区域。该参考标注区域的数量可以是一个或多个。
一些实施例中,在根据切片图像,获取待标注图像中对象的参考标注区域时,可以是对切片图像中的图像进行识别处理,并根据识别处理结果确定对象的形状信息,而后基于该形状信息获取待标注图像中对象的参考标注区域。
另一些实施例中,在根据切片图像,获取待标注图像中对象的参考标注区域时,还可以是将切片图像输入至预训练的机器学习模型中,以得到待标注图像中对象的参考标注区域,并传输至本公开实施例的执行主体。
或者,还可以采用其他任意可能的方法,根据切片图像,获取待标注图像中对象的参考标注区域,对此不做限制。
举例而言,本公开实施例中可以使用神经网络模型构建潜在对象全自动初筛模块,以处理待标注图像,得到参考标注区域,如卷积神经网络。该神经网络模型可以由卷积神经网络作为主干网络,并连接多级特征融合输出模块,各个多级特征融合模块可以并列连接两个全连接层和一个全卷积网络,以分别完成分类、定位、识别的功能;该神经网络模型可以进行自监督的预训练,训练至收敛,而后获取该模型参数作为模块训练的初始值。
该潜在对象全自动初筛模块在进行预训练时,可以获取来自于公开的道路场景数据集和/或自于内部标注的道路场景数据集(所涵盖的标注对象包含:行人、各种车辆、车道线、交通灯、道路标识牌等)作为训练数据。
本公开实施例中,通过根据切片图像,获取待标注图像中对象的参考标注区域,可以实现对待标注图像中标注区域的初步确定,所得参考标注区域可以为后续确定目标标注区域提供可靠的参考依据。
S103:根据切片图像,确定参考标注区域的区域调整信息。
其中,区域调整信息,是指参考标注区域对应调整过程的相关信息,可以被用于指示后续参考标注区域的调整过程。
一些公开实施例中,在根据切片图像,确定参考标注区域的区域调整信息时,可以是获取预先获取多个参考区域调整信息,而后将多个参考区域调整信息与切片图像进行匹配处理,并根据匹配处理结果从多个参考区域调整信息中确定适用于参考标注区域的区域调整信息。
另一些实施例中,在根据切片图像,确定参考标注区域的区域调整信息时,还可以预先建立本公开实施例的执行主体与大数据服务器的通信链接,而后根据切片图像,从大数据服务器处获取参考标注区域的区域调整信息。
当然,还可以采用其他任意可能的方法,根据切片图像,确定参考标注区域的区域调整信息,对此不做限制。
可以理解的是,上述所得参考标注区域的图像标注效果可能存在误差,当根据切片图像,确定参考标注区域的区域调整信息,可以为后续参考标注区域的调整过程提供可靠的参考依据,从而有效提升所得目标标注区域的图像标注效果。
S104:根据区域调整信息调整参考标注区域,得到目标标注区域,其中,目标标注区域用于标注待标注图像。
其中,目标标注区域,是指被用于标注待标注图像的标注区域。
本公开实施例中,在根据区域调整信息调整参考标注区域,得到目标标注区域时,可以是基于区域调整信息确定调整对象以及调整对象相应的调整值,而后基于调整值对相应调整对象进行调整,以得到目标标注区域,或者,还可以将区域调整信息输入至预训练的图像调整模型中,以得到目标调整区域,并传输至本公开实施例的执行主体,对此不做限制。
本实施例中,通过根据待标注图像,获取对象的切片图像,根据切片图像,获取待标注图像中对象的参考标注区域,根据切片图像,确定参考标注区域的区域调整信息,根据区域调整信息调整参考标注区域,得到目标标注区域,其中,目标标注区域用于标注待标注图像,由此,能够有效提升图像标注过程的自动化程度,降低图像标注的时间成本,从而有效提升图像标注效率。
图2是本公开另一实施例提出的图像标注方法的流程示意图。
如图2所示,该图像标注方法,包括:
S201:确定待标注图像中对象的局部图像区域。
其中,局部图像区域,可以是指标注图像中对象相应的图像区域。
本公开实施例提出的图像标注方法可以应用在自动驾驶技术领域中,以实现对各项道路场景数据的标注过程,当然可以扩展应用至其它技术领域。
举例而言,如图3所示,图3是本公开实施例提出的一应用场景示意图,用户可以依次点击左侧交通场景图中的人、汽车、汽车,以获取目标物体对应的像素级标注,而后本公开实施例中的图像标注方法可以辅助输出目标物体的精细化标注,以节省人工标注时间,提升标注效率。
S202:对待标注图像中局部图像区域的区域边界进行至少一次扩展处理,得到每次所扩展区域边界框选的切片图像区域。
其中,切片图像区域,是指局部图像区域经由扩展处理所得到的图像区域。
举例而言,本公开实施例在对待标注图像中局部图像区域的区域边界进行扩展处理时,可以确定局部图像区域的中心和尺寸信息,而后基于该局部图像区域的中心,扩展所得尺寸信息的100%,以得到切片区域图像。
可以理解的是,局部图像区域对上述对象相关信息的表征效果可能会存在缺陷,当对待标注图像中局部图像区域的区域边界进行至少一次扩展处理,可以有效提升所得切片图像区域对相应对象的表征完整性,从而为后续生成切片图像提供可靠的参考依据。
S203:根据切片图像区域,生成切片图像。
本公开实施中,在据切片图像区域,生成切片图像时,可以是基于切片图像区域对待标注图像进行裁剪处理,以得到该切片图像区域对应的切片图像。
也即是说,本公开实施例中,可以确定待标注图像中对象的局部图像区域,对待标注图像中局部图像区域的区域边界进行至少一次扩展处理,得到每次所扩展区域边界框选的切片图像区域,而后根据切片图像区域,生成切片图像,由此,可以实现对局部图像区域的灵活扩充处理,保证所得切片区域图像对相应对应的表征完整性,从而有效提升切片图像的生成效果。
S204:获取待标注图像中对象的初始标注区域。
本公开实施例中,可以使用计算机技术对待标注图像中可能成为标注对象的物体进行初步筛选,以得到多个参考标注对象,而参考标注图像对应的图像区域,即可以称为初始标注区域。
由此,可以实现对待标注图像中标注区域的初步筛选,从而为后续确定参考标注区域提供可靠的分析对象,且有效提升参考标注区域的确定效率。
S205:根据切片图像处理初始标注区域,得到参考标注区域。
一些实施例中,在根据切片图像处理初始标注区域,得到参考标注区域时,可以是对初始标注区域中的对象进行轮廓增强处理,而后基于切片图像处理轮廓增强处理后的初始标注区域,以得到参考标注区域。
另一些实施例中,在根据切片图像处理初始标注区域,得到参考标注区域时,还可以是获取初始标注图像中对象的属性信息,而后基于初始标注图像中对象的属性信息和切片图像处理初始标注区域,以得到参考标注区域。
当然,一些实施例中,还可以采用其他任意可能的方法,根据切片图像处理初始标注区域,得到参考标注区域,如工程学或数学的方法,对此不做限制。
也即是说,本公开实施例在根据切片图像区域,生成切片图像之后,可以获取待标注图像中对象的初始标注区域,而后根据切片图像处理初始标注区域,得到参考标注区域,由此,可以实现对待标记图像中标注区域的处于筛选,以得到初始标注图像,而后结合切片图像处理初始标注区域,可以在有效提升参考标注区域确定效率的同时,结合切片图像保证所得参考标注区域的可靠性。
S206:确定切片图像的切片图像特征。
其中,切片图像特征,是指切片图像中的相关特征,例如可以是对象的位置特征、轮廓特征、尺寸特征等,对此不做限制。
本公开实施例中,当确定切片图像的切片图像特征时,所得切片图像特征可以有效表征切片图像对应的特征信息,从而为后续确定参考标注区域的区域调整信息提供可靠的参考依据。
S207:根据切片图像和切片图像特征,确定参考标注区域的区域调整信息。
一些实施例中,在根据切片图像和切片图像特征,确定参考标注区域的区域调整信息时,可以是获取切片图像中对象的尺寸信息,而后结合该尺寸信息和切片图像确定参考标注区域的区域调整信息。
另一些实施例中,在根据切片图像和切片图像特征,确定参考标注区域的区域调整信息时,还可以是获取切片图像中对象的色度特征,而后结合该色度特征和切片图像确定参考标注区域的区域调整信息。
当然,一些实施例中,还可以采用其他任意可能的方法,根据切片图像和切片图像特征,确定参考标注区域的区域调整信息,如工程学或数形结合的方法,对此不做限制。
也即是说,本公开实施例在根据切片图像处理初始标注区域,得到参考标注区域之后,可以确定切片图像的切片图像特征,并根据切片图像和切片图像特征,确定参考标注区域的区域调整信息,由于切片图像特征与参考标注区域的调整过程具有较高的关联性,当结合切片图像和切片图像特征,确定参考标注区域的区域调整信息时,可以有效提升所得区域调整信息与参考标注区域之间的契合性,从而有效提升区域调整信息的调整效果。
S208:根据区域调整信息调整参考标注区域,得到目标标注区域,其中,目标标注区域用于标注待标注图像。
S208的描述说明可以具体参见上述实施例,在此不再赘述。
S209:获取待标注图像中对象的分类信息。
其中,分类信息,可以是指对标注图像中的多个对象进行分类处理所得到的相关信息。
举例而言,本公开实施例可以在交通场景中,将对应待标注图像中的多个对象按照行人、汽车、交通指示牌和其它障碍物等进行种类划分,以得到对应的分类信息。
本公开实施例中,通过获取待标注图像中对象的分类信息,可以为后续图像标注过程提供可靠的参考依据。
S210:根据目标标注区域和分类信息对待标注图像进行标注,得到目标标注图像。
本公开实施例在根据目标标注区域和分类信息对待标注图像进行标注时,可以是基于分类信息对各个目标标注区域进行标注,以完成对待标注图像的标注处理。
举例而言,潜在对象全自动初筛模块在使用时,可以输入RGB三通道的待标记图像,而后输出当前图像中潜在的对象,输出信息包括:对象的分类信息、位置特征、初始标注区域,并将其输出记做L1。由于L1输出了对象的分类信息,后续过程中只需要人工核对其正确性;若L1未能有效识别目标,则需要后续人工添加对象的分类信息。由此,辅助输出对象的分类信息,降低人工分类成本。
也即是说,本公开实施例在据区域调整信息调整参考标注区域,得到目标标注区域之后,可以获取待标注图像中对象的分类信息,而后根据目标标注区域和分类信息对待标注图像进行标注,得到目标标注图像,由此,可以在图像标注过程中有效结合待标注图像中对象的分类信息和目标标注区域两个维度的相关信息,从而在保证图像标注范围准确性的同时,有效提升图像标注成果的可靠性。
本实施例中,通过确定待标注图像中对象的局部图像区域,对待标注图像中局部图像区域的区域边界进行至少一次扩展处理,得到每次所扩展区域边界框选的切片图像区域,而后根据切片图像区域,生成切片图像,由此,可以实现对局部图像区域的灵活扩充处理,保证所得切片区域图像对相应对应的表征完整性,从而有效提升切片图像的生成效果,通过获取待标注图像中对象的初始标注区域,而后根据切片图像处理初始标注区域,得到参考标注区域,由此,可以实现对待标记图像中标注区域的处于筛选,以得到初始标注图像,而后结合切片图像处理初始标注区域,可以在有效提升参考标注区域确定效率的同时,结合切片图像保证所得参考标注区域的可靠性,通过确定切片图像的切片图像特征,并根据切片图像和切片图像特征,确定参考标注区域的区域调整信息,由于切片图像特征与参考标注区域的调整过程具有较高的关联性,当结合切片图像和切片图像特征,确定参考标注区域的区域调整信息时,可以有效提升所得区域调整信息与参考标注区域之间的契合性,从而有效提升区域调整信息的调整效果,通过获取待标注图像中对象的分类信息,而后根据目标标注区域和分类信息对待标注图像进行标注,得到目标标注图像,由此,可以在图像标注过程中有效结合待标注图像中对象的分类信息和目标标注区域两个维度的相关信息,从而在保证图像标注范围准确性的同时,有效提升图像标注成果的可靠性。
图4是本公开另一实施例提出的图像标注方法的流程示意图。
如图4所示,该图像标注方法,包括:
S401:根据待标注图像,获取对象的切片图像。
S402:根据切片图像,获取待标注图像中对象的参考标注区域。
S403:确定切片图像的切片图像特征。
S401-S403的描述说明可以具体参见上述实施例,在此不再赘述。
S404:从切片图像中获取对象的轮廓点。
可以理解的是,切片图像可以由多个像素点组成,而切片图像中对象轮廓相应的像素点即可以称为该对象的轮廓点。
本公开实施例中,通过从切片图像中获取对象的轮廓点,可以实现对切片图像中对象与其他图像因素边界线的初步确定。
S405:确定轮廓点在切片图像中的位置特征。
其中,位置特征,可以是指描述上述轮廓点在切片图像中空间位置属性的相关信息,例如可以是轮廓点距离切片图像四周边界的距离。
本公开实施例在确定轮廓点在切片图像中的位置特征时,可以是确定多个轮廓点与切片图像四周边界的距离最小值,而后基于所得距离最小值确定轮廓点在切片图像中的位置特征。
S406:从切片图像特征中,获取与轮廓点对应的轮廓点特征。
其中,轮廓点特征,可以是指轮廓点对应的特征信息,例如轮廓点的数量特征,分布特征等。
可以理解的是,轮廓点特征与参考标注区域的调整过程具有较高的关联性,当从切片图像特征中,获取与轮廓点对应的轮廓点特征,可以为后续确定参考标注区域的区域调整信息提供可靠的参考依据。
S407:根据位置特征、轮廓点特征,以及切片图像确定参考标注区域的区域调整信息。
一些实施例中,在根据位置特征、轮廓点特征,以及切片图像确定参考标注区域的区域调整信息时,可以是预先确定参考切片图像,并确定该参考切片图像对应的参考位置特征和参考轮廓点特征,而后将位置特征和轮廓点特征分别与参考位置特征和参考轮廓点特征进行分析对比,而后根据分析对比结果确定参考标注区域的区域调整信息。
另一些实施例中,在根据位置特征、轮廓点特征,以及切片图像确定参考标注区域的区域调整信息时,还可以是根据位置特征、轮廓点特征确定切片图像对应的扩大处理或缩小处理信息,而后将所得扩大处理或缩小处理信息作为参考标注区域的区域调整信息。
当然,一些实施例中,还可以采用其他任意可能的方法,根据位置特征、轮廓点特征,以及切片图像确定参考标注区域的区域调整信息,对此不做限制。
可选的,一些实施例中,在根据位置特征、轮廓点特征,以及切片图像确定参考标注区域的区域调整信息时,可以是根据轮廓点特征和切片图像,确定与位置特征对应的位置调整方向和位置调整值,将位置调整方向和位置调整值作为区域调整信息,由此,当基于位置调整方向和位置调整值作为区域调整信息时,可以准确量化该区域调整信息对应的调整方向和调整数值,从而有效提升该区域调整信息对调整内容的表征清晰性,以便于实现对参考标注区域的准确调整。
其中,位置调整方向,可以是指参考标注区域在进行位置调整时对应的调整方向。
其中,位置调整值,是指参考标注区域在进行位置调整时对应的调整数值。
本公开实施例中,在根据轮廓点特征和切片图像,确定与位置特征对应的位置调整方向和位置调整值时,可以是根据轮廓点特征确定相应对象在切片图像中的重心,而后依据该重心的位置信息确定与位置特征对应的位置调整方向和位置调整值,或者,还可以根据轮廓点特征确定轮廓点与切片图像边界之间的距离最小值,而后根据该距离最小值确定与位置特征对应的位置调整方向和位置调整值,对此不做限制。
可选的,一些实施例中,在根据轮廓点特征和切片图像,确定与位置特征对应的位置调整方向和位置调整值时,可以是将轮廓点特征和切片图像输入至第一调整信息确定模型中,以得到第一调整信息确定模型输出的位置调整方向和位置调整值,由此,可以基于第一调整信息确定模型快速、准确地确定位置调整方向和位置调整值,能够有效提升该位置调整方向和位置调整值确定过程的自动化程度。
其中,调整信息确定模型,可以例如为神经网络模型、机器学习模型,或者,也可以采用其它任意可能的能够执行调整信息确定任务的模型,对此不做限制。而第一调整信息确定模型,是指被用于处理轮廓点特征和切片图像,以确定位置调整方向和位置调整值的调整信息确定模型。
举例而言,本公开实施例可以基于神经网络模型构建所选对象全自动精调模块,该模块的结构可以为卷积神经网络,输入数据可以为切片图像对应的特征图以及参考标注区域,以输出目标标注区域。
该模块可以由多层神经网络构成,其使用过程可以是:提取切片图像中对象的多个轮廓点;在对应特征图中相同位置获取多个轮廓点对应的轮廓点特征和位置特征,并标记多个轮廓点的特征值为f;遍历多个轮廓点,将各个轮廓点对应的特征值输入至多层神经网络中,由多层神经网络对该轮廓点与对象的相对位置进行判断,而后输出对应的位置调整方向,即朝对象内部进行内缩或者朝对象外部进行外扩;重复执行上述步骤,直至特征点输入至多层神经网络后,多层神经网络确定对应轮廓点处于对象边缘,以停止精调过程,或者,还可以在多层神经网络输出的轮廓点位置与上轮输出轮廓点位置的方向相反时,停止精调过程。在精调完成后,可以基于精调后的对象轮廓对参考标注区域进行调整,以获取精细调整后的像素级标注区域。
也即是说,本公开实施例在确定切片图像的切片图像特征之后,可以从切片图像中获取对象的轮廓点,确定轮廓点在切片图像中的位置特征,从切片图像特征中,获取与轮廓点对应的轮廓点特征,根据位置特征、轮廓点特征,以及切片图像确定参考标注区域的区域调整信息,由此,可以有效结合位置特征、轮廓点特征以及切片图像多个维度的特征信息实现对区域调整信息的综合考量,从而有效提升所得区域调整信息与参考标注区域之间的适配性,提升区域调整信息对参考标注区域的调整效果。
S408:根据区域调整信息调整参考标注区域,得到目标标注区域,其中,目标标注区域用于标注待标注图像。
S408的描述说明可以具体参见上述实施例,在此不再赘述。
本实施例中,通过从切片图像中获取对象的轮廓点,确定轮廓点在切片图像中的位置特征,从切片图像特征中,获取与轮廓点对应的轮廓点特征,根据位置特征、轮廓点特征,以及切片图像确定参考标注区域的区域调整信息,由此,可以有效结合位置特征、轮廓点特征以及切片图像多个维度的特征信息实现对区域调整信息的综合考量,从而有效提升所得区域调整信息与参考标注区域之间的适配性,提升区域调整信息对参考标注区域的调整效果,通过根据轮廓点特征和切片图像,确定与位置特征对应的位置调整方向和位置调整值,将位置调整方向和位置调整值作为区域调整信息,由此,当基于位置调整方向和位置调整值作为区域调整信息时,可以准确量化该区域调整信息对应的调整方向和调整数值,从而有效提升该区域调整信息对调整内容的表征清晰性,以便于实现对参考标注区域的准确调整,通过将轮廓点特征和切片图像输入至第一调整信息确定模型中,以得到第一调整信息确定模型输出的位置调整方向和位置调整值,由此,可以基于第一调整信息确定模型快速、准确地确定位置调整方向和位置调整值,能够有效提升该位置调整方向和位置调整值确定过程的自动化程度。
图5是本公开另一实施例提出的图像标注方法的流程示意图。
如图5所示,该图像标注方法,包括:
S501:根据待标注图像,获取对象的切片图像。
S502:获取待标注图像中对象的初始标注区域。
S501和S502的描述说明可以具体参见上述实施例,在此不再赘述。
S503:获取正向点击数据和负向点击数据,其中,正向点击数据是点击位置位于待标注图像中对象内的点击数据,负向点击数据是点击位置位于待标注图像中对象外的点击数据。
其中,点击数据,可以是指由用户点击待标注图像所产生的数据。
其中,正向点击数据,可以是指用户点击对象所在图像区域内未被初始标注区域覆盖的区域所产生的点击数据。
其中,负向点击数据,则可以是指用户点击对象所在图像区域外且被初始标注区域覆盖的区域所产生的点击数据。
本公开实施例中,通过获取正向点击数据和负向点击数据,可以在图像标注过程中有效结合人工标注成果完成对初始标注区域的粗略调整,为后续确定参考标注区域提供可靠的参考数据。
S504:根据切片图像、正向点击数据,以及负向点击数据处理初始标注区域,得到参考标注区域。
一些实施例中,在根据切片图像、正向点击数据,以及负向点击数据处理初始标注区域,得到参考标注区域时,可以是基于正向点击数据和负向点击数据对初始标注区域进行特征增强处理,以得到初始标注区域中对象相应的轮廓边界,而后结合该轮廓边界和切片图像确定参考标注区域。
另一些实施例中,在根据切片图像、正向点击数据,以及负向点击数据处理初始标注区域,得到参考标注区域时,还可以是确定向点击数据与负向点击数据之间的距离信息,而后结合该距离信息和切片图像确定参考标注区域。
或者,还可以采用其他任意可能的方法,根据切片图像、正向点击数据,以及负向点击数据处理初始标注区域,得到参考标注区域,对此不做限制。
可选的,一些实施例中,在根据切片图像、正向点击数据,以及负向点击数据处理初始标注区域,得到参考标注区域时,可以是根据切片图像、正向点击数据,以及负向点击数据生成与初始标注区域对应的参考调整信息,而后根据参考调整信息调整初始标注区域,得到参考标注区域,由此,可以有效结合切片图像、正向点击数据以及负向点击数据准确确定初始标注区域对应的参考调整信息,从而为初始标注区域对应的调整过程提供可靠的执行依据,保证所得参考标注区域与对象之间的适配性。
其中,参考调整信息,可以是指初始标注区域对应的调整信息,该参考调整信息可以被用于指示初始标注区域对应的调整过程,以得到参考标注区域。
本公开实施例中,在根据切片图像、正向点击数据,以及负向点击数据生成与初始标注区域对应的参考调整信息时,可以是确定正向点击数据和负向点击数据在切片图像中的位置信息,而后根据该位置信息确定初始标注区域对应的参考调整信息,或者,还可以采用第三方调整信息生成装置处理切片图像、正向点击数据,以及负向点击数据,以得到与初始标注区域对应的参考调整信息,并传输至本公开实施例的执行主体,对此不做限制。
可选的,一些实施例中,在根据切片图像、正向点击数据,以及负向点击数据生成与初始标注区域对应的参考调整信息时,可以是将切片图像、正向点击数据,以及负向点击数据输入至第二调整信息确定模型中,以得到第二调整信息确定模型输出的参考调整信息,由此,可以基于第二调整信息确定模型实现对切片图像、正向点击数据以及负向点击数据中相关特征信息的提取和融合处理,能够有效提升所得参考调整信息对于初始标注区域调整过程的指示效果。
其中,第二调整信息确定模型,是指被用于处理切片图像、正向点击数据,以及负向点击数据,以得到参考调整信息的调整信息确定模型。
举例而言,本公开实施例可以使用神经网络模型构建所选对象半自动粗调模块,该模块的结构可以为卷积神经网络,用于处理RGB三通道的切片图像、正向点击数据、负向点击数据以及人工标注的初始标注区域,以输出所选对象相应的初始标注区域。
该模块在进行模型训练时,可以获取公开数据集作为训练数据,正向点击数据和负向点击数据分别表示点击位置在对象内部或外部,而人工标注的初始标注区域为空;在模型的迭代训练过程中,可以将前一次迭代过程所得目标标注区域作为本轮的初始标注区域,迭代次数可以为3次,在各轮迭代过程中可以输入2个正向点击数据和1个负向点击数据;该所选对象半自动粗调模块可以由卷积神经网络、注意力融合模块以及全卷积网络依次连接组成,以确定该所选对象的初始标注区域;上述卷积神经网络可以在公开数据集中进行自监督预训练,以训练至模型收敛,而后获取该模型参数作为模块训练的初始值。
该模块在使用过程中,可以处理切片图像、正向点击数据、负向点击数据以及初始标注区域以得到参考标注区域。
也即是说,本公开实施例在获取待标注图像中对象的初始标注区域之后,可以获取正向点击数据和负向点击数据,其中,正向点击数据是点击位置位于待标注图像中对象内的点击数据,负向点击数据是点击位置位于待标注图像中对象外的点击数据,并根据切片图像、正向点击数据,以及负向点击数据处理初始标注区域,得到参考标注区域,由于正向点击数据和负向点击数据的获取过程较为简单和方便,当根据切片图像、正向点击数据,以及负向点击数据处理初始标注区域以得到参考标注区域时,可以有效结合人工标注成果,实现对参考标注区域的快速确定。
S505:根据切片图像,确定参考标注区域的区域调整信息。
S506:根据区域调整信息调整参考标注区域,得到目标标注区域,其中,目标标注区域用于标注待标注图像。
S505和S506的描述说明可以具体参见上述实施例,在此不再赘述。
举例而言,如图6所示,图6是本公开实施例提出的一图像标注流程示意图,包括:
(a)获取待标注图像;
(b)使用计算机对整张待标注图像中可能成为标注对象的物体进行初步筛选,对所有场景中出现的潜在对象输出一个粗略的像素级标注(即初始标注区域),并输出其所属分类信息,记做L1;
(c)手动选中待标注的对象,若该对象与L1中所得对象重复,则将L1中该对象的像素级标注作为初始标注区域,并将L1中的对象所在局部图像区域外扩100%,得到切片图像区域,并基于所得切片图像区域在待标注图像上进行裁图,将其作为对象的切片图像。若该对象与L1中所得对象不重复,则该对象相应的初始标注区域为空;
(d)将切片图像与人工点击数据输入至计算机***中,经由机器学习模型处理,以得到参考标注区域,例如,可以对比L1中的对象的初始标注区域与对象实际所在区域,并在未检测到的区域点击一次,作为正向点击数据;然后在误检测到的区域中点击一次,作为负向点击数据;
(e)输出一个该对象的粗调结果,该过程可以迭代进行1至2次,输出结果记做L2;
(f)将L2输入计算机***进行对象轮廓的微调,输出结果记做L3,而后由人工对L3再次进行微调,输出目标标注图像L4。
本实施例中,通过获取正向点击数据和负向点击数据,其中,正向点击数据是点击位置位于待标注图像中对象内的点击数据,负向点击数据是点击位置位于待标注图像中对象外的点击数据,并根据切片图像、正向点击数据,以及负向点击数据处理初始标注区域,得到参考标注区域,由于正向点击数据和负向点击数据的获取过程较为简单和方便,当根据切片图像、正向点击数据,以及负向点击数据处理初始标注区域以得到参考标注区域时,可以有效结合人工标注成果,实现对参考标注区域的快速确定,通过根据切片图像、正向点击数据,以及负向点击数据生成与初始标注区域对应的参考调整信息,而后根据参考调整信息调整初始标注区域,得到参考标注区域,由此,可以有效结合切片图像、正向点击数据以及负向点击数据准确确定初始标注区域对应的参考调整信息,从而为初始标注区域对应的调整过程提供可靠的执行依据,保证所得参考标注区域与对象之间的适配性,通过将切片图像、正向点击数据,以及负向点击数据输入至第二调整信息确定模型中,以得到第二调整信息确定模型输出的参考调整信息,由此,可以基于第二调整信息确定模型实现对切片图像、正向点击数据以及负向点击数据中相关特征信息的提取和融合处理,能够有效提升所得参考调整信息对于初始标注区域调整过程的指示效果。
图7是本公开一实施例提出的图像标注装置的结构示意图。
如图7所示,该图像标注装置70,包括:
第一获取模块701,用于根据待标注图像,获取对象的切片图像;
第二获取模块702,用于根据切片图像,获取待标注图像中对象的参考标注区域;
确定模块703,用于根据切片图像,确定参考标注区域的区域调整信息;
第一处理模块704,用于根据区域调整信息调整参考标注区域,得到目标标注区域,其中,目标标注区域用于标注待标注图像。
在本公开的一些实施例中,如图8所示,图8是本公开另一实施例提出的图像标注装置的结构示意图,确定模块703,包括:
第一确定子模块7031,用于确定切片图像的切片图像特征;
第二确定子模块7032,用于根据切片图像和切片图像特征,确定参考标注区域的区域调整信息。
在本公开的一些实施例中,第二确定子模块7032,具体用于:
从切片图像中获取对象的轮廓点;
确定轮廓点在切片图像中的位置特征;
从切片图像特征中,获取与轮廓点对应的轮廓点特征;
根据位置特征、轮廓点特征,以及切片图像确定参考标注区域的区域调整信息。
在本公开的一些实施例中,第二确定子模块7032,还用于:
根据轮廓点特征和切片图像,确定与位置特征对应的位置调整方向和位置调整值;
将位置调整方向和位置调整值作为区域调整信息。
在本公开的一些实施例中,第二确定子模块7032,还用于:
将轮廓点特征和切片图像输入至第一调整信息确定模型中,以得到第一调整信息确定模型输出的位置调整方向和位置调整值。
在本公开的一些实施例中,第二获取模块702,包括:
获取子模块7021,用于获取待标注图像中对象的初始标注区域;
处理子模块7022,用于根据切片图像处理初始标注区域,得到参考标注区域。
在本公开的一些实施例中,处理子模块7022,具体用于:
获取正向点击数据和负向点击数据,其中,正向点击数据是点击位置位于待标注图像中对象内的点击数据,负向点击数据是点击位置位于待标注图像中对象外的点击数据;
根据切片图像、正向点击数据,以及负向点击数据处理初始标注区域,得到参考标注区域。
在本公开的一些实施例中,处理子模块7022,还用于:
根据切片图像、正向点击数据,以及负向点击数据生成与初始标注区域对应的参考调整信息;
根据参考调整信息调整初始标注区域,得到参考标注区域。
在本公开的一些实施例中,处理子模块7022,还用于:
将切片图像、正向点击数据,以及负向点击数据输入至第二调整信息确定模型中,以得到第二调整信息确定模型输出的参考调整信息。
在本公开的一些实施例中,第一获取模块701,具体用于:
确定待标注图像中对象的局部图像区域;
对待标注图像中局部图像区域的区域边界进行至少一次扩展处理,得到每次所扩展区域边界框选的切片图像区域;
根据切片图像区域,生成切片图像。
在本公开的一些实施例中,装置还包括:
第三获取模块705,用于获取待标注图像中对象的分类信息;
第二处理模块706,用于根据目标标注区域和分类信息对待标注图像进行标注,得到目标标注图像。
需要说明的是,前述对图像标注方法的解释说明也适用于本实施例的图像标注装置,此处不再赘述。
本实施例中,通过根据待标注图像,获取对象的切片图像,根据切片图像,获取待标注图像中对象的参考标注区域,根据切片图像,确定参考标注区域的区域调整信息,根据区域调整信息调整参考标注区域,得到目标标注区域,其中,目标标注区域用于标注待标注图像,由此,能够有效提升图像标注过程的自动化程度,降低图像标注的时间成本,从而有效提升图像标注效率。
图9示出了适于用来实现本公开实施方式的示例性电子设备的框图。图9显示的电子设备12仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图9所示,电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,***存储器28,连接不同***组件(包括***存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,***总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及***组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
电子设备12典型地包括多种计算机***可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机***可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其他可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例,存储***34可以用于读写不可移动的、非易失性磁介质(图9未显示,通常称为“硬盘驱动器”)。
尽管图9中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read OnlyMemory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其他光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本公开各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作***、一个或者多个应用程序、其他程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本公开所描述的实施例中的功能和/或方法。
电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得人体能与该电子设备12交互的设备通信,和/或与使得该电子设备12能与一个或多个其他计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local Area Network;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与电子设备12的其他模块通信。应当明白,尽管图中未示出,可以结合电子设备12使用其他硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
处理单元16通过运行存储在***存储器28中的程序,从而执行各种功能应用以及图像标注,例如实现前述实施例中提及的图像标注方法。
为了实现上述实施例,本公开还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开前述实施例提出的图像标注方法。
为了实现上述实施例,本公开还提出一种计算机程序产品,当计算机程序产品中的指令处理器执行时,执行如本公开前述实施例提出的图像标注方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
需要说明的是,在本公开的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本公开的描述中,除非另有说明,“多个”的含义是两个或两个以上。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本公开的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本公开的实施例所属技术领域的技术人员所理解。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本公开各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定是指相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本公开的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本公开的限制,本领域的普通技术人员在本公开的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (24)
1.一种图像标注方法,其特征在于,包括:
根据待标注图像,获取对象的切片图像;
根据所述切片图像,获取所述待标注图像中对象的参考标注区域;
根据所述切片图像,确定所述参考标注区域的区域调整信息;
根据所述区域调整信息调整所述参考标注区域,得到目标标注区域,其中,所述目标标注区域用于标注所述待标注图像。
2.如权利要求1所述的方法,其特征在于,所述根据所述切片图像,确定所述参考标注区域的区域调整信息,包括:
确定所述切片图像的切片图像特征;
根据所述切片图像和所述切片图像特征,确定所述参考标注区域的区域调整信息。
3.如权利要求2所述的方法,其特征在于,所述根据所述切片图像和所述切片图像特征,确定所述参考标注区域的区域调整信息,包括:
从所述切片图像中获取所述对象的轮廓点;
确定所述轮廓点在所述切片图像中的位置特征;
从所述切片图像特征中,获取与所述轮廓点对应的轮廓点特征;
根据所述位置特征、所述轮廓点特征,以及所述切片图像确定所述参考标注区域的区域调整信息。
4.如权利要求3所述的方法,其特征在于,所述根据所述位置特征、所述轮廓点特征,以及所述切片图像确定所述参考标注区域的区域调整信息,包括:
根据所述轮廓点特征和所述切片图像,确定与所述位置特征对应的位置调整方向和位置调整值;
将所述位置调整方向和位置调整值作为所述区域调整信息。
5.如权利要求4所述的方法,其特征在于,所述根据所述轮廓点特征和所述切片图像,确定与所述位置特征对应的位置调整方向和位置调整值,包括:
将所述轮廓点特征和所述切片图像输入至第一调整信息确定模型中,以得到所述第一调整信息确定模型输出的所述位置调整方向和位置调整值。
6.如权利要求1所述的方法,其特征在于,所述根据所述切片图像,获取所述待标注图像中对象的参考标注区域,包括:
获取所述待标注图像中对象的初始标注区域;
根据所述切片图像处理所述初始标注区域,得到所述参考标注区域。
7.如权利要求6所述的方法,其特征在于,所述根据所述切片图像处理所述初始标注区域,得到所述参考标注区域,包括:
获取正向点击数据和负向点击数据,其中,所述正向点击数据是点击位置位于所述待标注图像中对象内的点击数据,所述负向点击数据是点击位置位于所述待标注图像中对象外的点击数据;
根据所述切片图像、所述正向点击数据,以及所述负向点击数据处理所述初始标注区域,得到所述参考标注区域。
8.如权利要求7所述的方法,其特征在于,所述根据所述切片图像、所述正向点击数据,以及所述负向点击数据处理所述初始标注区域,得到所述参考标注区域,包括:
根据所述切片图像、所述正向点击数据,以及所述负向点击数据生成与所述初始标注区域对应的参考调整信息;
根据所述参考调整信息调整所述初始标注区域,得到所述参考标注区域。
9.如权利要求8所述的方法,其特征在于,所述根据所述切片图像、所述正向点击数据,以及所述负向点击数据生成与所述初始标注区域对应的参考调整信息,包括:
将所述切片图像、所述正向点击数据,以及所述负向点击数据输入至第二调整信息确定模型中,以得到所述第二调整信息确定模型输出的所述参考调整信息。
10.如权利要求1-9任一项所述的方法,其特征在于,所述根据待标注图像,获取对象的切片图像,包括:
确定所述待标注图像中对象的局部图像区域;
对所述待标注图像中所述局部图像区域的区域边界进行至少一次扩展处理,得到每次所扩展区域边界框选的切片图像区域;
根据所述切片图像区域,生成所述切片图像。
11.如权利要求1-9任一项所述的方法,其特征在于,在所述根据所述区域调整信息调整所述参考标注区域,得到目标标注区域之后,还包括:
获取所述待标注图像中对象的分类信息;
根据所述目标标注区域和所述分类信息对所述待标注图像进行标注,得到目标标注图像。
12.一种图像标注装置,其特征在于,包括:
第一获取模块,用于根据待标注图像,获取对象的切片图像;
第二获取模块,用于根据所述切片图像,获取所述待标注图像中对象的参考标注区域;
确定模块,用于根据所述切片图像,确定所述参考标注区域的区域调整信息;
第一处理模块,用于根据所述区域调整信息调整所述参考标注区域,得到目标标注区域,其中,所述目标标注区域用于标注所述待标注图像。
13.如权利要求12所述的装置,其特征在于,所述确定模块,包括:
第一确定子模块,用于确定所述切片图像的切片图像特征;
第二确定子模块,用于根据所述切片图像和所述切片图像特征,确定所述参考标注区域的区域调整信息。
14.如权利要求13所述的装置,其特征在于,所述第二确定子模块,具体用于:
从所述切片图像中获取所述对象的轮廓点;
确定所述轮廓点在所述切片图像中的位置特征;
从所述切片图像特征中,获取与所述轮廓点对应的轮廓点特征;
根据所述位置特征、所述轮廓点特征,以及所述切片图像确定所述参考标注区域的区域调整信息。
15.如权利要求14所述的装置,其特征在于,所述第二确定子模块,还用于:
根据所述轮廓点特征和所述切片图像,确定与所述位置特征对应的位置调整方向和位置调整值;
将所述位置调整方向和位置调整值作为所述区域调整信息。
16.如权利要求15所述的装置,其特征在于,所述第二确定子模块,还用于:
将所述轮廓点特征和所述切片图像输入至第一调整信息确定模型中,以得到所述第一调整信息确定模型输出的所述位置调整方向和位置调整值。
17.如权利要求12所述的装置,其特征在于,所述第二获取模块,包括:
获取子模块,用于获取所述待标注图像中对象的初始标注区域;
处理子模块,用于根据所述切片图像处理所述初始标注区域,得到所述参考标注区域。
18.如权利要求17所述的装置,其特征在于,所述处理子模块,具体用于:
获取正向点击数据和负向点击数据,其中,所述正向点击数据是点击位置位于所述待标注图像中对象内的点击数据,所述负向点击数据是点击位置位于所述待标注图像中对象外的点击数据;
根据所述切片图像、所述正向点击数据,以及所述负向点击数据处理所述初始标注区域,得到所述参考标注区域。
19.如权利要求18所述的装置,其特征在于,所述处理子模块,还用于:
根据所述切片图像、所述正向点击数据,以及所述负向点击数据生成与所述初始标注区域对应的参考调整信息;
根据所述参考调整信息调整所述初始标注区域,得到所述参考标注区域。
20.如权利要求19所述的装置,其特征在于,所述处理子模块,还用于:
将所述切片图像、所述正向点击数据,以及所述负向点击数据输入至第二调整信息确定模型中,以得到所述第二调整信息确定模型输出的所述参考调整信息。
21.如权利要求12-20任一项所述的装置,其特征在于,所述第一获取模块,具体用于:
确定所述待标注图像中对象的局部图像区域;
对所述待标注图像中所述局部图像区域的区域边界进行至少一次扩展处理,得到每次所扩展区域边界框选的切片图像区域;
根据所述切片图像区域,生成所述切片图像。
22.如权利要求12-20任一项所述的装置,其特征在于,还包括:
第三获取模块,用于获取所述待标注图像中对象的分类信息;
第二处理模块,用于根据所述目标标注区域和所述分类信息对所述待标注图像进行标注,得到目标标注图像。
23.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-11中任一项所述的方法。
24.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,其中,所述计算机指令用于使所述计算机执行权利要求1-11中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210768430.2A CN114820679B (zh) | 2022-07-01 | 2022-07-01 | 图像标注方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210768430.2A CN114820679B (zh) | 2022-07-01 | 2022-07-01 | 图像标注方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114820679A true CN114820679A (zh) | 2022-07-29 |
CN114820679B CN114820679B (zh) | 2023-04-18 |
Family
ID=82523312
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210768430.2A Active CN114820679B (zh) | 2022-07-01 | 2022-07-01 | 图像标注方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114820679B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116129126A (zh) * | 2023-04-04 | 2023-05-16 | 整数智能信息技术(杭州)有限责任公司 | 分割预测模型的构建方法、图片语义分割标注方法及装置 |
CN116309442A (zh) * | 2023-03-13 | 2023-06-23 | 北京百度网讯科技有限公司 | 挑拣信息的确定方法及目标对象的挑拣方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018019124A1 (zh) * | 2016-07-29 | 2018-02-01 | 努比亚技术有限公司 | 一种图像处理方法及电子设备、存储介质 |
CN110647886A (zh) * | 2019-09-19 | 2020-01-03 | 北京百度网讯科技有限公司 | 兴趣点标注方法、装置、计算机设备和存储介质 |
CN112364898A (zh) * | 2020-10-27 | 2021-02-12 | 星火科技技术(深圳)有限责任公司 | 图像识别自动标注方法、装置、设备及存储介质 |
CN112508975A (zh) * | 2020-12-21 | 2021-03-16 | 上海眼控科技股份有限公司 | 一种图像识别方法、装置、设备及存储介质 |
CN112652071A (zh) * | 2021-01-06 | 2021-04-13 | 厦门美图之家科技有限公司 | 外轮廓点标注方法、装置、电子设备和可读存储介质 |
CN112767288A (zh) * | 2021-03-19 | 2021-05-07 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN113160257A (zh) * | 2021-04-23 | 2021-07-23 | 深圳市优必选科技股份有限公司 | 图像数据标注方法、装置、电子设备及存储介质 |
CN113327193A (zh) * | 2021-05-27 | 2021-08-31 | 北京百度网讯科技有限公司 | 图像处理方法、装置、电子设备和介质 |
CN114063858A (zh) * | 2021-11-26 | 2022-02-18 | 北京百度网讯科技有限公司 | 图像处理方法、装置、电子设备及存储介质 |
-
2022
- 2022-07-01 CN CN202210768430.2A patent/CN114820679B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018019124A1 (zh) * | 2016-07-29 | 2018-02-01 | 努比亚技术有限公司 | 一种图像处理方法及电子设备、存储介质 |
CN110647886A (zh) * | 2019-09-19 | 2020-01-03 | 北京百度网讯科技有限公司 | 兴趣点标注方法、装置、计算机设备和存储介质 |
CN112364898A (zh) * | 2020-10-27 | 2021-02-12 | 星火科技技术(深圳)有限责任公司 | 图像识别自动标注方法、装置、设备及存储介质 |
CN112508975A (zh) * | 2020-12-21 | 2021-03-16 | 上海眼控科技股份有限公司 | 一种图像识别方法、装置、设备及存储介质 |
CN112652071A (zh) * | 2021-01-06 | 2021-04-13 | 厦门美图之家科技有限公司 | 外轮廓点标注方法、装置、电子设备和可读存储介质 |
CN112767288A (zh) * | 2021-03-19 | 2021-05-07 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN113160257A (zh) * | 2021-04-23 | 2021-07-23 | 深圳市优必选科技股份有限公司 | 图像数据标注方法、装置、电子设备及存储介质 |
CN113327193A (zh) * | 2021-05-27 | 2021-08-31 | 北京百度网讯科技有限公司 | 图像处理方法、装置、电子设备和介质 |
CN114063858A (zh) * | 2021-11-26 | 2022-02-18 | 北京百度网讯科技有限公司 | 图像处理方法、装置、电子设备及存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116309442A (zh) * | 2023-03-13 | 2023-06-23 | 北京百度网讯科技有限公司 | 挑拣信息的确定方法及目标对象的挑拣方法 |
CN116309442B (zh) * | 2023-03-13 | 2023-10-24 | 北京百度网讯科技有限公司 | 挑拣信息的确定方法及目标对象的挑拣方法 |
CN116129126A (zh) * | 2023-04-04 | 2023-05-16 | 整数智能信息技术(杭州)有限责任公司 | 分割预测模型的构建方法、图片语义分割标注方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN114820679B (zh) | 2023-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11455805B2 (en) | Method and apparatus for detecting parking space usage condition, electronic device, and storage medium | |
CN114820679B (zh) | 图像标注方法、装置、电子设备和存储介质 | |
CN110008956B (zh) | ***关键信息定位方法、装置、计算机设备及存储介质 | |
CN109583345B (zh) | 道路识别方法、装置、计算机装置及计算机可读存储介质 | |
CN112307978B (zh) | 目标检测方法、装置、电子设备及可读存储介质 | |
CN113723377B (zh) | 一种基于ld-ssd网络的交通标志检测方法 | |
CN110991489B (zh) | 一种驾驶数据的标注方法、装置及*** | |
CN108428248B (zh) | 车窗定位方法、***、设备及存储介质 | |
CN112258519B (zh) | 一种高精度地图制作中道路的让行线自动化提取方法及装置 | |
CN111435446A (zh) | 一种基于LeNet车牌识别方法及装置 | |
CN113971727A (zh) | 一种语义分割模型的训练方法、装置、设备和介质 | |
CN116484971A (zh) | 车辆的自动驾驶感知自学习方法、装置及电子设备 | |
CN111027539A (zh) | 一种基于空间位置信息的车牌字符分割方法 | |
CN111295666A (zh) | 一种车道线检测方法、装置、控制设备及存储介质 | |
CN111444911B (zh) | 车牌识别模型的训练方法及装置、车牌识别方法及装置 | |
CN114283343B (zh) | 基于遥感卫星图像的地图更新方法、训练方法和设备 | |
CN112287905A (zh) | 车辆损伤识别方法、装置、设备及存储介质 | |
CN116721396A (zh) | 车道线检测方法、设备及存储介质 | |
CN114429631B (zh) | 三维对象检测方法、装置、设备以及存储介质 | |
CN115909241A (zh) | 一种车道线检测方法、***、电子设备和存储介质 | |
CN115618602A (zh) | 一种车道级场景仿真方法及*** | |
CN115393379A (zh) | 一种数据标注方法及相关产品 | |
CN113239931A (zh) | 一种物流站车牌识别的方法 | |
CN113408514A (zh) | 一种基于深度学习检测路侧停车场泊位的方法及装置 | |
CN114118188A (zh) | 针对待检测图像中移动对象的处理***、方法和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |