CN111414902B - 图像标注的方法和装置 - Google Patents

图像标注的方法和装置 Download PDF

Info

Publication number
CN111414902B
CN111414902B CN201910016828.9A CN201910016828A CN111414902B CN 111414902 B CN111414902 B CN 111414902B CN 201910016828 A CN201910016828 A CN 201910016828A CN 111414902 B CN111414902 B CN 111414902B
Authority
CN
China
Prior art keywords
image
resolution
marked
images
ith
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910016828.9A
Other languages
English (en)
Other versions
CN111414902A (zh
Inventor
董博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201910016828.9A priority Critical patent/CN111414902B/zh
Publication of CN111414902A publication Critical patent/CN111414902A/zh
Application granted granted Critical
Publication of CN111414902B publication Critical patent/CN111414902B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/225Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本申请实施例提供一种图像标注的方法和装置,该方法包括:获取包括被标注的第一物体的第一图像,将第一图像中的第一物体替换成第二物体,得到包括被标注的第二物体的第二图像,第二物体在第二图像中的区域为第一物体在第一图像中的区域。本申请中通过将原始图像中被标注的第一物体替换成第二物体,得到了包括被标注的第二物体的图像,新增了带标注的图像,且新增的标注的图像无需人工进行标注,因此提高了图像标注的效率。

Description

图像标注的方法和装置
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种图像标注的方法和装置。
背景技术
计算机视觉方法(包括监督式的机器学习方法和半监督式的机器学习方法)在实际应用场景中会需要大量带有标注的图像作为训练样本,这些标注的图像用来训练模型时,可提高训练得到的模型的准确度。
目前图像的标注过程均是人工来完成的,而一个训练过程需要大量的带有标注的图像,因此目前图像的标注的效率很低。
发明内容
本申请实施例提供一种图像标注的方法和装置,提高了图像标注的效率。
第一方面,本申请实施例提供一种图像标注的方法,包括:
获取包括被标注的第一物体的第一图像;
将所述第一图像中的第一物体替换成第二物体,得到包括被标注的第二物体的第二图像,所述第二物体在所述第二图像中的区域为所述第一物体在所述第一图像中的区域。
在一种可能的设计中,还包括:
获取包括所述第二物体的第三图像;
将所述第三图像中的第二物体替换成所述第一物体,得到包括所述第一物体的第四图像,所述第一物体在所述第四图像中的区域为所述第二物体在所述第三图像中的区域。
在一种可能的设计中,还包括:
获取包括被标注的所述第二物体的第三图像;
将所述第三图像中的第二物体替换成所述第一物体,得到包括被标注的第一物体的第四图像,所述第一物体在所述第四图像中的区域为所述第二物体在所述第三图像中的区域。
在一种可能的设计中,所述将所述第一图像中的第一物体替换成第二物体,包括:
根据所述第一图像和目标生成器,将所述第一图像中的第一物体替换成第二物体,得到包括被标注的第二物体的第二图像;
其中,所述目标生成器是根据多张包括第一物体的图像和多张包括第二物体的图像训练得到的。
在一种可能的设计中,在根据所述第一图像和目标生成器,得到包括被标注的第二物体的第二图像之前,还包括:
A、根据第一分辨率下的多张包括第一物体的图像和所述第一分辨率下的多张包括第二物体的图像,获取第一生成器;
B、根据第i-1生成器和第i分辨率下的多张包括第一物体的图像和所述第i分辨率下的多张包括第二物体的图像,获取第i生成器;所述第i分辨率大于第i-1分辨率,i为大于等于2的整数;
C、判断所述第i分辨率是否达到预设分辨率,若否,则将i+1作为i,返回执行B,若是,则确定所述第i生成器为所述目标生成器。
在一种可能的设计中,所述获取包括被标注的第一物体的第一图像:
根据用户输入的标注指令,对包括所述第一物体的图像进行标注,得到包括被标注的第一物体的第一图像。
第二方面,本申请实施例提供一种图像标注的装置,包括:
获取模块,用于获取包括被标注的第一物体的第一图像;
替换模块,用于将所述第一图像中的第一物体替换成第二物体,得到包括被标注的第二物体的第二图像,所述第二物体在所述第二图像中的区域为所述第一物体在所述第一图像中的区域。
在一种可能的设计中,还包括:
所述获取模块,还用于获取包括所述第二物体的第三图像;
所述替换模块,还用于将所述第三图像中的第二物体替换成所述第一物体,得到包括所述第一物体的第四图像,所述第一物体在所述第四图像中的区域为所述第二物体在所述第三图像中的区域。
在一种可能的设计中,还包括:
所述获取模块,还用于获取包括被标注的所述第二物体的第三图像;
所述替换模块,还用于将所述第三图像中的第二物体替换成所述第一物体,得到包括被标注的第一物体的第四图像,所述第一物体在所述第四图像中的区域为所述第二物体在所述第三图像中的区域。
在一种可能的设计中,所述替换模块,具体用于:
根据所述第一图像和目标生成器,将所述第一图像中的第一物体替换成第二物体,得到包括被标注的第二物体的第二图像;
其中,所述目标生成器是根据多张包括第一物体的图像和多张包括第二物体的图像训练得到的。
在一种可能的设计中,还包括:生成模块;
所述生成模块,用于在根据所述第一图像和目标生成器,得到包括被标注的第二物体的第二图像之前:
A、根据第一分辨率下的多张包括第一物体的图像和所述第一分辨率下的多张包括第二物体的图像,获取第一生成器;
B、根据第i-1生成器和第i分辨率下的多张包括第一物体的图像和所述第i分辨率下的多张包括第二物体的图像,获取第i生成器;所述第i分辨率大于第i-1分辨率,i为大于等于2的整数;
C、判断所述第i分辨率是否达到预设分辨率,若否,则将i+1作为i,返回执行B,若是,则确定所述第i生成器为所述目标生成器。
第三方面,本申请实施例提供一种可读存储介质,包括程序或指令,当所述程序或指令在计算机上运行时,第一方面任一所述的方法被执行。
第四方面,本申请实施例提供一种电子设备,其特征在于,包括:处理器,所述处理器与存储器耦合;
所述存储器用于,存储计算机程序;
所述处理器用于,调用所述存储器中存储的计算机程序,以实现第一方面任一所述的方法。
本申请中通过将原始图像中被标注的第一物体替换成第二物体,得到了包括被标注的第二物体的图像,新增了带标注的图像,且新增的标注的图像无需人工进行标注,因此提高了图像标注的效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的应用场景示意图;
图2为本申请实施例提供的图像标注的方法的流程图一;
图3为本申请实施例提供的图像标注的方法的流程图二;
图4为本申请实施例提供的图像标注的方法的流程图三;
图5为本申请实施例提供的生成器的获取方法;
图6为本申请实施例提供的图像标注的装置的结构示意图一;
图7为本申请实施例提供的图像标注的装置的结构示意图二;
图8为本申请实施例提供的电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中a,b,c可以是单个,也可以是多个。本申请中术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
图1为本申请实施例提供的应用场景示意图。参见图1,第一图像11中包括第一物体12,第一物体12被矩形框标注,第一图像11可以作为带有标注的训练样本;对第一图像11进行处理,将第一图像中的第一物体11替换成第二物体22,得到包括被标注的第二物体22的第二图像21,第二物体22在第二图像21中的区域为第一物体12在第一图像11中的区域。其中,包括被标注的第二物体的第二图像可以作为带有标注的训练样本。
上述方法只需对第一图像中的第一物体进行标注,可得到包括被标注的任意种类的第二物体的第二图像,无需人工标注第二物体,图像标注的效率提高,也就提高了获取带有标注的训练样本的效率。
下面,通过具体实施例对本申请所示的技术方案进行详细说明。需要说明的是,下面几个具体实施例中相同或相似的内容,在不同的实施例中不再进行重复说明。
图2为本申请实施例提供的图像标注的方法的流程图一,本实施例的执行主体为图像标注的装置;本实施例的方法包括:
步骤S101、获取包括被标注的第一物体的第一图像;
具体地,包括被标注的第一物体的第一图像可存储在图像标注的装置中,或者其它设备中,图像标注的装置从自身的存储器或者其它设备中获取包括被标注的第一物体的第一图像。其中,包括被标注的第一物体的第一图像可作为训练样本,即为一种带标注的训练样本。
其中,得到包括被标注的第一物体的第一图像的过程可如下:对第一物体进行拍摄,得到包括第一物体的图像;接着对包括第一物体的图像中第一物体进行标注,得到包括被标注的第一物体的第一图像。包括被标注的第一物体的第一图像为一原始的且真实的图像。
其中,对包括第一物体的图像中第一物体进行标注可包括:根据用户输入的标注指令,对包括第一物体的图像进行标注,得到包括被标注的第一物体的第一图像。
用户可在包括第一物体的图像上绘制矩形框,输入标注指令,终端根据标注指令对包括第一物体的图像进行标注,得到包括被标注的第一物体的第一图像。
按照上述相同的方法,可得到多张包括被标注的第一物体的第一图像。可以理解的是,每张被标注的第一物体的第一图像中的第一物体的大小、位置、形态等属性特征可不相同,以得到不同的包括被标注的第一物体的第一图像,可作为不同的带标注的训练样本。
步骤S102、将第一图像中的第一物体替换成第二物体,得到包括被标注的第二物体的第二图像,第二物体在第二图像中的区域为第一物体在第一图像中的区域。
具体地,根据第一图像和目标生成器,将第一图像中的第一物体替换成第二物体,得到包括被标注的第二物体的第二图像,第二物体在第二图像中的区域为第一物体在第一图像中的区域。其中,第二物体可为任意的物体。
其中,第二物体在第二图像中的区域为第一物体在第一图像中的区域是指:第二物体在第二图像中的大小、位置、形态与第一物体在第一图像中的大小、位置、形态相同或大体相同。上述过程的本质为第一图像中的背景不变,将第一图像中的第一物体更新成第二物体。
其中,目标生成器是根据多张包括第一物体的图像和多张包括第二物体的图像训练得到的。得到目标生成器的算法可为CycleGAN算法或者GAN算法。此处的多张包括第一物体的图像为多张包括第一物体的真实图像,多张包括第二物体的图像为多张包括第二物体的真实图像。
具体地,目标生成器可通过一次训练过程得到,也可通过多次训练过程得到(即逐步训练得到的)。一次训练过程包括多次学习过程,对于一次训练过程中的第j次学习过程所需要的第j张包括第一物体的真实图像和第j张包括第二物体的真实图像,第j张包括第一物体的真实图像中的第一物体的大小、位置和形态等属性特征,与,第j张包括第二物体的真实图像中的第二物体的大小、位置和形态等属性特征相似,且第j张包括第一物体的真实图像和第j张包括第二物体的真实图像的背景相似,第j次学习过程使用的生成器可为第j代生成器,第j次学习过程完毕后得到的生成器可为第j+1代生成器,最后一次学习过程得到生成器即为目标生成器。得到目标生成器的具体的算法实现参照CycleGAN算法或者GAN算法,此处不再赘述。
经过了步骤S102,得到了包括被标注的第二物体的第二图像,即得到了新的带标注的图像。在具有N张不同的包括被标注的第一物体的第一图像的情况下,可得到N张不同的包括被标注的第二物体的第二图像,即新增多张带标注的图像。或者说,在经过了步骤S102后,带标注的图像集包括:N张被标注的第一物体的第一图像和N张包括被标注的第二物体的第二图像。
进一步地,将第一图像中的第一物体替换成多种不同种类的第二物体的过程可同时存在,将第一图像中的第一物体替换成不同种类的第二物体的方法相同,但是采用的目标生成器不相同。
本实施例中通过将原始图像中被标注的第一物体替换成第二物体,得到了包括被标注的第二物体的图像,新增了带标注的图像,且新增的标注的图像无需人工进行标注,因此提高了图像标注的效率。
应理解,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
下面结合图3和图4所示的实施例,对上一实施例中的图像标注方法的完整流程进行说明。
图3为本申请实施例提供的图像标注的方法的流程图二,本实施例的执行主体为图像标注的装置;本实施例的方法包括:
步骤S201、获取包括被标注的第一物体的第一图像和包括被标注的第二物体的第三图像。
具体地,获取包括被标注的第一物体的第一图像的方法参照图2所示的实施例中的步骤S101,此处不再赘述。获取包括被标注的第二物体的第三图像的方法,同获取包括被标注的第一物体的第一图像的方法。
步骤S202、将第一图像中的第一物体替换成第二物体,得到包括被标注的第二物体的第二图像,将第三图像中的第二物体替换成第一物体,得到包括被标注的第一物体的第四图像,第二物体在第二图像中的区域为第一物体在第一图像中的区域,第一物体在第四图像中的区域为所第二物体在第三图像中的区域。
具体地,“将第一图像中的第一物体替换成第二物体,得到包括被标注的第二物体的第二图像”的方法参照图2中所示的实施例中的步骤S102,此处不再赘述。
其中,“将第三图像中的第二物体替换成第一物体,得到包括被标注的第一物体的第四图像”的方法,包括:
根据第三图像和目标生成器,将第三图像中的第二物体替换成第一物体,得到包括被标注的第一物体的第四图像。此处的目标生成器也是根据多张包括第一物体的图像和多张包括第二物体的图像训练得到的,但是此处的目标生成器与将第一图像中的第一物体替换成第二物体所使用的目标生成器不相同,在本实施例中将第一图像中的第一物体替换成第二物体所使用的生成器称为第一目标生成器,将第三图像中的第二物体替换成第一物体所使用的生成器称为第二目标生成器。
在本实施例的图像标注方法采用的算法为CycleGAN算法时,训练多张包括第一物体的图像和多张包括第二物体的图像,得到CycleGAN模型,CycleGAN模型包括:能够将第一图像中的第一物体替换成第二物体的第一目标生成器和能够将第三图像中的第二物体替换成第一物体的第二目标生成器。
将步骤S201中的包括被标注的第一物体的第一图像和包括被标注的第二物体的第三图像作为CycleGAN模型的输入,包括被标注的第一物体的第一图像经第一目标生成器后,得到包括被标注的第二物体的第二图像,包括被标注的第二物体的第三图像经第二目标生成器后,得到包括被标注的第一物体的第四图像。也就是说,步骤S202实现了第一图像中的第一物体和第三图像中的第二物体的互换,从而得到了新的带有标注的图像。
经过了步骤S202,得到了包括被标注的第二物体的第二图像和包括被标注的第一物体的第四图像,即得到了新的带标注的图像。在具有N张不同的包括被标注的第一物体的第一图像的情况下,可得到N张不同的包括被标注的第二物体的第二图像,在具有M张不同的包括被标注的第二物体的第三图像的情况下,可得到M张不同的包括被标注的第一物体的第四图像,新增N+M张带标注的图像。或者说,在经过了步骤S202后,带标注的图像集包括:N张被标注的第一物体的第一图像、N张包括被标注的第二物体的第二图像、M张包括被标注的第二物体的第三图像和M张包括被标注的第一物体的第四图像。
本实施例中通过将第一原始图像中被标注的第一物体替换成第二物体,得到了包括被标注的第二物体的图像,将第二原始图像中被标注的第二物体替换成第一物体,得到了包括被标注的第一物体的第四图像,新增了带标注的图像,且新增的标注的图像无需人工进行标注,因此提高了图像标注的效率。
应理解,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
图4为本申请实施例提供的图像标注的方法的流程图三,本实施例的执行主体为图像标注的装置;本实施例的方法包括:
步骤S301、获取包括被标注的第一物体的第一图像以及包括第二物体的第三图像。
步骤S302、将第一图像中的第一物体替换成第二物体,得到包括被标注的第二物体的第二图像,将第三图像中的第二物体替换成第一物体,得到包括第一物体的第四图像,第二物体在第二图像中的区域为第一物体在第一图像中的区域,第一物体在第四图像中的区域为第二物体在第三图像中的区域。
具体地,本实施例中的步骤S301~步骤S302与上一实施例中不同之处为本实施例中获取的第三图像中的第二图像没有被标注,CycleGAN模型的输入为包括被标注的第一物体的第一图像和包括未被标注第二物体的第三图像,得到的包括的第一物体的第四图像中第一物体没有标注信息,那么在经过了步骤S302后,带标注的图像集包括:N张被标注的第一物体的第一图像、N张包括被标注的第二物体的第二图像;其余的与上一实施例相同,本实施例中不再赘述。
本实施例中通过将原始图像中被标注的第一物体替换成第二物体,得到了包括被标注的第二物体的图像,新增了带标注的图像,且新增的标注的图像无需人工进行标注,因此提高了图像标注的效率。
下面对将上述实施例中的第一图像中的第一物体替换成第二物体的目标生成器的获取方法进行说明。图5为本申请实施例提供的生成器的获取方法,本申请实施例提供的生成器的获取方法是图2所示的实施例中通过多次训练过程得到目标生成器的方法,参见图5,本实施例的方法包括:
步骤S401、根据第一分辨率下的多张包括第一物体的图像和第一分辨率下的多张包括第二物体的图像,获取第一生成器。
具体地,可根据GAN方法或CycleGAN方法,对第一分辨率下的多张包括第一物体的图像和第一分辨率下的多张包括第二物体的图像进行训练,得到第一生成器。即本次训练过程采用的训练样本为第一分辨率下的多张包括第一物体的图像和第一分辨率下的多张包括第二物体的图像。
第一分辨率下的多张包括第一物体的图像是指包括第一物体的图像的分辨率为第一分辨率,第一分辨率下的多张包括第二物体的图像是指包括第二物体的图像的分辨率为第一分辨率。
本实施例中的第一生成器是经包括多次学习过程的一次训练过程得到的生成器。其中,第一分辨率可为4×4。
步骤S402、根据第i-1生成器和第i分辨率下的多张包括第一物体的图像和第i分辨率下的多张包括第二物体的图像,获取第i生成器;第i分辨率大于第i-1分辨率,i为大于2的整数;
具体地,第i分辨率下的多张包括第一物体的图像是指包括第一物体的图像的分辨率为第i分辨率,第i分辨率下的多张包括第二物体的图像是指包括第二物体的图像的分辨率为第i分辨率。
示例性地,当i=2时,可根据GAN方法或CycleGAN方法,对第二分辨率下的多张包括第一物体的图像和第二分辨率下的多张包括第二物体的图像进行训练,在第一生成器的基础上,得到第二生成器,即在得到第二生成器的过程中所使用的第一代生成器为上述的第一生成器。其中,第二分辨率可为8×8。
示例性性,当i=3时,可根据GAN方法或CycleGAN方法,对第三分辨率下的多张包括第一物体的图像和第三分辨率下的多张包括第二物体的图像进行训练,在第二生成器的基础上,得到第三生成器,即在得到第三生成器的过程中所使用的第一代生成器为上述的第二生成器。其中,第二分辨率可为16×16。
步骤S403、判断第i分辨率是否达到预设分辨率。
预设分辨率可为1024×1024,此时,第一分辨率可为4×4,第二分辨率可为8×8,第三分辨率可为16×16,第四分辨率可为32×32,第五分辨率可为64×64,第六分辨率可为128×128,第七分辨率可为256×256,第八分辨率可为512×512,第九分辨率可为1024×1024。
步骤S404、若第i分辨率未达到预设分辨率,则将i+1作为i,返回执行步骤S402。
步骤S405、若第i分辨率达到预设分辨率,则确定第i生成器为目标生成器。
另外,还可按照步骤S401~步骤S405中的方法,获取上述实施例中将第三图像中的第二物体替换成第一物体的目标生成器。
若预设分辨率足够大,则根据包括被标注的第一物体的第一图像和采用本实施例中的方法生成的目标生成器,将第一图像中的第一物体替换成第二物体后,可得到高清的包括被标注的第二物体的第二图像。
若预设分辨率足够大,则根据包括被标注的第二物体的第三图像和采用本实施例中的方法生成的目标生成器,将第三图像中的第二物体替换成第一物体,可得到高清的包括被标注的第一物体的第四图像。
本实施例中通过逐步训练的方法得到目标生成器,使得在目标生成器训练的初始阶段,较小的分辨率的训练样本能使得训练过程更加稳定。相对于直接把高分辨率1024x1024作为训练样本得到目标生成器的过程,本实施例的方法使得训练过程中相关参数的更新更加简单,且得到目标生成器的速度更快。
上述通过图1~图5对本申请实施例提供的图像标注的方法进行了说明,下面采用图6~图7所示的实施例对本申请实施例提供的图像标注的装置进行说明。
图6为本申请实施例提供的图像标注的装置的结构示意图一,如图6所示,本实施例的装置可以包括:获取模块51和替换模块52;
获取模块51,用于获取包括被标注的第一物体的第一图像;
替换模块52,用于将所述第一图像中的第一物体替换成第二物体,得到包括被标注的第二物体的第二图像,所述第二物体在所述第二图像中的区域为所述第一物体在所述第一图像中的区域。
可选地中,还包括:
所述获取模块51,还用于获取包括所述第二物体的第三图像;
所述替换模块52,还用于将所述第三图像中的第二物体替换成所述第一物体,得到包括所述第一物体的第四图像,所述第一物体在所述第四图像中的区域为所述第二物体在所述第三图像中的区域。
可选地中,还包括:
所述获取模块51,还用于获取包括被标注的所述第二物体的第三图像;
所述替换模块52,还用于将所述第三图像中的第二物体替换成所述第一物体,得到包括被标注的第一物体的第四图像,所述第一物体在所述第四图像中的区域为所述第二物体在所述第三图像中的区域。
可选地中,所述替换模块52,具体用于:
根据所述第一图像和目标生成器,将所述第一图像中的第一物体替换成第二物体,得到包括被标注的第二物体的第二图像;
其中,所述目标生成器是根据多张包括第一物体的图像和多张包括第二物体的图像训练得到的。
本实施例的装置,可以用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图7为本申请实施例提供的图像标注的装置的结构示意图二,如图7所示,本实施例的装置在图6所示装置结构的基础上,进一步地,还可以包括:生成模块53;
所述生成模块53,用于在根据所述第一图像和目标生成器,得到包括被标注的第二物体的第二图像之前:
A、根据第一分辨率下的多张包括第一物体的图像和所述第一分辨率下的多张包括第二物体的图像,获取第一生成器;
B、根据第i-1生成器和第i分辨率下的多张包括第一物体的图像和所述第i分辨率下的多张包括第二物体的图像,获取第i生成器;所述第i分辨率大于第i-1分辨率,i为大于等于2的整数;
C、判断所述第i分辨率是否达到预设分辨率,若否,则将i+1作为i,返回执行B,若是,则确定所述第i生成器为所述目标生成器。
本实施例的装置,可以用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图8为本申请实施例提供的电子设备的结构示意图,参见图8,本实施例的电子设备包括:处理器72、存储器71和通信总线73,通信总线73用于连接处理器72和存储器71,处理器72与存储器71耦合;
所述存储器71用于,存储计算机程序;
所述处理器72用于,调用所述存储器71中存储的计算机程序,以实现上述方法实施例中的方法。
其中,计算机程序还可存储在电子设备外部的存储器中。
应理解,在本申请实施例中,该处理器72可以是CPU,该处理器52还可以是其他通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。
该存储器71可以包括只读存储器和随机存取存储器,并向处理器72提供指令和数据。存储器71还可以包括非易失性随机存取存储器。例如,存储器71还可以存储设备类型的信息。
该存储器71可以是易失性存储器或非易失性存储器,或均可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data date SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlinkDRAM,SLDRAM)和直接内存总线随机存取存储器(direct rambus RAM,DR RAM)。
该总线73除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都标为总线73。
本申请实施例提供一种可读存储介质,包括程序或指令,当所述程序或指令在计算机上运行时,如上述任意方法实施例所述的方法被执行。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本申请实施例的技术方案,而非对其限制;尽管参照前述各实施例对本申请实施例进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请实施例方案的范围。

Claims (9)

1.一种图像标注的方法,其特征在于,包括:
获取包括被标注的第一物体的第一图像;
将所述第一图像中的第一物体替换成第二物体,得到包括被标注的第二物体的第二图像,所述第二物体在所述第二图像中的区域为所述第一物体在所述第一图像中的区域;
所述将所述第一图像中的第一物体替换成第二物体,包括:
根据所述第一图像和目标生成器,将所述第一图像中的第一物体替换成第二物体,得到包括被标注的第二物体的第二图像;
其中,所述目标生成器是根据多张包括第一物体的图像和多张包括第二物体的图像训练得到的;
在根据所述第一图像和目标生成器,得到包括被标注的第二物体的第二图像之前,还包括:
A、根据第一分辨率下的多张包括第一物体的图像和所述第一分辨率下的多张包括第二物体的图像,获取第一生成器,其中,所述第一分辨率为4×4;
B、根据第i-1生成器和第i分辨率下的多张包括第一物体的图像和所述第i分辨率下的多张包括第二物体的图像,获取第i生成器;所述第i分辨率大于第i-1分辨率,i为大于等于2的整数;
C、判断所述第i分辨率是否达到预设分辨率,若否,则将i+1作为i,返回执行B,若是,则确定所述第i生成器为所述目标生成器,所述预设分辨率为1024×1024。
2.根据权利要求1所述的方法,其特征在于,还包括:
获取包括所述第二物体的第三图像;
将所述第三图像中的第二物体替换成所述第一物体,得到包括所述第一物体的第四图像,所述第一物体在所述第四图像中的区域为所述第二物体在所述第三图像中的区域。
3.根据权利要求1所述的方法,其特征在于,还包括:
获取包括被标注的所述第二物体的第三图像;
将所述第三图像中的第二物体替换成所述第一物体,得到包括被标注的第一物体的第四图像,所述第一物体在所述第四图像中的区域为所述第二物体在所述第三图像中的区域。
4.根据权利要求1~3任一项所述的方法,其特征在于,所述获取包括被标注的第一物体的第一图像:
根据用户输入的标注指令,对包括所述第一物体的图像进行标注,得到包括被标注的第一物体的第一图像。
5.一种图像标注的装置,其特征在于,包括:
获取模块,用于获取包括被标注的第一物体的第一图像;
替换模块,用于将所述第一图像中的第一物体替换成第二物体,得到包括被标注的第二物体的第二图像,所述第二物体在所述第二图像中的区域为所述第一物体在所述第一图像中的区域;
所述替换模块,具体用于:
根据所述第一图像和目标生成器,将所述第一图像中的第一物体替换成第二物体,得到包括被标注的第二物体的第二图像;
其中,所述目标生成器是根据多张包括第一物体的图像和多张包括第二物体的图像训练得到的;
还包括:生成模块;
所述生成模块,用于在根据所述第一图像和目标生成器,得到包括被标注的第二物体的第二图像之前:
A、根据第一分辨率下的多张包括第一物体的图像和所述第一分辨率下的多张包括第二物体的图像,获取第一生成器;
B、根据第i-1生成器和第i分辨率下的多张包括第一物体的图像和所述第i分辨率下的多张包括第二物体的图像,获取第i生成器;所述第i分辨率大于第i-1分辨率,i为大于等于2的整数;
C、判断所述第i分辨率是否达到预设分辨率,若否,则将i+1作为i,返回执行B,若是,则确定所述第i生成器为所述目标生成器。
6.根据权利要求5所述的装置,其特征在于,还包括:
所述获取模块,还用于获取包括所述第二物体的第三图像;
所述替换模块,还用于将所述第三图像中的第二物体替换成所述第一物体,得到包括所述第一物体的第四图像,所述第一物体在所述第四图像中的区域为所述第二物体在所述第三图像中的区域。
7.根据权利要求5所述的装置,其特征在于,还包括:
所述获取模块,还用于获取包括被标注的所述第二物体的第三图像;
所述替换模块,还用于将所述第三图像中的第二物体替换成所述第一物体,得到包括被标注的第一物体的第四图像,所述第一物体在所述第四图像中的区域为所述第二物体在所述第三图像中的区域。
8.一种可读存储介质,其特征在于,包括程序或指令,当所述程序或指令在计算机上运行时,权利要求1~4任一所述的方法被执行。
9.一种电子设备,其特征在于,包括:处理器,所述处理器与存储器耦合;
所述存储器用于,存储计算机程序;
所述处理器用于,调用所述存储器中存储的计算机程序,以实现权利要求1~4任一所述的方法。
CN201910016828.9A 2019-01-08 2019-01-08 图像标注的方法和装置 Active CN111414902B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910016828.9A CN111414902B (zh) 2019-01-08 2019-01-08 图像标注的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910016828.9A CN111414902B (zh) 2019-01-08 2019-01-08 图像标注的方法和装置

Publications (2)

Publication Number Publication Date
CN111414902A CN111414902A (zh) 2020-07-14
CN111414902B true CN111414902B (zh) 2024-06-18

Family

ID=71494376

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910016828.9A Active CN111414902B (zh) 2019-01-08 2019-01-08 图像标注的方法和装置

Country Status (1)

Country Link
CN (1) CN111414902B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108564103A (zh) * 2018-01-09 2018-09-21 众安信息技术服务有限公司 数据处理方法与装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103888689B (zh) * 2014-03-13 2017-10-31 北京智谷睿拓技术服务有限公司 图像采集方法及图像采集装置
CN106650705B (zh) * 2017-01-17 2020-04-24 深圳地平线机器人科技有限公司 区域标注方法、装置和电子设备
CN108229522B (zh) * 2017-03-07 2020-07-17 北京市商汤科技开发有限公司 神经网络的训练方法、属性检测方法、装置及电子设备
CN106815809B (zh) * 2017-03-31 2020-08-25 联想(北京)有限公司 一种图片处理方法和装置
CN108229429A (zh) * 2018-01-30 2018-06-29 海信(山东)冰箱有限公司 一种图像处理方法及装置和冰箱
CN108537129B (zh) * 2018-03-14 2021-01-08 北京影谱科技股份有限公司 训练样本的标注方法、装置和***

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108564103A (zh) * 2018-01-09 2018-09-21 众安信息技术服务有限公司 数据处理方法与装置

Also Published As

Publication number Publication date
CN111414902A (zh) 2020-07-14

Similar Documents

Publication Publication Date Title
US20230177343A1 (en) Scene understanding and generation using neural networks
CN109389030B (zh) 人脸特征点检测方法、装置、计算机设备及存储介质
US11966839B2 (en) Auto-regressive neural network systems with a soft attention mechanism using support data patches
JP7107976B2 (ja) セマンティックセグメンテーションモデルの訓練方法、装置、コンピュータデバイス、プログラム及び記憶媒体
KR102194675B1 (ko) 번역을 위해 메시지를 콘텍스트-기반으로 그룹화하기 위한 기법
CN107608951B (zh) 报表生成方法和***
CN111476719A (zh) 图像处理方法、装置、计算机设备及存储介质
TW202042181A (zh) 深度模型訓練方法及裝置、電子設備及儲存介質
CN111311599B (zh) 图像处理方法、装置、电子设备和存储介质
CN112016274B (zh) 医学文本结构化方法、装置、计算机设备及存储介质
CN109657675B (zh) 图像标注方法、装置、计算机设备和可读存储介质
KR20210106024A (ko) 확대된 이미지들의 캡처 및 저장
CN113780365B (zh) 样本生成方法和装置
CN111414902B (zh) 图像标注的方法和装置
CN109324967A (zh) 应用程序弹窗控件测试的方法、装置及终端设备
US20240127510A1 (en) Stylized glyphs using generative ai
CN113987242A (zh) 一种文件图片可视化方法、装置、设备及介质
CN115937875A (zh) 文本识别方法及装置、存储介质、终端
CN117079084B (zh) 样本图像的生成方法、装置、计算机设备和存储介质
US20220036172A1 (en) Olfactory predictions using neural networks
CN115272792A (zh) 数据增强的方法和电子设备
CN117094898A (zh) 一种模型训练方法、装置及设备
CN116610944A (zh) 一种模型训练方法、装置、设备及介质
CN117475284A (zh) 自定义形象的生成方法及装置
CN114792295A (zh) 基于智能相框的被遮挡物修正方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant