CN109614983A - 训练数据的生成方法、装置及*** - Google Patents

训练数据的生成方法、装置及*** Download PDF

Info

Publication number
CN109614983A
CN109614983A CN201811260697.0A CN201811260697A CN109614983A CN 109614983 A CN109614983 A CN 109614983A CN 201811260697 A CN201811260697 A CN 201811260697A CN 109614983 A CN109614983 A CN 109614983A
Authority
CN
China
Prior art keywords
image
target sample
training data
instruction
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811260697.0A
Other languages
English (en)
Other versions
CN109614983B (zh
Inventor
刘源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201811260697.0A priority Critical patent/CN109614983B/zh
Publication of CN109614983A publication Critical patent/CN109614983A/zh
Application granted granted Critical
Publication of CN109614983B publication Critical patent/CN109614983B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本说明书实施例提供了一种训练数据的生成方法、装置及***,该方法包括:向图像采集设备发送图像采集指令,以使图像采集设备根据图像采集指令的指示采集目标样本的第一图像;从图像采集设备获取其采集的第一图像,然后使用设定背景图像替换掉第一图像的背景图像,得到目标样本的第二图像;最后,通过数据标注算法对第二图像中的目标样本进行标注,得到训练数据;其中,上述背景图像为第一图像中除目标样本之外的区域。

Description

训练数据的生成方法、装置及***
技术领域
本申请涉及图像处理技术领域,尤其涉及一种训练数据的生成方法、装置及***。
背景技术
随着计算机技术的快速发展,机器学习在各个领域也得到了广泛的应用。例如,在无人零售领域,可以基于计算机视觉的方案利用图像识别技术对用户购买的商品进行识别,从而完成商品的购买、支付过程。当前,图像识别的主流则是基于卷积神经网络(Convolutional Neural Network,CNN)的深度学习算法。
在采用深度学习算法进行图像识别时,一般需要预先采集大量的训练数据,并使用训练数据训练CNN模型,并使用训练的CNN模型进行图像识别。而在训练CNN模型时,需要使用大量的训练数据。
因此,亟需一种可以快速、高效生成训练数据的方法,以满足模型训练需求。
发明内容
本说明书实施例的目的是提供一种训练数据的生成方法、装置及***,在生成训练数据时,通过向图像采集设备发送图像采集指令,可以控制图像采集设备采集目标样本的第一图像,实现了目标样本图像的自动采集;另外,在本说明书实施例中,还通过数据标注算法对第二图像中的目标样本进行标注,实现了目标样本的自动标注,提高了数据标注的效率;即通过本说明书实施例,实现了样本数据的自动训练,从而提高了数据训练的效率,降低了人力成本,并且所生成的训练数据准确性较高。
为解决上述技术问题,本说明书实施例是这样实现的:
本说明书实施例提供了一种训练数据的生成方法,包括:
向图像采集设备发送图像采集指令,以使所述图像采集设备根据所述图像采集指令的指示采集目标样本的第一图像;
获取所述第一图像,并使用设定背景图像替换所述第一图像的背景图像,得到所述目标样本的第二图像;其中,所述背景图像为所述第一图像中除所述目标样本之外的区域;
通过数据标注算法对所述第二图像中的目标样本进行标注,得到所述训练数据。
本说明书实施例还提供了一种训练数据的生成装置,包括:
第一发送模块,向图像采集设备发送图像采集指令,以使所述图像采集设备根据所述图像采集指令的指示采集目标样本的第一图像;
获取模块,获取所述第一图像;
替换模块,使用设定背景图像替换所述第一图像的背景图像,得到所述目标样本的第二图像;其中,所述背景图像为所述第一图像中除所述目标样本之外的区域;
标注模块,通过数据标注算法对所述第二图像中的目标样本进行标注,得到所述训练数据。
本说明书实施例还提供了一种训练数据的生成***,包括图像采集设备和训练数据的生成设备,所述训练数据的生成设备包括所述训练数据的生成装置;
所述图像采集设备,用于接收所述训练数据的生成设备发送的图像采集指令,并根据所述图像采集指令的指示采集目标样本的第一图像;
所述训练数据的生成设备,用于向所述图像采集设备发送图像采集指令;以及,还用于从所述图像采集设备获取所述第一图像,并使用设定背景图像替换所述第一图像的背景图像,得到所述目标样本的第二图像;其中,所述背景图像为所述第一图像中除所述目标样本之外的区域;通过数据标注算法对所述第二图像中的目标样本进行标注,得到所述训练数据。
本说明书实施例还提供了一种训练数据的生成设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
向图像采集设备发送图像采集指令,以使所述图像采集设备根据所述图像采集指令的指示采集目标样本的第一图像;
获取所述第一图像,并使用设定背景图像替换所述第一图像的背景图像,得到所述目标样本的第二图像;其中,所述背景图像为所述第一图像中除所述目标样本之外的区域;
通过数据标注算法对所述第二图像中的目标样本进行标注,得到训练数据。
本说明书实施例还提供了一种存储介质,用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:
向图像采集设备发送图像采集指令,以使所述图像采集设备根据所述图像采集指令的指示采集目标样本的第一图像;
获取所述第一图像,并使用设定背景图像替换所述第一图像的背景图像,得到所述目标样本的第二图像;其中,所述背景图像为所述第一图像中除所述目标样本之外的区域;
通过数据标注算法对所述第二图像中的目标样本进行标注,得到训练数据。
本实施例中的技术方案,在生成训练数据时,通过向图像采集设备发送图像采集指令,可以控制图像采集设备采集目标样本的第一图像,实现了目标样本图像的自动采集;另外,在本说明书实施例中,还通过数据标注算法对第二图像中的目标样本进行标注,实现了目标样本的自动标注,提高了数据标注的效率;即通过本说明书实施例,实现了样本数据的自动训练,从而提高了数据训练的效率,降低了人力成本,并且所生成的训练数据准确性较高。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书实施例提供的训练数据的生成方法的方法流程图之一;
图2为本说明书实施例提供的训练数据的生成方法中,对目标样本进行标注的方法流程图;
图3为本说明书实施例提供的训练数据的生成方法的方法流程图之二;
图4为本说明书实施例提供的训练数据的生成方法的方法流程图之三;
图5为本说明书实施例提供的训练数据的生成装置的模块组成示意图;
图6为本说明书实施例提供的训练数据的生成***的结构示意图之一;
图7为本说明书实施例提供的训练数据的生成***的结构示意图之二;
图8为本说明书实施例提供的训练数据的生成设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
本说明书实施例提供了一种训练数据的生成方法、装置、***和存储介质,可以实现训练数据的自动采集、自动标注,进而实现训练数据的自动生成;可以提高训练数据的生成效率以及所生成的训练数据的准确性。
本说明书实施例所提供方法的一种具体应用领域可以为无人零售领域,在无人零售领域,为了实现商品的交易,需要对用户所购买的商品进行识别。具体的,可以采用图像识别模型实现商品的识别,因此需要预先训练图像识别模型。而在训练图像识别模型时,则需要生成训练数据。
图1为本说明书实施例提供的训练数据的生成方法的方法流程图之一,图1所示的方法至少包括如下步骤:
步骤102,向图像采集设备发送图像采集指令,以使图像采集设备根据图像采集指令的指示采集目标对象的第一图像。
本说明书实施例提供的方法的执行主体为训练数据的生成设备,如计算机、手机、平板电脑等具有图像处理功能的设备,具体的,可以为安装在训练数据的生成设备上的训练数据的生成装置。
具体的,训练数据的生成设备与图像采集设备之间建立通信连接,当需要进行目标样本的图像采集时,训练数据的生成设备向图像采集设备发送图像采集指令,图像采集设备接收到该图像采集指令后,根据该图像采集指令的指示采集目标对象的图像,记为第一图像。
其中,在具体实施时,上述图像采集指令可以是用户通过训练数据的生成设备所触发的,也可是按照设定频率自动向图像采集设备发送图像采集指令。本说明书并不对上述图像采集指令的触发方式进行限定。
在本说明书实施例中,上述目标样本可以为模型、动植物标本或者进行售卖的商品等任意对象,上述目标样本所代表的具体内容可以根据实际应用场景所确定,本说明书实施例并不对目标样本的具体类别、名称等内容进行限定。
具体的,由于针对一个目标样本,在某些情况下可能需要从多个视角采集该目标样本的图像。因此,在具体实施时,可以是通过图像采集设备采集完目标样本的一张第一图像后,就将采集的该账第一图像发送给图像采集设备,以使图像采集设备生成针对该张第一图像的训练数据;当然,在其他具体实施方式中,可以采集完一个目标样本的图像后,再由训练数据的生成设备生成针对目标样本的训练数据。
步骤104,获取第一图像,并使用设定背景图像替换第一图像的背景图像,得到目标样本的第二图像;其中,背景图像为第一图像中除目标样本之外的区域。
其中,在步骤104中,接收图像采集设备发送的第一图像,由于在采集目标样本的第一图像时,所采集的内容包含目标样本以及目标样本当前所处的背景区域,因此,可以将第一图像中的目标样本所对应的区域记为前景图像,将背景所对应的区域记为背景图像。
而在具体应用时,目标样本可能会被放置在不同的场景中,这时目标样本所处的背景则会发生变化。因为,为了进一步提高所训练的图像识别模型的识别准确度,在本说明书实施例中,在获取到目标样本的第一图像后,需要执行使用设定背景图像替换第一图像的背景图像的步骤。
其中,上述设定背景图像则为实际应用场景中目标样本所处的背景。例如,上述目标样本为需要在无人售货机进行售卖的商品,而在进行商品识别时,所采集的商品的背景为无人售货机中该商品放置位置处所对应的背景,因此,为了进一步提高训练数据的准确性,从而提高所训练的图像识别模型的识别度,可以将所采集的商品的第一图像中的背景图像替换为无人售货机中该商品所对应的背景的图像。
步骤106,通过数据标注算法对第二图像中的目标样本进行标注,得到训练数据。
在上述步骤106中,对第二图像中的目标样本进行标注,实际上是对目标样本在第二图像中的位置以及目标样本的名称、类别等属性信息进行标注。当然,除此之外还可以对目标样本的其他信息进行标注,本说明书实施例并不对此进行限定。
具体的,在步骤106中,对目标样本在第二图像中的位置进行标注,可以是标注出目标样本所对应的像素点,使得目标样本的标注的精度较高。
在本说明书实施例中,则将目标样本的名称、类别等属性信息,以及标注的目标样本所对应的像素点图像作为目标样本的标注数据,将第二图像和所对应的标注数据作为训练数据。
在本说明书实施例中,通过向图像采集设备发送图像采集指令,可以控制图像采集设备采集目标样本的第一图像,实现了目标样本图像的自动采集;另外,在本说明书实施例中,还通过数据标注算法对第二图像中的目标样本进行标注,实现了目标样本的自动标注,提高了数据标注的效率;从而实现了训练数据的自动生成,提高了训练数据的生成效率、降低了人力成本,且所生成的训练数据的准确性较高。
为便于理解本说明书实施例所提供的训练数据的生成方法,下述将一一详细介绍上述各步骤的具体实现过程。
在本说明书实施例中,上述图像采集设备可以为(Red,Green,Blue,红绿蓝)RGB摄像头,相应的,所采集的第一图像则为RGB图像;或者,在另外一种实施方式中,为了获取目标样本的立体信息,增加训练数据的维度信息,在本说明书实施例中,上述图像采集设备除了包括RGB摄像头外,还可以包括深度摄像头,用于采集目标样本的深度图像,在该种情况下,所采集的目标样本的第一图像包括RGB图像和深度图像。而针对上述两种不同的情况,步骤104中使用设定背景图像替换第一图像的背景图像的具体实现过程存在差别,下述将分别论述上述步骤104的具体实现过程。
第一种情况,
上述图像采集设备只包括RGB摄像头,相应的,上述第一图像为RGB图像;
该种情况下,在步骤104中,使用设定背景图像替换第一图像的背景图像,得到目标样本的第二图像,包括如下步骤(1)和步骤(2);
步骤(1)、提取第一图像的前景图像;其中,前景图像为目标样本所对应的区域;
步骤(2)、将上述前景图像与设定背景图像进行合成,得到第二图像。
在本说明书实施例中,可以通过掩膜(mask)的方式提取第一图像中的前景图像,具体过程如下:
对第一图像进行图像灰度化、二值化,提取第一图像中目标样本的轮廓;新建一张与第一图像的大小相等的mask图像,例如,若第一图像的大小为640*480,则所建的mask图像的大小也为640*480,其中,640和480均为像素点的个数;将新建的mask图像上的所有像素点的像素值初始化为0,这时mask图像则为一张全黑的图像。
在mask图像中,使用上述提取的目标样本的轮廓圈出感兴趣区域,并将感兴趣区域内的像素点的像素值均设置为255,这样,感兴趣区域内则为白色区域;即在mask图像上,感兴趣区域内的像素点的像素值为非0,非感兴趣区域的像素点的像素值为0,将mask图像上各个像素点与第一图像上对应的像素点进行与运算,非感兴趣区域的与运算的结果为零,因此所得到的图像中只留下目标样本区域(感兴趣区域),其余区域像素点的像素值均为零,即为黑色;
最后直接从得到的图像中抠出目标样本区域即可,将抠出的目标区域作为第一图像的前景图像。
当然,上述只是介绍了其中一种从第一图像中提取出前景图像的具体实现过程,还可以通过其他方式从第一图像中提取出前景图像,本说明书实施例不再一一列举。
需要说明的是,在上述步骤(2)中,将前景图像与设定背景图像进行合成,可以是现在设定背景图像中确定出前景图像的叠加区域,然后将前景图像叠加在设定背景图像的叠加区域。
第二种情况,
上述图像采集设备包括RGB摄像头和深度摄像头,通过RGB摄像头采集目标样本的RGB图像,通过深度摄像头采集目标样本的深度图像,因此,目标样本的第一图像包括RGB图像和深度图像;
该种情况下,在步骤104中,使用设定背景图像替换第一图像的背景图像,得到目标样本的第二图像,具体包括如下步骤(一)、步骤(二)和步骤(三);
步骤(一)、提取第一图像的前景图像;其中,前景图像为目标样本所对应的区域;
步骤(二)、根据上述前景图像和深度图像,生成前景图像所对应的虚拟视点图像;
步骤(三)、将上述虚拟视点图像与设定背景图像进行合成,得到第二图像。
其中,上述步骤(一)的具体实现过程可参考第一种情况中步骤(1)的具体实现过程,此处不再赘述。
在上述步骤(二)中,根据前景图像和深度图像,生成前景图像所对应的虚拟视点图像,具体包括如下过程:
将前景图像根据深度图像进行投影,将前景图像投影到世界坐标系中,得到前景图像在世界坐标系中的投影坐标;然后再根据前景图像在世界坐标系中的投影坐标,投影到虚拟图像平面中,从而得到前景图像在虚拟投影平面中的虚拟视点图像。
当然,上述根据平面图像(前景图像)和深度图像生成虚拟视点图像的方式并不局限于此,还可以通过其他方式实现,本说明书实施例不再一一列举。
在本说明书实施例中,通过采集目标样本的深度图像和RGB图像可以得到目标样本更多维度的信息,从而使得所生成的训练数据的数据信息更多。
具体的,如图2所示,在上述步骤106中,通过数据标注算法对第二图像中的目标样本进行标注,得到训练数据,具体包括如下步骤:
步骤1062,确定目标样本的属性标签;其中,该属性标签至少包括目标样本的样本名称;
步骤1064,通过对第二图像进行图像分割,确定目标样本所对应的像素点,并生成目标样本所对应的像素点标注图像;
步骤1066,将第二图像、属性标签和像素点标注图像确定为训练数据。
需要说明的是,在本说明书实施例中,目标样本的属性标签指的是目标样本的各属性信息,例如,可以为目标样本的类别、目标样本的名称、目标样本的价格、目标样本的生产地以及目标样本的生产日期等信息。
其中,在上述步骤1062中,至少可以通过如下两种方式确定目标样本的属性标签:
第一、接收用户通过训练数据的生成设备输入的该目标样本的样本名称、样本类别等信息,将用户输入的样本信息作为目标样本的属性标签。
在具体实施时,在训练数据的生成设备执行对第二图像中的目标样本进行标注的步骤时,可以在训练数据的生成设备的屏幕上显示目标样本属性标签输入框,以使用户输入目标样本的属性信息,训练数据的生成设备接收用户输入的该目标样本的相关属性信息;或者,训练数据的生成设备还可以将目标样本属性标签输入框发送给用户的终端设备,以使用户通过终端设备输入目标样本的属性信息,训练数据的生成设备接收用户通过终端设备发送的目标样本的属性信息。
第二、在控制图像采集设备采集目标样本的第一图像的过程中,还可以控制扫描设备扫描目标样本上的识别码,如条形码等,识别目标样本的样本名称、类别等信息;在对第二图像中的目标样本进行标注时,训练数据的生成设备从扫描设备获取目标样本的样本名称、类别等信息,作为目标样本的属性标签。
或者,在具体实施时,可是当图像采集设备在对第二图像中的目标样本进行标注时,向与图像采集设备连接的扫描设备发送扫描指令,以使扫描设备扫描目标样本上的识别码,并识别目标样本的样本名称、类别等属性信息,并将识别的属性信息发送给图像采集设备,作为目标样本的属性标签。
具体的,在上述步骤1064中,可以采用绿幕分割和/或静态背景分割的方式对第二图像进行分割;由于采用绿幕分割或者静态背景分割的方式对图像进行分割属于现有技术,因此对于其具体实现过程此处不再赘述。
由于在第二图像的原图上进行像素点标注不太方便,并且可能会对后续模型生成产生影响,因此,在本说明书实施例中,当确定出目标样本所对应的像素点后,会生成一幅新的第二图像,并在新生成的第二图像中标注出目标样本所对应的像素点,记为目标样本所对应的像素标注图像。其中,需要说明的是新生成的第二图像与原第二图像是相同的,新生成第二图像的目的就是为了标注目标样本所对应的像素点。
具体的,在标注目标样本所对应的像素点时,可以将目标样本所对应的像素点圈出、或者将目标样本所对应的像素点的像素值设置为相同的值等方式。
通过上述过程,则可以生成目标样本的其中一张图像所对应的训练数据,具体的,可以为目标样本的其中一个视角的训练数据。在完成目标样本标注后,可以将第二图像、目标样本的属性标签以及目标样本的像素点标注图像对应的进行存储,作为目标样本的其中一个训练数据。
具体的,在得到目标样本的一个训练数据后,可以先将该训练数据在训练数据的生成设备本地进行存储;然后,开始生成目标样本的第二个训练数据,当得到目标样本所对应的所有训练数据后,可以将目标样本所对应的所有训练数据上传至云端,并在云端进行存储。
例如,在具体实施时,可以从采集目标样本不同视角的图像,并分别生成目标样本各个视角的训练数据。如第一次可以采集目标样本的正视图,在得到正视图所对应的训练数据后,将目标样本正视图所对应的训练数据存储在训练数据的生成设备本地;继续采集目标样本的左侧视图,并进行上述图像处理过程,得到左侧视图所对应的训练数据,并将目标样本左侧视图所对应的训练数据存储在训练数据的生成设备本地;之后再继续目标样本的右视图的图像采集、处理等过程,在得到目标样本有侧视图所对应的训练数据后,将目标样本对应的所有的训练数据上传至云端进行存储。
当然,在具体实施时,还可以是在得到所有目标样本的训练数据后,再执行将训练数据上传至云端进行存储的步骤。
在本说明书实施例中,将训练数据在远端进行存储,一方面数据存储的安全性较高,另外,还可以方面后续训练数据的使用。
需要说明的是,在具体实施时,在得到目标样本的其中一个训练数据后,可以通过向图像采集设备发送调节指令,以使得图像采集摄像通过旋转、平移等操作可以对目标样本的其他视角进行拍摄;或者,在具体实施时,还可以将目标样本放置在可以移动的运动平台上,在该运动平台上设置有运动控制器,训练数据的生成设备通过向运动控制器发送调节指令,以使得运动控制器控制运动平台按照调节指令的指示进行旋转、平移、上升或者下降,从而使得图像采集设备可以对目标样本的其他视角进行拍摄。
为便于理解,下述将举例进行说明。
例如,在采集完目标样本的正视图后,需要采集目标样本的侧视图,这时,可以向运动平台上的运动控制器发送正时针或者逆时针旋转90°的指令,或者,还可以向图像采集设备发送正时针或者逆时针旋转90°的指令,以使得图像采集设备可以采集目标样本侧视图。
另外,在本说明书实施例中,在采集目标样本的图像之前,为了可以采集到目标样本的设定视角的图像,也需要对目标样本的位置或者图像采集设备的位置进行调节。
不管是在采集目标样本的第一张图像,还是在完成第一张图像的采集后,采集目标样本的其他视角的图像之前,都需要对目标样品或者图像采集设备进行调节。因此,在执行上述步骤102之前,本说明书实施例提供的方法还包括如下步骤:
向图像采集设备发送第一调节指令,以使图像采集设备根据第一调节指令的指示旋转或者平移;
或者,
向运动平台所对应的运动控制器发送第二调节指令,以使运动控制器根据第二调节指令的指示控制运动平台旋转或者移动;其中,上述运动平台用于放置目标样本。
在本说明书实施例中,通过向图像采集设备或者运动控制器发送调节指令,可以实现目标样本拍摄视角的自动调节,从而可以实现对目标样本进行多视角的拍摄,并且,不需要用户手动调节图像采集设备或者目标样本的位置即可实现,操作简单方便。
另外,在具体实施时,在向图像采集设备或者运动平台所对应的运动控制器发送调节指令之前,可以检测目标样本当前的位置,以确定是否需要向图像采集设备或者运动平台所对应的运动控制器发送调节指令,以及确定调节指令的具体内容。
具体的,在检测目标样本当前的位置时,可以通过检测目标样本中预设关键点的位置进行目标样本位置的检测。例如,目标样本为灌装可乐,则可以在可乐罐上选择几个关键点,将图像采集设备对准可乐罐,检测预设的几个关键点是否位于图像采集设备的预览拍摄界面上的预设位置处。
另外,为了提高目标样本的数据量、增加目标样本数据的多样性、提高所训练的模型的鲁棒性,因此在执行上述步骤106之前,本说明书实施例提供的方法还包括如下步骤:
对第二图像进行数据增强处理。
具体的,上述对第二图像进行数据增强处理,实际上是对第二图像进行旋转、平移等操作,或者对第二图像进行放大、缩小、色彩抖动等操作,以得到目标样本的多个第二图像,在后续步骤106中,可以对多个第二图像分别进行标注,从而使得目标样本所对应的训练数据具有多样性。
另外,在本说明书实施例中,为了使得拍摄得到的第一图像中目标样本的效果与实际目标样本效果比较接近,在执行上述步骤104之前,本说明书实施例提供的方法还包括如下步骤:
对第一图像进行图像预处理。
具体的,上述对第一图像进行图像预处理具体可以是对第一图像的分辨率、亮度、颜色等参数进行调整,以使得第一图像中目标对象与实际目标对象的效果较接近。
另外,在本说明书实施例中,在采集目标样本的图像之前,还需要对图像采集设备的参数、光照参数、运动平台的运动参数等进行设置,具体的可以根据实际应用场景进行设置。
图3为本说明书实施例提供的训练数据的生成方法的方法流程图之二,图3所示的方法至少包括如下步骤:
步骤302,训练数据的生成设备检测目标样本是否位于设定位置处;若是,则执行步骤306,否则执行步骤304。
其中,在上述步骤302中,可以通过检测目标样本上的预设关键点是否位于RGB摄像头的预览拍摄界面上的预设位置处的方式检测目标样本是否位于设定位置处。
步骤304,训练数据的生成设备向RGB摄像头或者运动平台所对应的运动控制器发送调节指令,以对目标样本的拍摄视角进行调整;其中,运动平台用于放置目标样品。
步骤306,向RGB摄像头发送图像采集指令。
步骤308,RGB摄像头在接收到训练数据的生成设备发送的图像采集指令后,采集目标样本的第一图像,并将采集的图像发送给训练数据的生成设备。
步骤310,训练数据的生成设备提取第一图像中的前景图像,并将前景图像与设定背景图像进行合成。
步骤312,训练数据的生成设备获取目标样本的属性标签。
步骤314,训练数据的生成设备采用绿幕分割和/或静态背景分割的方式对第二图像进行图像分割,确定目标样本所对应的像素点,并生成目标样本所对应的像素点标注图像。
步骤316,训练数据的生成设备将第二图像、属性标签和像素点标注图像确定为目标样本所对应的训练数据,并进行本地存储。
步骤318,训练数据的生成设备将目标样本所有的训练数据上传至云端进行存储。
具体的,图3所对应实施例中各个步骤的具体实现过程与图1、图2所对应方法中各个步骤的实现过程相同,因此,图3所对应实施例中各个步骤的具体实现过程可参考图1、图2所对应实施例,此处不再赘述。
图4为本说明书实施例提供的训练数据的生成方法的方法流程图之三,图4所示的方法至少包括如下步骤:
步骤402,训练数据的生成设备检测目标样本是否位于设定位置处;若是,则执行步骤406,否则执行步骤404。
其中,在上述步骤402中,可以通过检测目标样本上的预设关键点是否位于RGB摄像头和深度摄像头的预览拍摄界面上的预设位置处的方式检测目标样本是否位于设定位置处。
步骤404,训练数据的生成设备向运动平台所对应的运动控制器发送调节指令,以对目标样本的拍摄视角进行调整;其中,运动平台用于放置目标样品。
或者,在步骤404中,图像采集设备还可以向RGB摄像头和深度摄像头发送调节指令,通过调节RGB摄像头和深度摄像头的位置、角度等,实现对目标样本的拍摄视角的调整。
步骤406,向RGB摄像头和深度摄像头发送图像采集指令。
步骤408,RGB摄像头在接收到训练数据的生成设备发送的图像采集指令后,采集目标样本的RGB图像,并将采集的RGB图像发送给训练数据的生成设备;深度摄像头在接收到训练数据的生成设备发送的图像采集指令后,采集目标样本的深度图像,并将采集的深度图像发送给训练数据的生成设备。
步骤410,训练数据的生成设备提取RGB图像中的前景图像,并根据前景图像和深度图像生成虚拟视点图像。
步骤412,训练数据的生成设备将虚拟视点图像与设定背景图像进行合成。
步骤414,训练数据的生成设备获取目标样本的属性标签。
步骤416,训练数据的生成设备采用绿幕分割和/或静态背景分割的方式对第二图像进行图像分割,确定目标样本所对应的像素点,并生成目标样本所对应的像素点标注图像。
步骤418,训练数据的生成设备将第二图像、属性标签和像素点标注图像确定为目标样本所对应的训练数据,并进行本地存储。
步骤420,训练数据的生成设备将目标样本所有的训练数据上传至云端进行存储。
具体的,图4所对应实施例中各个步骤的具体实现过程与图1、图2所对应方法中各个步骤的实现过程相同,因此,图4所对应实施例中各个步骤的具体实现过程可参考图1、图2所对应实施例,此处不再赘述。
本说明书实施例提供的训练数据的生成方法,在生成训练数据时,通过向图像采集设备发送图像采集指令,可以控制图像采集设备采集目标样本的第一图像,实现了目标样本图像的自动采集;另外,在本说明书实施例中,还通过数据标注算法对第二图像中的目标样本进行标注,实现了目标样本的自动标注,提高了数据标注的效率;即通过本说明书实施例,实现了样本数据的自动训练,从而提高了数据训练的效率,降低了人力成本,并且所生成的训练数据准确性较高。
对应于本说明书实施例提供的训练数据的生成方法,基于相同的思路,本说明书实施例提供了一种训练数据的生成装置,用于执行本说明书实施例提供的训练数据的生成方法,图5为本说明书实施例提供的训练数据的生成装置的模块组成示意图,图5所示的装置,包括:
第一发送模块501,用于向图像采集设备发送图像采集指令,以使图像采集设备根据图像采集指令的指示采集目标样本的第一图像;
获取模块502,用于获取第一图像;
替换模块503,用于使用设定背景图像替换第一图像的背景图像,得到目标样本的第二图像;其中,背景图像为第一图像中除目标样本之外的区域;
标注模块504,用于通过数据标注算法对第二图像中的目标样本进行标注,得到训练数据。
可选的,上述标注模块504,包括:
第一确定单元,用于确定目标样本的属性标签;其中,属性标签至少包括目标样本的样本名称;
第一生成单元,用于通过对第二图像进行图像分割,确定目标样本所对应的像素点,并生成目标样本所对应的像素点标注图像;
第二确定单元,用于将第二图像、属性标签和像素点标注图像确定为训练数据。
可选的,本说明书实施例提供的装置还包括:
第二发送模块,用于向图像采集设备发送第一调节指令,以使图像采集设备根据第一调节指令的指示旋转或者平移;
或者,
第三发送模块,用于向运动平台所对应的运动控制器发送第二调节指令,以使运动控制器根据第二调节指令的指示控制运动平台旋转或者移动;其中,运动平台用于放置目标样本。
可选的,上述第一图像为RGB图像;
上述替换模块503,包括:
第一提取单元,用于提取第一图像的前景图像;其中,前景图像为目标样本所对应的区域;
第一合成单元,用于将前景图像与设定背景图像进行合成,得到第二图像。
可选的,上述第一图像包括RGB图像和深度图像;
上述替换模块503,包括:
第二提取单元,用于提取第一图像的前景图像;其中,前景图像为目标样本所对应的区域;
第二生成单元,用于根据前景图像和深度图像,生成前景图像所对应的虚拟视点图像;
第二合成单元,用于将虚拟视点图像与设定背景图像进行合成,得到第二图像。
可选的,本说明书实施例提供的装置还包括:
增强处理模块,用于对上述第二图像进行数据增强处理。
本说明书实施例的训练数据的生成装置还可执行图1-图4中训练数据的生成装置执行的方法,并实现训练数据的生成装置在图1-图4所示实施例的功能,在此不再赘述。
本说明书实施例提供的训练数据的生成装置,在生成训练数据时,通过向图像采集设备发送图像采集指令,可以控制图像采集设备采集目标样本的第一图像,实现了目标样本图像的自动采集;另外,在本说明书实施例中,还通过数据标注算法对第二图像中的目标样本进行标注,实现了目标样本的自动标注,提高了数据标注的效率;即通过本说明书实施例,实现了样本数据的自动训练,从而提高了数据训练的效率,降低了人力成本,并且所生成的训练数据准确性较高。
对应于本说明书实施例提供的训练数据的生成方法,基于相同的思路,本说明书实施例还提供了一种训练数据的生成***,图6为本说明书实施例提供的训练数据的生成***的结构示意图之一,图6所示的***,包括图像采集设备601和图像处理设备602;图像处理设备602包括训练数据的生成装置;
图像采集设备601,用于接收训练数据的生成设备发送的图像采集指令,并根据图像采集指令的指示采集目标样本的第一图像;
图像处理设备602,用于向图像采集设备发送图像采集指令;以及,还用于从图像采集设备获取第一图像,并使用设定背景图像替换第一图像的背景图像,得到目标样本的第二图像;其中,背景图像为第一图像中除目标样本之外的区域;通过数据标注算法对第二图像中的目标样本进行标注,得到训练数据。
可选的,图像处理设备602,具体用于:
确定目标样本的属性标签;其中,属性标签至少包括目标样本的样本名称;通过对第二图像进行图像分割,确定目标样本所对应的像素点,并生成目标样本所对应的像素点标注图像;将第二图像、属性标签和像素点标注图像确定为训练数据。
可选的,图像处理设备602,还用于:
向图像采集设备发送第一调节指令,以使图像采集设备根据第一调节指令的指示旋转或者平移;
或者,
向运动平台所对应的运动控制器发送第二调节指令,以使运动控制器根据第二调节指令的指示控制运动平台旋转或者移动;其中,运动平台用于放置目标样本。
可选的,图像处理设备602,还用于:
对第二图像进行数据增强处理。
可选的,若第一图像为RGB图像,图像处理设备602,还具体用于:
提取第一图像的前景图像;其中,前景图像为目标样本所对应的区域;将前景图像与设定背景图像进行合成,得到第二图像。
可选的,若第一图像包括RGB图像和深度图像;图像处理设备602,还具体用于:
提取第一图像的前景图像;其中,前景图像为目标样本所对应的区域;根据前景图像和深度图像,生成前景图像所对应的虚拟视点图像;将虚拟视点图像与设定背景图像进行合成,得到第二图像。
在一种具体实施方式中,上述训练数据的生成***还包括运动平台603,如图7所示,在进行训练数据生成时,将目标样品放置在运动平台603上,另外,运动平台603与运动控制器604连接,具体的,控制器604可以集成在运行平台上603上,也可以为独立于运动平台603之外的器件。图像处理设备602通过向运动控制器发送调节指令,以控制运动平台603的旋转或者移动。图像处理器602还与图像采集设备601连接,控制图像采集设备601采集目标样本图像以及控制图像采集设备601进行旋转或者平移等。
当然的,图像处理设备602与运动控制器604连接,运动控制器604与运动平台连接,在图像处理设备602的控制下,控制运动平台603进行旋转或者移动。
图7只是示出了训练数据的生成***的一种可能的实现形式,训练数据的生成***的具体形式并不局限于此,本说明书实施例并不对此进行限定。
本说明书实施例提供的训练数据的生成***,在生成训练数据时,图像处理设备通过向图像采集设备发送图像采集指令,可以控制图像采集设备采集目标样本的第一图像,实现了目标样本图像的自动采集;另外,在本说明书实施例中,还通过数据标注算法对第二图像中的目标样本进行标注,实现了目标样本的自动标注,提高了数据标注的效率;即通过本说明书实施例,实现了样本数据的自动训练,从而提高了数据训练的效率,降低了人力成本,并且所生成的训练数据准确性较高。
进一步地,基于上述图1至图4所示的方法,本说明书实施例还提供了一种训练数据的生成设备,如图8所示。
训练数据的生成设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器801和存储器802,存储器802中可以存储有一个或一个以上存储应用程序或数据。其中,存储器802可以是短暂存储或持久存储。存储在存储器802的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对训练数据的生成设备中的一系列计算机可执行指令信息。更进一步地,处理器801可以设置为与存储器802通信,在训练数据的生成设备上执行存储器802中的一系列计算机可执行指令信息。训练数据的生成设备还可以包括一个或一个以上电源803,一个或一个以上有线或无线网络接口804,一个或一个以上输入输出接口805,一个或一个以上键盘806等。
在一个具体的实施例中,训练数据的生成设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对训练数据的生成设备中的一系列计算机可执行指令信息,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令信息:
向图像采集设备发送图像采集指令,以使图像采集设备根据图像采集指令的指示采集目标样本的第一图像;
获取第一图像,并使用设定背景图像替换第一图像的背景图像,得到目标样本的第二图像;其中,背景图像为第一图像中除目标样本之外的区域;
通过数据标注算法对第二图像中的目标样本进行标注,得到训练数据。
可选的,计算机可执行指令信息在被执行时,通过数据标注算法对第二图像中的目标样本进行标注,得到训练数据,包括:
确定目标样本的属性标签;其中,属性标签至少包括目标样本的样本名称;
通过对第二图像进行图像分割,确定目标样本所对应的像素点,并生成目标样本所对应的像素点标注图像;
将第二图像、属性标签和像素点标注图像确定为训练数据。
可选的,计算机可执行指令信息在被执行时,向图像采集设备发送图像采集指令之前,还可执行如下步骤:
向图像采集设备发送第一调节指令,以使图像采集设备根据第一调节指令的指示旋转或者平移;
或者,
向运动平台所对应的运动控制器发送第二调节指令,以使运动控制器根据第二调节指令的指示控制运动平台旋转或者移动;其中,运动平台用于放置目标样本。
可选的,计算机可执行指令信息在被执行时,通过数据标注算法对第二图像中的目标样本进行标注,得到训练数据之前,还可以执行如下步骤:
对第二图像进行数据增强处理。
可选的,计算机可执行指令信息在被执行时,第一图像为RGB图像;
相应的,使用设定背景图像替换第一图像的背景图像,得到目标样本的第二图像,包括:
提取第一图像的前景图像;其中,前景图像为目标样本所对应的区域;
将前景图像与设定背景图像进行合成,得到第二图像。
可选的,计算机可执行指令信息在被执行时,第一图像包括RGB图像和深度图像;
相应的,使用设定背景图像替换第一图像的背景图像,得到目标样本的第二图像,包括:
提取第一图像的前景图像;其中,前景图像为目标样本所对应的区域;
根据前景图像和深度图像,生成前景图像所对应的虚拟视点图像;
将虚拟视点图像与设定背景图像进行合成,得到第二图像。
本说明书实施例提供的训练数据的生成设备,在生成训练数据时,通过向图像采集设备发送图像采集指令,可以控制图像采集设备采集目标样本的第一图像,实现了目标样本图像的自动采集;另外,在本说明书实施例中,还通过数据标注算法对第二图像中的目标样本进行标注,实现了目标样本的自动标注,提高了数据标注的效率;即通过本说明书实施例,实现了样本数据的自动训练,从而提高了数据训练的效率,降低了人力成本,并且所生成的训练数据准确性较高。
进一步地,基于上述图1至图4所示的方法,本说明书实施例还提供了一种存储介质,用于存储计算机可执行指令信息,一种具体的实施例中,该存储介质可以为U盘、光盘、硬盘等,该存储介质存储的计算机可执行指令信息在被处理器执行时,能实现以下流程:
向图像采集设备发送图像采集指令,以使图像采集设备根据图像采集指令的指示采集目标样本的第一图像;
获取第一图像,并使用设定背景图像替换第一图像的背景图像,得到目标样本的第二图像;其中,背景图像为第一图像中除目标样本之外的区域;
通过数据标注算法对第二图像中的目标样本进行标注,得到训练数据。
可选的,该存储介质存储的计算机可执行指令信息在被处理器执行时,通过数据标注算法对第二图像中的目标样本进行标注,得到训练数据,包括:
确定目标样本的属性标签;其中,属性标签至少包括目标样本的样本名称;
通过对第二图像进行图像分割,确定目标样本所对应的像素点,并生成目标样本所对应的像素点标注图像;
将第二图像、属性标签和像素点标注图像确定为训练数据。
可选的,该存储介质存储的计算机可执行指令信息在被处理器执行时,向图像采集设备发送图像采集指令之前,还可执行如下步骤:
向图像采集设备发送第一调节指令,以使图像采集设备根据第一调节指令的指示旋转或者平移;
或者,
向运动平台所对应的运动控制器发送第二调节指令,以使运动控制器根据第二调节指令的指示控制运动平台旋转或者移动;其中,运动平台用于放置目标样本。
可选的,该存储介质存储的计算机可执行指令信息在被处理器执行时,通过数据标注算法对第二图像中的目标样本进行标注,得到训练数据之前,还可以执行如下步骤:
对第二图像进行数据增强处理。
可选的,该存储介质存储的计算机可执行指令信息在被处理器执行时,第一图像为RGB图像;
相应的,使用设定背景图像替换第一图像的背景图像,得到目标样本的第二图像,包括:
提取第一图像的前景图像;其中,前景图像为目标样本所对应的区域;
将前景图像与设定背景图像进行合成,得到第二图像。
可选的,该存储介质存储的计算机可执行指令信息在被处理器执行时,第一图像包括RGB图像和深度图像;
相应的,使用设定背景图像替换第一图像的背景图像,得到目标样本的第二图像,包括:
提取第一图像的前景图像;其中,前景图像为目标样本所对应的区域;
根据前景图像和深度图像,生成前景图像所对应的虚拟视点图像;
将虚拟视点图像与设定背景图像进行合成,得到第二图像。
本说明书实施例提供的存储介质存储的计算机可执行指令信息在被处理器执行时,在生成训练数据时,通过向图像采集设备发送图像采集指令,可以控制图像采集设备采集目标样本的第一图像,实现了目标样本图像的自动采集;另外,在本说明书实施例中,还通过数据标注算法对第二图像中的目标样本进行标注,实现了目标样本的自动标注,提高了数据标注的效率;即通过本说明书实施例,实现了样本数据的自动训练,从而提高了数据训练的效率,降低了人力成本,并且所生成的训练数据准确性较高。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字***“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、MicrochIP地址PIC18F26K20以及Silicone LabsC8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本说明书实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令信息实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令信息到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令信息产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令信息也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令信息产生包括指令信息装置的制造品,该指令信息装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令信息也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令信息提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令信息、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、***或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请可以在由计算机执行的计算机可执行指令信息的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (14)

1.一种训练数据的生成方法,所述方法包括:
向图像采集设备发送图像采集指令,以使所述图像采集设备根据所述图像采集指令的指示采集目标样本的第一图像;
获取所述第一图像,并使用设定背景图像替换所述第一图像的背景图像,得到所述目标样本的第二图像;其中,所述背景图像为所述第一图像中除所述目标样本之外的区域;
通过数据标注算法对所述第二图像中的目标样本进行标注,得到所述训练数据。
2.如权利要求1所述的方法,所述通过数据标注算法对所述第二图像中的目标样本进行标注,得到所述训练数据,包括:
确定所述目标样本的属性标签;其中,所述属性标签至少包括所述目标样本的样本名称;
通过对所述第二图像进行图像分割,确定所述目标样本所对应的像素点,并生成所述目标样本所对应的像素点标注图像;
将所述第二图像、所述属性标签和所述像素点标注图像确定为所述训练数据。
3.如权利要求1所述的方法,所述向图像采集设备发送图像采集指令之前,所述方法还包括:
向所述图像采集设备发送第一调节指令,以使所述图像采集设备根据所述第一调节指令的指示旋转或者平移;
或者,
向运动平台所对应的运动控制器发送第二调节指令,以使所述运动控制器根据所述第二调节指令的指示控制所述运动平台旋转或者移动;其中,所述运动平台用于放置所述目标样本。
4.如权利要求1所述的方法,所述通过数据标注算法对所述第二图像中的目标样本进行标注,得到所述训练数据之前,所述方法还包括:
对所述第二图像进行数据增强处理。
5.如权利要求1-4任一项所述的方法,所述第一图像为RGB图像;
相应的,所述使用设定背景图像替换所述第一图像的背景图像,得到所述目标样本的第二图像,包括:
提取所述第一图像的前景图像;其中,所述前景图像为所述目标样本所对应的区域;
将所述前景图像与所述设定背景图像进行合成,得到所述第二图像。
6.如权利要求1-4任一项所述的方法,所述第一图像包括RGB图像和深度图像;
相应的,所述使用设定背景图像替换所述第一图像的背景图像,得到所述目标样本的第二图像,包括:
提取所述第一图像的前景图像;其中,所述前景图像为所述目标样本所对应的区域;
根据所述前景图像和所述深度图像,生成所述前景图像所对应的虚拟视点图像;
将所述虚拟视点图像与所述设定背景图像进行合成,得到所述第二图像。
7.一种训练数据的生成装置,所述装置包括:
第一发送模块,用于向图像采集设备发送图像采集指令,以使所述图像采集设备根据所述图像采集指令的指示采集目标样本的第一图像;
获取模块,用于获取所述第一图像;
替换模块,用于使用设定背景图像替换所述第一图像的背景图像,得到所述目标样本的第二图像;其中,所述背景图像为所述第一图像中除所述目标样本之外的区域;
标注模块,用于通过数据标注算法对所述第二图像中的目标样本进行标注,得到所述训练数据。
8.如权利要求7所述的装置,所述标注模块,包括:
第一确定单元,用于确定所述目标样本的属性标签;其中,所述属性标签至少包括所述目标样本的样本名称;
第一生成单元,用于通过对所述第二图像进行图像分割,确定所述目标样本所对应的像素点,并生成所述目标样本所对应的像素点标注图像;
第二确定单元,用于将所述第二图像、所述属性标签和所述像素点标注图像确定为所述训练数据。
9.如权利要求7所述的装置,所述装置还包括:
第二发送模块,用于向所述图像采集设备发送第一调节指令,以使所述图像采集设备根据所述第一调节指令的指示旋转或者平移;
或者,
第三发送模块,用于向运动平台所对应的运动控制器发送第二调节指令,以使所述运动控制器根据所述第二调节指令的指示控制所述运动平台旋转或者移动;其中,所述运动平台用于放置所述目标样本。
10.如权利要求7-9任一项所述的装置,所述第一图像为RGB图像;
所述替换模块,包括:
第一提取单元,用于提取所述第一图像的前景图像;其中,所述前景图像为所述目标样本所对应的区域;
第一合成单元,用于将所述前景图像与所述设定背景图像进行合成,得到所述第二图像。
11.如权利要求7-9任一项所述的装置,所述第一图像包括RGB图像和深度图像;
所述替换模块,包括:
第二提取单元,用于提取所述第一图像的前景图像;其中,所述前景图像为所述目标样本所对应的区域;
第二生成单元,用于根据所述前景图像和所述深度图像,生成所述前景图像所对应的虚拟视点图像;
第二合成单元,用于将所述虚拟视点图像与所述设定背景图像进行合成,得到所述第二图像。
12.一种训练数据的生成***,包括图像采集设备和图像处理设备;所述图像处理设备包括所述训练数据的生成装置;
所述图像采集设备,用于接收所述训练数据的生成设备发送的图像采集指令,并根据所述图像采集指令的指示采集目标样本的第一图像;
所述图像处理设备,用于向所述图像采集设备发送图像采集指令;以及,还用于从所述图像采集设备获取所述第一图像,并使用设定背景图像替换所述第一图像的背景图像,得到所述目标样本的第二图像;其中,所述背景图像为所述第一图像中除所述目标样本之外的区域;通过数据标注算法对所述第二图像中的目标样本进行标注,得到所述训练数据。
13.一种训练数据的生成设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
向图像采集设备发送图像采集指令,以使所述图像采集设备根据所述图像采集指令的指示采集目标样本的第一图像;
获取所述第一图像,并使用设定背景图像替换所述第一图像的背景图像,得到所述目标样本的第二图像;其中,所述背景图像为所述第一图像中除所述目标样本之外的区域;
通过数据标注算法对所述第二图像中的目标样本进行标注,得到训练数据。
14.一种存储介质,用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:
向图像采集设备发送图像采集指令,以使所述图像采集设备根据所述图像采集指令的指示采集目标样本的第一图像;
获取所述第一图像,并使用设定背景图像替换所述第一图像的背景图像,得到所述目标样本的第二图像;其中,所述背景图像为所述第一图像中除所述目标样本之外的区域;
通过数据标注算法对所述第二图像中的目标样本进行标注,得到训练数据。
CN201811260697.0A 2018-10-26 2018-10-26 训练数据的生成方法、装置及*** Active CN109614983B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811260697.0A CN109614983B (zh) 2018-10-26 2018-10-26 训练数据的生成方法、装置及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811260697.0A CN109614983B (zh) 2018-10-26 2018-10-26 训练数据的生成方法、装置及***

Publications (2)

Publication Number Publication Date
CN109614983A true CN109614983A (zh) 2019-04-12
CN109614983B CN109614983B (zh) 2023-06-16

Family

ID=66002359

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811260697.0A Active CN109614983B (zh) 2018-10-26 2018-10-26 训练数据的生成方法、装置及***

Country Status (1)

Country Link
CN (1) CN109614983B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110060265A (zh) * 2019-05-15 2019-07-26 北京艺泉科技有限公司 一种从书画文物图像中分割并提取***的方法
CN110070540A (zh) * 2019-04-28 2019-07-30 腾讯科技(深圳)有限公司 图像生成方法、装置、计算机设备及存储介质
CN110287850A (zh) * 2019-06-20 2019-09-27 北京三快在线科技有限公司 一种模型训练以及目标物识别的方法及装置
CN110866504A (zh) * 2019-11-20 2020-03-06 北京百度网讯科技有限公司 标注数据的获取方法、装置和设备
CN111383267A (zh) * 2020-03-03 2020-07-07 重庆金山医疗技术研究院有限公司 一种目标重定位方法、设备及存储介质
CN111402334A (zh) * 2020-03-16 2020-07-10 深圳前海达闼云端智能科技有限公司 数据生成方法、装置及计算机可读存储介质
CN111783874A (zh) * 2020-06-29 2020-10-16 联想(北京)有限公司 一种样本生成方法、样本训练方法及装置
CN112802049A (zh) * 2021-03-04 2021-05-14 山东大学 一种家庭物品检测数据集构建方法及***
CN113012176A (zh) * 2021-03-17 2021-06-22 北京百度网讯科技有限公司 样本图像的处理方法、装置、电子设备及存储介质
CN113570534A (zh) * 2021-07-30 2021-10-29 山东大学 一种用于深度学习的物品识别数据集扩充方法及***
CN113688887A (zh) * 2021-08-13 2021-11-23 百度在线网络技术(北京)有限公司 图像识别模型的训练与图像识别方法、装置
CN115861739A (zh) * 2023-02-08 2023-03-28 海纳云物联科技有限公司 图像分割模型的训练方法、装置、设备、存储介质及产品

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103024421A (zh) * 2013-01-18 2013-04-03 山东大学 自由视点电视中的虚拟视点合成方法
US20160027187A1 (en) * 2014-07-23 2016-01-28 Xiaomi Inc. Techniques for image segmentation
CN106162137A (zh) * 2016-06-30 2016-11-23 北京大学 虚拟视点合成方法及装置
US20170262735A1 (en) * 2016-03-11 2017-09-14 Kabushiki Kaisha Toshiba Training constrained deconvolutional networks for road scene semantic segmentation
CN108010034A (zh) * 2016-11-02 2018-05-08 广州图普网络科技有限公司 商品图像分割方法及装置
CN108388833A (zh) * 2018-01-15 2018-08-10 阿里巴巴集团控股有限公司 一种图像识别方法、装置及设备
CN108492343A (zh) * 2018-03-28 2018-09-04 东北大学 一种扩充目标识别的训练数据的图像合成方法
CN108520223A (zh) * 2018-04-02 2018-09-11 广州华多网络科技有限公司 视频图像的分割方法、分割装置、存储介质和终端设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103024421A (zh) * 2013-01-18 2013-04-03 山东大学 自由视点电视中的虚拟视点合成方法
US20160027187A1 (en) * 2014-07-23 2016-01-28 Xiaomi Inc. Techniques for image segmentation
US20170262735A1 (en) * 2016-03-11 2017-09-14 Kabushiki Kaisha Toshiba Training constrained deconvolutional networks for road scene semantic segmentation
CN106162137A (zh) * 2016-06-30 2016-11-23 北京大学 虚拟视点合成方法及装置
CN108010034A (zh) * 2016-11-02 2018-05-08 广州图普网络科技有限公司 商品图像分割方法及装置
CN108388833A (zh) * 2018-01-15 2018-08-10 阿里巴巴集团控股有限公司 一种图像识别方法、装置及设备
CN108492343A (zh) * 2018-03-28 2018-09-04 东北大学 一种扩充目标识别的训练数据的图像合成方法
CN108520223A (zh) * 2018-04-02 2018-09-11 广州华多网络科技有限公司 视频图像的分割方法、分割装置、存储介质和终端设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHEONG_KG: "【数字图像处理系列四】图像数据集增强方式总结和实现", HTTPS://BLOG.CSDN.NET/FEILONG_CSDN/ARTICLE/DETAILS/82813382 *
全文: "Data Augmentation for Bounding Boxes: Rethinking Image Transforms for Object Detection", HTTPS://BLOG.PAPERSPACE.COM/DATA-AUGMENTATION-FOR-BOUNDING-BOXES/ *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110070540B (zh) * 2019-04-28 2023-01-10 腾讯科技(深圳)有限公司 图像生成方法、装置、计算机设备及存储介质
CN110070540A (zh) * 2019-04-28 2019-07-30 腾讯科技(深圳)有限公司 图像生成方法、装置、计算机设备及存储介质
CN110060265A (zh) * 2019-05-15 2019-07-26 北京艺泉科技有限公司 一种从书画文物图像中分割并提取***的方法
CN110287850A (zh) * 2019-06-20 2019-09-27 北京三快在线科技有限公司 一种模型训练以及目标物识别的方法及装置
CN110866504A (zh) * 2019-11-20 2020-03-06 北京百度网讯科技有限公司 标注数据的获取方法、装置和设备
CN110866504B (zh) * 2019-11-20 2023-10-17 北京百度网讯科技有限公司 标注数据的获取方法、装置和设备
CN111383267A (zh) * 2020-03-03 2020-07-07 重庆金山医疗技术研究院有限公司 一种目标重定位方法、设备及存储介质
CN111383267B (zh) * 2020-03-03 2024-04-05 重庆金山医疗技术研究院有限公司 一种目标重定位方法、设备及存储介质
CN111402334A (zh) * 2020-03-16 2020-07-10 深圳前海达闼云端智能科技有限公司 数据生成方法、装置及计算机可读存储介质
CN111402334B (zh) * 2020-03-16 2024-04-02 达闼机器人股份有限公司 数据生成方法、装置及计算机可读存储介质
CN111783874A (zh) * 2020-06-29 2020-10-16 联想(北京)有限公司 一种样本生成方法、样本训练方法及装置
CN112802049A (zh) * 2021-03-04 2021-05-14 山东大学 一种家庭物品检测数据集构建方法及***
CN112802049B (zh) * 2021-03-04 2022-10-11 山东大学 一种家庭物品检测数据集构建方法及***
CN113012176A (zh) * 2021-03-17 2021-06-22 北京百度网讯科技有限公司 样本图像的处理方法、装置、电子设备及存储介质
CN113012176B (zh) * 2021-03-17 2023-12-15 阿波罗智联(北京)科技有限公司 样本图像的处理方法、装置、电子设备及存储介质
CN113570534A (zh) * 2021-07-30 2021-10-29 山东大学 一种用于深度学习的物品识别数据集扩充方法及***
CN113688887A (zh) * 2021-08-13 2021-11-23 百度在线网络技术(北京)有限公司 图像识别模型的训练与图像识别方法、装置
CN115861739A (zh) * 2023-02-08 2023-03-28 海纳云物联科技有限公司 图像分割模型的训练方法、装置、设备、存储介质及产品

Also Published As

Publication number Publication date
CN109614983B (zh) 2023-06-16

Similar Documents

Publication Publication Date Title
CN109614983A (zh) 训练数据的生成方法、装置及***
CN108401112B (zh) 图像处理方法、装置、终端及存储介质
Dash et al. Designing of marker-based augmented reality learning environment for kids using convolutional neural network architecture
CN105493078B (zh) 彩色草图图像搜索
US20220319130A1 (en) Method for simulating natural perception in virtual and augmented reality scenes
US20200410211A1 (en) Facial image processing method and apparatus, electronic device and computer readable storage medium
CN108107571A (zh) 图像处理装置及方法及非暂时性计算机可读记录介质
CN111638784B (zh) 人脸表情互动方法、互动装置以及计算机存储介质
KR101923177B1 (ko) 사용자 기반의 증강 현실 정보를 제공하기 위한 장치 및 방법
CN111160261A (zh) 用于自动售货柜的样本图像标注方法、装置及存储介质
WO2024001095A1 (zh) 面部表情识别方法、终端设备及存储介质
US20220101578A1 (en) Generating composite images with objects from different times
CN107808372B (zh) 图像穿越处理方法、装置、计算设备及计算机存储介质
CN110751668B (zh) 图像处理方法、装置、终端、电子设备及可读存储介质
CN109815854A (zh) 一种用于在用户设备上呈现图标的关联信息的方法与设备
US20230353701A1 (en) Removing objects at image capture time
JP7310123B2 (ja) 撮影装置及びプログラム
Kim et al. PicMe: interactive visual guidance for taking requested photo composition
CN107743263B (zh) 视频数据实时处理方法及装置、计算设备
CN111783881A (zh) 基于预训练模型的场景适配学习方法及***
CN110177216A (zh) 图像处理方法、装置、移动终端以及存储介质
CN110012226A (zh) 一种电子设备及其图像处理方法
WO2023283894A1 (zh) 图像处理方法及装置
WO2023039327A1 (en) Display of digital media content on physical surface
CN111223192B (zh) 一种图像处理方法及其应用方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant