CN112926503B - 一种基于矩形拟合的抓取数据集自动生成方法 - Google Patents
一种基于矩形拟合的抓取数据集自动生成方法 Download PDFInfo
- Publication number
- CN112926503B CN112926503B CN202110307109.XA CN202110307109A CN112926503B CN 112926503 B CN112926503 B CN 112926503B CN 202110307109 A CN202110307109 A CN 202110307109A CN 112926503 B CN112926503 B CN 112926503B
- Authority
- CN
- China
- Prior art keywords
- grabbing
- image
- rectangle
- fitting
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000004519 manufacturing process Methods 0.000 claims abstract description 15
- 238000005070 sampling Methods 0.000 claims abstract description 10
- 238000012163 sequencing technique Methods 0.000 claims abstract description 10
- 230000009466 transformation Effects 0.000 claims abstract description 9
- 230000002194 synthesizing effect Effects 0.000 claims description 5
- 238000013480 data collection Methods 0.000 claims description 4
- 238000011410 subtraction method Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 2
- 238000002372 labelling Methods 0.000 abstract description 3
- 238000012549 training Methods 0.000 abstract description 3
- 238000013136 deep learning model Methods 0.000 abstract description 2
- 239000012636 effector Substances 0.000 abstract description 2
- 239000013598 vector Substances 0.000 description 18
- 230000006870 function Effects 0.000 description 5
- 239000002131 composite material Substances 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000001154 acute effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 210000000078 claw Anatomy 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000036544 posture Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000031068 symbiosis, encompassing mutualism through parasitism Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于矩形拟合的抓取数据集自动生成方法,采用机械臂末端执行器夹持物体边缘,驱动物体绕其中心旋转,通过相机采集物体各角度的图像;确定物体区域,生成物体掩码;检测目标物体的轮廓信息;对图像进行霍夫变换,检测物体轮廓中的直线,并对短线段进行合并;对直线长度进行排序,按直线长度检测对应平行线,利用多个矩形拟合物体轮廓;将拟合矩形按照等间距采样方式生成多个适用于双指手爪的抓取矩形;组合背景图像和物体图像生成抓取数据集图像,同时生成对应标签。本发明操作简单、实现方便快速,不需要额外设备。解决了抓取任务中数据集手动标注工作费时费力的问题,为抓取任务中深度学习模型所需训练集的制作提供了便利途径。
Description
技术领域
本发明属于机器人领域,具体地,涉及一种基于矩形拟合的抓取数据集自动生成方法。
背景技术
随着计算机视觉和人工智能的发展,机器人技术受到越来越多的关注,其中智能机器人更被认为是未来的主流发展方向。近年来,在机器人领域的期刊和会议上提出了多种用于检测物体抓取姿态的方法,尤其是在深度学习的框架下对场景物体抓取位姿的检测,需要一个拥有标注信息的庞大目标抓取数据集,用于模型的训练和测试。数据集中需要具有物体图像信息以及对应的多种抓取姿态。
在机器人领域,现有的抓取检测数据集有Cornell Grasp Dataset、JacquardDataset、VMRD等,这些数据集都是由研究人员手动标注。数据集中每个样本可能包含多个物体,并且每个物体存在多种可能的抓取姿态,手动制作抓取数据集费时费力,受人类主观性影响,标注的抓取数据集具有一定趋向性,标注的抓取位置只包含可用抓取位置的一部分,不能全面的表示物体的抓取位置。
发明内容
本发明的目的是针对现有抓取数据集制作过程中的问题,提供一种基于矩形拟合的抓取数据集自动生成方法。操作简单,省时省力,能够在短时间内完成抓取数据库的制作工作。
为达到上述目的,本发明采用的技术方案是:
一种基于矩形拟合的抓取数据集自动生成方法,包括如下步骤:
步骤一,物体图像采集:
通过机械臂与相机相结合的方式,完成物体多角度图像信息的采集;
步骤二,确定物体区域,生成物体掩码:
根据数据收集***中各部件之间的位置关系,初步确定物体所在图像中的大致位置,去除大部分背景噪声;利用背景相减法从背景中分割出物体区域,获得物体掩码;
步骤三,检测目标物体轮廓信息:
利用canny算子检测物体边缘,将物体轮廓通过大量短线条表示;
步骤四,霍夫变换检测直线:
对物体轮廓曲线进行霍夫变换,检测物体轮廓中直线,并对其中满足合并条件的线段进行整合,减少线条数量;
步骤五,利用多个矩形拟合轮廓:
根据直线长度对直线进行排序,按直线长度排序依次检测对应平行线;用于拟合物体轮廓的矩形需要同时满足四个条件:
①、两条线段夹角小于20°;
②、平行线之间距离大于阈值th1=50;
③、平行线之间像素个数不为零;
④、较短线段在较长线段上存在投影;
将同时满足以上①-④条件的平行线进行相互投影,生成多个矩形用于拟合物体轮廓;
步骤六,生成抓取矩形:
根据手指宽度w,在拟合矩形上按等间距采样的方式生成多个适用于双指手爪的抓取矩形;
步骤七,合成抓取数据集图像,制作抓取数据集:
利用在步骤二中生成的物体掩码,将物体的彩色图像和预设多种背景进行组合,生成多种抓取数据集图像,同时根据物体在图像中的位置和在步骤六中生成的抓取矩形,为数据集中的所有样本制作标签文件。
优选地,在所述步骤一中的数据采集用的是机械臂与相机相结合的方式,相机通过框架安装在背景桌面的正上方、竖直向下。为便于后期物体分割,背景桌面为单一颜色,在此选择白色。控制手爪夹持物体边缘并使物***于相机正下方,驱动物体分别绕手爪坐标系的X、Y、Z三个坐标轴各旋转正负30度,待***稳定后相机采集物体图像。
优选地,所述步骤二中,利用相机和机械臂之间的关系,通过运动学正解计算机械臂坐标系下两指尖连线的中点位置(X,Y,Z)在图像中的坐标(u,v),以此确定物体在图像中的位置:
其中,表示机械臂坐标系相对于相机坐标系的关系,fx,fy,cx,cy为相机内参。假设目标物体小于边长为20cm的立方体,通过对立方体进行投影可确定目标在图像中所处的区域,裁剪能够包含该区域的最小正方形,假设边长为e。该区域内仅包含目标物体、背景图像,然后将图像减去背景,设置阈值thv为10,其中差值小于阈值的部分便为物体区域。
优选地,在所述步骤三中,对步骤二中获得的物体掩码图像进行边缘检测,使用Canny算子检测物体边缘,计算图像中所有点的梯度值。若梯度值小于100的点设置为非边界点,梯度值大于150的点设置为边界点。位于区间内的点根据相邻点是否为边界点判断其性质,若与边界点相邻则认为是边界点,若与非边界点相邻则为非边界点。
优选地,在所述步骤四中,通过霍夫变换将轮廓上所有点映射到霍夫空间中,霍夫空间中点对应为图像空间中的直线,统计霍夫空间中各交点对应直线的数量,将大于阈值thc的点映射出图像空间中的直线,在此thc=30。然后计算任意两条线段之间的夹角和两条线段相邻最近两点的距离判断是否可以合并,若两线段所在直线夹角小于10°并且最近点之间距离小于20像素,则认为两条线段都为真实线段的一部分。经过两两匹配生成k个可用于合并的线段对。然后对k个线段对进行聚类,将具有匹配关系的所有线段聚为一类。计算每类直线上所有点构成的最小外接矩形,连接矩形中两条短边的中点用于表示合并后的直线。
优选地,在所述步骤五中,对合并后的所有直线长度进行排序,优先使用较长的直线生成矩形。依次判断较长直线与剩余直线是否可以生成用于拟合物体的矩形,拟合物体的矩形需要满足以下条件:
一、两条线段为平行线;
二、平行线之间距离大于阈值th1=50;
三、平行线之间非空;
四、较短线段在较长线段上存在投影。
根据以上条件建立拟合矩形。利用向量之间的夹角余计算夹角两条线段中点之间的距离简化表示两线段之间的距离;分别将其中一条线段的两个端点与另外一条线段的两个端点连接形成四个向量,若其中一条线段的两个端点生成的向量都至少存在一个向量与线段本身构成锐角,则说明两线段之间互相存在投影。连接两条线段对应端点构成一个四边形,统计四边形内非零点的个数n。若不能同时满足以上四个条件,则判断下一条直线,直至遍历完全部直线。对于符合条件的直线,计算较短线段在较长线段上的投影点,若不存在投影点则过长线段该侧端点向短线度做垂线,交点更新为短线段的端点。计算拟合矩形的中点、旋转角度、宽和高,中点的横纵坐标分别为线段四个端点横纵坐标的平均值,旋转角θr为两条线段与水平线形成夹角的平均值,宽W等于线段中点间的距离,高H为线段中较短的长度值。
优选地,在所述步骤六中,测量手指宽度w,根据手眼关系计算手指在图像中投影宽度w'。以w'/2为步长,沿拟合矩形中边H所在的方向,从矩形一端采样到另一端生成多个抓取矩形。抓取矩形的宽度wg=w',高抓取矩形与拟合矩形轴线相互垂直。抓取矩形中心点落在拟合矩形的轴线上,并保证抓取矩形不超出拟合矩形范围。
优选地,在所述步骤七中,选择单色背景和杂乱背景两种情况作为背景。利用在步骤二中获得物体掩码裁剪图像中的物体区域,然后粘贴到背景图像上中心位置并旋转θ▽,θ▽按间隔30°从0-360°取值,单一物体共生成2*12=24个样本。对于彩色图像,直接利用物体图像替换背景,当掩码取值为真时IB(x,y)=IF(x,y),其它位置取值保持不变。对于深度图像,在背景数值的基础上减去物体区域数值,当掩码取值为真时IB(x,y)=IB(x,y)-IF(x,y),其它位置取值保持不变。根据物体在背景图像中的位置和角度以及在步骤六中获得的抓取矩形,计算合成图像中物体的抓取矩形(c'x,c'y,w'g,h'g,θ'g),其中表示合成图像中抓取矩形中心点的横坐标,/>表示中心点的纵坐标,w'g=wg表示抓取矩形中手指的宽度,h'g=hg表示抓取矩形中手爪的开口大小,θ'g=θg+θ▽表示抓取矩形与图像水平轴的夹角。
本发明与现有技术相比较,具有如下显而易见的突出实质性特点和显著的优点:
1.本发明对于抓取数据集的制作操作简单、省时,中间仅需要人工夹取物体,不需要过多的人工干预,能够在最短时间内完成抓取数据集的制作工作;
2.本发明方法简单,效率高,易于实现。
附图说明
图1是本发明的流程图。
图2是本发明数据采集***示意图。
图3是本发明拟合矩形计算示意图。
图4是本发明抓取框采样示意图。
图5是本发明物体分割结果示意图。
图6是本发明轮廓检测示意图。
图7是本发明矩形拟合结果示意图。
图8是本发明抓取数据集样例示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的说明:
实施例一:
参见图1,一种基于矩形拟合的抓取数据集自动生成方法,包括如下步骤:
步骤一,物体图像采集:
通过机械臂与相机相结合的方式,完成物体多角度图像信息的采集;
步骤二,确定物体区域,生成物体掩码:
根据数据收集***中各部件之间的位置关系,初步确定物体所在图像中的大致位置,去除大部分背景噪声;利用背景相减法从背景中分割出物体区域,获得物体掩码;
步骤三,检测目标物体轮廓信息:
利用canny算子检测物体边缘,将物体轮廓通过大量短线条表示;
步骤四,霍夫变换检测直线:
对物体轮廓曲线进行霍夫变换,检测物体轮廓中直线,并对其中满足合并条件的线段进行整合,减少线条数量;
步骤五,利用多个矩形拟合轮廓:
根据直线长度对直线进行排序,按直线长度排序依次检测对应平行线;用于拟合物体轮廓的矩形需要同时满足四个条件:
①、两条线段夹角小于20°;
②、平行线之间距离大于阈值th1=50;
③、平行线之间像素个数不为零;
④、较短线段在较长线段上存在投影;
将同时满足以上①-④条件的平行线进行相互投影,生成多个矩形用于拟合物体轮廓;
步骤六,生成抓取矩形:
根据手指宽度w,在拟合矩形上按等间距采样的方式生成多个适用于双指手爪的抓取矩形;
步骤七,合成抓取数据集图像,制作抓取数据集:
利用在步骤二中生成的物体掩码,将物体的彩色图像和预设多种背景进行组合,生成多种抓取数据集图像,同时根据物体在图像中的位置和在步骤六中生成的抓取矩形,为数据集中的所有样本制作标签文件。
本实施例方法对于抓取数据集的制作操作简单、省时,中间仅需要人工夹取物体,不需要过多的人工干预,能够在最短时间内完成抓取数据集的制作工作。
实施例二:
本实施例与实施例一基本相同,特别之处如下:
在所述步骤一中,利用固定的Kinect相机作为数据采集设备,通过机械臂末端手爪夹持物体改变物体姿态,采集多种角度下物体的图像信息。
在所述步骤五中,利用构成矩形的四个条件,检测任意两条平行线是否可以用于合成拟合矩形,通过相互投影的方式由两条平行线建立拟合矩形。
在所述步骤六中,以手指宽度的投影w作为抓取矩形的宽,以6/5倍的拟合矩形的H作为抓取矩形的高h,并沿拟合矩形H边以间隔为0.5w进行采样构建抓取矩形。
5在所述步骤七中,将物体图像与背景图像合并构成抓取数据集图像,并根据物体图像在背景中的位置生成抓取参数。
本实施例基于矩形拟合的抓取数据集自动生成方法操作简单,省时省力,能够在短时间内完成抓取数据库的制作工作。
实施例三:
参见图1~图8,一种基于矩形拟合的抓取数据集自动生成方法,包括如下操作步骤:
步骤一,按照图2所示结构搭建数据收集***,相机通过框架安装在背景桌面的正上方、竖直向下,机械臂固定在桌面上。为便于后期物体分割,选择白色桌面背景。相机通过L转USB数据线连接计算机,机械臂控制器通过双绞线连接计算机。待所有硬件连接成功后为所有设备上电,并初始化数据采集***。手动控制机械臂手爪夹持待收集物体边缘,并拖动到相机正下方,驱动物体分别绕手爪坐标系的X、Y、Z三个坐标轴各旋转正负30度,待***稳定后相机采集物体图像。
步骤二,在两指尖连线的中点位置建立坐标系,利用相机和机械臂之间的位姿关系计算指尖在图像中的投影点,以此确定物体所在大致位置。建立一个边长为e为50像素的矩形,与图像边缘平行,指尖的投影点位于矩形轴线的3/4处,以此矩形限制物体所在区域。该区域内仅包含目标物体和背景图像,然后将图像减去背景,设置阈值thv为10,其中差值小于阈值的部分便为物体区域,效果如图5所示。
步骤三,对步骤二中获得的物体掩码图像利用OpenCV中提供的cvCanny()函数检测物体边缘。将掩码图像作为函数输入,并设置参数threshold1=100,threshold2=150,aperture_size=3。输出与输入尺寸相同的二维矩阵,物体轮廓位置用‘1’表示,其他部分用‘0’表示,效果如图6所示。
步骤四,利用OpenCV中提供的概率霍夫变换函数HoughLinesP()检测轮廓中可能为直线的点集。以步骤三中的输出为输入,设置搜索步长rho=2,搜索弧度间隔theta=pi/180,累计点数量threshold=30,线段最大间隔maxLineGap=10,线段最小长度minLineLength=100。函数输出为由多个线段组成的二维矩阵L,第一维表示检测到的线段数量,第二维是每条线段两个端点的横纵坐标。为简化线段整合时的计算量,首先对线段进行聚类。首先初始化一个集合S用于保存整合后直线段所用到的线段,依次从检测到的所有线段中提取一条,并从L中删除该线段。判断S中是否存在可以与之合并的线段,若存在则将该线段添加到对应的线段集合中,否则建立一个新的线段集合,直至遍历完检测到的全部线段。计算每类直线上所有点构成的最小外接矩形,连接矩形中两条短边的中点用于表示合并后的直线。
步骤五,计算所有合并后直线的长度,利用快速排序算法对直线进行排序。优先使用较长的直线生成矩形,依次判断较长直线与剩余直线是否可以生成用于拟合物体的矩形,拟合物体的矩形需要满足以下条件:一、两条线段夹角小于20°;二、平行线之间距离大于阈值thl=50;三、平行线之间像素个数不为零;四、较短线段在较长线段上存在投影。根据以上条件建立拟合矩形。假设任意给定的两条直线中长线为l1、短线为l2,l1的左端点为p1、右端点为p2,l2的左端点为p3、右端点为p4,如图3所示。连接点p1、p2构成向量V1,连接点p3、p4构成向量V2。计算两向量之间夹角通过计算l2中点到l1的距离d表示两线段之间的距离。分别将p3、p4点与p1、p2点相连接形成向量V13、V14、V23、V24,若V13、V14中至少存在一个向量与向量V1夹角为锐角,并且V23、V24中至少存在一个向量与向量V1夹角为锐角,则说明两线段之间互相存在投影。依次连接点p1、p2、p4、p3、p1构成一个四边形,统计四边形内非零点的个数n。若不能同时满足以上四个条件,则判断下一条直线,直至遍历完全部直线。对于符合条件的直线,计算点p3、p4在向量V1上的投影点p'3、p'4,投影点的横坐标纵坐标/>其中i∈{3,4},α1表示向量V1所在直线与水平线的夹角。如果p'3在向量V1上,则p'1=p3。否则,建立一条过点p1并与向量V2相垂直的直线,直线与V2所在直线的交点作为点p'1,p'3=p1。同理,如果p'4在向量V1上,则p'2=p4。否则,建立一条过点p2并与向量V2相垂直的直线,直线与V2所在直线的交点作为点p'2,p'4=p2。计算拟合矩形的中点(x,y),其中/> 计算拟合矩形旋转角/>计算拟合矩形宽W等于点p'1与p'2的中点到点p'3与p'4的中点的距离,计算拟合矩形高H为点p'1与p'2之间距离和点p'3与p'4之间距离较小值。最终通过矩形完成拟合,如图7所示。
步骤六,测量手指宽度w,根据手眼关系计算手指在图像中投影宽度w'。以w'/2为步长,沿拟合矩形中边H所在的方向,从矩形P1端采样到P2端生成多个抓取矩形,如图4所示。抓取矩形的宽度wg=w',高当θr取值为正时抓取矩形的旋转角θg=θr-90°,当θr取值为负时θg=θr+90°。抓取矩形中心点的横坐标cx=xP1+k·wgcos(θr),纵坐标cy=yP1+k·wgsin(θr),其中k=0.5,1,1.5,2…。
步骤七,选择单色背景和杂乱背景两种情况作为背景,大小为300*300。利用步骤二中获得物体掩码裁剪图像中的物体区域,获得一个仅在物体区域存在数值,其他部分为0的矩阵。利用warpAffine()函数旋转图像,旋转中心设置为图像的中心,边界填充值为0,旋转角θ▽按间隔30°从0-360°取值。将旋转后的图像与背景图像对应元素相加,单一物体共生成2*12=24个样本。根据物体在背景图像中的位置和角度以及在步骤六中获得的抓取矩形,计算合成图像中物体的抓取矩形(c'x,c'y,w'g,h'g,θ'g),其中表示合成图像中抓取矩形中心点的横坐标,/>表示中心点的纵坐标,w'g=wg表示抓取矩形中手指的宽度,h'g=hg表示抓取矩形中手爪的开口大小,θ'g=θg+θ▽表示抓取矩形与图像水平轴的夹角,所获得的抓取数据集示例如图8所示。
本实施例基于矩形拟合的抓取数据集自动生成方法利用机械臂末端执行器夹持物体边缘,驱动物体绕其中心旋转,通过相机采集物体各角度的图像;确定物体区域,生成物体掩码;检测目标物体的轮廓信息;对图像进行霍夫变换,检测物体轮廓中的直线,并对短线段进行合并;对直线长度进行排序,按直线长度检测对应平行线,利用多个矩形拟合物体轮廓;将拟合矩形按照等间距采样的方式生成多个适用于双指手爪的抓取矩形;组合背景图像和物体图像生成抓取数据集图像,同时生成对应标签。本实施例方法操作简单、实现方便快速,不需要额外的设备。解决了抓取任务中数据集手动标注工作费时费力的问题,为抓取任务中深度学习模型所需训练集的制作提供了便利途径。
以上对本发明的具体实施结合附图进行了详细说明,但本发明不限于上述实施例,凡是根据本发明技术方案原理下做出的改变、替代或简化,均为等效置换方式,或直接或间接的应用在其他相关领域,均包括在本申请的专利保护范围内。
Claims (5)
1.一种基于矩形拟合的抓取数据集自动生成方法,其特征在于,包括如下步骤:
步骤一,物体图像采集:
通过机械臂与相机相结合的方式,完成物体多角度图像信息的采集;
步骤二,确定物体区域,生成物体掩码:
根据数据收集***中各部件之间的位置关系,初步确定物体所在图像中的大致位置,去除大部分背景噪声;利用背景相减法从背景中分割出物体区域,获得物体掩码;
所述步骤二中,利用相机和机械臂之间的关系,通过运动学正解计算机械臂坐标系下两指尖连线的中点位置(X,Y,Z)在图像中的坐标(u,v),以此确定物体在图像中的位置:
其中,表示机械臂坐标系相对于相机坐标系的关系,fx,fy,cx,cy为相机内参;
步骤三,检测目标物体轮廓信息:
利用canny算子检测物体边缘,将物体轮廓通过大量短线条表示;
步骤四,霍夫变换检测直线:
对物体轮廓曲线进行霍夫变换,检测物体轮廓中直线,并对其中满足合并条件的线段进行整合,减少线条数量;
步骤五,利用多个矩形拟合轮廓:
根据直线长度对直线进行排序,按直线长度排序依次检测对应平行线;用于拟合物体轮廓的矩形需要同时满足四个条件:
①、两条线段夹角小于20°;
②、平行线之间距离大于阈值th1=50;
③、平行线之间像素个数不为零;
④、较短线段在较长线段上存在投影;
将同时满足以上①-④条件的平行线进行相互投影,生成多个矩形用于拟合物体轮廓;
步骤六,生成抓取矩形:
根据手指宽度w,在拟合矩形上按等间距采样的方式生成多个适用于双指手爪的抓取矩形;
步骤七,合成抓取数据集图像,制作抓取数据集:
利用在步骤二中生成的物体掩码,将物体的彩色图像和预设多种背景进行组合,生成多种抓取数据集图像,同时根据物体在图像中的位置和在步骤六中生成的抓取矩形,为数据集中的所有样本制作标签文件。
2.根据权利要求1所述基于矩形拟合的抓取数据集自动生成方法,其特征在于:在所述步骤一中,利用固定的Kinect相机作为数据采集设备,通过机械臂末端手爪夹持物体改变物体姿态,采集多种角度下物体的图像信息。
3.根据权利要求1所述基于矩形拟合的抓取数据集自动生成方法,其特征在于:在所述步骤五中,利用构成矩形的四个条件,检测任意两条平行线是否可以用于合成拟合矩形,通过相互投影的方式由两条平行线建立拟合矩形。
4.根据权利要求1所述基于矩形拟合的抓取数据集自动生成方法,其特征在于:在所述步骤六中,以手指宽度的投影w作为抓取矩形的宽,以6/5倍的拟合矩形的H作为抓取矩形的高h,并沿拟合矩形H边以间隔为0.5w进行采样构建抓取矩形。
5.根据权利要求1所述基于矩形拟合的抓取数据集自动生成方法,其特征在于:在所述步骤七中,将物体图像与背景图像合并构成抓取数据集图像,并根据物体图像在背景中的位置生成抓取参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110307109.XA CN112926503B (zh) | 2021-03-23 | 2021-03-23 | 一种基于矩形拟合的抓取数据集自动生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110307109.XA CN112926503B (zh) | 2021-03-23 | 2021-03-23 | 一种基于矩形拟合的抓取数据集自动生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112926503A CN112926503A (zh) | 2021-06-08 |
CN112926503B true CN112926503B (zh) | 2023-07-18 |
Family
ID=76175527
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110307109.XA Active CN112926503B (zh) | 2021-03-23 | 2021-03-23 | 一种基于矩形拟合的抓取数据集自动生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112926503B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113506314B (zh) * | 2021-06-25 | 2024-04-09 | 北京精密机电控制设备研究所 | 一种复杂背景下对称四边形工件的自动抓取方法及装置 |
CN116529760A (zh) * | 2021-11-28 | 2023-08-01 | 梅卡曼德(北京)机器人科技有限公司 | 抓取控制方法、装置、电子设备和存储介质 |
CN114428876B (zh) * | 2021-12-29 | 2023-03-07 | 广州盖盟达工业品有限公司 | 一种工业器械的图像搜索方法、装置、存储介质及设备 |
CN116416217B (zh) * | 2023-03-06 | 2023-11-28 | 赛那德科技有限公司 | 无序堆叠包裹图像的生成方法、***及设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105405126A (zh) * | 2015-10-27 | 2016-03-16 | 大连理工大学 | 一种基于单目视觉***的多尺度空-地参数自动标定方法 |
CN108460799A (zh) * | 2018-01-26 | 2018-08-28 | 中国地质大学(武汉) | 一种逐步逼近亚像素图像定位方法和*** |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108656107B (zh) * | 2018-04-04 | 2020-06-26 | 北京航空航天大学 | 一种基于图像处理的机械臂抓取***及方法 |
CN109948712A (zh) * | 2019-03-20 | 2019-06-28 | 天津工业大学 | 一种基于改进的Mask R-CNN的纳米颗粒尺寸测量方法 |
CN111507390B (zh) * | 2020-04-11 | 2023-07-04 | 华中科技大学 | 一种基于轮廓特征的仓储箱体识别与定位方法 |
-
2021
- 2021-03-23 CN CN202110307109.XA patent/CN112926503B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105405126A (zh) * | 2015-10-27 | 2016-03-16 | 大连理工大学 | 一种基于单目视觉***的多尺度空-地参数自动标定方法 |
CN108460799A (zh) * | 2018-01-26 | 2018-08-28 | 中国地质大学(武汉) | 一种逐步逼近亚像素图像定位方法和*** |
Also Published As
Publication number | Publication date |
---|---|
CN112926503A (zh) | 2021-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112926503B (zh) | 一种基于矩形拟合的抓取数据集自动生成方法 | |
CN111523486B (zh) | 一种基于改进CenterNet的机械臂抓取检测方法 | |
CN111462154B (zh) | 基于深度视觉传感器的目标定位方法、装置及自动抓取机器人 | |
CN111695562B (zh) | 一种基于卷积神经网络的机器人自主抓取方法 | |
Cai et al. | Metagrasp: Data efficient grasping by affordance interpreter network | |
CN110298886B (zh) | 一种基于四级卷积神经网络的灵巧手抓取规划方法 | |
CN111923053A (zh) | 基于深度视觉的工业机器人物件抓取示教***及方法 | |
CN112906797A (zh) | 一种基于计算机视觉和深度学***面抓取检测方法 | |
CN112509063A (zh) | 一种基于边缘特征匹配的机械臂抓取***及方法 | |
CN115816460B (zh) | 一种基于深度学习目标检测与图像分割的机械手抓取方法 | |
CN112845143A (zh) | 一种生活垃圾分类智能分拣***及方法 | |
CN111428815B (zh) | 一种基于Anchor angle机制的机械臂抓取检测方法 | |
CN114882109A (zh) | 一种面向遮挡、杂乱场景下的机器人抓取检测方法及*** | |
CN110640741A (zh) | 一种规则形状工件匹配的抓取工业机器人 | |
CN114140418A (zh) | 一种基于rgb图像和深度图像的七自由度抓取姿势检测方法 | |
CN115330734A (zh) | 一种基于三维目标检测和点云缺陷补全的自动化机器人补焊*** | |
Wakayama et al. | 6D-pose estimation for manipulation in retail robotics using the inference-embedded OAK-D camera | |
CN114029941A (zh) | 一种机器人抓取方法、装置、电子设备及计算机介质 | |
CN112288809B (zh) | 一种用于多物体复杂场景的机器人抓取检测方法 | |
CN115861780B (zh) | 一种基于yolo-ggcnn的机械臂检测抓取方法 | |
Li et al. | An efficient network for target-oriented robot grasping pose generation in clutter | |
CN112989881A (zh) | 一种无监督可迁移的3d视觉物体抓取方法 | |
CN115019202A (zh) | 一种应用于服务型移动机械臂的分步式抓取检测方法 | |
CN114998573A (zh) | 一种基于rgb-d特征深度融合的抓取位姿检测方法 | |
Deng et al. | Tiny screw and screw hole detection for Automated Maintenance Processes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |