CN111768449B

CN111768449B - 一种双目视觉结合深度学习的物体抓取方法

Info

Publication number: CN111768449B
Application number: CN201910254109.0A
Authority: CN
Inventors: 曾洪庆; 钱超超
Original assignee: Beijing Vizum Intelligent Technology Co ltd
Current assignee: Beijing Vizum Intelligent Technology Co ltd
Priority date: 2019-03-30
Filing date: 2019-03-30
Publication date: 2024-05-14
Anticipated expiration: 2039-03-30
Also published as: CN111768449A

Abstract

本发明公开一种双目视觉结合深度学习的物体抓取方法，包括：采集双目图像；对左右图像分别进行目标识别，获得目标区域信息；根据各目标区域信息，计算区域特征值，并进行左右目标的匹配；使用左右图像的目标区域信息及匹配关系，计算目标位姿；机械执行机构进行抓取。本发明将自适应的深度学习算法模型双目视觉相结合，利用自适应的深度学习算法模型进行特征匹配，得到更精确的匹配特征、匹配关系，进而使双目视觉计算结果更准确、稳定，从而提高机械臂对物体的定位和抓取的应用效率和可靠性。

Description

一种双目视觉结合深度学习的物体抓取方法

技术领域

本发明属于机械臂定位抓取应用技术领域，具体涉及一种双目视觉结合深度学习的物体抓取方法。

背景技术

机械臂对物体的定位和抓取，决定了机械臂的应用效率和可靠性，基于双目立体视觉对物体的识别与定位，可快速获得物***置信息，实现机械臂对物体的定位和抓取。双目立体视觉是计算机视觉的一个重要分支，利用两摄像机从不同位置对同一物体拍摄得到两幅图像，通过匹配算法找出两幅图像中的对应点，经过计算得出视差，然后基于三角测量原理恢复出物体在真实世界中的距离信息。在实际使用中，各匹配算法由于自身缺陷，提取的匹配特征不佳，再加上在处理纹理缺失物体时提取匹配特征难度加大，匹配的效果不尽完善。

深度学习能利用有监督训练自动学习提取的有用特征，令特征能更加抽象、高层地表现，且分布式和并行计算的能力是其最大的优点。将深度学习应用于双目视觉的匹配过程，填补普通双目视觉的不足之处，具有很高的实用价值。

发明内容

针对上述问题，本发明提出一种双目视觉结合深度学习的物体抓取方法。本发明所采用的技术方案是：

一种双目视觉结合深度学习的物体抓取方法，包括：采集双目图像；对左右图像分别进行目标识别，获得目标区域信息；根据各目标区域信息，计算区域特征值，并进行左右目标的匹配；使用左右图像的目标区域信息及匹配关系，计算目标位姿；机械执行机构进行抓取。

进一步地，所述采集双目图像包括：对双目相机进行立体标定；通过双目相机的左摄像头和右摄像头分别获取目标物体的左图像和右图像；对左图像、右图像进行极线校正，使校正后的左图像和右图像行对准。

进一步地，所述对左右图像分别进行目标识别，获得目标区域信息包括：图像尺寸裁剪至指定尺寸；输入到自适应深度学习算法进行处理；输出检测结果，作为后续匹配的基础。

进一步地，所述自适应深度学习算法基于经典的目标检测算法SSD，在原算法CONV4_3层，利用FPN算法思想对多级Feature Maps进行上采样以提高小目标检测精度。

进一步地，所述根据各目标区域信息，计算区域特征值，并进行左右目标的匹配包括：根据左右图像的区域信息计算参考锚点；根据锚点计算每一块区域信息的特征信息P；左右目标匹配。

进一步地，所述根据左右图像的区域信息计算参考锚点包括：锚点的计算藉由各区域大小及其中心点完成，具体方法如式：其中Qi为目标区域尺寸，Ki为目标区域中心。

进一步地，所述根据锚点计算每一块区域信息的特征信息P包括：由锚点信息(x₀，y₀)及区域信息(x，y，w，h，t)，计算坐标偏移信息(x-x₀，y-y₀)及区域信息(w*h，t)，共同组成特征信息P(x-x₀，y-y₀，w*h，t)。

进一步地，所述左右目标匹配包括：将特征信息P视为四维向量，分别乘以相应的权重，然后通过计算两个向量间的欧式距离视为其最终的差异度，根据差异度使用WTA(Winner Take ALL)算法获得匹配组合。

本发明的有益效果是：将自适应的深度学习算法模型双目视觉相结合，利用自适应的深度学习算法模型进行特征匹配，得到更精确的匹配特征、匹配关系，进而使双目视觉计算结果更准确、稳定，从而提高机械臂对物体的定位和抓取的应用效率和可靠性。

附图说明

图1是本发明一种双目视觉结合深度学习的物体抓取方法示意性流程图。

具体实施方式

下面结合附图对本发明的较佳实施例进行详细阐述，以使本发明的优点和特征能更易于被本领域技术人员理解，从而对本发明的保护范围做出更为清楚明确的界定。

参见图1，本发明实施例具体包括以下步骤：

(1)对双目相机进行立体标定。

具体包括：对双目相机的左摄像头和右摄像头分别进行标定，得到所述双目相机的内参矩阵A、所述左摄像头的旋转矩阵R₁和所述右摄像头的旋转矩阵R₂，以及所述左摄像头的平移向量T₁和所述右摄像头的平移向量T₂；通过如下公式计算得到所述左摄像头和所述右摄像头之间的旋转矩阵R和平移向量T：

(2)通过双目相机的左摄像头和右摄像头分别获取目标物体的左图像和右图像。

(3)对左图像、右图像进行极线校正，使校正后的左图像和右图像行对准。

具体包括：将所述旋转矩阵R分解为两个旋转矩阵r₁和r₂，其中r₁和r₂通过假设将所述左摄像头和所述右摄像头各旋转一半使所述左摄像头和所述右摄像头的光轴平行而得到；

对所述左图像和所述右图像进行行对准通过下式实现：

其中，R_rect为使行对准的旋转矩阵：

旋转矩阵R_rect由极点e₁方向开始，以所述左图像的原点为主，所述左摄像头至所述右摄像头的平移向量的方向为主点方向：

e₁与e₂正交，将e₁归一化到单位向量：

其中，T_x为平移向量T在双目相机所处平面内水平方向的分量，T_y为平移向量T在双目相机所处平面内竖直方向的分量；

e₃与e₁和e₂正交，e₃通过如下公式计算得到：

e₃＝e₂×e₁

根据上述旋转矩阵物理意义有：

其中，α表示为使行对准，所述左摄像头和所述右摄像头在其所处平面内需要旋转的角度，0≤α≤180°；对于所述左摄像头，使其绕e₃方向旋转α'，对于右相机，使其绕e₃方向旋转α”。

(4)对左右图像分别进行目标识别，获得目标区域信息。

具体包括：将图像尺寸裁剪至300×300mm；将裁减好的图像输入到自适应深度学习算法进行处理；输出检测结果，作为后续匹配的基础。

(5)根据各目标区域信息，计算参考锚点。

锚点的计算藉由各区域大小及其中心点完成，具体方法如式：其中Qi为目标区域尺寸，Ki为目标区域中心。

(6)根据锚点计算每一块区域信息的特征信息P。

具体包括：由锚点信息(x₀，y₀)及区域信息(x，y，w，h，t)，计算坐标偏移信息(x-x₀，y-y₀)及区域信息(w*h，t)，共同组成特征信息P(x-x₀，y-y₀，w*h，t)。

(7)根据得到的特征信息P进行左右匹配。

具体包括：将特征信息P视为四维向量，分别乘以相应的权重，然后通过计算两个向量间的欧式距离视为其最终的差异度，根据差异度使用WTA(Winner Take ALL)算法获得匹配组合。

(8)利用获得的匹配关系根据双目立体视觉原理计算特征点的三维坐标。具体包括：

设左摄像机O-xyz位于世界坐标系原点，且没有发生旋转，图像坐标系为O_l-X₁Y₁，有效焦距为f_l；右摄像机坐标系为O_r-xyz，图像坐标系为O_r-X_rY_r，有效焦距为f_r。那么根据摄像机的投射模型我们就能得到如下关系式：

因为O-xyz坐标系与O_r-x_ry_rz_r坐标系之间的位置关系可通过空间转换矩阵M_Lr表示为：

同理，对于O-xyz坐标系中的空间点，两个摄像机面点之间的对应关系可以表示为：

于是，空间点三维坐标可以表示为：

因此，只要通过计算机标定技术获得左右计算机内参数/焦距f_r,f_l和空间点在左右摄像机中的图像坐标，就能够重构出被测点的三维空间坐标。

(9)机械执行机构根据获取的三维坐标确定物***置并抓取。

Claims

1.一种双目视觉结合深度学习的物体抓取方法，其特征在于，包括：采集双目图像；对左右图像分别进行目标识别，获得目标区域信息；根据各目标区域信息，计算区域特征值，并进行左右目标的匹配；使用左右图像的目标区域信息及匹配关系，计算目标位姿；机械执行机构进行抓取；

所述根据各目标区域信息，计算区域特征值，并进行左右目标的匹配包括：根据左右图像的区域信息计算参考锚点；根据锚点计算每一块区域信息的特征信息P；左右目标匹配；

所述的根据左右图像的区域信息计算参考锚点，锚点的计算藉由各区域大小及其中心点完成，具体方法如式：

其中Qi为目标区域尺寸，Ki为目标区域中心；

所述的根据锚点计算每一块区域信息的特征信息P，包括：由锚点信息(x₀，y₀)及区域信息(x，y，w，h，t)，计算坐标偏移信息(x-x₀，y-y₀)及区域信息(w*h，t)，共同组成特征信息P(x-x₀，y-y₀，w*h，t)。

2.根据权利要求1所述的双目视觉结合深度学习的物体抓取方法，其特征在于，所述采集双目图像包括：对双目相机进行立体标定；通过双目相机的左摄像头和右摄像头分别获取目标物体的左图像和右图像；对左图像、右图像进行极线校正，使校正后的左图像和右图像行对准。

3.根据权利要求1所述的双目视觉结合深度学习的物体抓取方法，其特征在于，所述对左右图像分别进行目标识别，获得目标区域信息包括：图像尺寸裁剪至指定尺寸；输入到自适应深度学习算法进行处理；输出检测结果，作为后续匹配的基础。

4.根据权利要求3所述的双目视觉结合深度学习的物体抓取方法，其特征在于，所述自适应深度学习算法基于经典的目标检测算法SSD，在原算法CONV4_3层，利用FPN算法思想对多级Feature Maps进行上采样以提高小目标检测精度。

5.根据权利要求1所述的双目视觉结合深度学习的物体抓取方法，其特征在于，包括：将特征信息P视为四维向量，分别乘以相应的权重，然后通过计算两个向量间的欧式距离视为其最终的差异度，根据差异度使用Winner Take ALL算法获得匹配组合。