CN110400333B

CN110400333B - 教练式双目立体视觉装置及高精度立体视觉图像获取方法

Info

Publication number: CN110400333B
Application number: CN201910680675.8A
Authority: CN
Inventors: 史聪灵; 何竞择; 车洪磊; 徐圆飞
Original assignee: Beijing Hangxing Machinery Manufacturing Co Ltd; China Academy of Safety Science and Technology CASST
Current assignee: Beijing Hangxing Machinery Manufacturing Co Ltd; China Academy of Safety Science and Technology CASST
Priority date: 2019-07-26
Filing date: 2019-07-26
Publication date: 2020-06-26
Anticipated expiration: 2039-07-26
Also published as: NL2026030B1; NL2026030A; CN110400333A

Abstract

本发明涉及一种教练式双目立体视觉装置及高精度立体视觉图像获取方法，属于立体视觉技术领域，解决了现有立体视觉装置无法同时满足高精和低成本的问题。装置包括：双目立体视觉单元，离线采集视场范围内的双目样本图像及在线采集被测范围的双目实时图像，处理得到双目可见光非立体图像、匹配代价图及双目立体视觉图像；教练单元获取同一视场范围内的精确立体视觉图像；智能学习单元根据基于双目样本图像得到的双目可见光非立体图像中的一幅、匹配代价图、双目立体视觉图像及精确立体视觉图像，训练存储在智能学习单元中的深度卷积神经网络，直至收敛；还在收敛后，基于处理双目实时图像得到的相应图像，得到被测范围的高精度的立体视觉图像。

Description

教练式双目立体视觉装置及高精度立体视觉图像获取方法

技术领域

本发明涉及双目视觉图像校正技术领域，尤其涉及一种教练式双目立体视觉装置及高精度立体视觉图像获取方法。

背景技术

双目立体视觉(Binocular Stereo Vision)是机器视觉的一种重要形式，它是基于视差原理并利用成像设备从不同的位置获取被测物体的两幅图像，通过计算图像对应点间的位置偏差，来获取物体三维几何信息的方法。基于双目立体视觉的深度测量方式类似人类的双眼，和基于TOF、结构光原理的深度相机不同，它不对外主动投射光源，完全依靠拍摄的两张图片(彩色RGB或者灰度图)来计算深度，因此有时候也被称为被动双目深度相机。

实际应用过程中，双目立体视觉存在以下缺点：1)对环境光照非常敏感。双目立体视觉法依赖环境中的自然光线采集图像，而由于光照角度变化、光照强度变化等环境因素的影响，拍摄的两张图片亮度差别会比较大，这会对匹配算法提出很大的挑战；2)不适用于单调缺乏纹理的场景。由于双目立体视觉法根据视觉特征进行图像匹配，所以对于缺乏视觉特征的场景(如天空、白墙、沙漠等)会出现匹配困难，导致匹配误差较大甚至匹配失败。

激光TOF立体视觉设备能够有效解决双目立体视觉法存在的问题，且测量精度较高，但是由于其设备成本较高，严重限制了激光TOF立体视觉设备的广泛使用。如何实现高精度、低成本的立体视觉，是一个急需解决的问题。

发明内容

鉴于上述的分析，本发明旨在提供一种教练式双目立体视觉装置及高精度立体视觉图像获取方法，用以解决现有立体视觉装置无法满足高精度和低成本要求的问题。

本发明的目的主要是通过以下技术方案实现的：

一种教练式双目立体视觉装置，包括：

双目立体视觉单元，用于离线采集视场范围内的双目样本图像及在线采集被测范围的双目实时图像；基于所述双目样本图像或双目实时图像，处理得到双目可见光非立体图像、匹配代价图及双目立体视觉图像；

教练单元，用于获取与双目样本图像同一视场范围内的精确立体视觉图像；

智能学习单元，用于根据基于所述双目样本图像得到的双目可见光非立体图像中的一幅、匹配代价图、双目立体视觉图像，以及教练单元输出的精确立体视觉图像，训练存储在所述智能学习单元中的深度卷积神经网络，直至收敛；还用于在训练完成后，根据基于所述双目实时图像得到的双目可见光非立体图像中的一幅、匹配代价图、双目立体视觉图像，得到被测范围的高精度的立体视觉图像。

在上述方案的基础上，本发明还做了如下改进：

进一步，所述双目立体视觉单元包括：两个同参数可见光摄像头和一个控制器；

所述控制器，用于控制两个所述可见光摄像头在同一时刻采集图像，并处理所述同一时刻采集到的两幅图像，得到双目可见光非立体图像、匹配代价图及双目立体视觉图像。

进一步，所述教练单元包括红外激光发射器、高帧频红外摄像头，基于红外激光TOF原理，得到教练单元输出的精确立体视觉图像。

进一步，所述智能学习单元在训练所述深度卷积神经网络前，还根据所述双目立体视觉单元坐标和所述教练单元坐标之间的变换关系，校正所述基于所述双目样本图像得到的双目可见光非立体图像、匹配代价图、双目立体视觉图像，以及精确立体视觉图像，将其统一至同一坐标系中；

所述变换关系通过下述方式确定：

对齐所述双目立体视觉单元和所述教练单元，利用同一视场内的标定物为基准建立坐标系，确定所述双目立体视觉单元坐标和所述教练单元坐标之间的变换关系。

进一步，所述智能学习单元通过执行以下操作训练所述深度卷积神经网络：

以校正后的双目可见光非立体图像中的一幅、匹配代价图及双目立体视觉图像作为深度卷积神经网络的三个通道对齐输入，以校正后的教练单元精确立体视觉图像作为正样本图像，训练所述深度卷积神经网络；

当所述所述深度卷积神经网络训练输出的立体视觉图像与所述正样本图像之间的偏差满足阈值条件时，得到收敛的深度卷积神经网络；

否则，根据以下公式修正正样本图像的每个像素点：

其中，T_(x,y)表示所述深度卷积神经网络训练输出的立体视觉图像中坐标为(x,y)的像素点的像素值；L_(x,y)表示校正后的教练单元精确立体视觉图像中坐标为(x,y)的像素点的像素值；D_(x,y)表示校正后的双目立体视觉图像中坐标为(x,y)的像素点的像素值；T_max、T_min分别表示所述深度卷积神经网络训练输出的立体视觉图像中坐标为(x,y)的像素点的像素值最大值、最小值；k₁、k₂、k₃分别为T_(x,y)、L_(x,y)、D_(x,y)对应的权重系数；

利用修正后的正样本图像继续训练所述深度卷积神经网络，若收敛，得到收敛的深度卷积神经网络；否则，重复上述修正过程。

进一步，所述控制器采用SGB算法或BM算法处理所述同一时刻采集被测范围内的两幅图像，得到双目可见光非立体图像、匹配代价图及双目立体视觉图像。

本发明还公开了一种高精度立体视觉图像获取方法，包括如下步骤：

在线采集被测范围内的双目实时图像，并基于所述双目实时图像，处理得到双目可见光非立体图像、匹配代价图及双目立体视觉图像；

将基于所述双目实时图像得到的双目可见光非立体图像中的一幅、匹配代价图及双目立体视觉图像输入至训练好的深度卷积神经网络，由所述深度卷积神经网络处理输出高精度立体视觉图像。

在上述方案的基础上，本发明还做了如下改进：

进一步，还包括通过以下方式训练所述深度卷积神经网络：

离线采集视场范围内的双目样本图像，并基于所述双目样本图像，处理得到双目可见光非立体图像、匹配代价图及双目立体视觉图像；

在同一时刻获取与双目样本图像同一视场范围内的精确立体视觉图像；

校正所述基于所述双目样本图像处理得到的双目可见光非立体图像、匹配代价图、双目立体视觉图像，以及精确立体视觉图像；

将校正后的双目可见光非立体图像中的一幅、匹配代价图及双目立体视觉图像作为深度卷积神经网络的三个通道对齐输入，以校正后的精确立体视觉图像作为正样本图像，训练所述深度卷积神经网络；

当所述深度卷积神经网络训练输出的立体视觉图像与所述正样本图像之间的偏差满足阈值条件时，得到收敛的深度卷积神经网络；

否则，根据以下公式修正正样本图像的每个像素点：

其中，T_(x,y)表示所述深度卷积神经网络训练输出的立体视觉图像中坐标为(x,y)的像素点的像素值；L_(x,y)表示校正后的精确立体视觉图像中坐标为(x,y)的像素点的像素值；D_(x,y)表示校正后的双目立体视觉图像中坐标为(x,y)的像素点的像素值；T_max、T_min分别表示所述深度卷积神经网络训练输出的立体视觉图像中坐标为(x,y)的像素点的像素值最大值、最小值；k₁、k₂、k₃分别为T_(x,y)、L_(x,y)、D_(x,y)对应的权重系数；

进一步，所述校正所述基于所述双目样本图像处理得到的双目可见光非立体图像、匹配代价图、双目立体视觉图像，以及精确立体视觉图像，包括：

以同一视场内的标定物为基准建立坐标系，确定所述双目立体视觉单元坐标和所述教练单元坐标之间的变换关系；

根据所述变换关系校正所述基于所述双目样本图像得到的双目可见光非立体图像、匹配代价图、双目立体视觉图像，以及精确立体视觉图像，将其统一至同一坐标系中。

进一步，当采集双目实时图像的位置、视场范围或环境光源发生显著变化时，重新训练所述深度卷积神经网络。

本发明有益效果如下：

本发明中提供的教练式双目立体视觉装置具体分为离线训练过程和在线使用过程。在离线训练过程中，利用通过低成本的双目立体视觉单元获取到精度相对较低的双目视觉图像，利用高精度的教练单元获取到精确立体视觉图像；利用深度卷积神经网络确定它们之间的关系，得到训练后的深度卷积神经网络；训练完成后，即可拆除教练单元，仅利用双目立体视觉单元和智能学习单元的配合得到高精度的立体视觉图像，从而实现了利用低成本、低精度的双目视觉部件，获取到高精度的立体视觉图像。该方法适用于双目立体视觉单元安装位置相对固定、环境光源变化较小的场所，如地铁站等。本发明中方法与上述装置基于相同的原理实现，因此，也具备上述装置能够达到的效果。

本发明中，上述各技术方案之间还可以相互组合，以实现更多的优选组合方案。本发明的其他特征和优点将在随后的说明书中阐述，并且，部分优点可从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过说明书、权利要求书以及附图中所特别指出的内容中来实现和获得。

附图说明

附图仅用于示出具体实施例的目的，而并不认为是对本发明的限制，在整个附图中，相同的参考符号表示相同的部件。

图1为本发明实施例中教练式双目立体视觉装置离线训练时的结构示意图；

图2为本发明实施例中教练式双目立体视觉装置在线使用时的结构示意图；

图3为本发明实施例中高精度立体视觉图像获取方法流程图。

具体实施方式

下面结合附图来具体描述本发明的优选实施例，其中，附图构成本申请一部分，并与本发明的实施例一起用于阐释本发明的原理，并非用于限定本发明的范围。

实施例1

本发明的一个具体实施例，公开了一种教练式双目立体视觉装置，包括：双目立体视觉单元，用于离线采集视场范围内的双目样本图像及在线采集被测范围的双目实时图像；基于所述双目样本图像或双目实时图像，处理得到双目可见光非立体图像、匹配代价图及双目立体视觉图像；教练单元，用于获取与双目样本图像同一视场范围内的精确立体视觉图像；智能学习单元，用于根据基于所述双目样本图像得到的双目可见光非立体图像中的一幅、匹配代价图、双目立体视觉图像，以及教练单元输出的精确立体视觉图像，训练存储在所述智能学习单元中的深度卷积神经网络，直至收敛；还用于在训练完成后，根据基于所述双目实时图像得到的双目可见光非立体图像中的一幅、匹配代价图、双目立体视觉图像，得到被测范围的高精度的立体视觉图像，该高精度视觉图像具有高分辨率、高清晰度的特点，双目立体视觉装置经过神经网络的学习后可以有效的分辨客流，提高图像的精度，获得学习之前更好的性能。其中，图1为本实施例中教练式双目立体视觉装置离线训练时的结构示意图；图2为本实施例中教练式双目立体视觉装置在线使用时的结构示意图。

与现有技术相比，本发明中提供的教练式双目立体视觉装置具体分为离线训练过程和在线使用过程。在离线训练过程中，利用通过低成本的双目立体视觉单元获取到精度相对较低的双目视觉图像，利用高精度的教练单元获取到精确立体视觉图像；利用深度卷积神经网络确定它们之间的关系，得到训练后的深度卷积神经网络；训练完成后，即可拆除教练单元，仅利用双目立体视觉单元和智能学习单元的配合得到高精度的立体视觉图像，从而实现了利用低成本、低精度的双目视觉部件，获取到高精度的立体视觉图像。该装置适用于双目立体视觉单元安装位置相对固定、环境光源变化较小的场所，如地铁站等。

优选地，本实施例还给出了一种典型的双目立体视觉单元的设置方式，包括：两个相距一定距离的同参数可见光摄像头和一个控制器；其中，控制器用于控制两个所述可见光摄像头在同一时刻采集图像，并采用SGB算法或BM算法处理所述同一时刻采集被测范围内的两幅图像，得到双目可见光非立体图像、匹配代价图及双目立体视觉图像；还可以暂存上述三种图像信息；优选地，为得到精确立体视觉图像，本实施例中的教练单元包括红外激光发射器、高帧频红外摄像头，利用硬件本身的高精度，基于红外激光TOF原理，得到教练单元输出的精确立体视觉图像。

由于双模立体视觉单元与教练单元拍摄图像的位置可能存在偏差，为保证更为精确的处理结果，智能学习单元在训练深度卷积神经网络前，还需要根据所述双目立体视觉单元坐标和所述教练单元坐标之间的变换关系，校正所述基于所述双目样本图像得到的双目可见光非立体图像、匹配代价图、双目立体视觉图像，以及精确立体视觉图像，将其统一至同一坐标系中；本实施例给出了一种变换关系的确定方式：对齐所述双目立体视觉单元和所述教练单元，利用同一视场内的标定物为基准建立坐标系，确定所述双目立体视觉单元坐标和所述教练单元坐标之间的变换关系。

将图像校正至统一坐标系后，即可训练深度积神经网络。本实施中，所述智能学习单元通过执行以下操作训练所述深度卷积神经网络：

当所述深度卷积神经网络训练输出的立体视觉图像与所述正样本图像之间的偏差满足阈值条件时(阈值是度量神经元产生正激励的难易程度，在记忆学习中，阈值一般由自带的工具箱函数设定，一般是默认的值，也可根据客户要求进行调试，决定了训练时间的长短和训练效果)，得到收敛的深度卷积神经网络；

否则，根据以下公式修正正样本图像的每个像素点：

其中，T_(x,y)表示所述深度卷积神经网络训练输出的立体视觉图像中坐标为(x,y)的像素点的像素值；L_(x,y)表示校正后的教练单元精确立体视觉图像中坐标为(x,y)的像素点的像素值；D_(x,y)表示校正后的双目立体视觉图像中坐标为(x,y)的像素点的像素值；T_max、T_min分别表示所述深度卷积神经网络训练输出的立体视觉图像中坐标为(x,y)的像素点的像素值最大值、最小值，可通过以下方式确定：对坐标(x,y)周围一定范围内的像素点的像素值进行排序，将排序结果中的最大值作为T_max，最小值作为T_min；k₁、k₂、k₃分别为T_(x,y)、L_(x,y)、D_(x,y)对应的权重系数；

利用修正后的正样本图像继续训练所述深度卷积神经网络，这种修正方式能使得学习单元不断进行记忆学习，若收敛，得到收敛的深度卷积神经网络；否则，重复上述修正过程。这种修正方法使它能够对双目单元的一般图像进行修正，一旦之后满足了修正的阈值条件，便意味着他的修正能力已经可以使得双目单元和学习单元能够产生跟教练单元类似的高精度立体视觉图像，这种方法是神经网络记忆学习的基本学习方法。(***中的权重系数由程序中自带的工具箱函数设定，一般是默认的值，也可根据客户要求进行调试，决定了训练时间的长短和训练效果)

实施例2

在本发明的另一实施例中，还公开了一种高精度立体视觉图像获取方法，如图3所示，包括如下步骤：

步骤S1：在线采集被测范围内的双目实时图像，并基于所述双目实时图像，处理得到双目可见光非立体图像、匹配代价图及双目立体视觉图像；

步骤S2：将基于所述双目实时图像得到的双目可见光非立体图像中的一幅、匹配代价图及双目立体视觉图像输入至训练好的深度卷积神经网络，由所述深度卷积神经网络处理输出高精度立体视觉图像。

在具体实施过程中，通过以下方式训练所述深度卷积神经网络：

步骤S201：离线采集视场范围内的双目样本图像，并基于所述双目样本图像，处理得到双目可见光非立体图像、匹配代价图及双目立体视觉图像；

步骤S202：在同一时刻获取与双目样本图像同一视场范围内的精确立体视觉图像；

步骤S203：以同一视场内的标定物为基准建立坐标系，确定所述双目立体视觉单元坐标和所述教练单元坐标之间的变换关系；

步骤S204：根据所述变换关系校正所述基于所述双目样本图像得到的双目可见光非立体图像、匹配代价图、双目立体视觉图像，以及精确立体视觉图像，将其统一至同一坐标系中；

步骤S205：将校正后的双目可见光非立体图像中的一幅、匹配代价图及双目立体视觉图像作为深度卷积神经网络的三个通道对齐输入，以校正后的精确立体视觉图像作为正样本图像，训练所述深度卷积神经网络，具体地，

步骤S2051：当所述深度卷积神经网络训练输出的立体视觉图像与所述正样本图像之间的偏差满足阈值条件时，得到收敛的深度卷积神经网络，训练结束；否则，执行步骤S2052；

步骤S2052：根据以下公式修正正样本图像的每个像素点：

步骤S2053：利用修正后的正样本图像继续训练所述深度卷积神经网络(即跳转到步骤S2051)，若收敛，得到收敛的深度卷积神经网络；否则，重复上述修正过程。

经过上述过程，能够得到深度卷积神经网络。

训练完成后，将双目实时图像得到的双目可见光非立体图像中的一幅、匹配代价图及双目立体视觉图像输入至训练好的深度卷积神经网络，即可由所述深度卷积神经网络处理输出高精度立体视觉图像。但是，当当采集双目实时图像的位置、视场范围或环境光源发生显著变化时，已训练好的深度卷积神经网络不再适用，需要根据变化后的环境信息，重新进行图像的采集和深度卷积神经网络的训练。

上述方法实施例和装置实施例，基于相同的原理，其相关之处可相互借鉴，且能达到相同的技术效果。

本领域技术人员可以理解，实现上述实施例方法的全部或部分流程，可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于计算机可读存储介质中。其中，所述计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。

Claims

1.一种教练式双目立体视觉装置，其特征在于，包括：

智能学习单元，用于根据基于所述双目样本图像得到的双目可见光非立体图像中的一幅、匹配代价图、双目立体视觉图像，以及教练单元输出的精确立体视觉图像，训练存储在所述智能学习单元中的深度卷积神经网络，直至收敛；还用于在训练完成后，根据基于所述双目实时图像得到的双目可见光非立体图像中的一幅、匹配代价图、双目立体视觉图像，得到被测范围的高精度立体视觉图像；

所述智能学习单元在训练所述深度卷积神经网络前，还根据所述双目立体视觉单元坐标和所述教练单元坐标之间的变换关系，校正所述基于所述双目样本图像得到的双目可见光非立体图像、匹配代价图、双目立体视觉图像，以及精确立体视觉图像，将其统一至同一坐标系中；

所述变换关系通过下述方式确定：

对齐所述双目立体视觉单元和所述教练单元，利用同一视场内的标定物为基准建立坐标系，确定所述双目立体视觉单元坐标和所述教练单元坐标之间的变换关系；

所述智能学习单元通过执行以下操作训练所述深度卷积神经网络：

否则，根据以下公式修正正样本图像的每个像素点：

2.根据权利要求1所述的教练式双目立体视觉装置，其特征在于，所述双目立体视觉单元包括：两个同参数可见光摄像头和一个控制器；

3.根据权利要求2所述的教练式双目立体视觉装置，其特征在于，所述教练单元包括红外激光发射器、高帧频红外摄像头，基于红外激光TOF原理，得到教练单元输出的精确立体视觉图像。

4.根据权利要求2所述的教练式双目立体视觉装置，其特征在于，

所述控制器采用BM算法处理所述同一时刻采集被测范围内的两幅图像，得到双目可见光非立体图像、匹配代价图及双目立体视觉图像。

5.一种高精度立体视觉图像获取方法，其特征在于，包括如下步骤：

将基于所述双目实时图像得到的双目可见光非立体图像中的一幅、匹配代价图及双目立体视觉图像输入至训练好的深度卷积神经网络，由所述深度卷积神经网络处理输出高精度立体视觉图像；

通过以下方式训练所述深度卷积神经网络：

否则，根据以下公式修正正样本图像的每个像素点：

6.根据权利要求5所述的高精度立体视觉图像获取方法，其特征在于，所述校正所述基于所述双目样本图像处理得到的双目可见光非立体图像、匹配代价图、双目立体视觉图像，以及精确立体视觉图像，包括：

以同一视场内的标定物为基准建立坐标系，确定双目立体视觉单元坐标和教练单元坐标之间的变换关系；

根据所述变换关系校正所述基于所述双目样本图像得到的双目可见光非立体图像、匹配代价图、双目立体视觉图像，以及精确立体视觉图像，将其统一至同一坐标系中；

其中，所述双目立体视觉单元，用于离线采集视场范围内的双目样本图像及在线采集被测范围的双目实时图像；所述教练单元，用于获取与双目样本图像同一视场范围内的精确立体视觉图像。

7.根据权利要求5所述的高精度立体视觉图像获取方法，其特征在于，当采集双目实时图像的位置、视场范围或环境光源发生显著变化时，重新训练所述深度卷积神经网络。