WO2023231173A1

WO2023231173A1 - 双目立体匹配方法、设备及存储介质

Info

Publication number: WO2023231173A1
Application number: PCT/CN2022/110041
Authority: WO
Inventors: 崔岩; 常青玲; 戴成林; 徐世廷; 李敏华
Original assignee: 五邑大学; 广东四维看看智能设备有限公司; 中德（珠海）人工智能研究院有限公司; 珠海市四维时代网络科技有限公司
Priority date: 2022-06-01
Filing date: 2022-08-03
Publication date: 2023-12-07

Abstract

本申请公开了一种双目立体匹配方法、设备及存储介质，所述方法包括获取第一视图和第二视图；将第一视图和第二视图分别输入到两个特征提取模块，得到第一特征图和第二特征图；将第一特征图和第二特征图输入到有效注意力模块，得到第二大尺度重组图，有效注意力模块用于根据第一特征图重新分配第二特征图的内容权重；根据第一特征图和第二大尺度重组图，构建混合型代价体；将混合型代价体输入视差回归模块，得到视差图。本申请通过设置有效注意力模块，根据第一特征图重新分配第二特征图的内容权重，根据第一特征图和第二大尺度重组图构建得到的混合型代价体的准确性高，能够提高视差图的准确性。

Description

双目立体匹配方法、设备及存储介质

技术领域

本发明涉及图像数据处理领域，特别涉及一种双目立体匹配方法、设备及存储介质。

背景技术

双目立体匹配是一项计算机视觉任务，双目立体匹配也称作双目视差估计或双目深度估计，通常使用左右特征图构造的代价体来获得视差图或深度图，进而估计视差和深度，被广泛应用于三维重建、自动驾驶和机器人导航等领域。

相关技术中，双目立体匹配是通过对左图和右图分别提取对应的特征图，并根据左右特征图来构建代价体，构建过程中，由于两个视图之间存在部分区域不匹配的问题，容易影响构建得到的代价体的准确性，从而导致所获视差图的准确性不足。

发明内容

本发明旨在至少解决现有技术中存在的技术问题之一。为此，本发明提供了一种双目立体匹配方法、设备及存储介质，能够提高所获代价体的准确性，并且提高所获视差图的准确性。

本发明第一方面实施例提供一种双目立体匹配方法，包括如下步骤：

获取第一视图和第二视图；

将第一视图和第二视图分别输入到两个特征提取模块，得到第一特征图和第二特征图；

将第一特征图和第二特征图输入到有效注意力模块，得到第二大尺度重组图，其中，有效注意力模块用于根据第一特征图重新分配第二特征图的内容权重；

根据第一特征图和第二大尺度重组图，构建混合型代价体；

将混合型代价体输入视差回归模块，得到视差图。

根据本发明的上述实施例，至少具有如下有益效果：通过设置有效注意力模块，根据第一特征图重新分配第二特征图的内容权重，令第二特征图的有用信息得到强调并且抑制无用信息，能够提高得到的第二大尺度重组图与第一特征图的相似性，即令第二大尺度重组图能够重点展示与第一特征图各区域对应的图像信息，从而提高两者的匹配性能，根据第一特征图和第二大尺度重组图构建得到的混合型代价体的准确性高，进而能够提高所获视差图的准确性。

根据本发明第一方面的一些实施例，将第一视图和第二视图分别输入到两个特征提取模块，得到第一特征图和第二特征图，包括：

将第一视图输入第一特征提取模块，得到多个尺度的第一初始特征图；

将第二视图输入第二特征提取模块，得到多个尺度的第二初始特征图；

将每一第一初始特征图采样到同一尺度后进行融合，得到第一特征图；

将每一第二初始特征图采样到同一尺度后进行融合，得到第二特征图。

根据本发明第一方面的一些实施例，将每一第一初始特征图采样到同一尺度后进行融合，得到第一特征图，包括：

将每一第一初始特征图分别采样到两个不同尺度，得到两组不同尺度的第一采样图组，其中，第一采样图组中每一第一采样图的尺度相同；

将两组第一采样图组分别进行融合，得到第一大尺度特征图和第一小尺度特征图，其中第一大尺度特征图和第一小尺度特征图均为第一特征图，第一大尺度特征图的尺度大于第一小尺度特征图的尺度。

根据本发明第一方面的一些实施例，将每一第二初始特征图采样到同一尺度后进行融合，得到第二特征图，包括：

将每一第二初始特征图分别采样到两个不同尺度，得到两组不同尺度的第二采样图组，其中，第二采样图组中每一第二采样图的尺度相同；

将两组第二采样图组分别进行融合，得到第二大尺度特征图和第二小尺度特征图，其中，第二大尺度特征图和第二小尺度特征图均为第二特征图，第二大尺度特征图的尺度大于第二小尺度特征图的尺度。

根据本发明第一方面的一些实施例，第一大尺度特征图的尺度与第二大尺度特征图的尺度相同，第一小尺度特征图的尺度与第二小尺度特征图的尺度相同；

将第一特征图和第二特征图输入到有效注意力模块，得到第二大尺度重组图，包括：

将第一小尺度特征图和第二小尺度特征图输入到第一有效注意力模块，得到第二小尺度重组图；

将第一小尺度特征图和第二小尺度重组图融合后输入到细化模块进行特征细化，得到特征细化图；

将特征细化图和第二大尺度特征图输入到扭曲模块，得到扭曲特征图；

将第一大尺度特征图和扭曲特征图输入到第二有效注意力模块，得到第二大尺度重组图。

根据本发明第一方面的一些实施例，将第一小尺度特征图和第二小尺度特征图输入到第一有效注意力模块，得到第二小尺度重组图，包括：将第一小尺度特征图和第二小尺度特征图输入到第一有效注意力模块，通过第一有效注意力模块将第一小尺度特征图依次进行最大池化、二维卷积和激活之后与第二小尺度特征图相乘，得到第二小尺度重组图；

将第一大尺度特征图和扭曲特征图输入到第二有效注意力模块，得到第二大尺度重组图，包括：将第一大尺度特征图和扭曲特征图输入到第二有效注意力模块，通过第二有效注意力模块将第一大尺度特征图依次进行最大池化、二维卷积和激活之后与第二小尺度特征图相乘，得到第二大尺度重组图。

根据本发明第一方面的一些实施例，根据第一特征图和第二大尺度重组图，构建混合型代价体，包括：

根据第一特征图和第二大尺度重组图，分别构建相减型代价体、分组相关型代价体和连接合并型代价体；

将相减型代价体、分组相关型代价体和连接合并型代价体进行融合，得到混合型代价体。

根据本发明第一方面的一些实施例，将混合型代价体输入视差回归模块，得到视差图，包括：

将混合型代价体输入聚合模块，得到代价聚合结果；

将代价聚合结果输入视差回归模块，得到视差图。

本发明第二方面实施例提供一种电子设备，包括：

存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现第一方面任意一项的双目立体匹配方法。

由于第二方面实施例的电子设备应用第一方面任意一项的双目立体匹配方法，因此具有本发明第一方面的所有有益效果。

根据本发明第三方面实施例提供的一种计算机存储介质，存储有计算机可执行指令，计算机可执行指令用于执行第一方面任意一项的双目立体匹配方法。

由于第三方面实施例的计算机存储介质可执行第一方面任意一项的双目立体匹配方法，因此具有本发明第一方面的所有有益效果。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1是本发明实施例的双目立体匹配方法的主要步骤图；

图2是本发明实施例的双目立体匹配方法的工作原理示意图；

图3是图2中多尺度特征提取和融合模块的工作原理示意图；

图4是图2中有效注意力模块的工作原理示意图；

图5是图2中混合型代价体的构建过程的工作原理示意图。

具体实施方式

本发明的描述中，除非另有明确的限定，设置、安装、连接等词语应做广义理解，所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。在本发明的描述中，若干的含义是一个或者多个，多个的含义是两个以上，大于、小于、超过等理解为不包括本数，以上、以下、以内等理解为包括本数。此外，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。

双目立体匹配本质上就是深度估计方法，属于计算机视觉任务，立体匹配也称作视差估计或双目深度估计，通常使用左右特征图构造的代价体来估计视差和深度，被广泛应用于三维重建、自动驾驶和机器人导航等领域。它通常是利用从输入的左右图像中计算出的总代价来获得视差，然后根据公式D＝B×f/d计算深度D，即深度D便可以由基线B、焦距f和估计出的视差d计算得到，其中基线B是指输入的左右图像之间的距离。

一方面，自从深度学习被引入机器视觉领域，许多视觉任务都取得了很好的效果。图像分类、目标检测、目标识别等视觉任务都取得了很大的进步。仅以PSMNet、FADNet和StereoNet为例，PSMNet是一个重大的突破，它将全局上下文信息整合到代价体的构造中，以解决不适定区域问题，FADNet通过基于二维卷积的相关层实现，并借助多尺度权重训练策略保持更快的计算速度，StereoNet使用低分辨率代价体来加快运行时间，同时使用具有边缘感应功能的上采样函数来保留边缘的细节。而另一方面，一些基于学习的视觉任务，如实例分割、场景分割和图像超分，利用自然语言处理中通常用于关注感兴趣区域的注意力算法，也表现不错。双目立体匹配也不例外。例如MCANet利用它来细化视差，NLCANet通过它来利用全局上下文信息。

相关技术中，双目立体匹配是通过对左图和右图分别提取对应的特征图，并根据左右特征图来构建代价体，构建过程中，由于两个视图之间存在不适区域的问题，影响构建得到的代价体的准确性，从而导致所获视差的准确性不足。

当引入卷积神经网络和注意力算法到双目立体匹配时取得的视差图仍存在准确性不足的问题。

下面参照图1至图5描述本发明的双目立体匹配方法、设备及存储介质，通过提高用于构建代价体的两个特征图的匹配性，能够提高所获代价体的准确性，并且提高所获视差图的准确性。

参考图1所示，根据本发明第一方面实施例的一种双目立体匹配方法，至少包括如下步骤：

S100、获取第一视图和第二视图，其中，第一视图和第二视图分别为左图和右图、或右图和左图；

S200、将第一视图和第二视图分别输入到两个特征提取模块，得到第一特征图和第二特征图；

S300、将第一特征图和第二特征图输入到有效注意力模块，得到第二大尺度重组图，其中，有效注意力模块用于根据第一特征图重新分配第二特征图的内容权重，从而得到第二大尺度重组图；

S400、根据第一特征图和第二大尺度重组图，构建混合型代价体；

S500、将混合型代价体输入视差回归模块，得到视差图。

通过设置有效注意力模块，根据第一特征图重新分配第二特征图的内容权重，令第二特征图的有用信息得到强调并且能够抑制其中的无用信息，能够提高得到的第二大尺度重组图与第一特征图的相似性，即令第二大尺度重组图能够重点展示与第一特征图各区域对应的图像信息，从而提高得到的第二大尺度重组图与第一特征图的匹配性能，根据第一特征图和第二大尺度重组图构建得到的混合型代价体的准确性高，进而能够提高所获视差图的准确性。

相关技术中，引入卷积神经网络和注意力算法到双目立体匹配，尽管这些方式在精度或效率方面取得能够令人信服的性能，但仍存在一些不适区域的问题，例如表面反射、结构稀薄、图案重复、纹理缺失和区域遮挡，现有的双目立体匹配方法的信息获取不够完整，使得它们难以满足高精度应用的要求。

为了减少上述问题带来的影响，可以理解的是，步骤S200，将第一视图和第二视图分别输入到两个特征提取模块，得到第一特征图和第二特征图，包括：

S210、将第一视图输入第一特征提取模块，得到多个尺度的第一初始特征图；

S220、将第二视图输入第二特征提取模块，得到多个尺度的第二初始特征图；

S230、将每一第一初始特征图采样到同一尺度后进行融合，得到第一特征图；

S240、将每一第二初始特征图采样到同一尺度后进行融合，得到第二特征图。

可以理解的是，第一特征提取模块和第二特征提取模块均为MobileNetV2特征提取模块，它具有轻量级的特性，通过U-Net网络的上采样和下采样构建对应的融合模块，用于实现步骤S230和步骤S240的融合操作。

可以理解的是，步骤S230具体为：将每一第一初始特征图采样到同一尺度后进行融合，并且卷积后得到第一特征图。步骤S240具体为：将每一第二初始特征图采样到同一尺度后进行融合，并且卷积后得到第二特征图。通过卷积操作能够有效提高所获第一特征图和第二特征图的性能，从而提高后续步骤进行的可靠性。

可以理解的是，S230、将每一第一初始特征图采样到同一尺度后进行融合，得到第一特征图，包括：

S231、将每一第一初始特征图分别采样到两个不同尺度，得到两组不同尺度的第一采样图组，其中，同一第一采样图组中每一第一采样图的尺度相同；

S232、将两组第一采样图组分别进行融合，得到第一大尺度特征图和第一小尺度特征图，其中，第一大尺度特征图和第一小尺度特征图均为第一特征图，第一大尺度特征图的尺度大于第一小尺度特征图的尺度，融合时，同一组第一采样图组中的所有第一采样图进行融合。

可以理解的是，将每一第二初始特征图采样到同一尺度后进行融合，得到第二特征图，包括：

S241、将每一第二初始特征图分别采样到两个不同尺度，得到两组不同尺度的第二采样图组，其中，同一第二采样图组中每一第二采样图的尺度相同；

S242、将两组第二采样图组分别进行融合，得到第二大尺度特征图和第二小尺度特征图，其中，第二大尺度特征图和第二小尺度特征图均为第二特征图，第二大尺度特征图的尺度大于第二小尺度特征图的尺度，融合时，同一组第二采样图组中的所有第二采样图进行融合。

可以理解的是，第一大尺度特征图的尺度与第二大尺度特征图的尺度相同，第一小尺度特征图的尺度与第二小尺度特征图的尺度相同；

步骤S300，将第一特征图和第二特征图输入到有效注意力模块，得到第二大尺度重组图，包括：

S310、将第一小尺度特征图和第二小尺度特征图输入到第一有效注意力模块，得到第二小尺度重组图；

S320、将第一小尺度特征图和第二小尺度重组图融合后输入到细化模块进行特征细化，得到特征细化图，其中，特征细化是指特征的卷积细化操作，经过特征细化得到的特征细化图的尺度与第二大尺度特征图的尺度相同；

S330、将特征细化图和第二大尺度特征图输入到扭曲模块进行仿射扭曲，得到扭曲特征图，其中，扭曲特征图是通过将特征细化图向第二大尺度特征图的视角方向进行扭曲；

S340、将第一大尺度特征图和扭曲特征图输入到第二有效注意力模块，得到第二大尺度重组图。

第二小尺度重组图和第二大尺度重组图满足：

其中，

表示经过第二小尺度重组图或第二大尺度重组图，

表示第一小尺度特征图或第一大尺度特征图，

是第二小尺度重组图或第二大尺度重组图，i表示第i个尺度。

可以理解的是，步骤S310，将第一小尺度特征图和第二小尺度特征图输入到第一有效注意力模块，得到第二小尺度重组图，包括：将第一小尺度特征图和第二小尺度特征图输入到第一有效注意力模块，通过第一有效注意力模块将第一小尺度特征图依次进行最大池化、二维卷积和Sigmoid函数激活之后与第二小尺度特征图相乘，得到第二小尺度重组图；

步骤S340、将第一大尺度特征图和扭曲特征图输入到第二有效注意力模块，得到第二大尺度重组图，包括：将第一大尺度特征图和扭曲特征图输入到第二有效注意力模块，通过第二有效注意力模块将第一大尺度特征图依次进行最大池化、二维卷积和Sigmoid函数激活之后与第二小尺度特征图相乘，得到第二大尺度重组图。

单一的代价体难以为模型提供足够的特征信息。例如，相减型代价体利用输入成对图像之间有用的信息差异，可以使模型更快地获得结果；分组相关型代价体能够分组储存输入成对图像信道的平均信息，并使结果稳定在一定范围内；连接合并型代价体，为训练模型提供更全面的图像信息。

为了更充分地利用特征信息，综合各种代价体的特性，可以理解的是，步骤S400，根据第一特征图和第二大尺度重组图，构建混合型代价体，包括：

步骤S410、根据第一特征图和第二大尺度重组图，分别构建相减型代价体、分组相关型代价体和连接合并型代价体；

步骤S420、将相减型代价体、分组相关型代价体和连接合并型代价体进行融合，得到混合型代价体。

混合型代价体的融合过程满足：C _mix＝C _sub||C _gwc||C _con，其中，C _sub为相减型代价体，C _gwc为分组相关型代价体，C _con为连接合并型代价体，||为连接合并操作。

相减型代价体、分组相关型代价体和连接合并型代价体的构建通过以下方式获得：

其中，

和

表示提取的第一特征图，

和

表示第二大尺度重组图，N _c表示指提取的特征图的通道数，N _g表示分组数，<*,*>是内积操作，||表示连接合并操作。

在立体匹配中，代价体的具体是一个重要的环节，设置一种崭新的聚合模块用于发挥混合型代价体的作用，可以理解的是，将混合型代价体输入视差回归模块，得到视差图，包括：

S510、将混合型代价体输入聚合模块，得到代价聚合结果；

S520、将代价聚合结果输入视差回归模块，得到视差图。

其中，聚合模块的运行过程满足：C _mix′＝NCAM(C _mix)，C _mix′表示代价聚合结果，C _mix表示混合型代价体。

下面以一个具体的实施例来详细描述本发明第一方面的双目立体匹配方法。值得理解的是，下述描述仅是示例性说明，而不是对发明的具体限制。

获取第一视图和第二视图，其中，第一视图和第二视图分别为左图和右图。

将第一视图输入第一特征提取模块，得到多个尺度的第一初始特征图，各个尺度分别为1/2、1/4、1/8、1/16和1/32；将每一第一初始特征图分别采样到两个不同尺度，得到两组不同尺度的第一采样图组，其中，同一第一采样图组中每一第一采样图的尺度相同；将两组第一采样图组分别进行融合，分别得到第一大尺度特征图和第一小尺度特征图，其中，第一大尺度特征图和第一小尺度特征图均为第一特征图，第一大尺度特征图的尺度为1/4，第一小尺度特征度的尺度为1/8，融合时，同一组第一采样图组中的所有第一采样图进行融合。上述的执行过程在图2中第一视图后的多尺度特征提取和融合模块进行，其中，左图的多尺度特征提取和融合模块的执行过程参考图3中上半部分所示。

将第二视图输入第二特征提取模块，得到多个尺度的第二初始特征图，各个尺度分别为1/2、1/4、1/8、1/16和1/32，其中第二特征提取模块与第一特征提取模块共享权重；将每一第二初始特征图分别采样到两个不同尺度，得到两组不同尺度的第二采样图组，其中，同一第二采样图组中每一第二采样图的尺度相同；将两组第二采样图组分别进行融合，分别得到第二大尺度特征图和第二小尺度特征图，其中，第二大尺度特征图和第二小尺度特征图均为第二特征图，第二大尺度特征图的尺度为1/4，第二小尺度特征度的尺度为1/8，融合时，同一组第二采样图组中的所有第二采样图进行融合。上述的执行过程在图2中第二视图后的多尺度特征提取和融合模块进行，其中，多尺度特征提取和融合模块的执行过程参考图3中下半部分所示。

将第一小尺度特征图和第二小尺度特征图输入到第一有效注意力模块，将第一小尺度特征图依次进行最大池化、二维卷积和Sigmoid函数激活之后与第二小尺度特征图相乘，得到第二小尺度重组图。上述的执行过程在图2中左侧的有效注意力模块进行，对应的有效力注意力模块的执行过程参考图4所示，图4中所示为左特征图为第一小尺度特征图，图4中所示的(扭曲)右特征图为第二小尺度特征图，新(扭曲)右特征图为第二小尺度重组图。

将第一小尺度特征图和第二小尺度重组图融合后输入到细化模块进行特征细化，得到特征细化图，其中，特征细化是指特征的卷积细化操作，经过特征细化得到的特征细化图的尺度与第二大尺度特征图的尺度相同，尺度都为1/4。上述的执行过程在图2中细化模块中进行。

将特征细化图和第二大尺度特征图输入到扭曲模块进行仿射扭曲，得到扭曲特征图，其中，扭曲特征图是通过将特征细化图向第二大尺度特征图的视角方向进行扭曲。上述的执行过程在图2中扭曲模块中进行。

将第一大尺度特征图和扭曲特征图输入到第二有效注意力模块，将第一大尺度特征图依次进行最大池化、二维卷积和Sigmoid函数激活之后与第二小尺度特征图相乘，得到第二大尺度重组图。上述的执行过程在图2中右侧的有效注意力模块进行，其中，对应有效注意力模块的执行过程参考图4所示，图4中所示为左特征图为第一大尺度特征图，图4中所示的(扭曲)右特征图为扭曲特征图，新(扭曲)右特征图为第二大尺度重组图。

根据第一大尺度特征图和第二大尺度重组图，分别构建相减型代价体、分组相关型代价体和连接合并型代价体；将相减型代价体、分组相关型代价体和连接合并型代价体进行融合，得到混合型代价体。上述的执行过程在图2中混合型代价体进行，其中，混合型代价体的构建过程参考图5所示。

将混合型代价体输入聚合模块进行，得到代价聚合结果。上述执行过程在图2中崭新代价体聚合模块进行。

将代价聚合结果输入视差回归模块，得到视差图。上述执行过程在图2中视差回归模块进行。

上述的各个处理模块都可以通过神经网络训练获得。

另外，本发明第二方面实施例还提供了一种电子设备，该电子设备包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序。

处理器和存储器可以通过总线或者其他方式连接。

存储器作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外，存储器可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中，存储器可选包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

实现上述第一方面实施例的双目立体匹配方法所需的非暂态软件程序以及指令存储在存储器中，当被处理器执行时，执行上述实施例中的双目立体匹配方法，例如，执行以上描述的方法步骤S100至S500、方法步骤S210至S240、方法步骤S231和S232、方法步骤S241和S242、方法步骤S310至S340、方法步骤S410至S420、方法步骤S510至S520。

以上所描述的设备实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

此外，本发明第三方面实施例提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机可执行指令，该计算机可执行指令被一个处理器或控制器执行，例如，被上述设备实施例中的一个处理器执行，可使得上述处理器执行上述实施例中的双目立体匹配方法，例如，执行以上描述的方法步骤S100至S500、方法步骤S210至S240、方法步骤S231和S232、方法步骤S241和S242、方法步骤S310至S340、方法步骤S410至S420、方法步骤S510至S520。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、***可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器，如中央处理器、数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

Claims

一种双目立体匹配方法，其特征在于，包括如下步骤：

获取第一视图和第二视图；

将所述第一视图和所述第二视图分别输入到两个特征提取模块，得到第一特征图和第二特征图；

将所述第一特征图和所述第二特征图输入到有效注意力模块，得到第二大尺度重组图，其中，所述有效注意力模块用于根据所述第一特征图重新分配所述第二特征图的内容权重；

根据所述第一特征图和所述第二大尺度重组图，构建混合型代价体；

将所述混合型代价体输入视差回归模块，得到视差图。
根据权利要求1所述的一种双目立体匹配方法，其特征在于，所述将所述第一视图和所述第二视图分别输入到两个特征提取模块，得到第一特征图和第二特征图，包括：

将所述第一视图输入第一特征提取模块，得到多个尺度的第一初始特征图；

将所述第二视图输入第二特征提取模块，得到多个尺度的第二初始特征图；

将每一所述第一初始特征图采样到同一尺度后进行融合，得到第一特征图；

将每一所述第二初始特征图采样到同一尺度后进行融合，得到第二特征图。
根据权利要求2所述的一种双目立体匹配方法，其特征在于，所述将每一所述第一初始特征图采样到同一尺度后进行融合，得到第一特征图，包括：

将每一所述第一初始特征图分别采样到两个不同尺度，得到两组不同尺度的第一采样图组，其中，所述第一采样图组中每一第一采样图的尺度相同；

将两组所述第一采样图组分别进行融合，得到第一大尺度特征图和第一小尺度特征图，其中所述第一大尺度特征图和所述第一小尺度特征图均为第一特征图，所述第一大尺度特征图的尺度大于所述第一小尺度特征图的尺度。
根据权利要求3所述的一种双目立体匹配方法，其特征在于，所述将每一所述第二初始特征图采样到同一尺度后进行融合，得到第二特征图，包括：

将每一所述第二初始特征图分别采样到两个不同尺度，得到两组不同尺度的第二采样图组，其中，所述第二采样图组中每一第二采样图的尺度相同；

将两组所述第二采样图组分别进行融合，得到第二大尺度特征图和第二小尺度特征图，其中，所述第二大尺度特征图和所述第二小尺度特征图均为第二特征图，所述第二大尺度特征图的尺度大于所述第二小尺度特征图的尺度。
根据权利要求4所述的一种双目立体匹配方法，其特征在于，所述第一大尺度特征图的尺度与所述第二大尺度特征图的尺度相同，所述第一小尺度特征图的尺度与所述第二小尺度特征图的尺度相同；

所述将所述第一特征图和所述第二特征图输入到有效注意力模块，得到第二大尺度重组图，包括：

将所述第一小尺度特征图和所述第二小尺度特征图输入到第一有效注意力模块，得到第二小尺度重组图；

将所述第一小尺度特征图和所述第二小尺度重组图融合后输入到细化模块进行特征细化，得到特征细化图；

将所述特征细化图和所述第二大尺度特征图输入到扭曲模块，得到扭曲特征图；

将所述第一大尺度特征图和所述扭曲特征图输入到第二有效注意力模块，得到第二大尺度重组图。
根据权利要求5所述的一种双目立体匹配方法，其特征在于，所述将所述第一小尺度特征图和所述第二小尺度特征图输入到第一有效注意力模块，得到第二小尺度重组图，包括：将所述第一小尺度特征图和所述第二小尺度特征图输入到第一有效注意力模块，通过所述第一有效注意力模块将所述第一小尺度特征图依次进行最大池化、二维卷积和激活之后与所述第二小尺度特征图相乘，得到第二小尺度重组图；

所述将所述第一大尺度特征图和所述扭曲特征图输入到第二有效注意力模块，得到第二大尺度重组图，包括：将所述第一大尺度特征图和所述扭曲特征图输入到第二有效注意力模块，通过所述第二有效注意力模块将所述第一大尺度特征图依次进行最大池化、二维卷积和激活之后与所述第二小尺度特征图相乘，得到第二大尺度重组图。
根据权利要求1至6任一项所述的一种双目立体匹配方法，其特征在于，所述根据所述第一特征图和所述第二大尺度重组图，构建混合型代价体，包括：

根据所述第一特征图和所述第二大尺度重组图，分别构建相减型代价体、分组相关型代价体和连接合并型代价体；

将所述相减型代价体、所述分组相关型代价体和所述连接合并型代价体进行融合，得到混合型代价体。
根据权利要求7所述的一种双目立体匹配方法，其特征在于，所述将所述混合型代价体输入视差回归模块，得到视差图，包括：

将所述混合型代价体输入聚合模块，得到代价聚合结果；

将所述代价聚合结果输入视差回归模块，得到所述视差图。
一种电子设备，其特征在于，包括：

存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至8中任意一项所述的一种双目立体匹配方法。
一种计算机存储介质，其特征在于，存储有计算机可执行指令，所述计算机可执行指令用于执行权利要求1至8中任意一项所述的一种双目立体匹配方法。