CN113269699B

CN113269699B - 基于异步事件流与灰度图像融合的光流估计方法与***

Info

Publication number: CN113269699B
Application number: CN202110436248.2A
Authority: CN
Inventors: 史殿习; 刘聪; 苏雅倩文; 金松昌; 杨烟台; 景罗希; 李雪辉
Original assignee: Tianjin (binhai) Intelligence Military-Civil Integration Innovation Center; National Defense Technology Innovation Institute PLA Academy of Military Science
Current assignee: Tianjin (binhai) Intelligence Military-Civil Integration Innovation Center; National Defense Technology Innovation Institute PLA Academy of Military Science
Priority date: 2021-04-22
Filing date: 2021-04-22
Publication date: 2023-01-03
Anticipated expiration: 2041-04-22
Also published as: CN113269699A

Abstract

本申请涉及计算机视觉中的光流估计技术领域，具体而言，本申请涉及基于异步事件流与灰度图像融合的光流估计方法与***。所述方法包括以下步骤：获取异步事件流与同步灰度图像；对所述异步事件流与同步灰度图像进行预处理，得到事件帧与灰度图像；对所述事件帧与灰度图像按照时间对齐进行通道叠加扩充得到多通道的复合图像，对所述复合图像进行池化得到区域特征矩阵，对所述区域特征矩阵叠加获得相应的张量，再将所述张量输入到权重自适应提取网络进行融合；将融合后得到的融合图像输入训练好的光流估计深度神经网络，获得最终的光流估计结果。本方法与***将事件流与灰度图像有机融合，能够提高光流估计算法的鲁棒性与泛化性。

Description

基于异步事件流与灰度图像融合的光流估计方法与***

技术领域

本申请涉及计算机视觉中的光流估计技术领域，更为具体来说，本申请涉及基于异步事件流与灰度图像融合的光流估计方法与***。

背景技术

对于光流估计视觉任务而言，清晰稳定的输入是确保算法性能的基本前提。在普通场景下，传统相机可以捕捉到较为清晰的图像，然而在高速运动、光照变化强烈等复杂情况下，基于传统相机的光流估计方法性能会受到影响。事件相机是一种新型仿生视觉传感器，该相机具有高动态范围、高时间分辨率、低延迟等特点，尤其适合于高速动态场景。现有的光流估计方法要么只利用事件相机，要么只利用传统相机，将互补的二者结合起来有利于提高光流估计算法的鲁棒性。

事件相机输出的是异步的事件流，其独特的成像方式，使得其在光照变化不够明显，或者与环境间的相对运动变化不大的情况下输出的数据往往是不稳定的、不可靠的，包含有很多噪点。在这种情况下，传统相机可以互补地捕捉到较为清晰的图像。目前有许多面向异步事件流或者传统相机的光流估计算法，但是还没有将二者结合起来的用于光流估计的方法。

事件相机输出的是异步的事件流，与传统的灰度图像在数据格式上有本质上的区别，要想将二者融合首先是需要将事件流处理成与灰度图像具有相同格式的数据。常用的方法是事件流的事件计数表示法与最近时间戳表示法。在其他视觉任务领域中，可见的事件流与传统图像融合的方法最多的是基于通道扩充的直接融合法。这种融合方法没有考虑到在不同情况下事件帧与传统图像的成像质量不同，而是将二者等比融合。同时，在一个图像的不同区域内也存在二者质量分布的差别。

因此，本申请提出基于异步事件流与灰度图像融合的光流估计方法与***，以至少部分地解决上述技术问题。

发明内容

本发明做法是将异步事件流变为与同步灰度图像相同的格式，再将二者融合，从而提高光流估计法的鲁棒性与泛化性。

为实现上述技术目的，本申请提供了基于异步事件流与灰度图像融合的光流估计方法，包括以下步骤：

获取异步事件流与同步灰度图像；

对所述异步事件流与同步灰度图像进行预处理，得到事件帧与灰度图像；

对所述事件帧与灰度图像按照时间对齐进行通道叠加扩充得到多通道的复合图像，对所述复合图像进行池化得到区域特征矩阵，对所述区域特征矩阵叠加获得相应的张量，再将所述张量输入到权重自适应提取网络进行融合；

将融合后得到的融合图像输入训练好的光流估计深度神经网络，获得最终的光流估计结果。

优选地，所述获取异步事件流与同步灰度图像通过事件相机、场景构建和运动控制获得。

优选地，所述多通道为五通道。

进一步地，所述对所述异步事件流与同步灰度图像进行预处理，得到事件帧与灰度图像，具体包括：

将离散的事件按照左右双目相机划分为两个主题，分别对应事件和灰度图像；

将所有事件打包为rosbag格式文件包；

将灰度图像以jpg格式进行存储，并按照时间序列对其进行标号，得到灰度图像序列；

接收所述rosbag格式文件包和所述灰度图像序列，将rosbag格式文件包中的异步事件流叠加成与灰度图像具有相同尺寸大小的同步帧的格式，记为事件帧。

进一步地，所述事件帧的表示方法采用事件计数图像或最近时间戳图像表示法。

进一步地，对所述事件帧与灰度图像按照时间对齐进行通道叠加扩充得到五通道的复合图像，对其进行池化得到区域特征矩阵，对所述区域特征矩阵叠加获得相应的张量，再将所述张量输入到自适应提取网络进行融合，具体包括：

接收具有同样大小的事件帧与灰度图像共五个帧，其中，五个帧包含正事件的计数图像1帧与其最近时间戳图像1帧、负事件的计数图像1帧与其最近时间戳图像1帧及灰度图像1帧；

对所述五个帧按照时间对齐进行通道叠加扩充，得到包含五个通道的复合图像；

将所述复合图像的每个通道按比例划分为4×4共16个小区域，然后对每个小区域进行区域平均池化，池化后区域内的所有像素被缩小为一个值代替，得到4×4大小的区域特征矩阵；

将所述区域特征矩阵进行叠加得到4×4×5大小的张量，然后将其输入到权重自适应提取网络进行融合。

优选地，所述权重自适应提取网络由两层全连接层实现，第一层全连接的激活函数为ReLU激活函数，第二层全连接的激活函数为Sigmoid激活函数，所述权重自适应提取网络输出的是与输入相同大小的4×4×5的张量。

优选地，所述光流估计深度神经网络的训练步骤包括：

获取事件帧与灰度图像的融合图像；

对所述融合图像进行卷积编码与上采样解码；

计算自监督损失，损失函数包括光滑误差和光度误差；

更新网络连接参数。

优选地，所述光流估计深度神经网络采用4层编码层、2层残差层和4层解码层。

本发明第二方面还提供了一种基于异步事件流与灰度图像融合的光流估计***，包括：

***底层模块，用于获取异步事件流与同步灰度图像；

事件帧生成模块，用于对所述异步事件流与同步灰度图像进行预处理，得到事件帧与灰度图像；

事件帧与灰度图像融合模块，用于对所述事件帧与灰度图像按照时间对齐进行通道叠加扩充得到多通道的复合图像，对所述复合图像进行池化得到区域特征矩阵，对所述区域特征矩阵叠加获得相应的张量，再将所述张量输入到权重自适应提取网络进行融合；

光流估计深度神经网络模块，用于将融合后得到的融合图像输入训练好的光流估计深度神经网络，获得最终的光流估计结果。

本申请的有益效果为：

本申请提出的基于异步事件流与灰度图像融合的光流估计方法与***，实现了原始三维的异步事件流与灰度图像较好的融合，在二者数据格式截然不同的情况下最终得到清晰的二维图像，将二者有机融合，进而提高了光流估计算法的鲁棒性与泛化性。

附图说明

图1示出了本申请实施例1的方法流程示意图；

图2示出了采用本申请实施例1中融合的过程示意图；

图3示出了采用本申请实施例1中光流估计整体过程示意图；

图4示出了采用本申请实施例2中的***结构图；

图5示出了采用本申请实施例3中***结构及过程图。

具体实施方式

以下，将参照附图来描述本申请的实施例。但是应该理解的是，这些描述只是示例性的，而并非要限制本申请的范围。此外，在以下说明中，省略了对公知结构和技术的描述，以避免不必要地混淆本申请的概念。对于本领域技术人员来说显而易见的是，本申请可以无需一个或多个这些细节而得以实施。在其他的例子中，为了避免与本申请发生混淆，对于本领域公知的一些技术特征未进行描述。

应予以注意的是，这里所使用的术语仅是为了描述具体实施例，而非意图限制根据本申请的示例性实施例。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式。此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在所述特征、整体、步骤、操作、元件和/或组件，但不排除存在或附加一个或多个其他特征、整体、步骤、操作、元件、组件和/或它们的组合。

现在，将参照附图更详细地描述根据本申请的示例性实施例。然而，这些示例性实施例可以多种不同的形式来实施，并且不应当被解释为只限于这里所阐述的实施例。附图并非是按比例绘制的，其中为了清楚表达的目的，可能放大了某些细节，并且可能省略了某些细节。图中所示出的各种区域、层的形状以及它们之间的相对大小、位置关系仅是示例性的，实际中可能由于制造公差或技术限制而有所偏差，并且本领域技术人员根据实际所需可以另外设计具有不同形状、大小、相对位置的区域/层。

实施例1：

本实施例实施了一种基于异步事件流与灰度图像融合的光流估计方法，如图1所示，包括以下步骤：

S1、获取异步事件流与同步灰度图像；

S2、对所述异步事件流与同步灰度图像进行预处理，得到事件帧与灰度图像；

S3、对所述事件帧与灰度图像按照时间对齐进行通道叠加扩充得到多通道的复合图像，对所述复合图像进行池化得到区域特征矩阵，对所述区域特征矩阵叠加获得相应的张量，再将所述张量输入到权重自适应提取网络进行融合；

S4、将融合后得到的融合图像输入训练好的光流估计深度神经网络，获得最终的光流估计结果。

优选地，所述多通道为五通道。

S2中所述对所述异步事件流与同步灰度图像进行预处理，得到事件帧与灰度图像，具体包括：

将离散的事件按照左右双目相机划分为两个主题(topic)，分别对应事件和灰度图像；

将所有事件打包为rosbag格式文件包，为了控制rosbag文件的大小，减少***读取数据所用的时间，每个rosbag格式文件包的时间长度均设置为10秒；

接收所述rosbag格式文件包和所述灰度图像序列，以灰度图像的帧间时间间隔为累积时间跨度，将rosbag格式文件包中的异步事件流叠加成与灰度图像具有相同尺寸大小的同步帧的格式，记为事件帧。

上述在得到事件帧之前的所有操作是所述预处理。

S3中对所述事件帧与灰度图像按照时间对齐进行通道叠加扩充得到五通道的复合图像，对其进行池化得到区域特征矩阵，对所述区域特征矩阵叠加获得相应的张量，再将所述张量输入到自适应提取网络进行融合，具体包括：

为了获得各个区域的特征，又考虑到数据量的大小，将所述复合图像的每个通道按比例划分为4×4共16个小区域，然后对每个小区域进行区域平均池化，池化后区域内的所有像素被缩小为一个值代替，得到4×4大小的区域特征矩阵；

优选地，所述权重自适应提取网络由两层全连接层实现，第一层全连接的激活函数为ReLU激活函数，第二层全连接的激活函数为Sigmoid激活函数，所述权重自适应提取网络输出的是与输入相同大小的4×4×5的张量。融合的过程示意图如图2所示，在图2中，F表示function的首字母缩写，lsq表示local squeeze的简写，ex表示Extraction-Net的简写。异步事件x原本是三维的，将其按照时间对齐进行通道扩充为五个通道(c是channel的首字母，代表通道)，也就是上述五个帧，其中，五个帧包含正事件的计数图像1帧与其最近时间戳图像1帧、负事件的计数图像1帧与其最近时间戳图像1帧及灰度图像1帧。在此，帧与通道同义，每个通道按比例划分为4×4共16个小区域，然后对每个小区域进行区域平均池化，池化后区域内的所有像素被缩小为一个值代替，得到4×4大小的区域特征矩阵，将所述区域特征矩阵叠加得到4×4×5大小的张量，然后将其输入到权重自适应提取网络进行自适应加权计算，使异步事件与灰度图像融合，使x变为

所述权重自适应提取网络实现事件帧与灰度图像融合，假设相比之下通道1更清晰，那么说明权重自适应提取网络给其分配的权重就大，所以说实现了自适应性的权重计算，使异步事件流与同步灰度图像达到有效融合。

优选地，S4中所述光流估计深度神经网络的训练步骤包括：

获取事件帧与灰度图像的融合图像；

对所述融合图像进行卷积编码与上采样解码；

计算自监督损失，损失函数包括光滑误差和光度误差；

更新网络连接参数。

基于异步事件流与灰度图像融合的光流估计整体过程示意图如图3所示，在图3中，权重自适应提取网络简称为LSENet。另外优选地，所述光流估计深度神经网络采用4层编码层、2层残差层和4层解码层。编码层采用步长为2的卷积实现，每经过一层编码层，图像的尺寸就缩小一半，同时通道数扩充一倍，同时为了增强***对于不同尺寸下图像的适应性，每层编码层得到的数据保存起来，用于之后与对应编码层的跳连接。残差层的引入是为了防止过拟合。解码层采用双线性插值上采样实现，原始数据每经过一层解码层后，数据尺寸会增加一倍，通道数会减少一半。解码得到的数据将与对应的编码层得到的数据一起输入下一层解码层中。网络训练采用了自监督方式实现，损失函数包括光滑误差与光度误差。

实施例2：

本实施例实施了一种基于异步事件流与灰度图像融合的光流估计***，如图4所示，包括：

***底层模块501，用于获取异步事件流与同步灰度图像；

事件帧生成模块502，用于对所述异步事件流与同步灰度图像进行预处理，得到事件帧与灰度图像；

事件帧与灰度图像融合模块503，用于对所述事件帧与灰度图像按照时间对齐进行通道叠加扩充得到多通道的复合图像，对所述复合图像进行池化得到区域特征矩阵，对所述区域特征矩阵叠加获得相应的张量，再将所述张量输入到权重自适应提取网络进行融合；

光流估计深度神经网络模块504，用于将融合后得到的融合图像输入训练好的光流估计深度神经网络，获得最终的光流估计结果。

实施例3：

本实施例实施了一种基于异步事件流与灰度图像融合的光流估计***，如图5所示，包括：***底层模块、事件帧生成模块、事件帧与灰度图像融合模块和光流估计深度神经网络模块。

***底层模块，搭载了事件相机的智能体，可以同步采集异步事件流与传统灰度图像，通常还包括智能体自带的运动控制模块及场景构建模块。ROS和Ubuntu操作***从事件相机DAVIS 346接收异步事件流，将离散的独立的事件点按照左右双目相机的不同划分为两个topic，然后将每个topic内的所有事件打包为rosbag格式文件包，便于后续对事件的处理与筛选。灰度图像以jpg格式进行存储，并按照时间序列对其进行标号，得到灰度图像序列。接收所述rosbag格式文件包和所述灰度图像序列，以灰度图像的帧间时间间隔为累积时间跨度，将rosbag格式文件包中的异步事件流叠加成与灰度图像具有相同尺寸大小的同步帧的格式，记为事件帧。

事件帧生成模块，用于对所述异步事件流与同步灰度图像进行预处理，得到事件帧与灰度图像，而上述得到事件帧与灰度图像之前的所有操作是预处理。

事件帧与灰度图像融合模块，用于对所述事件帧与灰度图像按照时间对齐进行通道叠加扩充得到多通道的复合图像，对所述复合图像进行池化得到区域特征矩阵，对所述区域特征矩阵叠加获得相应的张量，再将所述张量输入到权重自适应提取网络进行融合。即将所述张量输入(Extraction-Net)进行自适应权重学习，该网络由两层全连接网络实现，第一层全连接的激活函数为ReLU激活函数，第二层全连接的激活函数为Sigmoid激活函数，最后输出的是与输入相同大小的4×4×5的张量。

光流估计深度神经网络模块，用于接收事件帧与灰度图像融合模块输出的融合图像，通过训练好的光流估计深度神经网络，获得最终的光流估计结果。光流估计深度神经网络采用4层编码层、2层残差层和4层解码层。编码层采用步长为2的卷积实现，每经过一层编码层，图像的尺寸就缩小一半，同时通道数扩充一倍，同时为了增强***对于不同尺寸下图像的适应性，每层编码层得到的数据保存起来，用于之后与对应编码层的跳连接。残差层的引入是为了防止过拟合。解码层采用双线性插值上采样实现，原始数据每经过一层解码层后，数据尺寸会增加一倍，通道数会减少一半。解码得到的数据将与对应的编码层得到的数据一起输入下一层解码层中。网络训练采用了自监督方式实现，损失函数包括光滑误差与光度误差。

作为可变换的实施方式，再如图5所示，本实施例中光流估计深度神经网络模块将输出彩色光流估计图，可输入到下游应用，如应急避障、视觉里程计、视频分析和气象预测等应用。

以上所述，仅为本申请较佳的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种基于异步事件流与灰度图像融合的光流估计方法，其特征在于，包括以下步骤：

获取异步事件流与同步灰度图像；

将融合后得到的融合图像输入训练好的光流估计深度神经网络，获得最终的光流估计结果；

其中，所述多通道为五通道；

对所述事件帧与灰度图像按照时间对齐进行通道叠加扩充得到五通道的复合图像，对其进行池化得到区域特征矩阵，对所述区域特征矩阵叠加获得相应的张量，再将所述张量输入到自适应提取网络进行融合，具体包括：

2.根据权利要求1所述的基于异步事件流与灰度图像融合的光流估计方法，其特征在于，所述获取异步事件流与同步灰度图像通过事件相机、场景构建和运动控制获得。

3.根据权利要求1所述的基于异步事件流与灰度图像融合的光流估计方法，其特征在于，所述对所述异步事件流与同步灰度图像进行预处理，得到事件帧与灰度图像，具体包括：

将所有事件打包为rosbag格式文件包；

4.根据权利要求3所述的基于异步事件流与灰度图像融合的光流估计方法，其特征在于，所述事件帧的表示方法采用事件计数图像或最近时间戳图像表示法。

5.根据权利要求1所述的基于异步事件流与灰度图像融合的光流估计方法，其特征在于，所述权重自适应提取网络由两层全连接层实现，第一层全连接的激活函数为ReLU激活函数，第二层全连接的激活函数为Sigmoid激活函数，所述权重自适应提取网络输出的是与输入相同大小的4×4×5的张量。

6.根据权利要求1所述的基于异步事件流与灰度图像融合的光流估计方法，其特征在于，所述光流估计深度神经网络的训练步骤包括：

获取事件帧与灰度图像的融合图像；

对所述融合图像进行卷积编码与上采样解码；

计算自监督损失，损失函数包括光滑误差和光度误差；

更新网络连接参数。

7.根据权利要求6所述的基于异步事件流与灰度图像融合的光流估计方法，其特征在于，所述光流估计深度神经网络采用4层编码层、2层残差层和4层解码层。

8.一种基于异步事件流与灰度图像融合的光流估计***，其特征在于，包括：

***底层模块，用于获取异步事件流与同步灰度图像；

光流估计深度神经网络模块，用于将融合后得到的融合图像输入训练好的光流估计深度神经网络，获得最终的光流估计结果；

其中，所述多通道为五通道；