CN114219722A

CN114219722A - 一种利用时频域层级处理的低光照图像增强方法

Info

Publication number: CN114219722A
Application number: CN202111336761.0A
Authority: CN
Inventors: 胡晓; 欧嘉敏; 黄奕秋; 谭湘粤; 钟小容
Original assignee: Guangzhou University
Current assignee: Guangzhou University
Priority date: 2021-11-12
Filing date: 2021-11-12
Publication date: 2022-03-22

Abstract

本发明涉及一种利用时频域层级处理的低光照图像增强方法，包括步骤：S1、构建低光照图像数据集，包括低光照图像数据集的采集和标注，合理划分训练数据集和测试数据集；S2、建立低光照图像增强网络框架，使用深度学习中的卷积神经网络搭建整个网络框架；S3、进行模型训练，利用步骤S1划分好的训练数据集对步骤S2构建的低光照图像增强网络框架进行迭代训练；S4、进行模型测试，利用步骤S3训练后保存的模型对步骤S1划分好的测试数据集进行检测。本发明在深度学习框架下，结合时域与频域构建网络框架，利用数据驱动方式对低光照图像进行层级处理，实现图像亮度拉伸，生成清晰、低噪声的结果图像，使得低光照图像增强任务更高效。

Description

一种利用时频域层级处理的低光照图像增强方法

技术领域

本发明涉及低光照图像增强技术领域，尤其涉及一种利用时频域层级处理的低光照图像增强方法。

背景技术

随着生活水平的逐步改善和高科技技术的发展，人们常以拍摄的方式记录生活的点滴，同时在工业上智能设备通过捕获各种图像高效处理视觉任务，取得比手工操作更高的效率，因此，图像成为了人类生活必不可少的一部分。但由于低光照环境和有限且昂贵的摄像设备，人们常捕获到一些低质量的图像，如低光照图像。而这种暗光照图像通常具有亮度低，对比度不高，噪声大等缺点，这不仅影响图像的美感，人类的视觉感知，而且还会挑战许多依赖于计算机视觉算法的智能***，如全天自动驾驶和生物特征识别，目标检测等，导致其性能受限。

为了有效改善低光图像质量，出现了许多低光照图像增强算法，这些算法可以分为三大类：基于传统理论的方法、基于视网膜皮层(Retinex)的方法和基于深度学习的方法。传统的经典方法是直方图均衡，该方法根据图像直方图统计像素的灰度值，再对其进行像素均衡，从而使得亮度有所提升，但这种方法并未考虑邻域像素的关系，仅对图像像素进行单一处理，所以得到的图像往往看起来是不自然的。Retinex理论认为任何图像都可以分解为反映物体内在属性的反射分量和受环境影响的光照分量。人眼感受外界物体的明暗程度通常是由物体的反射分量决定的，但由于反射分量与光照分量的分解过程是不适定问题，因此，基于Retinex的方法很难完全将这两分量分离开并对其进行有效增强。而基于深度学习的方法通过从大规模数据中捕获自然图像统计信息，灵活地进行学习，对现实中图像具有一定的适用性，泛化能力高，且成本低。因此，可通过深度学习的框架，进一步研发一种图像亮度提升与噪声抑制的技术方案。

发明内容

为解决现有技术所存在的技术问题，本发明提供一种利用时频域层级处理的低光照图像增强方法，在深度学习框架下，结合时域与频域构建网络框架，利用数据驱动方式对低光照图像进行层级处理，实现拉伸图像亮度范围的同时，生成自然的、清晰的、低噪声的结果图像，使得低光照图像增强任务更高效。

本发明采用以下技术方案来实现：一种利用时频域层级处理的低光照图像增强方法，包括以下步骤：

S1、构建低光照图像数据集，包括低光照图像数据集的采集和标注，合理划分训练数据集和测试数据集；

S2、建立低光照图像增强网络框架，使用深度学习中的卷积神经网络搭建整个网络框架，针对低光照图像存在的问题设计相应的模块，构建一个基于深度学习的低光照图像增强网络；

S3、进行模型训练，利用步骤S1划分好的训练数据集对步骤S2构建的低光照图像增强网络框架进行迭代训练；

S4、进行模型测试，利用步骤S3训练后保存的模型对步骤S1划分好的测试数据集进行检测。

本发明与现有技术相比，具有如下优点和有益效果：

1、本发明通过利用自然低光图像以及人工合成的暗光图像混合而成的数据集进行训练以获得通用的低光图像增强网络模型，不仅能处理自然场景产生的暗光图像，而且考虑了更复杂的光照情况，能够很好地增强亮度的同时，显著地抑制噪声和恢复细节，具有较高的鲁棒性和通用性。

2、本发明构建的网络模型基于深度学习技术处理图像，速度快，输出结果自然且清晰。

3、本发明构建的网络是端到端训练的，对运行设备要求不高，成本低，占用资源小，因此，在目标检测、数字监控、自动驾驶等多个领域都有明显的应用价值，既可提升生活质量，也可进一步提高视觉任务的精度，推动人工智能技术的发展。

附图说明

图1是本发明方法的流程图；

图2是本发明低光照图像增强网络框架图；

图3是本发明动态增强单元网络结构图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。

实施例

如图1所示，本实施例一种利用时频域层级处理的低光照图像增强方法，包括以下步骤：

本实施例中，步骤S1中构建低光照图像数据集的具体步骤如下：

S11、进行图像收集，通过两种途径获取暗光图像，包括从各个摄影学网站收集的低光照图像和利用现有的单反摄像设备、多种品牌的手机，在现实的白天及夜晚场景中人工采集图像；具体地，在白天场景中，通过调节摄像设备光圈可以分别采集到同一场景的两种类型图像，分别是正常光照图像以及低光照图像；在夜晚及暗光环境中，将摄像设备光圈置于正常范围，直接对物体进行拍摄，采集低光图像；

S12、进行数据集标注，对所获得的图像进行分类，利用人工对从网站上收集的以及夜晚条件下拍摄的图像进行人工标注，将同一场景的低光图像和与其对应的正常光照图像称为一组图像对，并将图像对的文件名按照自然数顺序重命名；

S13、进行数据集划分标注，将收集的所有图像按照7:3的比例随机划分为训练数据集和测试数据集。

如图2所示，本实施例中，步骤S2中低光照图像增强网络框架，包括：

时域亮度增强模块，用于提升暗光图像的亮度水平；

频域噪声抑制模块，用于滤除图像的噪声；

时域细节重构模块，由于经过频域噪声抑制模块的滤除作用，图像变得平滑的同时细节会丢失，因此，时域细节重构模块主要用于恢复图像的结构，纹理等细节部分；

各个模块均由动态增强单元(Dynamic Enhancement Unit，DEU)作为基本的元素，利用不同的构建方法组成，并使用L1正则化损失、总变分差(Total Variation,TV)损失和拉普拉斯损失组合为一组约束条件用作网络的总损失函数。

具体地，本实施例中，时域亮度增强模块的具体实现过程如下：

S211、将输入图像经过一层核3×3的卷积操作获得一组特征；

S212、将该特征输入类人眼机制工作的DEU增强特征，使其更能表征图像的亮度水平并利用统计特性增强亮度；

S213、利用一层核3×3的卷积与Tanh激活操作将图像编码后输出，完成初步的亮度提升。

具体地，本实施例中，频域噪声抑制模块的具体实现过程如下：

S221、将时域亮度增强模块得到的图像利用小波变换(Discrete WaveletTransform,DWT)将图像特征变换到频域；

S222、利用DEU以及基本的卷积对特征进行处理；

S223、通过对处理后的图像逐渐小波逆变换(Discrete Inverse WaveletTransform,IDWT)使其变换回时域图像，再进入时域细节重构模块的处理。

具体地，本实施例中，时域细节重构模块的具体实现过程如下：

S231、将时域亮度增强模块和频域噪声抑制模块的输出结果图级联，并输入到时域细节重构模块；

S232、对该图像经过数层卷积层以及多个动态增强单元DEU，进行图像边缘增强，颜色恢复等细节信息的重构；

S233、输出最终整个网络的增强图像。

本实施例中，步骤S211的具体过程为：将图像大小为H×W，通道数为3的输入图像S∈R^H×W×3，利用一层核为3×3的卷积层及带泄露的修正线性单元(Leaky Rectified LinearUnit,LReLU)激活操作提取一组大小为[8,64,256,256]的特征，该特征包含图像的亮度，颜色，细节等信息。

如图3所示，本实施例中，步骤S212中动态增强单元DEU主要采用类视网膜的工作处理机制，以并行通道的方式进一步处理输入特征。对于输入的视觉信号，人类的视网膜会运用两种细胞共同作用，分别是侏儒细胞和阳伞细胞。其中，侏儒细胞感受野较小，用于编码高频信息，如场景中的细节和边缘等；而阳伞细胞善于处理视觉信息中的低频部分，包括场景的全局结构等，它的主要特点是感受野较大。因此，根据此原理，动态增强单元DEU分别采用核为3×3和5×5的卷积表示侏儒细胞以及阳伞细胞构成两条处理通路对特征进行增强，这两条并行通道可以提取到不同感受野的特征信息。然后，利用特征相加操作融合两条通路的输出特征，该过程模拟的是人脑的视交叉神经工作机制，通过相加运算可以聚合不同的信息，使得特征更能表征图像。接着，将融合后的特征以并行的方式分别输入到由卷积层构成的网络通路中，增强学***衡融合后的特征使之更平滑以及信息交流更充分，整个过程定量可表示为：

f＝Rconv3(X_deu)+Rconv5(X_deu) (1)

其中，X_deu表示动态增强单元DEU的输入特征；RconvN(.)是结合核为N×N卷积运算和LReLU激活运算的顺序操作；F_dam(·)是动态注意力机制模块(Dynamic AttentionModule，DAM)操作；

是级联操作；

是逐像素相加操作；f是中间输出量；f_deu是最终动态增强单元DEU的输出结果。

具体地，F_dam(·)模拟了人体大脑皮层的选择性工作机制。在人类捕获外界场景信息后，经过眼睛传入大脑皮层，而控制中心大脑中枢会根据需求筛选出有用的信息而丢弃无关部分。因此，根据此机制，动态增强单元DEU后续部分加入了动态注意力机制模块DAM，其作用是对特征进行筛选，使网络关注对任务有益的部分，如对于时域亮度增强模块的亮度增强任务，更关注亮度信息；频域噪声抑制模块主要作用于噪声区域；而时域细节重构模块，需关注图像的边缘结构细节。动态注意力机制模块DAM的结构如图3所示，其结构由并行的三分支组成，按从上到下的顺序依次是通道注意力分支、筛选分支、像素注意力分支。具体地，通道注意力分支由全局平均池化、1×1卷积、ReLU激活函数、1×1卷积以及Sigmoid激活操作顺序组成；而与通道注意力分支相比，像素注意力分支去掉全局平均池化操作，使其处理层面为图像像素点。对于筛选分支，主要是利用线性层和Softmax操作构成分类处理***，该分支的输出结果为一组分类得分数值(x，y)。因此，动态注意力机制模块DAM的工作过程可表示为：

其中，X_dam为动态注意力机制模块DAM的输入特征；

表示动态注意力机制模块DAM的通道注意力分支；

表示动态注意力机制模块DAM的像素注意力分支；而x，y为筛选分支的输出得分；f_dam则为输出特征。

本实施例中，步骤S213初步的亮度提升过程可表示为：

S_l＝Tanh(Rconv3(F_deu(Rconv3(S)))) (5)

其中，S表示输入图像；F_deu(·)为动态增强单元DEU的操作；Tanh(·)是双曲正切激活函数；S_l表示输出特征，即为经过亮度增强的输出图像。

本实施例中，步骤S221中小波变换DWT主要是通过一维滤波函数和小波函数对图像的每行每列进行滤波，同时水平和垂直方向降采样。由此，可以计算出4个子图像I_LL，I_LH，I_HL，I_HH。对于输入图像S(x，y)，二维小波变换输出的4个子图像可以表示如下：

I_LL＝φ(x)φ(y) (6)

其中，x为图像水平方向像素值；y为垂直方向像素值；φ(·)和

分别是一维尺度函数和小波函数；I_LL为图像低频分量，包含基本的场景信息，如颜色，亮度，内容等；I_LH，I_HL，I_HH为高频分量，经过低通滤波后，这些分量保留了图像的细节信息，比如噪声、边缘。相比之下，小波逆变换使用相同的滤波器和上采样方法将四个子图像合并到原始图像。由于小波变换DWT和小波逆变换IDWT涉及下采样和上采样，每经过一次DWT操作图像大小会缩小成原来四分之一，通道数相应增大四倍；相反地，小波逆变换IDWT使图像大小扩大四倍，通道数减少四分之一。

如图2所示，本实施例中，在频域噪声抑制模块中，图像分别按顺序经过小波变换DWT、卷积层和动态增强单元DEU操作后，可依次获得特征{x₁，x₂，x₃}，其大小分别为{256，128，64}，按照自底向上的顺序先将x₃输入到卷积层和动态增强单元DEU中，可对其中的噪声进行第一次抑制。再经过小波逆变换IDWT上采样到与x₂相同的大小并与其进行级联，接着同样运用卷积层和动态增强单元DEU对其进行第二次噪声抑制。同理地，x₂小波逆变换后与x₁级联作为第三次噪声抑制操作的输入，经过处理后最终将得到图像大小与原图一样的增强图像S_d。

本实施例中，特征进入时域细节重构模块后，按顺序经过1×1卷积，3×3卷积，三个动态增强单元DEU以及3×3卷积操作。尽管网络仅有5层，但是在损失函数的驱动下，细节可以很好地被恢复。因此，在时域细节重构模块的输出结果S_s就是整个网络最终的增强图像。

具体地，损失函数采用如下定义：

L_total＝l₁+l₂+l₃ (10)

l₁＝||S_l-S_normal||₁ (11)

l₂＝||S_d-S_normal||₁+||ΔS_d||₁ (12)

l₃＝||S_s-S_normal||₁+||F_lap(s_s)-F_lap(S_normal)||₁ (13)

其中，L_total表示低光照增强网络的总损失；l₁，l₂，l₃分别为时域亮度增强模块、频域噪声抑制模块、时域细节重构模块的损失；S_l，S_d，S_s分别为时域亮度增强模块、频域噪声抑制模块、时域细节重构模块的输出结果图；S_normoal为标签图像，即对应的正常光照图像；‖·‖₁是L₁正则化函数；Δ表示图像水平和垂直梯度和；F_lap(·是拉普拉斯变换函数。

本实施例中，步骤S3的具体过程如下：

S31、进行模型训练时将输入图像尺寸调整为256×256，使用自适应矩估计优化器以运行平均值系数为(0.9，0.999)和0.000008的权重衰减训练网络，训练的迭代次数为150，批量化大小为8，初始学习率为0.0002，采用学习计划策略，在迭代次数到达60后学习率下降10％；

S32、每迭代训练10次保存一次模型。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种利用时频域层级处理的低光照图像增强方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种利用时频域层级处理的低光照图像增强方法，其特征在于，步骤S1中构建低光照图像数据集的具体步骤如下：

S11、进行图像收集，通过两种途径获取暗光图像，包括从各个摄影学网站收集的低光照图像和利用现有的单反摄像设备、多种品牌的手机，在现实的白天及夜晚场景中人工采集图像；在白天场景中，通过调节摄像设备光圈分别采集同一场景的两种类型图像，分别是正常光照图像以及低光照图像；在夜晚及暗光环境中，将摄像设备光圈置于正常范围，对物体进行拍摄，采集低光图像；

3.根据权利要求1所述的一种利用时频域层级处理的低光照图像增强方法，其特征在于，步骤S2中低光照图像增强网络框架，包括：

时域亮度增强模块，用于提升暗光图像的亮度水平；

频域噪声抑制模块，用于滤除图像的噪声；

时域细节重构模块，用于恢复图像的细节部分，包含图像的结构和纹理；

各个模块均由动态增强单元DEU作为基本的元素，利用多种构建方法组成，并使用L1正则化损失、总变分差TV损失和拉普拉斯损失组合为一组约束条件用作网络的总损失函数。

4.根据权利要求3所述的一种利用时频域层级处理的低光照图像增强方法，其特征在于，时域亮度增强模块的具体实现过程如下：

S211、将输入图像经过一层核3x3的卷积操作获得一组特征；

S212、将该特征输入类人眼机制工作的动态增强单元DEU增强特征，使其更能表征图像的亮度水平并利用统计特性增强亮度；

S213、利用一层核3x3的卷积与Tanh激活操作将图像编码后输出，完成初步的亮度提升；

频域噪声抑制模块的具体实现过程如下：

S221、将时域亮度增强模块得到的图像利用小波变换DWT将图像特征变换到频域；

S222、利用动态增强单元DEU以及基本的卷积对特征进行处理；

S223、通过对处理后的图像逐渐小波逆变换IDWT使其变换回时域图像，再进入时域细节重构模块的处理；

时域细节重构模块的具体实现过程如下：

S232、对该输入图像经过数层卷积层以及多个动态增强单元DEU，进行图像边缘增强，颜色恢复以及细节信息重构；

S233、输出最终整个网络的增强图像。

5.根据权利要求4所述的一种利用时频域层级处理的低光照图像增强方法，其特征在于，步骤S211的具体过程为：将图像大小为H×W，通道数为3的输入图像S∈R^H×W×3，利用一层核为3×3的卷积层及带泄露的修正线性单元激活操作提取一组大小为[8，64，256，256]的包含图像的亮度，颜色，细节信息的特征。

6.根据权利要求4所述的一种利用时频域层级处理的低光照图像增强方法，其特征在于，步骤S212中动态增强单元DEU分别采用核为3×3和5×5的卷积构成两条处理通路对特征进行增强，利用这两条处理通路提取特征信息；再利用特征相加操作融合两条通路的输出特征，将融合后的特征以并行的方式分别输入到由卷积层构成的网络通路中，增强学***衡融合后的特征，整个过程定量可表示为：

f＝Rconv3(X_deu)+Rconv5(X_deu) (1)

其中，X_deu表示动态增强单元DEU的输入特征；RconvN(.)是结合核为N×N卷积运算和LReLU激活运算的顺序操作；F_dam(·)是动态注意力机制模块DAM操作；

是级联操作；

是逐像素相加操作；f是中间输出量；f_deu是动态增强单元DEU的最终输出结果。

7.根据权利要求6所述的一种利用时频域层级处理的低光照图像增强方法，其特征在于，动态注意力机制模块DAM由并行的三分支组成，按从上到下的顺序依次是通道注意力分支、筛选分支、像素注意力分支；其中，通道注意力分支由全局平均池化、1×1卷积、ReLU激活函数、1×1卷积以及Sigmoid激活操作顺序组成；筛选分支，通过利用线性层和Softmax操作构成分类处理***，该分支的输出结果为一组分类得分数值(x，y)；像素注意力分支由1×1卷积、ReLU激活函数、1×1卷积以及Sigmoid激活操作顺序组成；动态注意力机制模块DAM的工作过程可表示为：

其中，X_dam为动态注意力机制模块DAM的输入特征；

表示动态注意力机制模块DAM的通道注意力分支；

8.根据权利要求4所述的一种利用时频域层级处理的低光照图像增强方法，其特征在于，步骤S213初步的亮度提升过程可表示为：

S_l＝Tanh(Rconv3(F_deu(Rconv3(S)))) (5)

其中，S表示输入图像；F_deu(·)为动态增强单元DEU的操作；Tanh(·)是双曲正切激活函数；S_l表示输出特征。

9.根据权利要求4所述的一种利用时频域层级处理的低光照图像增强方法，其特征在于，特征进入时域细节重构模块后，按顺序经过1×1卷积，3×3卷积，三个动态增强单元DEU以及3×3卷积操作，并利用损失函数驱动；其中，损失函数采用如下定义：

L_total＝l₁+l₂+l₃ (10)

l₁＝||S_l-S_normal||₁ (11)

l₂＝||S_d-S_normal||₁+||ΔS_d||₁ (12)

l₃＝||S_s-S_notmal||₁+||F_lap(S_s)-F_lap(S_normal)||₁ (13)

其中，L_total表示低光照增强网络的总损失；l₁，l₂，l₃分别为时域亮度增强模块、频域噪声抑制模块、时域细节重构模块的损失；S_l，S_d，S_s分别为时域亮度增强模块、频域噪声抑制模块、时域细节重构模块的输出结果图；S_normal为标签图像；||·||₁是L₁正则化函数；Δ表示图像水平和垂直梯度和；F_lap(·)是拉普拉斯变换函数。

10.根据权利要求1所述的一种利用时频域层级处理的低光照图像增强方法，其特征在于，步骤S3的具体过程如下：

S32、每迭代训练10次保存一次模型。