CN114862698A

CN114862698A - 一种基于通道引导的真实过曝光图像校正方法与装置

Info

Publication number: CN114862698A
Application number: CN202210381937.2A
Authority: CN
Inventors: 付莹; 洪阳
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2022-04-12
Filing date: 2022-04-12
Publication date: 2022-08-05
Anticipated expiration: 2042-04-12
Also published as: CN114862698B

Abstract

本发明涉及一种基于通道引导的真实过曝光图像校正方法与装置，属于图像处理技术领域。本发明通过分析基于RAW格式过曝光图像的数据特性，根据可见光传感器所得过曝光RAW图像R‑G‑G‑B(红‑绿‑绿‑蓝)各颜色通道亮度与感知强度不同，进而纹理特征和信息含量留存不一致的数据特性设计通道引导校正的卷积计算，并进一步构建通道引导的卷积神经网络，使用所采集的数据集训练过曝光图像校正神经网络，实现通道引导的高精度过曝光图像校正，提升真实过曝光图像校正质量。本发明能够提升真实图像过曝光校正的质量，保证真实过曝光校正图像的保真度。

Description

一种基于通道引导的真实过曝光图像校正方法与装置

技术领域

本发明涉及一种基于通道引导的真实过曝光图像校正方法与装置，属于图像处理技术领域。

背景技术

图像的过曝光校正，是一个对图像处理和社交媒体相关任务及产业都具有重大影响的技术问题。

在相机的成像过程中，不合理的曝光水平会直接影响成像的全局亮度和纹理信息，令图像质量显著下降，进而明显影响图像的视觉效果和信息含量，极大地降低了下游计算机视觉算法(如目标检测、分割等)在其上的效果。

尽管通过调节光圈、曝光时间或感光度等数字相机参数方式，可以在一定程度上缓解过曝光问题，但是，由于数字相机及各类图像传感器有限的物理动态范围或错误的参数设置，光照度过高或明亮变化剧烈场景中相对较亮的区域常常会使传感器产生饱和的像素，造成信息丢失并产生过曝光的图像。此外，现有的图像采集设备拍摄得到的8位量化JPEG等格式的可视化图像，都是经过内置ISP算法(Image Signal Processor，图像信号处理)从RAW域图像处理所得的，过曝光图像仅有的语义信息在此过程中会有所丢失，使得输出图像中像素通常会严重饱和，有时甚至会导致场景信息的永久丢失。

过曝光校正技术，是指利用后处理算法将过曝光图像转变成正常光照图像，并恢复过曝光区域丢失的纹理细节信息，从而调节饱和像素、补充缺失内容、校正全局亮度的一种图像处理技术。该技术能够有效提高图像视觉质量，增强图像细节，并提升下游视觉任务算法性能。

然而，现有技术对于过曝光校正技术并未有太多的针对性研究，也鲜有方法专注于解决这个问题。现有的曝光校正(exposure-correction)方法，一般专注于欠曝光(under-exposure)图像的恢复校正(即暗光增强)，而过曝光图像同欠曝光图像及其恢复校正任务之前又因为纹理信息留存情况、像素值特性、噪声问题等存在本质区别，因此，将欠曝光图像校正的相关算法直接用于过曝光校正任务时，无法达到较好效果。

一些传统的通用图像增强技术，主要利用统计学原理以及人工先验模型对过曝光图像进行处理，并借助优化策略和规则来校正全局亮度，根据图像未丢失纹理信息的区域的像素来为饱和区域生成内容补全。然而，这些方法在很大程度上取决于其手工制作先验假设的精度，手工制作的先验并不足以代表真实世界的各种亮度饱和与纹理丢失情况。现有的一些曝光校正算法，往往专注于图像曝光度和对比度的调整，而非丢失信息的修复，因此，恢复所得图像无法获得预期的视觉质量或纹理信息细节。

近年来，基于深度学习的端到端曝光校正网络涌现了一些研究成果。通过使用卷积神经网络，自动从过曝光与欠曝光数据中提取特征。然而，深度学习方法很大程度上依赖于训练数据集。而现有的深度学习方法，一般依赖于仅采用伽马变换或线性变化来调高自然光照图像亮度，或进一步利用非线性函数映射仿真等方式合成的仅包含sRGB图像的训练数据集。一方面，合成的数据与真实的原始数据存在数据分布差异，由于缺乏真实的带参考的过曝光校正数据，限制了经过训练的曝光校正方法在现实世界中的应用；另一方面，受限于数据，这些算法专注于图像曝光与颜色的调整，而非丢失信息的修复，尤其难以对过曝光程度严重(像素值几乎完全饱和)的现实世界图像或区域进行恢复，处理得到的图像往往仍无法满足美学质量要求或下游高层视觉算法需求。

发明内容

本发明的目的是针对现在技术尚没有真实成对过曝光图像校正数据集，以及现有的基于学习算法难以有效恢复严重过曝光图像或区域的纹理信息等技术问题，创造性地一种基于通道引导的真实过曝光图像校正方法与装置。

本发明的创新点在于：分析基于RAW(原始)格式过曝光图像的数据特性，根据可见光传感器所得过曝光RAW图像各颜色通道亮度与感知强度不同，进而纹理特征和信息含量留存不一致的数据特性设计通道引导校正的卷积计算，并进一步构建通道引导的卷积神经网络。同时，设计了一种真实成对过曝光校正数据采集装置并采集数据集，使用所采集的数据集训练过曝光图像校正神经网络，实现通道引导的高精度过曝光图像校正，提升真实过曝光图像的校正质量。

一种基于通道引导的真实过曝光图像校正方法，包括以下步骤：

步骤101：采集真实成对的过曝光校正数据集(可以使用数码单反相机搭建真实数据采集装置，但不限于此种方式)。

该数据集包含成对的过曝光图像和正常光照参考图像，每张图像同时拥有RAW和其他所需格式的数据(如sRGB格式等)。

步骤102：分析RAW格式真实过曝光图像的数据特性，设计通道引导卷积分支。

通常，人眼对于不同颜色的视觉敏感度不同，可见光相机传感器亦基于此进行颜色感知设计。

因此，根据RAW图像的各种色彩模式(如RGB模式、CMYK模式、Lab模式等)下不同颜色通道亮度与感知强度不同，所保留纹理信息含量不一致，且亮度与感知强度更高的通道在过曝光条件下更容易过曝的数据特性，设计通道引导卷积分支。

步骤103：使用通道引导卷积分支，构建利用RAW图像数据特性的通道引导过曝光校正卷积神经网络。

优选地，可以根据步骤102分析的RAW图像亮度与感知强度相对高的通道在过曝光条件下更容易过曝的数据特性，利用输入图像中亮度与感知强度相对低的通道所保留的更丰富的纹理信息，有效恢复严重过曝光图像或区域的精细纹理细节。

步骤104：建立真实图像过曝光增强的训练目标函数，对卷积神经网络的参数进行训练，得到过曝光RAW图像和参考图像之间的映射关系。

步骤105：输入需要测试的过曝光RAW图像，以及步骤104得到的过曝光RAW图像与参考图像间的映射关系。通过曝光RAW图像与参考图像间的映射关系，将过曝光RAW图像映射成正常光照所需格式的图像。由此，实现高效率和高精度图像过曝光校正，显著提高在过曝光场景下的成像质量。

为实现本发明所述目的，本发明进一步提出了一种基于通道引导的真实过曝光图像校正装置，包括真实成对过曝光校正数据采集子模块、颜色通道引导学习子模块、真实过曝光图像校正网络子模块。

其中，真实成对过曝光校正数据采集子模块，用于采集真实成对的过曝光校正数据集。

颜色通道引导学习子模块，用于设计通道引导卷积分支，使其能够基于RAW格式真实过曝光图像的数据特性，利用亮度与感知强度更高的颜色通道的信息优势，引导骨干网恢复过曝光区域中丢失的像素信息。

真实过曝光图像校正网络子模块，使用采集的真实成对过曝光校正数据进行训练，训练得到网络用于过曝光真实图像的校正增强。

上述模块之间的连接关系如下：

真实成对过曝光校正数据采集子模块的输出端，与颜色通道引导学习子模块的输入端相连。

颜色通道引导学习子模块的输出端，与真实过曝光图像校正网络子模块的输入端相连。

有益效果

1.本发明，通过搭建真实数据采集装置，采集真实成对的正常光照参考图像数据集，同时确保每张图像同时拥有RAW和其他所需格式(如sRGB格式)的数据。数据采集装置能够高效采集真实成对过曝光校正数据集，采集的数据集能够有效提升过曝光校正方法在真实图像上的精度。

2.本发明，根据RAW域过曝光图像不同颜色模式下各颜色通道亮度和感知强度不同，纹理特征和信息含量留存不一致的数据特性，设计通道引导卷积计算分支，构建通道引导过曝光校正网络。所述通道引导过曝光校正网络能够充分利用过曝光RAW图像亮度和感知强度较低的颜色通道中保留的纹理信息，逐步引导信息丢失严重的通道进行信息恢复，共享相似边缘信息，有效提升过曝光校正网络对不同信息含量的过曝光图像的鲁棒性恢复。

3.本发明，利用卷积神经网络学习过曝光RAW图像和正常光照参考图像之间的映射关系，结合有益效果1和2能够提升卷积神经网络的泛化性和鲁棒性，且能够提升真实图像过曝光校正的质量，保证真实过曝光校正图像的保真度。

附图说明

图1是本发明方法的流程图；

图2是本发明中利用RAW数据的通道引导过曝光校正网络示意图；

图3是本发明实施例所提供的装置结构示意图。

具体实施方式

为了更好地说明本发明的目的和优点，下面结合附图对发明内容做进一步说明。

实施例

下面，以RGB图像为例，对本发明方法及装置进行说明。

如图1所示，一种基于通道引导的真实过曝光图像校正方法，包括以下步骤：

步骤101：采集真实成对的过曝光校正数据集(可以使用数码单反相机搭建真实数据采集装置实现)。该数据集包含成对的过曝光图像和正常光照参考图像，每张图像同时拥有RAW和sRGB两种格式的数据。

为同时采集高质量RAW和sRGB图像，可以使用能够存储RAW格式数据的数码单反相机(或其他符合要求的图像采集设备)。

具体地，为了采集每一对过曝光RAW/sRGB图像，首先选定预拍摄场景，确保无环境或人为因素干扰，以及所采集图像数据的场景和内容的丰富度。其次，设置拍摄硬件设备，将相机固定在三脚架上，形成真实数据采集装置，并由远程软件控制快门进行拍摄，以避免相机运动造成的错位。之后，设置相机拍摄参数，在每个场景中，通过调整光圈、焦距和曝光时间等参数，最大限度地提高参考图像的视觉质量(可以肉眼清晰辨明图像细节信息)。在具体采集时，每次先获取目标场景的正常光干净参考图像，再通过远程控制软件调整图像采集设备的曝光时间参数，将图像采集设备的曝光时间提高3至10倍，从而实现实际过曝光条件的图像拍摄。优选地，为更好地实现暗光图像采集，ISO参数可固定为100以减小噪声干扰，曝光时间倍数选用3、5、8、10等来模拟不同的过曝光程度的过曝光图像。

通过上述流程，能够采集到真实成对的过曝光校正数据集。

由于人眼对于不同颜色的视觉敏感度不同，可见光相机传感器亦基于此进行颜色感知设计。根据RAW图像在RGB色彩模式下分解成四通道R-G-G-B(红-绿-绿-蓝)图像后，不同颜色通道亮度与感知强度不同，所保留纹理信息含量不一致，绿色通道在过曝光条件下亮度和感知强度更高，更容易过曝的数据特性，设计通道引导卷积分支。

其中，基于步骤101得到的过曝光RAW图像的绿色通道会在图像过曝光的明亮区域丢失更多纹理信息的观察，利用信息更丰富的通道共同引导骨干网恢复过曝光区域中丢失的像素信息。

此外，由于绿色通道与其余通道共享相似的边缘，因此，对其余通道进行初始估计，能够使绿色通道受益。

具体地，如图2所示，首先，在拜耳模式的RAW图像的每2×2块中提取属于相应位置的红色和蓝色通道的像素，获得红色和蓝色通道，并一同被馈送至通道引导卷积分支，以生成输出的sRGB图像中相应红色和蓝色通道的初始估计。

通道引导卷积分支由一个引导增强模块和四个下采样模块组成，其中，引导增强模块包含三个3×3深度可分离卷积层、实例归一化操作和LeakyReLU激活函数，允许充分探索和提取局部信息。每个下采样模块均包含一个能够减小特征图大小的平均池化层、一个自注意机制结构和两个深度可分离卷积，从而确保每次下采样时分支网络对输入的红蓝通道逐级增强，并都能与主干网络进行拼接，帮助主干网络以多尺度的方式恢复过度曝光RAW图像。

至此，完成通道引导卷积分支的设计，并完成纹理细节恢复的引导增强。

可以根据步骤102所分析的RAW图像绿色通道亮度与感知强度更高，在过曝光条件下更容易过曝的数据特性，利用输入图像的红蓝通道中所保留的更丰富的纹理信息，有效恢复严重过曝光图像或区域的精细纹理细节。

具体地，如图2所示，通道引导过曝光校正网络的主分支，是由4个编码器阶段和4个相应的解码器阶段组成的U-net结构。其中，主分支首先通过一个3×3卷积，从四通道RAW图像中提取原始特征。在编码器部分，使用半实例归一化块代替传统的残差块来扩展感受野，并提高每个下采样尺度上的特征的鲁棒性。在下采样操作期间，将所提取到的特征图中的通道数加倍。在解码器部分，引入局部残差学习，使用残差块来提取高级特征。对于跳跃连接结构，使用级联空洞残差块替代常规的跳跃连接结构，以提取高级特征，并于编码器部分的各级特征相融合，从而更好地弥补下采样所导致的细节信息丢失。同时，在结构中引入步骤102所构建的通道引导卷积分支。

优选地，半实例归一化块，是由标准3×3卷积、LeakyReLU激活函数和实例归一化结构组成，其中，实例归一化结构仅被使用于一半的通道上，即，提取的特征信息只有一半会被进行实例归一化处理，另一半通道会保留上下文信息。采取这种设计，对网络浅层的特征更加友好，能够扩展编码器部分中每个尺度的感受野，也提高了特征的鲁棒性。

级联空洞残差块，包含由空洞卷积、LeakyReLU激活函数组成的三个残差连接，以及一层1×1卷积层。该结构能够以细粒度的方式，很好地利用编码器每个阶段的特征，充分探索局部纹理信息。同时，空洞卷积的引入，将使其感受野得以扩展，并具备了提取多尺度上下文信息的特征图。

至此，完成了利用RAW数据的通道引导过曝光校正网络的构建，可根据输入图像的红蓝通道中所保留的更丰富的纹理信息，有效恢复严重过曝光图像或区域的精细纹理细节。

步骤104：建立真实图像过曝光增强的训练目标函数，对网络参数θ进行训练，得到输入过曝光RAW图像和参考sRGB图像之间的映射关系F。

具体地，过曝光校正卷积神经网络的总训练目标函数

为：

其中，θ表示网络参数，I^OE表示输入过曝光RAW图像，I^GT表示参考sRGB图像，0.5和0.2分别为损失函数权重，

表示像素级均方根误差损失，

表示感知损失，

表示梯度损失，

表示颜色损失。

式1中的

用于优化适应高频细节以生成平滑的重建结果，表示为：

其中，W和H分别表示输入图像的宽度和高度；F表示网络映射关系，F(I^OE)为过曝光校正后的重建图像；x和y是参考图像空间中的输出像素坐标。

式1中的

利用VGG网络从特征空间恢复图像丢失的信息，表示为：

其中，W_i，j和H_i，j描述了VGG网络中各个特征图的维度，φ_i，j用于表示在VGG网络中的第i个最大池化层之前通过第j个卷积(激活后)获得的特征图。

式1中的

利用sobel算子计算图像梯度进而评估图像纹理信息的损失并对全图进行小幅平滑，从而有效增强输出结果的纹理细节特征，表示为：

其中，Grad是重建图像F(I^OE)和参考图像I^GT的融合梯度。

其中，基于F(I^OE)的Grad表示为：

Grad(F(I^OE，θ))_x，y＝|f_x·F(I^OE，θ)^|+|f_y·F(I^OE，θ)| (5)

式5中，

式1中的

利用高斯模糊评价和优化过度曝光图像和参考图像之间的色差，表示为：

式6中，F(I^OE，θ)_b、I^GT _b分别为F(I^OE)和I^GT的模糊图像。b表示原图经高斯模糊计算所得的模糊图像。

其中，基于F(I^OE，θ)_b表示为：

F(I^OE，θ)_b(i，j)＝∑_k，lF (I^OE，θ)(i+m，j+n)·G(m，n) (7)

式7中，二维高斯模糊操作G(m，n)定义为：

其中，K表示模糊程度参数，μ_x、μ_y分别表示均值参数，σ_x、σ_y分别表示方差参数。优选地，设置参数K＝0.053，参数μ_x＝μ_y＝0，参数σ_x＝σ_y＝3。

通过优化训练的目标函数式1，得到优化后的网络参数θ。

至此，完成了过曝光校正网络的训练，得到不同曝光程度和场景的过曝光RAW图像和参考sRGB图像之间的映射关系F。

步骤105：输入需要测试的过曝光RAW图像，并输入步骤104得到的过曝光RAW图像与参考sRGB图像间的映射关系F。通过曝光RAW图像与参考sRGB图像间的映射关系F，将过曝光RAW图像映射成高质量的正常光照sRGB图像，从而实现高效率和高精度图像过曝光校正，显著提高在过曝光场景下的成像质量。

其中，过曝光RAW图像为

其中Y、

分别为过曝光RAW图像和正常光照sRGB图像。

优选地，使用GPU完成步骤104网络的训练过程和步骤105图像过曝光校正过程，并利用cuDNN库加快卷积神经网络的运行速度。

同时，为实现本发明所述目的，本发明进一步提出了一种基于通道引导的真实过曝光图像校正装置，如图3所示，包括真实成对过曝光校正数据采集子模块10、颜色通道引导学习子模块20、真实过曝光图像校正网络子模块30。

其中，真实成对过曝光校正数据采集子模块10，用于采集真实成对的过曝光校正数据集。

颜色通道引导学习子模块20，用于设计通道引导卷积分支，使其能够基于RAW格式真实过曝光图像的数据特性，利用红色和蓝色通道的信息优势，引导骨干网恢复过曝光区域中丢失的像素信息。

真实过曝光图像校正网络子模块30，使用采集的真实成对过曝光校正数据进行训练，训练得到网络用于过曝光真实图像的校正增强。

上述模块之间的连接关系如下：

真实成对过曝光校正数据采集子模块10的输出端与颜色通道引导学习子模块20的输入端相连。

颜色通道引导学习子模块20的输出端与真实过曝光图像校正网络子模块30的输入端相连。

以上所述的具体描述，对发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于通道引导的真实过曝光图像校正方法，其特征在于，包括以下步骤：

步骤101：采集真实成对的过曝光校正数据集，该数据集包含成对的过曝光图像和正常光照参考图像，每张图像同时拥有RAW和其他所需格式的数据；

步骤102：分析RAW格式真实过曝光图像的数据特性，设计通道引导卷积分支；

步骤103：使用通道引导卷积分支，构建利用RAW图像数据特性的通道引导过曝光校正卷积神经网络；

步骤104：建立真实图像过曝光增强的训练目标函数，对卷积神经网络的参数进行训练，得到过曝光RAW图像和参考图像之间的映射关系；

步骤105：输入需要测试的过曝光RAW图像，以及步骤104得到的过曝光RAW图像与参考图像间的映射关系；通过曝光RAW图像与参考图像间的映射关系，将过曝光RAW图像映射成正常光照所需格式的图像。

2.如权利要求1所述的一种基于通道引导的真实过曝光图像校正方法，其特征在于，步骤101中，首先选定预拍摄场景，确保无环境或人为因素干扰，以及所采集图像数据的场景和内容的丰富度；

其次，设置拍摄硬件设备，将相机固定在三脚架上，形成真实数据采集装置，并由软件控制快门进行拍摄，以避免相机运动造成的错位；

之后，设置相机拍摄参数，在每个场景中，通过调整光圈、焦距和曝光时间等参数，最大限度地提高参考图像的视觉质量；

在具体采集时，每次先获取目标场景的正常光干净参考图像，再通过软件调整图像采集设备的曝光时间参数，将图像采集设备的曝光时间提高。

3.如权利要求1所述的一种基于通道引导的真实过曝光图像校正方法，其特征在于，步骤102中，通道引导卷积分支由一个引导增强模块和四个下采样模块组成，其中，引导增强模块包含三个3×3深度可分离卷积层、实例归一化操作和LeakyReLU激活函数，允许充分探索和提取局部信息；每个下采样模块均包含一个能够减小特征图大小的平均池化层、一个自注意机制结构和两个深度可分离卷积，从而确保每次下采样时分支网络对输入的红蓝通道逐级增强，并都能与主干网络进行拼接，帮助主干网络以多尺度的方式恢复过度曝光RAW图像。

4.如权利要求1所述的一种基于通道引导的真实过曝光图像校正方法，其特征在于，步骤103中，通道引导过曝光校正网络的主分支，由4个编码器阶段和4个相应的解码器阶段组成的U-net结构；其中，主分支首先通过一个3×3卷积，从四通道RAW图像中提取原始特征；在编码器部分，使用半实例归一化块扩展感受野，并提高每个下采样尺度上的特征的鲁棒性；在下采样操作期间，将所提取到的特征图中的通道数加倍；在解码器部分，引入局部残差学习，使用残差块提取高级特征；对于跳跃连接结构，使用级联空洞残差块替代常规的跳跃连接结构，以提取高级特征，并于编码器部分的各级特征相融合；同时，在结构中引入步骤102所构建的通道引导卷积分支。

5.如权利要求4所述的一种基于通道引导的真实过曝光图像校正方法，其特征在于：

半实例归一化块，由标准3×3卷积、LeakyReLU激活函数和实例归一化结构组成，其中，实例归一化结构仅被使用于一半的通道上，即，提取的特征信息只有一半会被进行实例归一化处理，另一半通道会保留上下文信息；

级联空洞残差块，包含由空洞卷积、LeakyReLU激活函数组成的三个残差连接，以及一层1×1卷积层。

6.如权利要求1所述的一种基于通道引导的真实过曝光图像校正方法，其特征在于，步骤104中，过曝光校正卷积神经网络的总训练目标函数