CN115035003A

CN115035003A - 交互补偿注意力的红外与可见光图像对抗融合方法

Info

Publication number: CN115035003A
Application number: CN202210376347.0A
Authority: CN
Inventors: 王志社; 邵文禹; 陈彦林; 杨帆; 孙婧
Original assignee: Taiyuan University of Science and Technology
Current assignee: Taiyuan University of Science and Technology
Priority date: 2022-04-11
Filing date: 2022-04-11
Publication date: 2022-09-09

Abstract

本发明涉及一种交互补偿注意力的红外与可见光图像对抗融合方法。本发明在交互补偿生成器中构造了具有三重路径的多尺度编码器‑解码器网络，红外路径和可见光路径在多尺度编码器‑解码器网络的交互注意力模块和补偿注意力模块的作用下，为连接路径提供了额外的强度和梯度信息，使得可以在融合图像中保留更突出的红外目标和丰富的纹理细节，增强了特征提取和特征重构能力，获得的注意力特征图更聚焦于红外图像目标感知和可见光图像纹理细节表征；在训练时通过双鉴别器对交互补偿生成器进行了优化，使用双鉴别器可以更加均衡地约束融合结果和源图像间的数据分布相似度，使交互补偿生成器生成更平衡的融合结果。

Description

交互补偿注意力的红外与可见光图像对抗融合方法

技术领域

本发明涉及图像处理技术领域，尤其涉及一种交互补偿注意力的红外与可见光图像对抗融合方法。

背景技术

红外与可见光图像融合旨在综合两类传感器的优势，互补生成的融合图像具有更好的目标感知和场景表达，有利于人眼观察和后续计算处理。红外传感器对热源辐射敏感可以获取突出的目标区域信息，但所获得的红外图像通常缺乏结构特征和纹理细节。相反，可见光传感器通过光反射成像，可以获取丰富的场景信息和纹理细节，可见光图像具有较高的空间分辨率和丰富的纹理细节，但不能有效突出目标特性，且易受到外界环境影响，特别在低照度的环境条件下，信息丢失严重。由于红外和可见光成像机制的不同，这两类图像具有较强的互补信息，只有运用融合技术才能有效提高红外与可见光成像传感器的协同探测能力，在遥感探测、医疗诊断、智能驾驶、安全监控等领域有广泛应用。

目前，红外和可见光图像融合技术大致可以分为传统融合方法和深度学习融合方法。传统图像融合方法通常以相同的特征变换或特征表示提取图像特征，采用合适的融合规则进行合并，再通过反变换重构获得最终融合图像。由于红外与可见光传感器成像机制不同，红外图像以像素亮度表征目标特征，而可见光图像以边缘和梯度表征场景纹理。传统融合方法不考虑源图像的内在不同特性，采用相同的变换或表示模型无差别地提取图像特征，不可避免地造成融合性能低、视觉效果差的结果。此外，融合规则是人为设定，且越来越复杂，计算成本高，限制了图像融合的实际应用。

近年来，由于卷积操作具有很强的特征提取能力，且能从大量数据中学习构建模型参数，基于深度学习的融合方法虽然取得了令人满意的效果。尽管如此，但还存在一些不足。首先，这些方法盲目依靠卷积操作提取图像特征，未考虑两类图像内在特征交互，造成局部特征提取能力不足，易导致图像融合的目标亮度降低和纹理细节模糊。其次，这些方法完全依靠卷积操作提取图像的局部特征，未考虑到图像特征的全局依赖性，不能有效提取图像的全局特征信息，易导致融合图像全局特征信息缺失。

综上所述，急需一种能够同时提取两类图像的局部与全局特征，有效强化深度特征的表征能力，增强有用信息时抑制无关信息，进而提高红外与可见光图像的融合性能。

发明内容

为解决现有深度学***衡的融合结果，即融合图像不能同时有效保留红外典型目标和可见纹理细节的技术问题，本发明提供一种交互补偿注意力的红外与可见光图像对抗融合方法。所述的技术方案如下：

一种交互补偿注意力的红外与可见光图像对抗融合方法，其包括：

S1，将待融合红外图像、待融合可见光图像分别对应的红外路径、可见光路径以及待融合红外图像、待融合可见光图像进行通道连接得到的连接路径这三重路径确定为预先训练好的交互补偿生成器的输入，所述交互补偿生成器建立了三重路径的多尺度编码-解码网络框架，所述多尺度编码-解码网络框架包括交互注意力编码网络、融合层和补偿注意力解码网络；

S2，通过交互注意力编码网络采用的4个卷积核为3×3的卷积层，提取三重路径的多尺度深度特征，其中，交互注意力编码网络的第一卷积层、第二卷积层均是步长为1的卷积，用于提取图像的浅层特征，第三卷积层、第四卷积层均是步长为2的卷积，用于提取图像的多尺度深度特征，浅层特征和多尺度深度特征经过三级交互注意力作用后，得到最终的交互注意力图；

S3，通过融合层将最终的交互注意力图与红外路径、可见光路径的第四卷积层得到的补偿注意力图直接进行通道连接，获得融合的注意力特征图；

S4，通过补偿注意力解码网络采用的4个卷积核为3×3的卷积层重构特征，其中，补偿注意力解码网络的第一卷积层、第二卷积层伴随上采样操作；融合的注意力特征图经过上采样操作和第一卷积层的卷积操作，得到的输出与对应尺度的红外路径补偿注意图和可见路径补偿注意图进行通道连接，获得融合图像。

可选地，所述交互注意力编码网络的红外路径和可见光路径四个卷积层的输入通道数分别为1、16、16、32，输出通道数分别为16、16、32、64，连接路径四个卷积层的输入通道数分别为2、16、64、128，输出通道数分别为16、16、32、64，激活函数为PReLU；从第二卷积层开始，红外路径和可见光路径的特征分别与连接路径的特征进行通道连接，记为Φ_m和Φ_n，然后输入交互注意力编码网络的交互注意力模块，生成交互注意力融合图，记为Φ_F。

可选地，所述补偿注意力解码网络的四个卷积层的输入通道数分别为384、192、96、32，输出通道数分别为128、64、32、1，激活函数为PReLU。

可选地，所述交互注意力模块，对于输入特征Φ_m和Φ_n∈R^H×W×C，首先在通道注意力模型使用全局平均池化操作和最大池化操作分别将深度特征映射到通道向量，经过两个卷积层和PReLU激活层后，将输出特征向量进行通道连接，并输入到卷积层和Sigmod激活层，得到了初始通道加权系数

和

分别表示为

和

其中，Conv表示卷积运算，Con表示通道连接操作，AP(·)和MP(·)分别表示全局平均池化操作和最大池化操作，σ和δ代表PReLU和Sigmod激活函数，H和W分别表示图像的高度和宽度，C表示输入通道数；

然后，采用Softmax运算得到对应的最终通道加权系数，即

和

分别表示为

和

将最终通道加权系数与其各自的输入特征相乘，得到相应的通道交互主意力图

和

分别表示为：

和

随后，将相应的通道交互注意力图作为空间注意力模型的输入，经过全局平均池化操作和最大池化操作，并将输出的空间特征图进行通道连接，输入卷积层和Sigmod激活层，得到各自初始空间加权系数

和

分别表示为

和

接下来，再利用Softmax运算得到最终空间加权系数

和

分别表示为

和

将最终空间加权系数与其对应的通道注意图相乘，得到相应的空间交互注意力图

和

分别表示为

和

最后，将两者的空间交互注意力图进行通道连接，获得交互注意力融合图Φ_F，表示为

可选地，所述补偿注意力模块，对于输入的红外图像特征或者可见光图像特征Φ_m∈R^H×W×C，首先在通道注意力模型使用全局平均池化操作和最大池化操作将特征映射转到通道向量，经过两个卷积层和PReLU激活层后，将输出特征向量进行通道连接，并输入到卷积层和Sigmod激活层，得到了通道加权系数

表示为

H和W分别表示图像的高度和宽度，C表示输入通道数；

接着，将通道加权系数与输入特征相乘，得到相应的通道注意力图

表示为

随后，将通道注意力图作为空间注意力模型的输入，再经过全局平均池化操作和最大池化操作，并将输出的空间特征图进行通道连接后，输入卷积层和Sigmod激活层，得到空间加权系数

表示为

最后，将空间加权系数与输入的通道注意力图相乘，得到相应的空间注意力图

表示为

可选地，所述S1之前还包括：

S01，构建交互补偿生成器：以红外路径、可见光路径、红外图像与可见光图像通道连接的连接路径作为输入，建立三重路径的多尺度编码-解码网络框架，包括交互注意力编码网络、融合层和补偿注意力解码网络，用于生成初始融合图像；

所述交互注意力编码网络，分别采用4个卷积核为3×3的卷积层，提取三重路径的多尺度深度特征，其中，第一卷积层、第二卷积层是步长为1的卷积，用于提取图像的浅层特征，第三卷积层、第四卷积层是步长为2的卷积，用于提取图像多尺度深度特征；红外路径与可见光路径四个卷积层的输入通道数分别为1、16、16、32，输出通道数分别为16、16、32、64，连接路径四个卷积层的输入通道数分别为2、16、64、128，输出通道数分别为16、16、32、64，激活函数为PReLU；从第二卷积层开始，红外路径和可见光路径的特征分别与连接路径的特征进行通道连接，记为Φ_m和Φ_n，然后输入交互注意力模块，生成交互注意力融合图，记为Φ_F；经过三级交互注意力作用后，得到最终的交互注意力图；

所述融合层，直接将最终的交互注意力图与红外路径、可见光路径的第四卷积层的补偿注意力图直接进行通道连接，获得融合的注意力特征图；

所述补偿注意力解码网络，分别采用4个卷积核为3×3的卷积层来重构特征，其中第一卷积层、第二卷积层伴随上采样操作；四个卷积层的输入通道数分别为384、192、96、32，输出通道数分别为128、64、32、1，激活函数为PReLU；融合的注意力特征图首先经过上采样操作和第一层卷积，得到的输出与对应尺度的红外路径补偿注意图和可见路径补偿注意图进行通道连接，最终获得初始融合图像；

S02，构建包括红外鉴别器和可见光鉴别器的双鉴别器模型；在训练过程中，将交互补偿生成器获得的初始融合图像与红外图像、可见光图像输入对应的鉴别器，以约束融合图像分别与红外图像、可见光图像同时具有相似的数据分布；当交互补偿生成器与红外鉴别器和可见光鉴别器的对抗博弈达到平衡时，得到最终的融合结果；

所述红外鉴别器与可见光鉴别器具有相同的网络结构，均由4个卷积层和1个全连接层组成，所有卷积层均采用3×3核大小和LeakyRelu激活函数，步长为2，相应的卷积层的输入通道分别为1、16、32、64，输出通道数分别为16、32、64、128；

S03，网络模型训练：以红外图像与可见光图像作为训练数据集，采用表征红外图像像素强度和可见光图像边缘梯度的损失函数监督网络模型训练，获得最优的网络模型参数；

所述损失函数包括交互补偿生成器损失函数和鉴别器损失函数；在交互补偿生成器中，损失函数由对抗性损失函数L_adv和内容损失函数L_con组成，表示为L_G＝L_adv+L_con；交互补偿生成器的内容损失函数可表示为

其中，H和W分别表示图像的高度和宽度，||·||_F和||·||₁表示Frobenius范数，L1范数，

表示梯度算子，I_f表示初始融合图像，I_ir表示红外图像，I_vis表示可见光图像；在红外鉴别器和可见光鉴别器中，对抗损失函数表示为

N表示训练图像数；同时，红外鉴别器和可见光鉴别器各自的损失函数分别表示为

和

其中，λ为正则化参数，||·||₂表示L2范数；第一项表示融合结果与红外或可见光图像之间的wasserstein距离，第二项是梯度惩罚，用于限制红外鉴别器和可见光鉴别器的学习能力。

可选地，所述训练数据集采用TNO数据集的25组红外与可见光图像，使用步长为12的滑动窗口，将原始图像分割为尺寸128×128，灰度值范围转换为[-1，1]，最终获得18813组图像作为训练集；

训练过程中使用Adam优化器更新网络模型参数，Batchsize和Epoch分别设置为4和16；交互补偿生成器和鉴别器的学习率分别设置为1×10^-4和4×10^-4，相应的迭代次数分别设置为1和2；正则化参数λ设置为10。

借由上述方案，本发明具有如下特点：

1、本发明在交互补偿生成器中，构造了一个具有三重路径的多尺度编码器-解码器网络。红外路径和可见光路径在多尺度编码器-解码器网络的交互注意力模块和补偿注意力模块的作用下，为连接路径提供了额外的强度和梯度信息，使得可以在融合图像中保留更突出的红外目标和丰富的纹理细节。

2、本发明开发了交互注意力模块和补偿注意力模块来传递路径特征，并从通道和空间维度建模全局特征，增强了特征提取和特征重构能力，获得的注意力特征图更聚焦于红外图像目标感知和可见光图像纹理细节表征。

3、本发明在训练交互补偿生成器时设计了包括红外鉴别器和可见光鉴别器的双鉴别器，通过双鉴别器对交互补偿生成器进行了优化，使用红外鉴别器与可见光图像鉴别器可以更加均衡地约束融合结果和源图像间的数据分布相似度，使交互补偿生成器生成更平衡的融合结果，从源图像中获取更相似的像素分布和更细致的纹理细节信息。

4、本发明提出了一种端到端的(即预训练网络模型与测试网络模型相同的，不需要在测试网络模型中添加额外融合规则的)红外图像与可见光图像生成对抗融合方法，融合效果明显提升，该方法也可以应用于多模态图像、多聚焦图像和医学图像融合，对图像融合领域具有很高的应用价值。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，并可依照说明书的内容予以实施，以下以本发明的较佳实施例并配合附图详细说明如后。

附图说明

图1是本发明的流程图。

图2是通过交互注意力编码网络、融合层和补偿注意力解码网络对待融合红外图像和待融合可见光图像进行融合的过程示意图。

图3是交互注意图模块的数据处理过程示意图。

图4是补偿注意力模块的数据处理过程示意图。

图5是交互补偿生成器的训练过程示意图。

图6是第一组Solider_with_jeep融合结果对比示意图。

图7是第二组Street融合结果对比示意图。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下灾施例用于说明本发明，但不用来限制本发明的范围。

如图1所示，本发明提供的交互补偿注意力的红外与可见光图像对抗融合方法，其包括：

S1，将待融合红外图像、待融合可见光图像分别对应的红外路径、可见光路径以及待融合红外图像、待融合可见光图像进行通道连接得到的连接路径这三重路径确定为预先训练好的交互补偿生成器的输入，所述交互补偿生成器建立了三重路径的多尺度编码-解码网络框架，所述多尺度编码-解码网络框架包括交互注意力编码网络、融合层和补偿注意力解码网络。

S2，通过交互注意力编码网络采用的4个卷积核为3×3的卷积层，提取三重路径的多尺度深度特征，其中，交互注意力编码网络的第一卷积层、第二卷积层均是步长为1的卷积，用于提取图像的浅层特征，第三卷积层、第四卷积层均是步长为2的卷积，用于提取图像的多尺度深度特征，浅层特征和多尺度深度特征经过三级交互注意力作用后，得到最终的交互注意力图。

其中，所述交互注意力编码网络的红外路径和可见光路径四个卷积层的输入通道数分别为1、16、16、32，输出通道数分别为16、16、32、64，连接路径四个卷积层的输入通道数分别为2、16、64、128，输出通道数分别为16、16、32、64，激活函数为PReLU；从第二卷积层开始，红外路径和可见光路径的特征分别与连接路径的特征进行通道连接(concatenation，对应图2至图5中的C)，记为Φ_m和Φ_n，然后输入交互注意力编码网络的交互注意力模块(图2中的Inter_Att)，生成交互注意力融合图，记为Φ_F。

S3，通过融合层将最终的交互注意力图与红外路径、可见光路径的第四卷积层得到的补偿注意力图直接进行通道连接，获得融合的注意力特征图。

S4，通过补偿注意力解码网络采用的4个卷积核为3×3的卷积层重构特征，其中，补偿注意力解码网络的第一卷积层、第二卷积层伴随上采样操作(图2中的Upsampling)；融合的注意力特征图经过上采样操作和第一卷积层的卷积操作，得到的输出与对应尺度的红外路径补偿注意图和可见路径补偿注意图进行通道连接，获得融合图像。

其中，所述补偿注意力解码网络的四个卷积层的输入通道数分别为384、192、96、32，输出通道数分别为128、64、32、1，激活函数为PReLU。补偿注意力解码网络中，将交互注意力编码网络中的红外路径与可见光路径经过补偿注意力模块(图2中的Comp_Att)得到的不同尺度特征，与连接路径的对应尺度特征进行通道连接，并伴随上采样操作完成对特征图的重构，得到初始融合图像。红外路径与可见光路径为连接路径提供了额外的强度和梯度信息，提高了特征解码能力。

如图2所示，其为通过交互注意力编码网络、融合层和补偿注意力解码网络对待融合红外图像和待融合可见光图像进行融合的过程示意图。图2中的Conv表示卷积运算，k3表示卷积核为3×3，s1表示步长为1的卷积，In16表述输出通道数为16，图2中的其余参数同理。

可选地，如图3所示，所述交互注意力模块，对于输入特征Φ_m和Φ_n∈R^H×W×C，首先在通道注意力模型使用全局平均池化操作和最大池化操作分别将深度特征映射到通道向量，经过两个卷积层和PReLU激活层后，将输出特征向量进行通道连接，并输入到卷积层和Sigmod激活层，得到了初始通道加权系数

和

分别表示为

和

然后，采用Softmax运算得到对应的最终通道加权系数，即

和

分别表示为

和

将最终通道加权系数与其各自的输入特征相乘，得到相应的通道交互注意力图

和

分别表示为：

和

和

分别表示为

和

接下来，再利用Softmax运算得到最终空间加权系数

和

分别表示为

和

和

分别表示为

和

可选地，如图4所示，所述补偿注意力模块，对于输入的红外图像特征或者可见光图像特征Φ_m∈R^H×W×C，首先在通道注意力模型使用全局平均池化操作和最大池化操作将特征映射转到通道向量，经过两个卷积层和PReLU激活层后，将输出特征向量进行通道连接，并输入到卷积层和Sigmod激活层，得到了通道加权系数

表示为

H和W分别表示图像的高度和宽度，C表示输入通道数；

表示为

表示为

表示为

其中，交互注意力模块和补偿注意力模块用于建立局部特征的全局依赖关系，并实现三重路径的特征交互和补偿，增强特征提取和特征重构能力。

上述过程即为对待融合红外图像和待融合可见光图像进行图像融合的相关内容。为了能够通过交互补偿生成器对待融合红外图像和待融合可见光图像进行图像融合，需要预先训练交互补偿生成器，下述内容即为训练交互补偿生成器的过程。

具体地，在训练交互补偿生成器时包括：

S01，构建交互补偿生成器：以红外路径、可见光路径、红外图像与可见光图像通道连接的连接路径作为输入，建立三重路径的多尺度编码-解码网络框架，包括交互注意力编码网络、融合层和补偿注意力解码网络，用于生成初始融合图像。

所述交互注意力编码网络，分别采用4个卷积核为3×3的卷积层，提取三重路径的多尺度深度特征，其中，第一卷积层、第二卷积层是步长为1的卷积，用于提取图像的浅层特征，第三卷积层、第四卷积层是步长为2的卷积，用于提取图像多尺度深度特征；红外路径与可见光路径四个卷积层的输入通道数分别为1、16、16、32，输出通道数分别为16、16、32、64，连接路径四个卷积层的输入通道数分别为2、16、64、128，输出通道数分别为16、16、32、64，激活函数为PReLU从第二卷积层开始，红外路径和可见光路径的特征分别与连接路径的特征进行通道连接，记为Φ_m和Φ_n，然后输入交互注意力模块，生成交互注意力融合图，记为Φ_F；经过三级交互注意力作用后，得到最终的交互注意力图；

所述补偿注意力解码网络，分别采用4个卷积核为3×3的卷积层来重构特征，其中第一卷积层、第二卷积层伴随上采样操作；四个卷积层的输入通道数分别为384、192、96、32，输出通道数分别为128、64、32、1，激活函数为PReLU；融合的注意力特征图首先经过上采样操作和第一层卷积，得到的输出与对应尺度的红外路径补偿注意图和可见路径补偿注意图进行通道连接，最终获得初始融合图像。

S02，构建包括红外鉴别器和可见光鉴别器的双鉴别器模型；在训练过程中，将交互补偿生成器获得的初始融合图像与红外图像、可见光图像输入对应的鉴别器，以约束融合图像分别与红外图像、可见光图像同时具有相似的数据分布；当交互补偿生成器与红外鉴别器和可见光鉴别器的对抗博弈达到平衡时，得到最终的融合结果。

红外鉴别器使融合图像保存尽可能多的红外像素强度信息，而可见光鉴别器使融合图像包含尽可能多的可见光细节信息。对抗博弈达到平衡时得到的最终的融合结果使融合图像同时具有源图像的红外像素强度和可见光纹理细节信息。

S03，网络模型训练：以红外图像与可见光图像作为训练数据集，采用表征红外图像像素强度和可见光图像边缘梯度的损失函数监督网络模型训练，获得最优的网络模型参数，即最优的交互补偿生成器的参数。

所述损失函数包括交互补偿生成器损失函数和鉴别器损失函数；在交互补偿生成器中，损失函数由对抗性损失函数L_adv和内容损失函数L_con组成，表示为L_G＝L_adv+L_con；考虑到红外图像以像素强度表示目标特征，而可见光图像通过边缘和梯度表示场景纹理。故采用Frobenius范数对红外图像与融合图像的像素强度进行相似性约束，采用L1范数对可见光图像与融合图像的梯度变化进行相似性约束，因此，交互补偿生成器的内容损失函数可表示为

表示梯度算子，I_f表示初始融合图像，I_ir表示红外图像，I_vis表示可见光图像。在双鉴别器中，红外鉴别器与可见光鉴别器旨在平衡融合图像和源图像的真实性，迫使生成的融合图像同时倾向于红外图像和可见光图像的真实数据分布。在红外鉴别器和可见光鉴别器中，对抗损失函数表示为

和

其中，所述训练数据集集采用TNO数据集的25组红外与可见光图像，使用步长为12的滑动窗口，将原始图像分割为尺寸128×128，灰度值范围转换为[-1，1]，最终获得18813组图像作为训练集；训练过程中使用Adam优化器更新网络模型参数，Batchsize和Epoch分别设置为4和16；交互补偿生成器和鉴别器(红外鉴别器与可见光鉴别器)的学***台为IntelI9-10850KCPU，64GB内存和NVIDIA GeForce GTX3090 GPU。编译环境是Python和PyTorch平台。

进一步地，为了验证通过上述方法训练得到的交互补偿生成器的图像融合效果，本发明实施例还对训练好的交互补偿生成器进行了验证。

具体地，在测试阶段，从TNO数据集选取了22组图像进行测试验证。对比方法选择了9种典型方法，包括MDLatLRR、DenseFuse，IFCNN，Res2Fusion、SEDRFuse，RFN-Nest，PMGI，FusionGAN和GANMcC。此外，客观评价指标采用了平均梯度(AG)、信息熵(EN)、标准差(SD)、互信息(MI)、空间频率(SF)、非线性相关信息熵(NCIE)、Qabf和视觉信息保真度(VIF)等8个指标。验证结果包括下述两个方面。

(1)主观评价。图6和图7给出了两组图像Solider_with_jeep和Street的主观比较结果示意图。通过对比，可以发现本发明的融合方法具有三个优势。首先，融合结果可以保留红外图像中的高亮度目标信息。对于典型的红外目标，如图6的汽车和图7的行人，本发明的融合结果比其他方法具有更高亮度的目标特征。其次，融合结果可以保留可见光图像的纹理细节。例如，图6的房屋边缘和图7的广告牌，对于这些代表性细节信息，本发明的融合结果比其他方法更明显、更精晰。最后，融合结果获得更高的对比度和更好的视觉效果。与源图像和其他融合结果相比，本发明方法可以更好地保留突出的目标特征和丰富的的场景细节信息，获得更加平衡的融合结果。

(2)客观评价。表1给出了TNO数据集的22组图像的客观比较结果。最优平均值和次优平均值分别用加粗和下划线标注。可以看出，本发明方法取得了指标AG、EN、MI、SF、NCIE和VIF的最优平均值，指标SD和Qabf次优平均值。客观实验表明本发明方法比其他方法具有更好的融合性能。最大值EN表示可以保持源图像中丰富的有用信息。这是因为本发明方法采用了一个三重路径，红外路径和可见光路径为连接路径提供额外的强度和梯度信息。最大值MI和NCIE表示融合结果与源图像具有很强的相关性和相似性。这是因为本发明方法采用双鉴别器对交互补偿生成器进行监督和优化，可以产生更平衡的融合结果。最大值AG、SF和VIF表示可以获得更好的图像对比度和视觉效果。本发明方法采用交互注意力模块和补偿注意力模块，建立局部特征的长依赖关系，获取的注意力特征图更聚焦于红外目标感知和可见纹理细节表征。

表1

上述所有可选地技术方案均可任意组合，本发明不对一一组合后的结构进行详细说明。

以上所述仅是本发明的优选实施方式，并不用于限制本发明，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变型，这些改进和变型也应视为本发明的保护范围。

Claims

1.一种交互补偿注意力的红外与可见光图像对抗融合方法，其特征在于，包括：

2.根据权利要求1所述的交互补偿注意力的红外与可见光图像对抗融合方法，其特征在于，所述交互注意力编码网络的红外路径和可见光路径四个卷积层的输入通道数分别为1、16、16、32，输出通道数分别为16、16、32、64，连接路径四个卷积层的输入通道数分别为2、16、64、128，输出通道数分别为16、16、32、64，激活函数为PReLU；从第二卷积层开始，红外路径和可见光路径的特征分别与连接路径的特征进行通道连接，记为Φ_m和Φ_n，然后输入交互注意力编码网络的交互注意力模块，生成交互注意力融合图，记为Φ_F。

3.根据权利要求1所述的交互补偿注意力的红外与可见光图像对抗融合方法，其特征在于，所述补偿注意力解码网络的四个卷积层的输入通道数分别为384、192、96、32，输出通道数分别为128、64、32、1，激活函数为PReLU。

4.根据权利要求2所述的交互补偿注意力的红外与可见光图像对抗融合方法，其特征在于，

所述交互注意力模块，对于输入特征Φ_m和