CN109272024B

CN109272024B - 一种基于卷积神经网络的图像融合方法

Info

Publication number: CN109272024B
Application number: CN201810991787.0A
Authority: CN
Inventors: 王蒙; 刘兴旺; 梁敏
Original assignee: Kunming University of Science and Technology
Current assignee: Kunming University of Science and Technology
Priority date: 2018-08-29
Filing date: 2018-08-29
Publication date: 2021-08-20
Anticipated expiration: 2038-08-29
Also published as: CN109272024A

Abstract

本发明涉及一种基于卷积神经网络的图像融合方法，属于信息融合、图像处理领域。本发明通过训练并使用卷积神经网络来获得融合图片。通过针对待融合图片选定训练集预先对卷积神经网络进行训练，整个训练过程属于监督训练；在训练过程中涉及到图片的分析与合成；再使用训练好的两组模型权值前馈网络的分析和反馈网络的合成，用于深度神经网络融合模型。训练和融合过程中的融合法则均采用基于深度学习的sigmoid函数融合法则。本发明避免了融合过程中出现冗余信息以及相关信息的遗漏。

Description

一种基于卷积神经网络的图像融合方法

技术领域

本发明涉及一种基于卷积神经网络的图像融合方法，属于图像融合领域。

背景技术

图像融合是将两个或者两个以上的传感器在同一时间或不同时间获取的关于某个具体场景的图像或者图像序列信息加以综合，以生成新的有关此场景届时的信息处理过程。

随着多源图像融合技术的发展，其在军事和民用领域的应用更为深入，并且对经济和国防事业的建设都有重要的意义。多源图像大致分为多传感器图像、遥感多源图像、多聚焦图像、时间序列图像。而多聚焦图像和时间序列图像都是采用同种传感器的不同成像方式或不用成像时间获得的。特别的，多聚焦图像是由同种传感器采用不同的成像方式(聚焦点的不同)获得的。多聚焦图像的融合是图像融合研究中一类具有代表性的问题。由于光学镜头的成像原理可知，物体在镜头的共轭平面时，成清晰的像，处于共轭平面以外的物体将出现不同程度的模糊，当模糊程度不超过光学***的景深时，物体所成的像仍然可以看做是清晰的。光学***的景深指保证在像平面能获得清晰的像的物体在物放空间前后移动的最大距离，由于光学镜头的景深有限，使得在拍摄是很难获取一幅所有景物都聚焦清晰的图像。所以仅仅依靠成像***本身很难解决这一问题。因此这个问题的有效解决方法是对同一场景拍摄几幅聚焦点不同的图像，然后，将其融合为一幅场景内所有景物均被聚焦的图像，这种图像融合被称为多聚焦图像融合。

医学图像融合(medical image fusion，MIF)是将来自相同或不同成像设备采集的同一组织或器官的相关图像，经过适当的空间配准和叠加，加以必要的变换处理，使其在空间位置、空间坐标上达到匹配。

医学成像已经成为包括诊断，治疗计划和手术导航在内的各种临床应用中不可替代的组成部分。为了向医生提供用于临床目的的足够的信息，通常需要用多种形式获得的医学图像，诸如X射线，计算机断层摄影(CT)，磁共振(MR)，正电子发射断层摄影(PET)，单光子发射计算机断层摄影(SPECT)等。由于成像机制的不同，具有不同形态的医学图像关注不同类别的器官/组织信息。例如，CT图像通常用于骨骼和种植体等密集结构的精确定位，MR图像可以提供具有高分辨率解剖信息的优异的软组织细节，而血流和代谢变化的功能信息可以由PET和SPECT图像提供，但空间分辨率低。多模态医学图像融合旨在通过生成可视化的合成图像，将不同来源图像中包含的补充信息相结合，从而帮助医生为各种目的做出更容易更好的决策。

传统的融合方法，比如变换域和空间域方法，前者将图像进行系数变换然后在系数空间进行融合再反变换，得到融合图像。后者直接在图像的空间信息上进行融合。然而这两类方法中滤波器组都是人为设定的，所以在滤波的过程中会漏掉很多相关信息并引入冗余信息。

发明内容

本发明提供一种基于卷积神经网络的多聚焦图片和医学图片融合技术，基于卷积神经网络，通过训练网络模型得到权值，基于变换域的思想分解与合成图片，避免融合过程中出现冗余信息以及相关信息的遗漏。

本发明的技术方案是：首先针对待融合图片特性选定训练数据集并对其进行预处理，针对待融合图片选取若干图片作为训练数据集，并对选取的图片进行模糊处理，形成由原清晰图片和模糊图片组成的训练数据集；模糊处理时可以对图片的不同区域进行处理得到不同的模糊图片，而训练数据集中数据数量越多，训练得到的结果以及最后的图像融合的到的效果越好。

然后通过监督训练利用卷积神经网络模型对训练数据集获得模型权值，将原清晰图片和模糊图片输入卷积神经网络模型得到对应的特征映射，将模糊图片的特征映射通过融合法则得到了融合后的特征映射，计算原清晰图片的特征映射和模糊图片融合后的特征映射的差值，并使差值达到最小误差，获得对待融合图片分析的前馈网络权值weight_f与合成图片的反馈网络权值weight_b；

最后将训练获得的权值应用到模型上对图像进行融合，将一张白噪声图片和待融合图片输入卷积神经网络模型得到对应的特征映射，利用融合法则对待融合图片的特征映射进行融合进而获得融合后的特征映射，计算待融合图片融合后的特征映射与白噪声图片的特征映射的差值，并使差值最小化，对此时的白噪声图片进行逆运算得到最终的融合图片。

如图1所示，其中卷积神经网络模型采用VGG16模型，训练和融合过程中的融合法则均采用SIGMOID函数，具体步骤如图2-3所示：

Step1训练数据集的选取与处理

可以选定一些高清图片利用MATLAB人为模糊图片，如清晰图片I_A模糊成

和

和

的模糊区域不同；

Step2利用卷积神经网络模型进行训练

在训练过程中我们同时在一个模型中训练两组权值数据，初始VGG16的权值为ImageNet权值数据，通过对一组图片数据，如I_A与

和

将图片I_A、模糊图片

和

输入到初始的VGG16模型中我们可以得到对应的5层特征映射。

其中，Nwⁱ为对应的VGG16网络层，

和

分别对应I_A、

和

在各个层上得到的相应的特征映射，i为VGG16的层数；

在此后我们需要计算两幅图片在各个区域的权重以用来融合，将特征映射

和

通过sigmoid融合法则得到融合后的特征映射

计算误差

根据深度学习框架中的反向传播算法不断修正误差

最终达到最小误差，此时获得两组权值数据即对待融合图片分析的前馈网络权值weight_f与合成图片的反馈网络权值weight_b；

在融合时也可采用绝对值最大化来计算权重：

Step3利用Step2得到的两组网络权值对待融合图片进行融合

在VGG16模型初始化时读入两组权值数据，将一张白噪声图片I_w、待融合图片I₁和I₂经过VGG16模型得到对应的5层特征映射：

其中

为带有训练权值的对应的VGG16网络层，

和

分别对应I_w、I₁和I₂在各个层上得到的相应的特征映射，i为VGG16的层数；

对

和

通过sigmoid融合法则得到融合后的特征映射

再迭代计算

和

之间的误差

并使误差L_s最小化，此时的白噪声图片映射

已经无限接近融合的映射

此时的白噪声图片即融合图片

最后对W_F运行分解图片时的逆运算，获得最终的融合图片I_F，

本发明的有益效果：本发明所使用的的滤波器组均为学习得到的滤波器，可以有效的避免人为设计滤波器的缺陷。比如在图片的活跃区域测量和权值的分配等问题，并且使用基于深度学习SIGMOID函数设计的新的融合法则，减少了***的参数，避免融合过程中出现冗余信息以及相关信息的遗漏，最终融合结果更理想。

附图说明

图1是卷积神经网络VGG16结构图；

图2是本发明训练模型逻辑图；

图3是本发明融合模型逻辑图；

图4中(a)和(b)是两幅待融合医学图片，(c)为融合结果；

图5是多聚焦图片训练数据集；

图6中(a)和(b)是两幅待融合多聚焦图片，(c)为其融合结果。

图7是医学图片训练数据集。

具体实施方式

下面结合附图和具体实施例，对本发明作进一步说明。

实施例1：采用上述发明内容中的方法对如图4中(a)和(b)两幅待融合多聚焦图片进行融合，我们选择了如图5所示的7副高清图片并在裁剪后，用MATLAB对其进行模糊得到70副训练图片集。

将70幅训练数据图片转换成.h5文件后输入到训练模型中，其中训练集包含两组数据，一组是真实的清晰图片，另一组是在清晰图片基础上模糊的十幅图片，此时真实图片就是标注的图片，用于误差的计算。经过多次迭代后，得到模型的两组权值并保存。

对VGG16模型权值进行初始化(读取训练生成的两组权值)，待融合图片经过网络后会得到五个特征映射(对应VGG16的五层)，只有对特征映射应用融合法则得到融合后的特征映射，与此同时我们对网络输入一张白噪声图片，也会得到对应的五张特征映射，之后计算白噪声图片的特征映射与融合的特征映射之间的误差，经过100次迭代后损失函数达到最小值，此时两组特征映射的相似度无限接近，最后对迭代后得到的白噪声映射(已相同于融合的映射)运行卷积的逆运算(VGG16网络的反向计算过程)得到最后的融合图片即图4中的c所示，其结果与现有技术的对比如表1所示。

表1本方法和现有技术对多聚焦图片融合结果对比表

表1展示了本方法和一些传统方法的客观评价指标(Objective Assessment ofMultiresolution Image Fusion Algorithms for Context Enhancement in NightVision:A Comparative Study)。为了便于分析，我们从图片特征Qg，结构相似度Qs和人眼Qcv指标来评价。而对比方法来自刘羽的图片融合工具箱，可在网络上获取。其中包括曲波变换(curvelet)，拉普拉斯变换(LP),非下采样Contourlet(NSCT)变换和稀疏表示(SR)。在表1中可以看到，本方法在这三种指标中都占据了明显优势，特别在Qcv上，通过神经网络去分析图片更符合人类的理解认知。

实施例2：采用发明内容中的方法以及实施例1中的具体取值对如图6中(a)和(b)两幅待融合医学图片进行融合，一副为CT图像，一副为MRI图像，其训练数据集如图7所示，最后的融合图片即图6中的c所示，其结果与现有技术的对比如表2所示。

表2本方法和现有技术对医学图片融合结果对比表

方法	Qg	Qs	Qcv
				Curvelet	0.3974	0.6316	1917.1
LP	0.6419	0.6353	1450.7
				NSCT	0.6516	0.6923	1507.0
SR	0.8465	0.9151	1716.9
				本专利	0.7535	0.9220	2212.6

由表2可以看出，本方法在对医学图片进行融合时相对于其他常规方法占据明显优势，特别在Qcv这一指标上，说明了通过神经网络去分析图片更符合人类的理解认知。

上面结合附图对本发明的具体实施例作了详细说明，但是本发明并不限于上述实施例，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下作出各种变化。