CN108764064A

CN108764064A - 基于导向滤波器与自编码器的sar目标识别算法

Info

Publication number: CN108764064A
Application number: CN201810427650.2A
Authority: CN
Inventors: 王健; 任萍; 杨珂; 张修飞
Original assignee: Northwestern Polytechnical University; Xian Aisheng Technology Group Co Ltd
Current assignee: Northwestern Polytechnical University; Xian Aisheng Technology Group Co Ltd
Priority date: 2018-05-07
Filing date: 2018-05-07
Publication date: 2018-11-06

Abstract

本发明提出一种基于导向滤波器与自编码器的目标识别算法。针对神经网络识别合成孔径雷达(synthetic aperture radar，SAR)图像目标追求高识别率，设计复杂结构造成的耗时问题，将快速图像融合技术应用于SAR识别技术的特征提取，用加权快速导向滤波器(guided filter,GF)对SAR图像做两尺度融合预处理，然后生成一维图像矢量，用自编码器对图像进行低维特征重构，用softmax分类器进行分类处理，经实验仿真验证将加权导向滤波器的图像融合技术与特征提取结合起来，不仅可以提高目标的识别精度，而且大大降低自编码器隐层神经元的数量，计算复杂度大幅度降低。

Description

基于导向滤波器与自编码器的SAR目标识别算法

技术领域

本发明涉及一种基于导向滤波器与自编码器的目标识别算法，可以应用于各种军用或民用的图像处理***。

背景技术

现代高科技战争中，战场信息的及时准确获取以及战场态势的高效评估，对争夺战场的军事主导权具有十分重要的作用。合成孔径雷达图像(Synthetic Aperture Radar，SAR)作为一种重要的遥感成像传感器，在环境监测、资源勘察和国防军事等领域有着非常广泛的应用。合成孔径雷达具有一定的地面和植被穿透能力，有助于发现机场、港口、桥梁、道路等人造建筑目标以及飞机、坦克、舰船等军事目标。SAR目标识别利用SAR图像信息实现目标种类、型号等属性的判定，在战场侦察、精确打击等军事领域有明确的应用需求，未来数字化、信息化的战场上，能够及时、精确获取敌方目标，对敌方目标进行识别以确保有针对性地对敌方目标军事打击。

近年来基于深层神经网络的目标识别技术在各个领域都取得很好的效果，促使学者们用神经网络对SAR图像目标识别进行研究。文献“SAR Automatic Target RecognitionBased on Euclidean Distance Restricted Autoencoder,IEEE J.Sel.TopicsAppl.Earth Observ.Remote Sens.,pp.1-11,Jul.2017.”将欧氏距离限制与自编码器相结合使增加样本不同类间距的同时,减小类内样本间距,使网络可分性更好,用dropout操作解决了训练样本有限产生的过拟合现象.文献“Synthetic Aperture Radar TargetRecognition with Feature Fusion Based on a Stacked Autoencoder,Sensors,2017,17,192,1-16”先提取23个冗余性较低的描述图像全局和局部信息的互补性TPLBP特征；其次设计一种有效的特征融合网络，基线和TPLBP特征作为SAE的输入；然后，采用无监督学习算法，通过贪婪分层训练方法对SAE进行预训练；最后用softmax对目标进行分类。文献“相似性约束的深度置信网络在SAR图像目标识别的应用.电子与信息学报,2016,38(1):97-103.”提出相似性约束的受限玻尔兹曼机模型，该模型在训练过程中通过约束特征向量之间的相似性达到引入监督信息的目的，可以将多个相似性约束的受限玻尔兹曼机堆叠成一种新的深度模型。文献“Deep learning-based classification of hyperspectraldata.IEEE J.Sel.Top.Appl.Earth Obs.Remote Sens.2014,7,2094–2107.”结合高光谱图像的空间特征和光谱信息，在分类任务中取得了较好的性能，但高维的原始光谱信息导致了相对复杂的网络结构。通过采用多层自编码，依据提取的轮廓和阴影的SAR影像特征和集成到协同神经网络的目标识别，一定程度上提高了分类精度，该算法需要分割目标的阴影区域和批处理，比较复杂。文献“SAR Automatic Target Recognition Based on a VisualCortical System.In Proceedings of the 2013 6th International Congress onImage and Signal Processing,Hangzhou,China,16–18December2013；pp.778–782.”在预处理和分割后，将SAR图像变为一维向量，并将其输入到SAE中，得到了更具竞争力的结果。为了适应复杂的原始数据，在SAE的第一层中需要64×64个神经元，这导致了复杂的SAE结构和低的网络训练效率。

神经网络的识别性能要求大量的标记数据作为训练样本，但在SAR目标中是很难实现的，因为复杂的SAR图像通常需要一个复杂的网络结构来适应它们。随着网络结构的复杂度增加，网络的训练时间将显著延长。针对神经网络识别合成孔径雷达(syntheticaperture radar，SAR)图像目标追求高识别率，设计复杂结构造成的耗时问题，将快速图像重构技术与SAR目标识别技术结合起来，用导向滤波器(guided filter,GF)对SAR图像做两尺度重构预处理，然后生成一维图像矢量并作归一化处理，用自编码器对图像进行低维特征抽取，用softmax分类器进行分类处理，经实验仿真验证将加权导向滤波器的图像重构技术与特征提取结合起来，不仅可以提高目标的识别精度,而且大大降低自编码器的隐层神经元的数量，计算复杂度大幅度降低。在样本量相对较少的情况下，大幅度简化网络结构，提高训练效率，可以提高SAR ATR技术的性能。

发明内容

要解决的技术问题

为了避免现有技术的不足之处，本发明提出一种基于导向滤波器与自编码器的SAR目标识别算法。

技术方案

一种基于导向滤波器与自编码器的SAR目标识别算法，其特征在于步骤如下：

步骤1：基于快速导向滤波器的两尺度图像融合

对原图像I_n做拉普拉斯滤波得到高频图像H_n：

H_n＝I_n*L (1)

式中，I_n为第n个源图像，L是一个3×3拉普拉斯滤波器；

对H_n取绝对值并作局部平均用来重建特征映射图S_n：

S_n＝|H_n|*g_r,σ (2)

式中，g是一个(2r+1)×(2r+1)的高斯低通滤波器，r和σ均为5；σ为高斯低通滤波器的方差；

使用特征映射图来确定权重图如下：

式中，N为输入图像的像素数，为第n幅输入图像像素数为k时的特征映射值；

将加权导向滤波器应用于每个视觉特征加权映射图P_n中，将相对应的源图像I_n作为引导图像通过导向滤波器生成的加权图如下：

式中：r₁，ε₁，r₂和ε₂分别为快速加权导向滤波器的参数，和分别为近似分量和细节分量的加权图，分别对和进行归一化处理，

其中r₁＝45；ε₁＝0.3；r₂＝7；ε₂＝10^-6；GF是导向滤波函数；

利用平滑滤波器对源图像进行两尺度分解得到近似分量，细节分量通过源图像减去近似分量获得，如下式：

式中：为源图像的低频分量，为源图像的高频分量；G为(2r′+1)(2r′+1)窗口的平滑滤波器，其中r′＝15；

最后将源图像的近似分量和细节分量分别通过加权平均进行融合得到各自的融合分量，如下式：

将得到的融合后的近似分量和细节分量进行重构得到融合后的图像，则

步骤2：基于稀疏降噪自编码器的低维图像特征提取

设X＝{x₁,x₂,…,x_n}代表训练样本数据,其中x_n为融合后的图像I_n做裁剪后的图像扩展成的一维矢量，x_n＝{1,2,…,N}是第n个训练样本数据，是一个列向量,N表示训练样本的总数，自编码器将图像输入X映射到隐层H,h_n是第n个训练样本投影的特征，也是一个列向量；

自编码器包括编码器和解码器，训练时,一个自编码器首先将输入图像映射到隐层神经元产生隐层的特征表示编码器的权值矩阵W维度为d_h×d_x，其偏置向量由解码器通过将隐藏表示h映射到输出层y来完成重构，解码器的偏置为因此需要学习W,b_h和b_y三个参数：

h＝f(x)＝s_f(Wx+b_h) (11)

y＝g(h)＝h_W,b(x)＝s_g(W^Th+b_y) (12)

式中，s_f是一个非线性激活函数，s_g是解码器的激活函数；

在训练自编码器学习不同参数W,b_h和b_y的过程中，将降噪自编码器与dropout结合起来，自编码器中引入dropout操作时输入与隐层神经元及输出层神经元的映射关系如下所示：

训练的时候，每个隐含层的输出以p的概率设置为0；测试时，所有隐藏的单元的输出权重乘以p；经过交叉验证，隐含节点dropout率等于0.5的时候效果最好；

为了使隐藏层单元提取编码出鲁棒性特征，这里引入降噪自编码器，具体实现是以一定概率分布给原始图像矩阵的值随机置0，然后计算自编码器输出，将输出与原始图像做误差迭代；

编码器的输出表示隐藏层特征，解码器通过最小化下列代价函数，从编码器的表示中重建出原始输入：

L表示重建误差函数，θ∈{W,b_h,b_y}是自编码器需要学习的参数，D_n为训练集，自编码器的目的就是找到一组最优的参数θ使输入图像与降维特征之间重建误差最小化，参数通过梯度下降算法进行更新：

步骤3：基于softmax分类器的目标分类输出

假设softmax分类器的输出函数h_W(y)形式如下：

其中，{(y₁,L₁),…,(y_N,L_N)}为训练集，y_n(i＝1,2,…,N)为训练样本数据x_n(n＝1,2,…,N)经过自编码器重构后的样本矢量，L_n∈{1,2,...,k}为数据的标签值，W₁,W₂,…,W_k为模型参数,是归一化因子，使得输出向量的所有元素之和即总概率为1；定义示性函数1{·}，若函数的输入表达式为真，则函数输出值为1，否则为0；即

引入示性函数得到softmax的代价函数为

其中，λ＝10^-4；

Softmax回归中将y分类为类别j的概率为：

使用梯度下降法对损失函数进行求导进行优化，得到最优的目标输出函数h_W(y)：

有益效果

附图说明

图1：本发明方法的整体框架流程图

图2：实验源图像数据MSTAR集的三类目标图：(a)给出了一些BMP-2的SAR图像；(d)是BMP-2的光学图像；(b)给出了一些BTR-70的SAR图像；(e)是BTR-70的光学图像；(c)给出了一些T-72的SAR图像；(f)是T-72的光学图像。

图3：自编码器结构图

具体实施方式

现结合实施例、附图对本发明作进一步描述：

用于实施的硬件环境是：实验环境为Intel(R)Core(TM)i5-3230M [email protected]，内存为4GB，采用MATLAB R2016a编程。本发明实验数据采用美国国防高等研究计划署(DARPA)支持的MSTAR计划所公布的实测SAR地面静止目标数据。采集数据集的传感器为高分辨聚束式合成孔径雷达，分辨率为0.3m×0.3m。工作在X波段，所用的极化方式为HH极化方式。对采集到的数据进行处理，从中提取出128×128包含各类目标的数据集图像。

该数据大多是静止车辆的SAR切片图像，包含多种车辆目标在各个方位角下获取到的目标图像。在该数据集中包含一个该计划推荐的三类目标训练集和测试集，训练集是雷达工作俯仰角为17°时所得到的目标图像数据，测试集是雷达工作俯仰角为15时所得到的目标图像数据。目标包括3大类:BTR70(装甲运输车)，BMP2(步兵战车)，T72(坦克)；三种类别的目标具有七种不同的型号，BMP2包括型号SN-9563、SN-9566和SN-C21，T72包括型号SN-132、SN-812和SN-S7，BTR70包括型号SN-C71，同类但不同型号的目标在配备上有些差异，但总体散射特性相差不大。

本发明方法的基本流程如附图1所示，实验源图像数据如附图2所示，三类样本数据如附表4所示，具体实施如下：

步骤一：基于导向滤波器的两尺度图像重构

对目标识别来说，对原图像进行重构预处理目的在于突出不同类目标图像之间的差异性，而基于导向滤波器的两尺度图像重构的关键之处——特征映射图的构造，其具体步骤如下：

通过对原图像I_n做拉普拉斯滤波得到高频图像H_n：

H_n＝I_n*L (1)

式中，I_n为第n个源图像，L是一个3×3拉普拉斯滤波器，H_n取绝对值并作局部平均用来重建特征映射图S_n：

S_n＝|H_n|*g_r,σ (2)

其中g是一个(2r+1)×(2r+1)的高斯低通滤波器，σ为高斯低通滤波器的标准差，r和σ均为5；特征映射图对图像高频细节分量的显著性水平提供了良好的表征。特征映射图来确定权重图如下：

N为输入图像的像素数，为第n幅输入图像像素数为k时的特征映射值。

r₁,ε₁,r₂和ε₂分别为加权导向滤波器的参数，和分别为低频近似分量和高频细节分量的加权图，分别对和进行归一化处理，其中r₁＝45；ε₁＝0.3；r₂＝7；ε₂＝10^-6。

利用平滑滤波器对源图像进行两尺度分解得到低频近似分量，高频细节分量通过源图像减去低频近似分量获得，如下式：

式中：为源图像的低频分量，为源图像的高频分量。G为(2r+1)×(2r+1)窗口的平滑滤波器，其中r＝15。

最后将源图像的低频近似分量和高频细节分量分别通过加权平均进行重构得到各自的重构分量，如下式：

将得到的重构后的低频近似分量和高频细节分量进行重构得到重构后的图像，则

步骤二：基于稀疏降噪自编码器的低维图像特征抽取

自动编码器(autoencoder,AE)就是一种用低维特征矢量重构输入图像的神经网络。为了实现这种重构，自动编码器就须提取出可以重构输入数据的特征矢量，代表原图像的主要成分。作为一种无监督的学习网络，自编码器通过简单的非线性模型和优化重构算法特点，用低维的特征失量对原始图像进行重构，极大程度上降低了特征之间的冗余信息。

通过减少冗余的特征提取来简化AE的输入层，重构图像的不同特征来获得判读性较高的特征和提高识别效率，较低维度的AE可以实现与复杂结构神经网络相同的性能，网络结构相对简单，满足快速高精度SAR图像判读识别的需要，而且当标记样本数量比较小时,无监督学习的堆叠自编码器不仅可以防止网络过拟合，而且有效地提高网络的非线性映射能力。

设X＝{x₁,x₂,…,x_N}代表训练样本数据,x_n(n＝1,2,…,N)是第n个训练样本数据，是由原图像I_n作两尺度重构后的图像做裁剪后扩展成一维矢量形成的，是一个列向量，N表示训练样本的总数，自编码器将图像输入X映射到隐层H,h_n是第n个训练样本投影的特征，也是一个列向量。

一般情况下自编码器由编码器和解码器两部分组成。训练时,一个自编码器首先将输入图像映射到隐层神经元产生隐层的特征表示其中s_f是一个非线性激活函数,一般情况下默认为是sigmoid函数，编码器的权值矩阵W维度为d_h×d_x，其偏置向量由解码器通过将隐藏表示h映射到输出层y来完成重构。s_g是解码器的激活函数，解码器的偏置为因此有三个参数需要学习：W,b_h和b_y。

h＝f(x)＝s_f(Wx+b_h) (11)

y＝g(h)＝h_W,b(x)＝s_g(W^Th+b_y) (12)

在训练自编码器学习不同参数W,b_h和b_y的过程中，深度神经网络具有很强的非线性映射能力，随着层数和每一层神经元数目的增加，它对原始数据重构的表征能力更加突出,也造成很严重的过拟合问题,降低了网络训练和测试数据的速度。dropout是一种防止过拟合的有效方法，将降噪自编码器与dropout起来，提高了网络的性能，降低了时间复杂度。dropout是指在深度学习网络的训练过程中，对于隐层的神经元，按照一定的概率将其暂时从网络中丢弃。自编码器中引入dropout操作时输入与隐层神经元及输出层神经元的映射关系如下所示：

训练的时候，每个隐含层的输出以p的概率设置为0。测试时，所有隐藏的单元的输出权重乘以p。减弱了神经元节点间的联合适应性，增强了泛化能力。经过交叉验证，隐含节点dropout率等于0.5的时候效果最好，原因是0.5的时候dropout随机生成的网络结构最多。

为了使隐藏层单元提取编码出鲁棒性特征，这里引入降噪自编码器，具体实现是以一定概率分布(通常是指二项分布)给原始图像矩阵的值随机置0，然后计算自编码器输出，将输出与原始图像做误差迭代。通过置0处理，与原数据相比，噪声对结果的影响降低，而且减少了训练数据与测试数据之间的差异，一定程度上提高了网络的泛化能力。

步骤三：基于softmax分类器的目标分类输出

softmax分类器以多项式分布为模型的多分类回归模型，是二分类logistic回归分类器推广到多分类问题的一般形式，对于训练集{(y₁,L₁),…,(y_N,L_N)}，y_n(i＝1,2,…,N)为训练样本数据x_n(n＝1,2,…,N)经过自编码器重构后的样本矢量，有数据的标签值L_n∈{1,2,...,k}。在这里，k为样本的种类，取值为3,10。从概率学的角度解释，模型的输出是一个维的向量，向量的每个元素表示输入数据被分到相应的类别的概率。假设输出函数h_W(y)形式如下：

其中，W₁,W₂,…,W_k为模型参数,是归一化因子，使得输出向量的所有元素之和即总概率为1。定义示性函数1{·}，若函数的输入表达式为真，则函数输出值为1，否则为0；即

引入示性函数得到softmax的代价函数为

在softmax回归函数中直接用上述对数似然函数的第一项是不能用梯度下降法来更新参数的，因为它存在冗余的参数，是一个非凸函数，通过添加一个权重衰减项来使代价函数满足凸函数的性质，得到最优化的解。这里λ＝10^-4。

Softmax回归中将y分类为类别j的概率为：

用梯度下降法对损失函数进行求导进行优化，得到最优的目标输出函数h_W(y)。

附表4是三类目标训练集和测试集样本数据集样本数据,附表7显示了用本发明方法得到的三类目标识别结果。下面结合附表5和附表6对本发明的效果做进一步描述。

1.实验条件

实验环境为Intel(R)Core(TM)i5-3230M [email protected]，内存为4GB，采用MATLABR2016a编程。本发明实验数据采用美国国防高等研究计划署(DARPA)支持的MSTAR计划所公布的实测SAR地面静止目标数据。采集数据集的传感器为高分辨聚束式合成孔径雷达，分辨率为0.3m×0.3m。工作在X波段，所用的极化方式为HH极化方式。对采集到的数据进行处理，从中提取出128×128包含各类目标的数据集图像。

该数据大多是静止车辆的SAR切片图像，包含多种车辆目标在各个方位角下获取到的目标图像。在该数据集中包含一个该计划推荐的三类目标训练集和测试集，训练集是雷达工作俯仰角为17°时所得到的目标图像数据，测试集是雷达工作俯仰角为15时所得到的目标图像数据。目标包括3大类:BTR70(装甲运输车)，BMP2(步兵战车)，T72(坦克)；三种类别的目标具有七种不同的型号，BMP2包括型号SN-9563、SN-9566和SN-C21，T72包括型号SN-132、SN-812和SN-S7，BTR70包括型号SN-C71，同类但不同型号的目标在配备上有些差异，但总体散射特性相差不大。。

2.实验内容

导向滤波器重构的图像尺寸为128×128,预处理完成后,将训练集图像处理为1×1024或者1×784的列向量,用于自编码器的输入,生成的低维特征矢量的维度即自编码器的隐层神经元数量。

附表6显示了几种不同算法的分类识别率，文献“相似性约束的深度置信网络在SAR图像目标识别的应用.电子与信息学报,2016,38(1):97-103.”对深度置信网络引入相似性约束,对三类目标的七种型号进行分类识别，特征可分性更好。文献“基于两级2DPCA的SAR目标特征提取与识别.电子与信息学报,2008,30(7):1722-1726.”首先对图像进行适当的预处理，然后使用2DPCA特征提取，近邻分类器完成分类。文献“Image Matting forAutomatic Target Recognition.IEEE TRANSACTIONS ON AEROSPACE AND ELECTRONICSYSTEMS,pp2233-2250,VOL.53,NO.5OCTOBER 2017.”适应地分配前景和背景的约束，估计图像目标的中心，消除非目标区域，分割出目标进行识别。文献“基于压缩感知的SAR图像目标识别方法研究.南京：南京航空航天大学，2013.”将训练样本进行稀疏表示，用GD-SA和GD-CM得到测量矩阵并用shearlet进行特征提取，构建过完备字典得到稀疏表示模型进行目标分类。文献“SAR Automatic Target Recognition Based on Euclidean DistanceRestricted Autoencoder,IEEE J.Sel.Topics Appl.Earth Observ.Remote Sens.,pp.1-11,Jul.2017.”对自编码器引入欧氏距离限制，同时采用dropout策略防止网络过拟合，支持向量机作为分类器输出。文献“Synthetic Aperture Radar Target Recognition withFeature Fusion Based on a Stacked Autoencoder,Sensors,2017,17,192,1-16.”提取23个基线特征和TPLBP特征并进行特征重构作为SAE的输入，通过贪婪分层训练方法对无监督的SAE进行训练，最后用softmax对目标进行分类。

自编码器引入相似性约束与欧式限制，固然可以使特征可分析性更好，同时计算复杂度也会随之增加，用压缩感知对图像重构，计算复杂度高，不满足识别实时性的需求，因此快速的图像重构算法的选取可以提高识别整个流程的处理速度，提高了自编码器对图像进行低维重构的效率。通过对比，多尺度shearlet与自编码器接合起来进行识别，由于shearlet处理图像的速度很慢，造成效率低下的问题，因此本发明算法在提高效率的同时，应用性更强。

附表4三类目标训练集和测试集样本数据集样本数据

类别	BMP-2	BTR-70	T-72	合计
					训练数据17°	233	233	230	696
测试数据15°	195	196	196	587

附表5不同方法的最优参数设置

附表6不同文献识别算法的识别率比较

算法	识别率	训练样本	测试样本	神经元
					相似性约束深度置信网络	92.54％	698	587	4096-500
欧氏距离约束的自编码器	94.14％	698	587	1024-400
					图像分割的自动目标识别	94.77％	3670	3501	-
堆叠自编码器的特征重构	95.43％	2747	2426	600-200
					2DPCA+最近邻分类器	96.41％	698	1169	-
shearlet+CS	96.78％	698	1365	-
					导向滤波器+NN+softmax	97.104％	696	587	1024-98
导向滤波器+NN+softmax	96.422％	696	587	784-98
					Shearlet+NN+softmax	95.741％	696	587	1024-98

附表7三类目标的识别率

Claims

1.一种基于导向滤波器与自编码器的SAR目标识别算法，其特征在于步骤如下：

步骤1：基于快速导向滤波器的两尺度图像融合

对原图像I_n做拉普拉斯滤波得到高频图像H_n：

H_n＝I_n*L (1)

式中，I_n为第n个源图像，L是一个3×3拉普拉斯滤波器；

对H_n取绝对值并作局部平均用来重建特征映射图S_n：

S_n＝|H_n|*g_r,σ (2)

使用特征映射图来确定权重图如下：

步骤2：基于稀疏降噪自编码器的低维图像特征提取

h＝f(x)＝s_f(Wx+b_h) (11)

y＝g(h)＝h_W,b(x)＝s_g(W^Th+b_y) (12)

式中，s_f是一个非线性激活函数，s_g是解码器的激活函数；

步骤3：基于softmax分类器的目标分类输出

假设softmax分类器的输出函数h_W(y)形式如下：

引入示性函数得到softmax的代价函数为

其中，λ＝10^-4；

Softmax回归中将y分类为类别j的概率为：