CN108764064A - 基于导向滤波器与自编码器的sar目标识别算法 - Google Patents
基于导向滤波器与自编码器的sar目标识别算法 Download PDFInfo
- Publication number
- CN108764064A CN108764064A CN201810427650.2A CN201810427650A CN108764064A CN 108764064 A CN108764064 A CN 108764064A CN 201810427650 A CN201810427650 A CN 201810427650A CN 108764064 A CN108764064 A CN 108764064A
- Authority
- CN
- China
- Prior art keywords
- self
- image
- encoding encoder
- output
- function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
- G06F18/2414—Smoothing the distance, e.g. radial basis function networks [RBFN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Astronomy & Astrophysics (AREA)
- Remote Sensing (AREA)
- Image Analysis (AREA)
Abstract
本发明提出一种基于导向滤波器与自编码器的目标识别算法。针对神经网络识别合成孔径雷达(synthetic aperture radar,SAR)图像目标追求高识别率,设计复杂结构造成的耗时问题,将快速图像融合技术应用于SAR识别技术的特征提取,用加权快速导向滤波器(guided filter,GF)对SAR图像做两尺度融合预处理,然后生成一维图像矢量,用自编码器对图像进行低维特征重构,用softmax分类器进行分类处理,经实验仿真验证将加权导向滤波器的图像融合技术与特征提取结合起来,不仅可以提高目标的识别精度,而且大大降低自编码器隐层神经元的数量,计算复杂度大幅度降低。
Description
技术领域
本发明涉及一种基于导向滤波器与自编码器的目标识别算法,可以应用于各种军用或民用的图像处理***。
背景技术
现代高科技战争中,战场信息的及时准确获取以及战场态势的高效评估,对争夺战场的军事主导权具有十分重要的作用。合成孔径雷达图像(Synthetic Aperture Radar,SAR)作为一种重要的遥感成像传感器,在环境监测、资源勘察和国防军事等领域有着非常广泛的应用。合成孔径雷达具有一定的地面和植被穿透能力,有助于发现机场、港口、桥梁、道路等人造建筑目标以及飞机、坦克、舰船等军事目标。SAR目标识别利用SAR图像信息实现目标种类、型号等属性的判定,在战场侦察、精确打击等军事领域有明确的应用需求,未来数字化、信息化的战场上,能够及时、精确获取敌方目标,对敌方目标进行识别以确保有针对性地对敌方目标军事打击。
近年来基于深层神经网络的目标识别技术在各个领域都取得很好的效果,促使学者们用神经网络对SAR图像目标识别进行研究。文献“SAR Automatic Target RecognitionBased on Euclidean Distance Restricted Autoencoder,IEEE J.Sel.TopicsAppl.Earth Observ.Remote Sens.,pp.1-11,Jul.2017.”将欧氏距离限制与自编码器相结合使增加样本不同类间距的同时,减小类内样本间距,使网络可分性更好,用dropout操作解决了训练样本有限产生的过拟合现象.文献“Synthetic Aperture Radar TargetRecognition with Feature Fusion Based on a Stacked Autoencoder,Sensors,2017,17,192,1-16”先提取23个冗余性较低的描述图像全局和局部信息的互补性TPLBP特征;其次设计一种有效的特征融合网络,基线和TPLBP特征作为SAE的输入;然后,采用无监督学习算法,通过贪婪分层训练方法对SAE进行预训练;最后用softmax对目标进行分类。文献“相似性约束的深度置信网络在SAR图像目标识别的应用.电子与信息学报,2016,38(1):97-103.”提出相似性约束的受限玻尔兹曼机模型,该模型在训练过程中通过约束特征向量之间的相似性达到引入监督信息的目的,可以将多个相似性约束的受限玻尔兹曼机堆叠成一种新的深度模型。文献“Deep learning-based classification of hyperspectraldata.IEEE J.Sel.Top.Appl.Earth Obs.Remote Sens.2014,7,2094–2107.”结合高光谱图像的空间特征和光谱信息,在分类任务中取得了较好的性能,但高维的原始光谱信息导致了相对复杂的网络结构。通过采用多层自编码,依据提取的轮廓和阴影的SAR影像特征和集成到协同神经网络的目标识别,一定程度上提高了分类精度,该算法需要分割目标的阴影区域和批处理,比较复杂。文献“SAR Automatic Target Recognition Based on a VisualCortical System.In Proceedings of the 2013 6th International Congress onImage and Signal Processing,Hangzhou,China,16–18December2013;pp.778–782.”在预处理和分割后,将SAR图像变为一维向量,并将其输入到SAE中,得到了更具竞争力的结果。为了适应复杂的原始数据,在SAE的第一层中需要64×64个神经元,这导致了复杂的SAE结构和低的网络训练效率。
神经网络的识别性能要求大量的标记数据作为训练样本,但在SAR目标中是很难实现的,因为复杂的SAR图像通常需要一个复杂的网络结构来适应它们。随着网络结构的复杂度增加,网络的训练时间将显著延长。针对神经网络识别合成孔径雷达(syntheticaperture radar,SAR)图像目标追求高识别率,设计复杂结构造成的耗时问题,将快速图像重构技术与SAR目标识别技术结合起来,用导向滤波器(guided filter,GF)对SAR图像做两尺度重构预处理,然后生成一维图像矢量并作归一化处理,用自编码器对图像进行低维特征抽取,用softmax分类器进行分类处理,经实验仿真验证将加权导向滤波器的图像重构技术与特征提取结合起来,不仅可以提高目标的识别精度,而且大大降低自编码器的隐层神经元的数量,计算复杂度大幅度降低。在样本量相对较少的情况下,大幅度简化网络结构,提高训练效率,可以提高SAR ATR技术的性能。
发明内容
要解决的技术问题
为了避免现有技术的不足之处,本发明提出一种基于导向滤波器与自编码器的SAR目标识别算法。
技术方案
一种基于导向滤波器与自编码器的SAR目标识别算法,其特征在于步骤如下:
步骤1:基于快速导向滤波器的两尺度图像融合
对原图像In做拉普拉斯滤波得到高频图像Hn:
Hn=In*L (1)
式中,In为第n个源图像,L是一个3×3拉普拉斯滤波器;
对Hn取绝对值并作局部平均用来重建特征映射图Sn:
Sn=|Hn|*gr,σ (2)
式中,g是一个(2r+1)×(2r+1)的高斯低通滤波器,r和σ均为5;σ为高斯低通滤波器的方差;
使用特征映射图来确定权重图如下:
式中,N为输入图像的像素数,为第n幅输入图像像素数为k时的特征映射值;
将加权导向滤波器应用于每个视觉特征加权映射图Pn中,将相对应的源图像In作为引导图像通过导向滤波器生成的加权图如下:
式中:r1,ε1,r2和ε2分别为快速加权导向滤波器的参数,和分别为近似分量和细节分量的加权图,分别对和进行归一化处理,
其中r1=45;ε1=0.3;r2=7;ε2=10-6;GF是导向滤波函数;
利用平滑滤波器对源图像进行两尺度分解得到近似分量,细节分量通过源图像减去近似分量获得,如下式:
式中:为源图像的低频分量,为源图像的高频分量;G为(2r′+1)(2r′+1)窗口的平滑滤波器,其中r′=15;
最后将源图像的近似分量和细节分量分别通过加权平均进行融合得到各自的融合分量,如下式:
将得到的融合后的近似分量和细节分量进行重构得到融合后的图像,则
步骤2:基于稀疏降噪自编码器的低维图像特征提取
设X={x1,x2,…,xn}代表训练样本数据,其中xn为融合后的图像In做裁剪后的图像扩展成的一维矢量,xn={1,2,…,N}是第n个训练样本数据,是一个列向量,N表示训练样本的总数,自编码器将图像输入X映射到隐层H,hn是第n个训练样本投影的特征,也是一个列向量;
自编码器包括编码器和解码器,训练时,一个自编码器首先将输入图像映射到隐层神经元产生隐层的特征表示编码器的权值矩阵W维度为dh×dx,其偏置向量由解码器通过将隐藏表示h映射到输出层y来完成重构,解码器的偏置为因此需要学习W,bh和by三个参数:
h=f(x)=sf(Wx+bh) (11)
y=g(h)=hW,b(x)=sg(WTh+by) (12)
式中,sf是一个非线性激活函数,sg是解码器的激活函数;
在训练自编码器学习不同参数W,bh和by的过程中,将降噪自编码器与dropout结合起来,自编码器中引入dropout操作时输入与隐层神经元及输出层神经元的映射关系如下所示:
训练的时候,每个隐含层的输出以p的概率设置为0;测试时,所有隐藏的单元的输出权重乘以p;经过交叉验证,隐含节点dropout率等于0.5的时候效果最好;
为了使隐藏层单元提取编码出鲁棒性特征,这里引入降噪自编码器,具体实现是以一定概率分布给原始图像矩阵的值随机置0,然后计算自编码器输出,将输出与原始图像做误差迭代;
编码器的输出表示隐藏层特征,解码器通过最小化下列代价函数,从编码器的表示中重建出原始输入:
L表示重建误差函数,θ∈{W,bh,by}是自编码器需要学习的参数,Dn为训练集,自编码器的目的就是找到一组最优的参数θ使输入图像与降维特征之间重建误差最小化,参数通过梯度下降算法进行更新:
步骤3:基于softmax分类器的目标分类输出
假设softmax分类器的输出函数hW(y)形式如下:
其中,{(y1,L1),…,(yN,LN)}为训练集,yn(i=1,2,…,N)为训练样本数据xn(n=1,2,…,N)经过自编码器重构后的样本矢量,Ln∈{1,2,...,k}为数据的标签值,W1,W2,…,Wk为模型参数,是归一化因子,使得输出向量的所有元素之和即总概率为1;定义示性函数1{·},若函数的输入表达式为真,则函数输出值为1,否则为0;即
引入示性函数得到softmax的代价函数为
其中,λ=10-4;
Softmax回归中将y分类为类别j的概率为:
使用梯度下降法对损失函数进行求导进行优化,得到最优的目标输出函数hW(y):
有益效果
本发明提出一种基于导向滤波器与自编码器的目标识别算法。针对神经网络识别合成孔径雷达(synthetic aperture radar,SAR)图像目标追求高识别率,设计复杂结构造成的耗时问题,将快速图像融合技术应用于SAR识别技术的特征提取,用加权快速导向滤波器(guided filter,GF)对SAR图像做两尺度融合预处理,然后生成一维图像矢量,用自编码器对图像进行低维特征重构,用softmax分类器进行分类处理,经实验仿真验证将加权导向滤波器的图像融合技术与特征提取结合起来,不仅可以提高目标的识别精度,而且大大降低自编码器隐层神经元的数量,计算复杂度大幅度降低。
附图说明
图1:本发明方法的整体框架流程图
图2:实验源图像数据MSTAR集的三类目标图:(a)给出了一些BMP-2的SAR图像;(d)是BMP-2的光学图像;(b)给出了一些BTR-70的SAR图像;(e)是BTR-70的光学图像;(c)给出了一些T-72的SAR图像;(f)是T-72的光学图像。
图3:自编码器结构图
具体实施方式
现结合实施例、附图对本发明作进一步描述:
用于实施的硬件环境是:实验环境为Intel(R)Core(TM)i5-3230M [email protected],内存为4GB,采用MATLAB R2016a编程。本发明实验数据采用美国国防高等研究计划署(DARPA)支持的MSTAR计划所公布的实测SAR地面静止目标数据。采集数据集的传感器为高分辨聚束式合成孔径雷达,分辨率为0.3m×0.3m。工作在X波段,所用的极化方式为HH极化方式。对采集到的数据进行处理,从中提取出128×128包含各类目标的数据集图像。
该数据大多是静止车辆的SAR切片图像,包含多种车辆目标在各个方位角下获取到的目标图像。在该数据集中包含一个该计划推荐的三类目标训练集和测试集,训练集是雷达工作俯仰角为17°时所得到的目标图像数据,测试集是雷达工作俯仰角为15时所得到的目标图像数据。目标包括3大类:BTR70(装甲运输车),BMP2(步兵战车),T72(坦克);三种类别的目标具有七种不同的型号,BMP2包括型号SN-9563、SN-9566和SN-C21,T72包括型号SN-132、SN-812和SN-S7,BTR70包括型号SN-C71,同类但不同型号的目标在配备上有些差异,但总体散射特性相差不大。
本发明方法的基本流程如附图1所示,实验源图像数据如附图2所示,三类样本数据如附表4所示,具体实施如下:
步骤一:基于导向滤波器的两尺度图像重构
对目标识别来说,对原图像进行重构预处理目的在于突出不同类目标图像之间的差异性,而基于导向滤波器的两尺度图像重构的关键之处——特征映射图的构造,其具体步骤如下:
通过对原图像In做拉普拉斯滤波得到高频图像Hn:
Hn=In*L (1)
式中,In为第n个源图像,L是一个3×3拉普拉斯滤波器,Hn取绝对值并作局部平均用来重建特征映射图Sn:
Sn=|Hn|*gr,σ (2)
其中g是一个(2r+1)×(2r+1)的高斯低通滤波器,σ为高斯低通滤波器的标准差,r和σ均为5;特征映射图对图像高频细节分量的显著性水平提供了良好的表征。特征映射图来确定权重图如下:
N为输入图像的像素数,为第n幅输入图像像素数为k时的特征映射值。
将加权导向滤波器应用于每个视觉特征加权映射图Pn中,将相对应的源图像In作为引导图像通过导向滤波器生成的加权图如下:
r1,ε1,r2和ε2分别为加权导向滤波器的参数,和分别为低频近似分量和高频细节分量的加权图,分别对和进行归一化处理,其中r1=45;ε1=0.3;r2=7;ε2=10-6。
利用平滑滤波器对源图像进行两尺度分解得到低频近似分量,高频细节分量通过源图像减去低频近似分量获得,如下式:
式中:为源图像的低频分量,为源图像的高频分量。G为(2r+1)×(2r+1)窗口的平滑滤波器,其中r=15。
最后将源图像的低频近似分量和高频细节分量分别通过加权平均进行重构得到各自的重构分量,如下式:
将得到的重构后的低频近似分量和高频细节分量进行重构得到重构后的图像,则
步骤二:基于稀疏降噪自编码器的低维图像特征抽取
自动编码器(autoencoder,AE)就是一种用低维特征矢量重构输入图像的神经网络。为了实现这种重构,自动编码器就须提取出可以重构输入数据的特征矢量,代表原图像的主要成分。作为一种无监督的学习网络,自编码器通过简单的非线性模型和优化重构算法特点,用低维的特征失量对原始图像进行重构,极大程度上降低了特征之间的冗余信息。
通过减少冗余的特征提取来简化AE的输入层,重构图像的不同特征来获得判读性较高的特征和提高识别效率,较低维度的AE可以实现与复杂结构神经网络相同的性能,网络结构相对简单,满足快速高精度SAR图像判读识别的需要,而且当标记样本数量比较小时,无监督学习的堆叠自编码器不仅可以防止网络过拟合,而且有效地提高网络的非线性映射能力。
设X={x1,x2,…,xN}代表训练样本数据,xn(n=1,2,…,N)是第n个训练样本数据,是由原图像In作两尺度重构后的图像做裁剪后扩展成一维矢量形成的,是一个列向量,N表示训练样本的总数,自编码器将图像输入X映射到隐层H,hn是第n个训练样本投影的特征,也是一个列向量。
一般情况下自编码器由编码器和解码器两部分组成。训练时,一个自编码器首先将输入图像映射到隐层神经元产生隐层的特征表示其中sf是一个非线性激活函数,一般情况下默认为是sigmoid函数,编码器的权值矩阵W维度为dh×dx,其偏置向量由解码器通过将隐藏表示h映射到输出层y来完成重构。sg是解码器的激活函数,解码器的偏置为因此有三个参数需要学习:W,bh和by。
h=f(x)=sf(Wx+bh) (11)
y=g(h)=hW,b(x)=sg(WTh+by) (12)
在训练自编码器学习不同参数W,bh和by的过程中,深度神经网络具有很强的非线性映射能力,随着层数和每一层神经元数目的增加,它对原始数据重构的表征能力更加突出,也造成很严重的过拟合问题,降低了网络训练和测试数据的速度。dropout是一种防止过拟合的有效方法,将降噪自编码器与dropout起来,提高了网络的性能,降低了时间复杂度。dropout是指在深度学习网络的训练过程中,对于隐层的神经元,按照一定的概率将其暂时从网络中丢弃。自编码器中引入dropout操作时输入与隐层神经元及输出层神经元的映射关系如下所示:
训练的时候,每个隐含层的输出以p的概率设置为0。测试时,所有隐藏的单元的输出权重乘以p。减弱了神经元节点间的联合适应性,增强了泛化能力。经过交叉验证,隐含节点dropout率等于0.5的时候效果最好,原因是0.5的时候dropout随机生成的网络结构最多。
为了使隐藏层单元提取编码出鲁棒性特征,这里引入降噪自编码器,具体实现是以一定概率分布(通常是指二项分布)给原始图像矩阵的值随机置0,然后计算自编码器输出,将输出与原始图像做误差迭代。通过置0处理,与原数据相比,噪声对结果的影响降低,而且减少了训练数据与测试数据之间的差异,一定程度上提高了网络的泛化能力。
编码器的输出表示隐藏层特征,解码器通过最小化下列代价函数,从编码器的表示中重建出原始输入:
L表示重建误差函数,θ∈{W,bh,by}是自编码器需要学习的参数,Dn为训练集,自编码器的目的就是找到一组最优的参数θ使输入图像与降维特征之间重建误差最小化,参数通过梯度下降算法进行更新:
步骤三:基于softmax分类器的目标分类输出
softmax分类器以多项式分布为模型的多分类回归模型,是二分类logistic回归分类器推广到多分类问题的一般形式,对于训练集{(y1,L1),…,(yN,LN)},yn(i=1,2,…,N)为训练样本数据xn(n=1,2,…,N)经过自编码器重构后的样本矢量,有数据的标签值Ln∈{1,2,...,k}。在这里,k为样本的种类,取值为3,10。从概率学的角度解释,模型的输出是一个维的向量,向量的每个元素表示输入数据被分到相应的类别的概率。假设输出函数hW(y)形式如下:
其中,W1,W2,…,Wk为模型参数,是归一化因子,使得输出向量的所有元素之和即总概率为1。定义示性函数1{·},若函数的输入表达式为真,则函数输出值为1,否则为0;即
引入示性函数得到softmax的代价函数为
在softmax回归函数中直接用上述对数似然函数的第一项是不能用梯度下降法来更新参数的,因为它存在冗余的参数,是一个非凸函数,通过添加一个权重衰减项来使代价函数满足凸函数的性质,得到最优化的解。这里λ=10-4。
Softmax回归中将y分类为类别j的概率为:
用梯度下降法对损失函数进行求导进行优化,得到最优的目标输出函数hW(y)。
附表4是三类目标训练集和测试集样本数据集样本数据,附表7显示了用本发明方法得到的三类目标识别结果。下面结合附表5和附表6对本发明的效果做进一步描述。
1.实验条件
实验环境为Intel(R)Core(TM)i5-3230M [email protected],内存为4GB,采用MATLABR2016a编程。本发明实验数据采用美国国防高等研究计划署(DARPA)支持的MSTAR计划所公布的实测SAR地面静止目标数据。采集数据集的传感器为高分辨聚束式合成孔径雷达,分辨率为0.3m×0.3m。工作在X波段,所用的极化方式为HH极化方式。对采集到的数据进行处理,从中提取出128×128包含各类目标的数据集图像。
该数据大多是静止车辆的SAR切片图像,包含多种车辆目标在各个方位角下获取到的目标图像。在该数据集中包含一个该计划推荐的三类目标训练集和测试集,训练集是雷达工作俯仰角为17°时所得到的目标图像数据,测试集是雷达工作俯仰角为15时所得到的目标图像数据。目标包括3大类:BTR70(装甲运输车),BMP2(步兵战车),T72(坦克);三种类别的目标具有七种不同的型号,BMP2包括型号SN-9563、SN-9566和SN-C21,T72包括型号SN-132、SN-812和SN-S7,BTR70包括型号SN-C71,同类但不同型号的目标在配备上有些差异,但总体散射特性相差不大。。
2.实验内容
导向滤波器重构的图像尺寸为128×128,预处理完成后,将训练集图像处理为1×1024或者1×784的列向量,用于自编码器的输入,生成的低维特征矢量的维度即自编码器的隐层神经元数量。
附表6显示了几种不同算法的分类识别率,文献“相似性约束的深度置信网络在SAR图像目标识别的应用.电子与信息学报,2016,38(1):97-103.”对深度置信网络引入相似性约束,对三类目标的七种型号进行分类识别,特征可分性更好。文献“基于两级2DPCA的SAR目标特征提取与识别.电子与信息学报,2008,30(7):1722-1726.”首先对图像进行适当的预处理,然后使用2DPCA特征提取,近邻分类器完成分类。文献“Image Matting forAutomatic Target Recognition.IEEE TRANSACTIONS ON AEROSPACE AND ELECTRONICSYSTEMS,pp2233-2250,VOL.53,NO.5OCTOBER 2017.”适应地分配前景和背景的约束,估计图像目标的中心,消除非目标区域,分割出目标进行识别。文献“基于压缩感知的SAR图像目标识别方法研究.南京:南京航空航天大学,2013.”将训练样本进行稀疏表示,用GD-SA和GD-CM得到测量矩阵并用shearlet进行特征提取,构建过完备字典得到稀疏表示模型进行目标分类。文献“SAR Automatic Target Recognition Based on Euclidean DistanceRestricted Autoencoder,IEEE J.Sel.Topics Appl.Earth Observ.Remote Sens.,pp.1-11,Jul.2017.”对自编码器引入欧氏距离限制,同时采用dropout策略防止网络过拟合,支持向量机作为分类器输出。文献“Synthetic Aperture Radar Target Recognition withFeature Fusion Based on a Stacked Autoencoder,Sensors,2017,17,192,1-16.”提取23个基线特征和TPLBP特征并进行特征重构作为SAE的输入,通过贪婪分层训练方法对无监督的SAE进行训练,最后用softmax对目标进行分类。
自编码器引入相似性约束与欧式限制,固然可以使特征可分析性更好,同时计算复杂度也会随之增加,用压缩感知对图像重构,计算复杂度高,不满足识别实时性的需求,因此快速的图像重构算法的选取可以提高识别整个流程的处理速度,提高了自编码器对图像进行低维重构的效率。通过对比,多尺度shearlet与自编码器接合起来进行识别,由于shearlet处理图像的速度很慢,造成效率低下的问题,因此本发明算法在提高效率的同时,应用性更强。
附表4三类目标训练集和测试集样本数据集样本数据
类别 | BMP-2 | BTR-70 | T-72 | 合计 |
训练数据17° | 233 | 233 | 230 | 696 |
测试数据15° | 195 | 196 | 196 | 587 |
附表5不同方法的最优参数设置
附表6不同文献识别算法的识别率比较
算法 | 识别率 | 训练样本 | 测试样本 | 神经元 |
相似性约束深度置信网络 | 92.54% | 698 | 587 | 4096-500 |
欧氏距离约束的自编码器 | 94.14% | 698 | 587 | 1024-400 |
图像分割的自动目标识别 | 94.77% | 3670 | 3501 | - |
堆叠自编码器的特征重构 | 95.43% | 2747 | 2426 | 600-200 |
2DPCA+最近邻分类器 | 96.41% | 698 | 1169 | - |
shearlet+CS | 96.78% | 698 | 1365 | - |
导向滤波器+NN+softmax | 97.104% | 696 | 587 | 1024-98 |
导向滤波器+NN+softmax | 96.422% | 696 | 587 | 784-98 |
Shearlet+NN+softmax | 95.741% | 696 | 587 | 1024-98 |
附表7三类目标的识别率
Claims (1)
1.一种基于导向滤波器与自编码器的SAR目标识别算法,其特征在于步骤如下:
步骤1:基于快速导向滤波器的两尺度图像融合
对原图像In做拉普拉斯滤波得到高频图像Hn:
Hn=In*L (1)
式中,In为第n个源图像,L是一个3×3拉普拉斯滤波器;
对Hn取绝对值并作局部平均用来重建特征映射图Sn:
Sn=|Hn|*gr,σ (2)
式中,g是一个(2r+1)×(2r+1)的高斯低通滤波器,r和σ均为5;σ为高斯低通滤波器的方差;
使用特征映射图来确定权重图如下:
式中,N为输入图像的像素数,为第n幅输入图像像素数为k时的特征映射值;
将加权导向滤波器应用于每个视觉特征加权映射图Pn中,将相对应的源图像In作为引导图像通过导向滤波器生成的加权图如下:
式中:r1,ε1,r2和ε2分别为快速加权导向滤波器的参数,和分别为近似分量和细节分量的加权图,分别对和进行归一化处理,
其中r1=45;ε1=0.3;r2=7;ε2=10-6;GF是导向滤波函数;
利用平滑滤波器对源图像进行两尺度分解得到近似分量,细节分量通过源图像减去近似分量获得,如下式:
式中:为源图像的低频分量,为源图像的高频分量;G为(2r′+1)(2r′+1)窗口的平滑滤波器,其中r′=15;
最后将源图像的近似分量和细节分量分别通过加权平均进行融合得到各自的融合分量,如下式:
将得到的融合后的近似分量和细节分量进行重构得到融合后的图像,则
步骤2:基于稀疏降噪自编码器的低维图像特征提取
设X={x1,x2,…,xn}代表训练样本数据,其中xn为融合后的图像In做裁剪后的图像扩展成的一维矢量,xn={1,2,…,N}是第n个训练样本数据,是一个列向量,N表示训练样本的总数,自编码器将图像输入X映射到隐层H,hn是第n个训练样本投影的特征,也是一个列向量;
自编码器包括编码器和解码器,训练时,一个自编码器首先将输入图像映射到隐层神经元产生隐层的特征表示编码器的权值矩阵W维度为dh×dx,其偏置向量由解码器通过将隐藏表示h映射到输出层y来完成重构,解码器的偏置为因此需要学习W,bh和by三个参数:
h=f(x)=sf(Wx+bh) (11)
y=g(h)=hW,b(x)=sg(WTh+by) (12)
式中,sf是一个非线性激活函数,sg是解码器的激活函数;
在训练自编码器学习不同参数W,bh和by的过程中,将降噪自编码器与dropout结合起来,自编码器中引入dropout操作时输入与隐层神经元及输出层神经元的映射关系如下所示:
训练的时候,每个隐含层的输出以p的概率设置为0;测试时,所有隐藏的单元的输出权重乘以p;经过交叉验证,隐含节点dropout率等于0.5的时候效果最好;
为了使隐藏层单元提取编码出鲁棒性特征,这里引入降噪自编码器,具体实现是以一定概率分布给原始图像矩阵的值随机置0,然后计算自编码器输出,将输出与原始图像做误差迭代;
编码器的输出表示隐藏层特征,解码器通过最小化下列代价函数,从编码器的表示中重建出原始输入:
L表示重建误差函数,θ∈{W,bh,by}是自编码器需要学习的参数,Dn为训练集,自编码器的目的就是找到一组最优的参数θ使输入图像与降维特征之间重建误差最小化,参数通过梯度下降算法进行更新:
步骤3:基于softmax分类器的目标分类输出
假设softmax分类器的输出函数hW(y)形式如下:
其中,{(y1,L1),…,(yN,LN)}为训练集,yn(i=1,2,…,N)为训练样本数据xn(n=1,2,…,N)经过自编码器重构后的样本矢量,Ln∈{1,2,...,k}为数据的标签值,W1,W2,…,Wk为模型参数,是归一化因子,使得输出向量的所有元素之和即总概率为1;定义示性函数1{·},若函数的输入表达式为真,则函数输出值为1,否则为0;即
引入示性函数得到softmax的代价函数为
其中,λ=10-4;
Softmax回归中将y分类为类别j的概率为:
使用梯度下降法对损失函数进行求导进行优化,得到最优的目标输出函数hW(y):
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810427650.2A CN108764064A (zh) | 2018-05-07 | 2018-05-07 | 基于导向滤波器与自编码器的sar目标识别算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810427650.2A CN108764064A (zh) | 2018-05-07 | 2018-05-07 | 基于导向滤波器与自编码器的sar目标识别算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108764064A true CN108764064A (zh) | 2018-11-06 |
Family
ID=64009902
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810427650.2A Pending CN108764064A (zh) | 2018-05-07 | 2018-05-07 | 基于导向滤波器与自编码器的sar目标识别算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108764064A (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109490840A (zh) * | 2018-11-22 | 2019-03-19 | 中国人民解放军海军航空大学 | 基于改进稀疏自编码模型的雷达目标hrrp的降噪和重构方法 |
CN109507655A (zh) * | 2018-12-11 | 2019-03-22 | 西北工业大学 | 基于导向重构与范数约束dbn的sar目标识别算法 |
CN109785366A (zh) * | 2019-01-21 | 2019-05-21 | 中国科学技术大学 | 一种针对遮挡的相关滤波目标跟踪方法 |
CN109872291A (zh) * | 2019-02-21 | 2019-06-11 | 中国科学技术大学 | 一种对抗ann中汇聚噪声的正则化方法及*** |
CN109903262A (zh) * | 2019-02-26 | 2019-06-18 | 东北师范大学人文学院 | 一种图像融合的方法、***及相关装置 |
CN110260925A (zh) * | 2019-07-12 | 2019-09-20 | 创新奇智(重庆)科技有限公司 | 司机停车技术优劣的检测方法及其***、智能推荐方法、电子设备 |
CN110378294A (zh) * | 2019-07-22 | 2019-10-25 | 大连海事大学 | 一种基于局部能量约束与特征融合的高光谱目标检测方法及*** |
CN110866882A (zh) * | 2019-11-21 | 2020-03-06 | 湖南工程学院 | 基于深度置信度的分层联合双边滤波深度图修复算法 |
CN111242056A (zh) * | 2020-01-16 | 2020-06-05 | 陕西师范大学 | 一种最大-最小距离嵌入的无监督高光谱图像分类方法 |
CN111626122A (zh) * | 2020-04-24 | 2020-09-04 | 贝壳技术有限公司 | 合成孔径雷达图像识别方法、装置、电子设备和存储介质 |
CN112184646A (zh) * | 2020-09-22 | 2021-01-05 | 西北工业大学 | 基于梯度域导向滤波和改进pcnn的图像融合方法 |
CN112202696A (zh) * | 2020-10-12 | 2021-01-08 | 青岛科技大学 | 基于模糊自编码器的水声信号自动调制识别方法 |
CN113033615A (zh) * | 2021-03-01 | 2021-06-25 | 电子科技大学 | 一种基于在线微簇聚类的雷达信号目标实时关联方法 |
CN113538693A (zh) * | 2021-07-06 | 2021-10-22 | 太原理工大学 | 一种基于深度学习的微波乳腺图像重建方法 |
CN113627544A (zh) * | 2021-08-16 | 2021-11-09 | 沈阳工业大学 | 一种基于多源异构数据融合的机床铣刀状态识别方法 |
CN113780450A (zh) * | 2021-09-16 | 2021-12-10 | 郑州云智信安安全技术有限公司 | 基于自编码神经网络的分布式存储方法及*** |
CN117934979A (zh) * | 2024-03-22 | 2024-04-26 | 南京大学 | 一种基于分形编解码器的目标识别方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104680180A (zh) * | 2015-03-09 | 2015-06-03 | 西安电子科技大学 | 基于k均值和稀疏自编码的极化sar图像分类方法 |
CN105787517A (zh) * | 2016-03-11 | 2016-07-20 | 西安电子科技大学 | 基于小波稀疏自编码器的极化sar图像分类方法 |
CN106503734A (zh) * | 2016-10-14 | 2017-03-15 | 哈尔滨工程大学 | 基于三边滤波器和堆栈稀疏自动编码器的图像分类方法 |
CN107085704A (zh) * | 2017-03-27 | 2017-08-22 | 杭州电子科技大学 | 基于elm自编码算法的快速人脸表情识别方法 |
CN107563420A (zh) * | 2017-08-23 | 2018-01-09 | 西安电子科技大学 | 基于散射能量和堆栈自编码的极化sar图像分类方法 |
CN107679543A (zh) * | 2017-02-22 | 2018-02-09 | 天津大学 | 稀疏自动编码器与极限学习机立体图像质量评价方法 |
-
2018
- 2018-05-07 CN CN201810427650.2A patent/CN108764064A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104680180A (zh) * | 2015-03-09 | 2015-06-03 | 西安电子科技大学 | 基于k均值和稀疏自编码的极化sar图像分类方法 |
CN105787517A (zh) * | 2016-03-11 | 2016-07-20 | 西安电子科技大学 | 基于小波稀疏自编码器的极化sar图像分类方法 |
CN106503734A (zh) * | 2016-10-14 | 2017-03-15 | 哈尔滨工程大学 | 基于三边滤波器和堆栈稀疏自动编码器的图像分类方法 |
CN107679543A (zh) * | 2017-02-22 | 2018-02-09 | 天津大学 | 稀疏自动编码器与极限学习机立体图像质量评价方法 |
CN107085704A (zh) * | 2017-03-27 | 2017-08-22 | 杭州电子科技大学 | 基于elm自编码算法的快速人脸表情识别方法 |
CN107563420A (zh) * | 2017-08-23 | 2018-01-09 | 西安电子科技大学 | 基于散射能量和堆栈自编码的极化sar图像分类方法 |
Non-Patent Citations (3)
Title |
---|
SHENG DENG ET AL.: "SAR Automatic Target Recognition Based on Euclidean Distance Restricted Autoencoder", 《IEEE JOURNAL OF SELECTED TOPICS IN APPLIED EARTH OBSERVATIONS AND REMOTE SENSING》 * |
SHUTAO LI ET AL.: "mage Fusion with Guided Filtering", 《IEEE TRANSACTIONS ON IMAGE PROCESSING》 * |
杨森: "基于Softmax回归的小微企业信用评分模型应用研究", 《中国优秀硕士学位论文全文数据库 经济与管理科学辑》 * |
Cited By (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109490840B (zh) * | 2018-11-22 | 2022-05-31 | 中国人民解放军海军航空大学 | 基于改进稀疏自编码模型的雷达目标hrrp的降噪和重构方法 |
CN109490840A (zh) * | 2018-11-22 | 2019-03-19 | 中国人民解放军海军航空大学 | 基于改进稀疏自编码模型的雷达目标hrrp的降噪和重构方法 |
CN109507655A (zh) * | 2018-12-11 | 2019-03-22 | 西北工业大学 | 基于导向重构与范数约束dbn的sar目标识别算法 |
CN109507655B (zh) * | 2018-12-11 | 2022-09-02 | 西北工业大学 | 基于导向重构与范数约束dbn的sar目标识别算法 |
CN109785366B (zh) * | 2019-01-21 | 2020-12-25 | 中国科学技术大学 | 一种针对遮挡的相关滤波目标跟踪方法 |
CN109785366A (zh) * | 2019-01-21 | 2019-05-21 | 中国科学技术大学 | 一种针对遮挡的相关滤波目标跟踪方法 |
CN109872291A (zh) * | 2019-02-21 | 2019-06-11 | 中国科学技术大学 | 一种对抗ann中汇聚噪声的正则化方法及*** |
CN109903262A (zh) * | 2019-02-26 | 2019-06-18 | 东北师范大学人文学院 | 一种图像融合的方法、***及相关装置 |
CN109903262B (zh) * | 2019-02-26 | 2021-02-12 | 东北师范大学人文学院 | 一种图像融合的方法、***及相关装置 |
CN110260925A (zh) * | 2019-07-12 | 2019-09-20 | 创新奇智(重庆)科技有限公司 | 司机停车技术优劣的检测方法及其***、智能推荐方法、电子设备 |
CN110260925B (zh) * | 2019-07-12 | 2021-06-25 | 重庆赛迪奇智人工智能科技有限公司 | 司机停车技术优劣的检测方法及其***、智能推荐方法、电子设备 |
CN110378294A (zh) * | 2019-07-22 | 2019-10-25 | 大连海事大学 | 一种基于局部能量约束与特征融合的高光谱目标检测方法及*** |
CN110378294B (zh) * | 2019-07-22 | 2022-08-19 | 大连海事大学 | 一种基于局部能量约束与特征融合的高光谱目标检测方法及*** |
CN110866882A (zh) * | 2019-11-21 | 2020-03-06 | 湖南工程学院 | 基于深度置信度的分层联合双边滤波深度图修复算法 |
CN111242056A (zh) * | 2020-01-16 | 2020-06-05 | 陕西师范大学 | 一种最大-最小距离嵌入的无监督高光谱图像分类方法 |
CN111242056B (zh) * | 2020-01-16 | 2023-03-10 | 陕西师范大学 | 一种最大-最小距离嵌入的无监督高光谱图像分类方法 |
CN111626122A (zh) * | 2020-04-24 | 2020-09-04 | 贝壳技术有限公司 | 合成孔径雷达图像识别方法、装置、电子设备和存储介质 |
CN111626122B (zh) * | 2020-04-24 | 2024-01-05 | 贝壳技术有限公司 | 合成孔径雷达图像识别方法、装置、电子设备和存储介质 |
CN112184646A (zh) * | 2020-09-22 | 2021-01-05 | 西北工业大学 | 基于梯度域导向滤波和改进pcnn的图像融合方法 |
CN112184646B (zh) * | 2020-09-22 | 2022-07-29 | 西北工业大学 | 基于梯度域导向滤波和改进pcnn的图像融合方法 |
CN112202696A (zh) * | 2020-10-12 | 2021-01-08 | 青岛科技大学 | 基于模糊自编码器的水声信号自动调制识别方法 |
CN112202696B (zh) * | 2020-10-12 | 2022-03-29 | 青岛科技大学 | 基于模糊自编码器的水声信号自动调制识别方法 |
CN113033615A (zh) * | 2021-03-01 | 2021-06-25 | 电子科技大学 | 一种基于在线微簇聚类的雷达信号目标实时关联方法 |
CN113033615B (zh) * | 2021-03-01 | 2022-06-07 | 电子科技大学 | 一种基于在线微簇聚类的雷达信号目标实时关联方法 |
CN113538693A (zh) * | 2021-07-06 | 2021-10-22 | 太原理工大学 | 一种基于深度学习的微波乳腺图像重建方法 |
CN113627544A (zh) * | 2021-08-16 | 2021-11-09 | 沈阳工业大学 | 一种基于多源异构数据融合的机床铣刀状态识别方法 |
CN113627544B (zh) * | 2021-08-16 | 2024-03-08 | 沈阳工业大学 | 一种基于多源异构数据融合的机床铣刀状态识别方法 |
CN113780450A (zh) * | 2021-09-16 | 2021-12-10 | 郑州云智信安安全技术有限公司 | 基于自编码神经网络的分布式存储方法及*** |
CN117934979A (zh) * | 2024-03-22 | 2024-04-26 | 南京大学 | 一种基于分形编解码器的目标识别方法 |
CN117934979B (zh) * | 2024-03-22 | 2024-07-02 | 南京大学 | 一种基于分形编解码器的目标识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108764064A (zh) | 基于导向滤波器与自编码器的sar目标识别算法 | |
Ji et al. | Landslide detection from an open satellite imagery and digital elevation model dataset using attention boosted convolutional neural networks | |
Chen et al. | Target classification using the deep convolutional networks for SAR images | |
Chen et al. | SAR target recognition based on deep learning | |
Hosseiny et al. | WetNet: A spatial–temporal ensemble deep learning model for wetland classification using Sentinel-1 and Sentinel-2 | |
CN108734171A (zh) | 一种深度协同稀疏编码网络的合成孔径雷达遥感图像海洋浮筏识别方法 | |
Pacifici et al. | Automatic change detection in very high resolution images with pulse-coupled neural networks | |
Hwang et al. | Automatic ship detection using the artificial neural network and support vector machine from X-band SAR satellite images | |
CN112308152B (zh) | 基于光谱分割与同质区域检测的高光谱图像地物分类方法 | |
CN108932479A (zh) | 一种人体异常行为检测方法 | |
Karuppusamy | Building detection using two-layered novel convolutional neural networks | |
Liu et al. | Multimorphological superpixel model for hyperspectral image classification | |
CN109507655B (zh) | 基于导向重构与范数约束dbn的sar目标识别算法 | |
Unnikrishnan et al. | Deep AlexNet with reduced number of trainable parameters for satellite image classification | |
CN109558803B (zh) | 基于卷积神经网络与np准则的sar目标鉴别方法 | |
Tang et al. | Adversarial patch attacks against aerial imagery object detectors | |
Ortiz et al. | On the defense against adversarial examples beyond the visible spectrum | |
El-Arafy et al. | Using edge detection techniques and machine learning classifications for accurate lithological discrimination and structure lineaments extraction: a comparative case study from Gattar area, Northern Eastern Desert of Egypt | |
Ganakwar et al. | Convolutional neural network-VGG16 for road extraction from remotely sensed images | |
Wu et al. | Research on asphalt pavement disease detection based on improved YOLOv5s | |
Papadomanolaki et al. | Patch-based deep learning architectures for sparse annotated very high resolution datasets | |
CN115909086A (zh) | 基于多级增强网络的sar目标检测识别方法 | |
Rizvi et al. | Improving the accuracy of object based supervised image classification using cloud basis function neural network for high resolution satellite images | |
CN104573746B (zh) | 基于磁共振成像的实蝇种类识别方法 | |
Alamgeer et al. | Optimal fuzzy wavelet neural network based road damage detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20181106 |