CN114863283A - 迁移学习与注意力机制结合的sar图像目标识别方法 - Google Patents

迁移学习与注意力机制结合的sar图像目标识别方法 Download PDF

Info

Publication number
CN114863283A
CN114863283A CN202210579119.3A CN202210579119A CN114863283A CN 114863283 A CN114863283 A CN 114863283A CN 202210579119 A CN202210579119 A CN 202210579119A CN 114863283 A CN114863283 A CN 114863283A
Authority
CN
China
Prior art keywords
attention mechanism
weight
sar image
channel
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210579119.3A
Other languages
English (en)
Inventor
肖永生
毛聪
黄丽贞
贺丰收
胡义海
饶烜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanchang Hangkong University
Original Assignee
Nanchang Hangkong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanchang Hangkong University filed Critical Nanchang Hangkong University
Priority to CN202210579119.3A priority Critical patent/CN114863283A/zh
Publication of CN114863283A publication Critical patent/CN114863283A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种迁移学习与注意力机制结合的SAR图像目标识别方法,包括以下步骤S1、输入的SAR图像经过7*7的卷积核提取出卷积特征图;S2、得到的卷积特征图输入注意力机制进行聚焦,得到初步聚焦特征图;S3、初步聚焦特征图输入到微调后的残差网络得到权重特征图,所述残差网络是结合深度迁移学习的方法形成的,将残差网络在已知数据集上训练出来的权重模型迁移至SAR图像的识别工作中;S4、得到含有权重的权重特征图再次输入到注意力机制进行聚焦;S5、把含有权重的聚焦的目标识别特征图输入后续卷积层进行分类得到目标识别结果,本发明能提高特征筛选的能力,进而提高SAR图像的目标识别能力,从而有效的提高识别性能。

Description

迁移学习与注意力机制结合的SAR图像目标识别方法
技术领域
本发明涉及,尤其涉及一种迁移学习与注意力机制结合的SAR图像目标识别方法。
背景技术
SAR作为一种高分辨率成像雷达,不受天气、光照等条件影响,具有一定的地表穿透能力,能够实现对隐蔽目标的穿透探测,而且能够实现全天时、全天候持续对地观测。这些优良性能使得SAR在民用和军用领域的应用也越来越广泛。
近些年来,SAR的技术发展越来越快,成像质量越来越好,图像分辨率越来越高,但基于SAR图像的自动目标识别(Automatic Target Recognition,ATR)则发展相对缓慢。SARATR的难点主要体现在两个方面:(1)噪声干扰的影响,尤其是在噪声比较严重的情况下模型性能下降,甚至于无法正确的识别目标问题;(2)信息量大,信息杂乱且不够聚焦,无法快速准确的识别到有关系的信息。
发明内容
本发明的目的在于解决现有技术中存在的技术问题,提供一种迁移学习与注意力机制结合的SAR图像目标识别方法。
为实现上述目的,本发明提供的技术方案是:一种迁移学习与注意力机制结合的SAR图像目标识别方法,所述方法包括以下步骤:
S1、输入的SAR图像经过7*7的卷积核提取出卷积特征图;
S2、得到的卷积特征图输入注意力机制进行聚焦,得到初步聚焦特征图,其中注意力机制是从大量数字图像信息中过滤出感兴趣点,有选择地筛选出重要信息并聚焦;
S3、初步聚焦特征图输入到微调后的残差网络得到权重特征图,所述残差网络是利用深度卷积网络先完成端到端的目标识别任务,然后结合深度迁移学习的方法形成的,将残差网络在已知数据集上训练出来的权重模型迁移至SAR图像的识别工作中,加速SAR图像识别模型训练时间;
S4、得到含有权重的权重特征图再次输入到注意力机制进行聚焦;
S5、把含有权重的聚焦的目标识别特征图输入后续卷积层进行分类得到目标识别结果。
优选的,所述S3中深度迁移学习的方法为深度网络的微调,将残差网络在ImageNet数据集上训练的权重模型迁移至SAR图像识别工作中。
优选的,所述S2中的注意力机制为CBAM混合注意力模块,所述混合注意力模块的操作方法为通道注意力机制和空间注意力机制结合使用。
优选的,所述通道注意力机制为:通道子模块利用共享网络的最大汇集输出和平均汇集输出,所述通道注意力机制计算公式为:
Figure BDA0003661626670000021
其中,Ac(F)表示通道注意力机制函数,F表示通道注意力机制的输入,以矩阵形式进行计算,σ表示sigmoid函数,W0表示多层感知机内隐藏层权重计算,W1表示多层感知机内输出层权重计算,
Figure BDA0003661626670000022
表示通道注意力机制内对输入F做平均池化;
Figure BDA0003661626670000023
表示通道注意力机制内对输入F做最大池化。
优选的,所述W0和W1为两个输入共享,ReLU激活功能后接W0;W0∈RC/r×C,W1∈RC×C/r,W0∈RC/r×C表示W0是输入层C个神经元到隐藏层C/r个神经元之间的权重值,C表示SAR图像数据的通道数,r表示多层感知机的一个超参数,R表示图片数据;W1∈RC×C/r表示W1是隐藏层C/r个神经元到输出层C个神经元之间的权重值。
优选的,所述空间注意力机制为:空间子模块利用沿通道轴汇集的两个类似的输出,并将它们转发到卷积层,所述空间注意力机制的公式为:
Figure BDA0003661626670000031
其中,As(F)表示空间注意力机制函数,F表示空间注意力机制的输入;σ表示sigmoid函数,f7×7表示卷积核大小为7*7的卷积运算操作,
Figure BDA0003661626670000032
表示在空间注意力机制中对图像数据做沿通道维度做平均池化;
Figure BDA0003661626670000033
表示在空间注意力机制中对图像数据做沿通道维度做最大池化。
优选的,
Figure BDA0003661626670000034
表示把平均池化数据和最大池化树沿通道维度拼接在一起,得到的特征图维度
Figure BDA0003661626670000035
表示在输入特征图数据在空间注意力机制的平均池化处理后特征图数据维度变为1×H×W;
Figure BDA0003661626670000036
表示在输入特征图数据在空间注意力机制的最大池化处理后特征图数据维度变为1×H×W。
优选的,用所述目标识别向量M所述S5中得到的目标识别结果;所述目标识别向量M是通过注意力学习得到的权值A与输入H相乘得到:
M=AH (3)
上式中,H为注意力层输入,而A作为注意力的编码输出;
A计算如下所示:
Figure BDA0003661626670000041
其中,
Figure BDA0003661626670000042
为矩阵乘法元素;Ac为一维通道注意图,As为二维空间注意图。
本发明有益效果:
本发明相对于传统的SAR图像目标识别方法而言,基于深度迁移学习的SAR ATR方法具有更强的表现能力,通过利用微调后的残差网络,能够快速的提取图像特征,实现端到端的学习,再结合注意力机制,聚焦包含目标特征的信息,提高特征筛选的能力,进而提高SAR图像的目标识别能力,从而有效的提高识别性能。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明深度迁移模型示意图;
图2为本发明CBAM结构图;
图3为本发明通道注意力模型结构示意图;
图4为本发明空间注意力模型结构示意图;
图5为本发明注意力机制与迁移模型结合的SAR图像识别算法结构示意图;
图6为不同程度噪声影响下的SAR图像识别率对比折线图。
具体实施方式
本部分将详细描述本发明的具体实施例,附图的作用在于用图形补充说明书文字部分的描述,使人能够直观地、形象地理解本发明的每个技术特征和整体技术方案,但其不能理解为对本发明保护范围的限制。
参照图1-图6,本发明的优选实施例,一种迁移学习与注意力机制结合的SAR图像目标识别方法,所述方法包括以下步骤:
S1、输入的SAR图像经过7*7的卷积核提取出卷积特征图;
S2、得到的卷积特征图输入注意力机制进行聚焦,得到初步聚焦特征图,其中注意力机制是从大量数字图像信息中过滤出感兴趣点,有选择地筛选出重要信息并聚焦,进一步改善性能;
S3、初步聚焦特征图输入到微调后的残差网络得到权重特征图,所述残差网络是利用深度卷积网络先完成端到端的目标识别任务,然后结合深度迁移学习的方法形成的,将残差网络在已知数据集上训练出来的权重模型迁移至SAR图像的识别工作中,加速SAR图像识别模型训练时间,提高识别效率;
S4、得到含有权重的权重特征图再次输入到注意力机制进行聚焦;
S5、把含有权重的聚焦的目标识别特征图输入后续卷积层进行分类得到目标识别结果。
具体采用的迁移模型为ImageNet数据集上训练所得到的模型,采用注意力机制方法的是通道注意力和空间注意力,在不改变原始的深度卷积网络结构的情况下,结合注意力机制来进行训练;结合了深度迁移学习与注意力机制的SAR的ATR算法原理框图如图5所示。
作为本发明的优选实施例,其还可具有以下附加技术特征:
本实施例中,所述S3中深度迁移学习的方法为深度网络的微调,将残差网络在ImageNet数据集上训练的权重模型迁移至SAR图像识别工作中。
本实施例中,所述S2中的注意力机制为混合注意力模块,所述混合注意力模块的操作方法为通道注意力机制和空间注意力机制结合使用。
本实施例中,所述通道注意力机制为:通道子模块利用共享网络的最大汇集输出和平均汇集输出,所述通道注意力机制计算公式为:
Figure BDA0003661626670000061
其中,Ac(F)表示通道注意力机制函数,F表示通道注意力机制的输入,以矩阵形式进行计算,σ表示sigmoid函数,W0表示多层感知机内隐藏层权重计算,W1表示多层感知机内输出层权重计算,
Figure BDA0003661626670000062
表示通道注意力机制内对输入F做平均池化;
Figure BDA0003661626670000063
表示通道注意力机制内对输入F做最大池化。
本实施例中,所述W0和W1为两个输入共享,ReLU激活功能后接W0;W0∈RC/r×C,W1∈RC ×C/r,W0∈RC/r×C表示W0是输入层C个神经元到隐藏层C/r个神经元之间的权重值,C表示SAR图像数据的通道数,r表示多层感知机的一个超参数,R表示图片数据;W1∈RC×C/r表示W1是隐藏层C/r个神经元到输出层C个神经元之间的权重值。
本实施例中,所述空间注意力机制为:空间子模块利用沿通道轴汇集的两个类似的输出,并将它们转发到卷积层,所述空间注意力机制的公式为:
Figure BDA0003661626670000064
其中,As(F)表示空间注意力机制函数,F表示空间注意力机制的输入;σ表示sigmoid函数,f7×7表示卷积核大小为7*7的卷积运算操作,
Figure BDA0003661626670000065
表示在空间注意力机制中对图像数据做沿通道维度做平均池化;
Figure BDA0003661626670000066
表示在空间注意力机制中对图像数据做沿通道维度做最大池化。
本实施例中,
Figure BDA0003661626670000071
表示把平均池化数据和最大池化树沿通道维度拼接在一起,得到的特征图维度
Figure BDA0003661626670000072
表示在输入特征图数据在空间注意力机制的平均池化处理后特征图数据维度变为1×H×W;
Figure BDA0003661626670000073
表示在输入特征图数据在空间注意力机制的最大池化处理后特征图数据维度变为1×H×W。
本实施例中,用所述目标识别向量M所述S5中得到的目标识别结果;所述目标识别向量M是通过注意力学习得到的权值A与输入H相乘得到:
M=AH (3)
上式中,H为注意力层输入,而A作为注意力的编码输出;
A计算如下所示:
Figure BDA0003661626670000074
其中,
Figure BDA0003661626670000075
为矩阵乘法元素;Ac为一维通道注意图,As为二维空间注意图。
具体实施例
图1所示的是深度迁移模型,深度网络的微调(fine-turning)是最普遍的深度网络迁移方法,网络微调利用别人已经训练好的网络,针对自己的任务再对网络进行调整。其优势在于不需要针对新任务从头开始训练网络,节省了时间成本;预训练好的模型通常都是在大数据集上进行的,扩充了训练数据,使得模型更具有鲁棒性,有效提高模型的泛化能力。
具体过程体现在,利用已经训练好的A目标SAR的ATR深度学习模型的模型结构以及部分参数直接迁移到B目标SAR的ATR深度学习模型上,再用B目标SAR数据集的少量训练数据进行微调;相当于给预训练的模型做一个输出层转换,即将原始的输出层转换成一个新的参数随机初始化的输出层,接下来在这个模型上的基础上用比较小的数据集进行训练。
图2所示的是CBAM结构。输入一张SAR图像后,CBAM会同时考虑目标“是什么”和目标“在哪里”这两个问题,具体的操作方法为:通道子模块利用共享网络的最大汇集输出和平均汇集输出;空间子模块利用沿通道轴汇集的两个类似的输出,并将它们转发到卷积层。
为了针对解决常规CNN中使用Softmax单层全连接的方式并不能很好地解决非线性分类问题,我们采用了注意力机制为混合注意力模块(Convolutional Block AttentionModule,CBAM),相对于原始的注意力方法而言,CBAM包含通道注意力机制和空间注意力机制,注意力机制能够灵活的捕捉全局信息和局部信息之间的联系。注意力机制的目的是让模型获得需要重点关注的目标区域,给该目标区域投入更大的权重,突出显著有用特征,抑制和忽略无关特征。
图3所示的是通道注意力机制,其公式表示如下:
Figure BDA0003661626670000081
其中,Ac(F)表示通道注意力机制函数,F表示通道注意力机制的输入,以矩阵形式进行计算,σ表示sigmoid函数,W0表示多层感知机内隐藏层权重计算,W1表示多层感知机内输出层权重计算,
Figure BDA0003661626670000082
表示通道注意力机制内对输入F做平均池化;
Figure BDA0003661626670000083
表示通道注意力机制内对输入F做最大池化。
对于给定的SAR图像特征图输入F∈RH×W×C,其中F表示SAR图像数据的输入,RH×W×C表示输入特征图的三个维度数据,分别是H图像高度,W图像宽度,C图像通道数;同时经过全局平均池化(GAP)和全局最大池化(GMP)操作,分别得到不同空间语义描述的算子,将二者通过一个多层感知机(MPL),随后将两个特征向量使用相加方式进行融合,最后经过激活sigmoid函数,得到通道注意力向量Ac∈RC×1×1。Ac∈RC×1×1表示图像经过通道注意力机制处理后三个维度数据为分别是H图像高度为1,W图像宽度为1,C图像通道数为C。
图4所示的是空间注意力机制,空间子模块利用沿通道轴汇集的两个类似的输出,并将它们转发到卷积层。其公式为:
Figure BDA0003661626670000091
其中,As(F)表示空间注意力机制函数,F表示空间注意力机制的输入;σ表示sigmoid函数,f7×7表示卷积核大小为7*7的卷积运算操作,
Figure BDA0003661626670000092
表示在空间注意力机制中对图像数据做沿通道维度做平均池化;
Figure BDA0003661626670000093
表示在空间注意力机制中对图像数据做沿通道维度做最大池化。
对于给定的输入:F∈RH×W×C沿通道维度同时经过全局平均池化(GAP)和全局最大池化(GMP)操作,分别得到两种不同的通道特征描述算子,将二者进行拼接,得到一个两个维度的特征图,然后经过一个7*7的卷积操作,在经过sigmoid激活函数,最后得到空间注意力向量As∈R1×H×W。As∈R1×H×W表示图像经过通道注意力机制处理后三个维度数据为分别是H图像高度为H,W图像宽度为W,C图像通道数为1。
把图3和图4进行结合,SAR图像先经过一个卷积层提取出的特征图输入图3所示的通道注意力机制,经过通道注意力机制对原特征图进行矫正后得到一个中间特征图,再由中间特征图输入给空间注意力机制模块进行矫正,最终得到一个经过注意力聚焦后的特征图如图2所示,CBAM混合注意力机制是一个先由特征图经过通道注意力机制后经过空间注意力机制的串行混合机制。
图5所示的是结合了深度迁移学习和注意力机制的SAR图像网络框架,目标识别向量M是表示最终的目标识别结果,M是通过注意力学习得到的权值A与输入H相乘得到:
M=AH (3)
上式中,H为注意力层输入,而A作为注意力的编码输出;
A计算如下所示:
Figure BDA0003661626670000101
其中,
Figure BDA0003661626670000102
为矩阵乘法元素;Ac为一维通道注意图,As为二维空间注意图。
最后,通过有效的结合注意力机制与迁移学习方法,从而达到实现SAR的ATR的整体算法。
图6所示为0%~15%随机噪声下的SAR图像识别准确率,本发明对有含有15%随机噪声的MSTART数据集的SAR图像识别率远高于其他方法对含有15%随机噪声的MSTART数据集的SAR图像识别率。
本发明相对于传统的SAR图像目标识别方法而言,基于深度迁移学习的SAR ATR方法具有更强的表现能力,通过利用微调后的残差网络,能够快速的提取图像特征,实现端到端的学习,再结合注意力机制,聚焦包含目标特征的信息,提高特征筛选的能力,进而提高SAR图像的目标识别能力,从而有效的提高识别性能。
在不出现冲突的前提下,本领域技术人员可以将上述附加技术特征自由组合以及叠加使用。
以上所述仅为本发明的优先实施方式,只要以基本相同手段实现本发明目的的技术方案都属于本发明的保护范围之内。

Claims (8)

1.一种迁移学习与注意力机制结合的SAR图像目标识别方法,其特征在于:所述方法包括以下步骤:
S1、输入的SAR图像经过7*7的卷积核提取出卷积特征图;
S2、得到的卷积特征图输入注意力机制进行聚焦,得到初步聚焦特征图,其中注意力机制是从大量数字图像信息中过滤出感兴趣点,有选择地筛选出重要信息并聚焦;
S3、初步聚焦特征图输入到微调后的残差网络得到权重特征图,所述残差网络是利用深度卷积网络先完成端到端的目标识别任务,然后结合深度迁移学习的方法形成的,将残差网络在已知数据集上训练出来的权重模型迁移至SAR图像的识别工作中,加速SAR图像识别模型训练时间;
S4、得到含有权重的权重特征图再次输入到注意力机制进行聚焦;
S5、把含有权重的聚焦的目标识别特征图输入后续卷积层进行分类得到目标识别结果。
2.根据权利要求1所述的迁移学习与注意力机制结合的SAR图像目标识别方法,其特征在于:所述S3中深度迁移学习的方法为深度网络的微调,将残差网络在ImageNet数据集上训练的权重模型迁移至SAR图像识别工作中。
3.根据权利要求1所述的迁移学习与注意力机制结合的SAR图像目标识别方法,其特征在于:所述S2中的注意力机制为CBAM混合注意力模块,所述混合注意力模块的操作方法为通道注意力机制和空间注意力机制结合使用。
4.根据权利要求3所述的迁移学***均汇集输出,所述通道注意力机制计算公式为:
Figure FDA0003661626660000021
其中,Ac(F)表示通道注意力机制函数,F表示通道注意力机制的输入,以矩阵形式进行计算,σ表示sigmoid函数,W0表示多层感知机内隐藏层权重计算,W1表示多层感知机内输出层权重计算,
Figure FDA0003661626660000022
表示通道注意力机制内对输入F做平均池化;
Figure FDA0003661626660000023
表示通道注意力机制内对输入F做最大池化。
5.根据权利要求4所述的迁移学习与注意力机制结合的SAR图像目标识别方法,其特征在于:所述W0和W1为两个输入共享,ReLU激活功能后接W0;W0∈RC/r×C,W1∈RC×C/r,W0∈RC/r×C表示W0是输入层C个神经元到隐藏层C/r个神经元之间的权重值,C表示SAR图像数据的通道数,r表示多层感知机的一个超参数,R表示图片数据;W1∈RC×C/r表示W1是隐藏层C/r个神经元到输出层C个神经元之间的权重值。
6.根据权利要求3所述的迁移学习与注意力机制结合的SAR图像目标识别方法,其特征在于:所述空间注意力机制为:空间子模块利用沿通道轴汇集的两个类似的输出,并将它们转发到卷积层,所述空间注意力机制的公式为:
Figure FDA0003661626660000024
其中,As(F)表示空间注意力机制函数,F表示空间注意力机制的输入;σ表示sigmoid函数,f7×7表示卷积核大小为7*7的卷积运算操作,
Figure FDA0003661626660000025
表示在空间注意力机制中对图像数据做沿通道维度做平均池化;
Figure FDA0003661626660000026
表示在空间注意力机制中对图像数据做沿通道维度做最大池化。
7.根据权利要求6所述的迁移学***均池化数据和最大池化树沿通道维度拼接在一起,得到的特征图维度
Figure FDA0003661626660000032
表示在输入特征图数据在空间注意力机制的平均池化处理后特征图数据维度变为1×H×W;
Figure FDA0003661626660000033
表示在输入特征图数据在空间注意力机制的最大池化处理后特征图数据维度变为1×H×W。
8.根据权利要求1所述的迁移学习与注意力机制结合的SAR图像目标识别方法,其特征在于:用所述目标识别向量M所述S5中得到的目标识别结果;所述目标识别向量M是通过注意力学习得到的权值A与输入H相乘得到:
M=AH (3)
上式中,H为注意力层输入,而A作为注意力的编码输出;
A计算如下所示:
Figure FDA0003661626660000034
其中,
Figure FDA0003661626660000035
为矩阵乘法元素;Ac为一维通道注意图,As为二维空间注意图。
CN202210579119.3A 2022-05-25 2022-05-25 迁移学习与注意力机制结合的sar图像目标识别方法 Pending CN114863283A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210579119.3A CN114863283A (zh) 2022-05-25 2022-05-25 迁移学习与注意力机制结合的sar图像目标识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210579119.3A CN114863283A (zh) 2022-05-25 2022-05-25 迁移学习与注意力机制结合的sar图像目标识别方法

Publications (1)

Publication Number Publication Date
CN114863283A true CN114863283A (zh) 2022-08-05

Family

ID=82639805

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210579119.3A Pending CN114863283A (zh) 2022-05-25 2022-05-25 迁移学习与注意力机制结合的sar图像目标识别方法

Country Status (1)

Country Link
CN (1) CN114863283A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116228797A (zh) * 2023-05-09 2023-06-06 中国石油大学(华东) 基于注意力和U-Net的页岩扫描电镜图像分割方法
CN116559949A (zh) * 2023-05-19 2023-08-08 北京宸宇金源科技有限公司 一种基于深度学习的碳酸盐岩储层预测方法、***及设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116228797A (zh) * 2023-05-09 2023-06-06 中国石油大学(华东) 基于注意力和U-Net的页岩扫描电镜图像分割方法
CN116228797B (zh) * 2023-05-09 2023-08-15 中国石油大学(华东) 基于注意力和U-Net的页岩扫描电镜图像分割方法
CN116559949A (zh) * 2023-05-19 2023-08-08 北京宸宇金源科技有限公司 一种基于深度学习的碳酸盐岩储层预测方法、***及设备

Similar Documents

Publication Publication Date Title
CN109753903B (zh) 一种基于深度学习的无人机检测方法
Liu et al. A spectral grouping and attention-driven residual dense network for hyperspectral image super-resolution
CN111325165B (zh) 考虑空间关系信息的城市遥感影像场景分类方法
CN113065558A (zh) 一种结合注意力机制的轻量级小目标检测方法
CN114863283A (zh) 迁移学习与注意力机制结合的sar图像目标识别方法
Zhang et al. One-two-one networks for compression artifacts reduction in remote sensing
CN109801215B (zh) 基于对抗生成网络的红外超分辨率成像方法
CN110717856A (zh) 一种用于医学成像的超分辨率重建算法
Mostofa et al. Joint-SRVDNet: Joint super resolution and vehicle detection network
CN111612711A (zh) 一种基于生成对抗网络改进的图片去模糊方法
CN109034184B (zh) 一种基于深度学习的均压环检测识别方法
CN112241939B (zh) 一种基于多尺度和非局部的轻量去雨方法
CN113920043A (zh) 基于残差通道注意力机制的双流遥感图像融合方法
Hu et al. A two-stage unsupervised approach for low light image enhancement
CN113763417B (zh) 一种基于孪生网络和残差结构的目标跟踪方法
CN115331104A (zh) 一种基于卷积神经网络的农作物种植信息提取方法
CN116758130A (zh) 一种基于多路径特征提取和多尺度特征融合的单目深度预测方法
CN110751271B (zh) 一种基于深度神经网络的图像溯源特征表征方法
CN113034361A (zh) 一种基于改进esrgan的遥感影像超分重建方法
CN114937202A (zh) 一种双流Swin Transformer遥感场景分类方法
CN113538243A (zh) 基于多视差注意力模块组合的超分辨图像重建方法
Yanshan et al. OGSRN: Optical-guided super-resolution network for SAR image
CN114463176B (zh) 基于改进esrgan的图像超分辨重建方法
CN116843975A (zh) 结合空间金字塔注意力机制的高光谱图像分类方法
CN113627487B (zh) 一种基于深层注意力机制的超分辨率重建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination