CN115527121A - 一种端到端林地变化检测方法、***、介质、设备及终端 - Google Patents

一种端到端林地变化检测方法、***、介质、设备及终端 Download PDF

Info

Publication number
CN115527121A
CN115527121A CN202211273622.2A CN202211273622A CN115527121A CN 115527121 A CN115527121 A CN 115527121A CN 202211273622 A CN202211273622 A CN 202211273622A CN 115527121 A CN115527121 A CN 115527121A
Authority
CN
China
Prior art keywords
model
change detection
training
data
forest land
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211273622.2A
Other languages
English (en)
Inventor
邢元军
刘恩林
宋亚斌
郭晓妮
江腾宇
刘金山
刘晓农
胥东海
周灯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South Investigation And Planning Institute Of State Forestry And Grassland Administration
Original Assignee
Central South Investigation And Planning Institute Of State Forestry And Grassland Administration
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South Investigation And Planning Institute Of State Forestry And Grassland Administration filed Critical Central South Investigation And Planning Institute Of State Forestry And Grassland Administration
Priority to CN202211273622.2A priority Critical patent/CN115527121A/zh
Publication of CN115527121A publication Critical patent/CN115527121A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/188Vegetation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/52Scale-space analysis, e.g. wavelet analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/70Labelling scene content, e.g. deriving syntactic or semantic representations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Image Analysis (AREA)

Abstract

本发明属于遥感影像数据处理技术领域,公开了一种端到端林地变化检测方法、***、介质、设备及终端,对原始数据进行矢量栅格化以及滑动剪裁并划分数据集;基于深度学习体系的语义分割技术构建林地变化检测模型;设计复合损失函数以及Adamw优化器,采用空间变换和光谱变换的增强策略进行训练迭代;采取多尺度策略进行模型训练,并在模型训练完成后进入模型实际部署阶段。本发明的编码器采用Transformer系列骨干网络,相比于传统卷积神经网络的骨干网络,其提取特征过程更接近于人工目视解译;解码器选择FPN,该网络通过融合多尺度特征图,保证了低分辨率语义信息和高分辨率空间信息的结合使用,实现了全局信息的有效融合。

Description

一种端到端林地变化检测方法、***、介质、设备及终端
技术领域
本发明属于遥感影像数据处理技术领域,尤其涉及一种端到端林地变化检测方法、***、介质、设备及终端。
背景技术
目前,国内外基于遥感影像的林地变化调查方法主要有以下两种,一是人工目视解译,即人为在Arcgis等程序上比对多期遥感影像数据,人工绘制变化区域图斑,然后统一整理为变化清查结果,该策略难易度较低,但人力和物力成本高,难以统一不同解译人员的主观判断;二是利用基于深度学习的变化检测模型,如STANet等,该类模型具有精度高效率快的特点,大幅降低人力消耗,但大多数变化检测模型并不会针对林地变化设计,这些模型在面对林地变化中常见的季相因素干扰时通常表现不佳。
基于深度学习技术的变化检测模型具有准确率高、效率高、端到端等优点,越来越受到土地管理部门的重视。面向林业遥感实际应用,基于全国林地“一张图”的更新需求,亟需设计一种高效、针对林地资源变化、可迁移复用的林地变化检测方法。
通过上述分析,现有技术存在的问题及缺陷为:
(1)现有基于人工目视解译的基于遥感影像的林地变化调查方法的人力和物力成本高,难以统一不同解译人员的主观判断。
(2)现有利用基于深度学习的变化检测模型并不会针对林地变化设计,这些模型在面对林地变化中常见的季相因素干扰时通常表现不佳。
发明内容
针对现有技术存在的问题,本发明提供了一种端到端林地变化检测方法、***、介质、设备及终端,尤其涉及一种基于高分辨率遥感影像的端到端林地变化检测方法、***、介质、设备及终端。
本发明是这样实现的,一种端到端林地变化检测方法,所述端到端林地变化检测方法包括:
对原始数据进行矢量栅格化以及滑动剪裁并划分数据集;基于深度学习体系的语义分割技术构建林地变化检测模型;设计损失函数与优化器,采用数据增强策略训练数据集;训练模型并在模型训练完成后进入模型实际部署阶段。
进一步,所述端到端林地变化检测方法包括以下步骤:
步骤一,数据预处理:进行矢量栅格化以及滑动剪裁并划分数据集;
步骤二,模型构建:基于深度学习的语义分割技术构建林地变化检测模型;
步骤三,损失函数与优化器设计:设计复合损失函数以及Adamw优化器;
步骤四,数据增强:采用空间变换和光谱变换的增强策略进行训练迭代;
步骤五,模型训练:采取多尺度策略进行林地变化检测模型的训练;
步骤六,模型部署:使用有重叠区域的滑动窗口对待预测影像进行预测。
进一步,所述步骤一中的数据预处理包括:
原始遥感影像数据包括:经过地理配准的两幅不同时相的遥感影像、人工目视解译勾绘的变化图斑,所述数据预处理步骤如下:
(1)变化图斑矢量栅格化,像元分辨率与遥感影像保持一致;
(2)两幅不同时相的遥感影像按时间分为前时相影像与后时相影像,与变化图斑的栅格化数据一同裁剪为256×256分辨率大小的图像集,裁剪时采用滑动窗口策略,根据数据量适当保留30~50%的重叠区域以消除裁剪边界对模型训练效果的影响;裁剪过程中,保证各组图像在原始影像中的位置一一对应;
(3)按照训练集:测试集:验证集=8:1:1的比例,对应划分数据集。
进一步,所述步骤二中的模型构建包括:
所述林地变化检测模型基于深度学习体系的语义分割技术,使用标准的编码器-解码器架构;编码器部分采用Swin Transformer系列骨干网络作为特征提取手段,解码器部分采用特征金字塔网络FPN用于特征恢复;在解码器末端,基于对象上下文技术的OCR分割头被用于精细化变化区域的边界。
所述步骤三中的损失函数与优化器设计包括:
所述损失函数为复合损失函数,包括Dice Loss和Focal Loss,表示为:
L=Lfocal+Ldice
Focal Loss和Dice Loss的计算公式为:
Lfocal=-α(1-pt)γlog(pt);
Figure BDA0003896170240000031
Figure BDA0003896170240000032
式中,α,γ为控制样本权重的超参数,默认为0.25和2;p为概率;
Figure BDA0003896170240000033
为变化图;Y为地面真值。
采用的优化器为Adamw,学习率衰减策略为带有热重启的余弦衰减法,初始学习率默认为1e-3。
进一步,所述步骤四中的数据增强包括:
所述数据增强策略包括空间变换和光谱变换,空间方面采用水平、垂直翻转,光谱方面采用随机高斯噪声;在训练迭代过程中,随机选取空间变换和光谱变换进行组合,并使用Cutmix在不同训练批次中进行数据的二次增强。
进一步,所述步骤五中的模型训练包括:
在林地变化检测模型训练阶段,采取多尺度策略提高模型对于不同尺度变化区域的泛化性,模型在前向传播的过程中额外输出软对象区域用于深监督训练;在模型训练过程中,以测试集的F1分数作为模型效果的评价指标。
所述步骤六中的模型部署包括:
模型训练完成后进入实际部署阶段,使用有重叠区域的滑动窗口对两幅待预测影像进行预测;预测阶段将测试时增强TTA作为可选项,用于增强模型预测效果;在预测的最终阶段集成结果后处理与结果矢量化,用于复核检验。
本发明的另一目的在于提供一种应用所述的端到端林地变化检测方法的端到端林地变化检测***,所述端到端林地变化检测***包括:
数据预处理模块,用于对原始数据矢量栅格化以及滑动剪裁并划分数据集;
模型构建模块,用于基于深度学习的语义分割技术构建林地变化检测模型;
损失函数与优化器设计模块,用于设计复合损失函数以及Adamw优化器;
数据增强模块,用于采用空间变换和光谱变换的增强策略进行训练迭代;
模型训练模块,用于采取多尺度策略进行林地变化检测模型的训练;
模型部署模块,用于使用有重叠区域的滑动窗口对待预测影像进行预测。
本发明的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述的端到端林地变化检测方法的步骤。
本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述的端到端林地变化检测方法的步骤。
本发明的另一目的在于提供一种信息数据处理终端,所述信息数据处理终端用于实现所述的端到端林地变化检测***。
结合上述的技术方案和解决的技术问题,请从以下几方面分析本发明所要保护的技术方案所具备的优点及积极效果为:
第一,针对上述现有技术存在的技术问题以及解决该问题的难度,紧密结合本发明的所要保护的技术方案以及研发过程中结果和数据等,详细、深刻地分析本发明技术方案如何解决的技术问题,解决问题之后带来的一些具备创造性的技术效果。具体描述如下:
本发明所使用的林地变化检测模型特点为有效利用全局信息。在实际调研中发现,人工目视解译变化图斑时,解译人员通常根据变化区域周边背景来辅助判断林地变化。从该角度出发,设计模型时应考虑增大模型的感受野,使用更多背景信息辅助进行变化判断。本发明的编码器采用Transformer系列骨干网络,该系列骨干网络通过计算全局自注意力来捕获长距离的信息关联,相比于传统卷积神经网络(CNN)的骨干网络,其提取特征过程更接近于人工目视解译;解码器选择FPN,该网络通过融合多尺度特征图,保证低分辨率语义信息和高分辨率空间信息的结合使用,即全局信息的有效融合。
本发明在模型训练完成后进入实际部署阶段,使用有重叠区域的滑动窗口对两幅待预测影像进行预测,重叠区域保证了最终结果没有明显的边缘拼接痕迹;预测阶段将测试时增强作为可选项,用于进一步增强模型预测效果;在预测的最终阶段集成了结果后处理与结果矢量化,供操作人员进一步复核检验。
第二,把技术方案看做一个整体或者从产品的角度,本发明所要保护的技术方案具备的技术效果和优点,具体描述如下:
本发明的林地变化检测模型采用编码器-解码器结构,包括数据预处理、损失函数、模型训练等部分。本发明所提出的林地变化检测的主要优点有:基于深度学习(语义分割)技术设计模型和数据驱动,效率高,准确率高;可有效减少由于林地变化中常见的季相因素干扰而产生的非语义变化(伪变化);模型参数适中,硬件需求合理。本发明提供的端到端林地变化检测方法可有效减少目视解译工作量,经实际测试,后期仅需人工复核即可满足实际需求。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的端到端林地变化检测方法流程图;
图2是本发明实施例提供的数据预处理流程图;
图3是本发明实施例提供的模型结构示意图;
图4是本发明实施例提供的数据增强方法流程图;
图5是本发明实施例提供的模型训练流程图;
图6是本发明实施例提供的目视解译示例图;
图7是本发明实施例提供的影像裁剪示例图;
图8是本发明实施例提供的模型局部预测示例图;
图9是本发明实施例提供的成果示例(1024×1024尺度)示意图;
图10是本发明实施例提供的成果示例(省级尺度)示意图;
图11是本发明实施例提供的数据集示例图;
图12是本发明实施例提供的Sentinel-2结果示例(前时相)图;
图13是本发明实施例提供的Sentinel-2结果示例(后时相)图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种端到端林地变化检测方法、***、介质、设备及终端,下面结合附图对本发明作详细的描述。
一、解释说明实施例。为了使本领域技术人员充分了解本发明如何具体实现,该部分是对权利要求技术方案进行展开说明的解释说明实施例。
如图1所示,本发明实施例提供的端到端林地变化检测方法包括以下步骤:
S101,数据预处理:进行矢量栅格化以及滑动剪裁并划分数据集;
S102,模型构建:基于深度学习的语义分割技术构建林地变化检测模型;
S103,损失函数与优化器设计:设计复合损失函数以及Adamw优化器;
S104,数据增强:采用空间变换和光谱变换的增强策略进行训练迭代;
S105,模型训练:采取多尺度策略进行林地变化检测模型的训练;
S106,模型部署:使用有重叠区域的滑动窗口对待预测影像进行预测。
作为优选实施例,本发明实施例提供的端到端林地变化检测方法具体包括以下步骤:
步骤1:数据预处理
原始遥感影像数据需要经过预处理后才可作为数据集供模型训练。原始遥感影像数据包括:经过地理配准的两幅不同时相的遥感影像、人工目视解译勾绘的变化图斑。数据预处理整体流程如图2所示,预处理步骤如下:
(1)变化图斑矢量栅格化,像元分辨率与遥感影像保持一致。
(2)两幅不同时相的遥感影像按时间分为前时相影像与后时相影像,与变化图斑的栅格化数据一同裁剪为256×256分辨率大小的图像集,裁剪时采用滑动窗口策略,根据数据量适当保留30%~50%的重叠区域以消除裁剪边界对模型训练效果的影响。裁剪过程中,保证各组图像在原始影像中的位置一一对应。
(3)按训练集:测试集:验证集=8:1:1的比例,对应划分数据集。
步骤2:模型构建
本发明实施例考虑到全国林地“一张图”的更新需要,林地变化检测通常要求影像的时间跨度为一年,因此季相的干扰需要得到重视。季相干扰具体指植被处于不同季相或物候期,在遥感影像中反映出不同的光谱特征。其地类在此过程中并未发生改变,即“非语义变化”或“伪变化”。因此提高林地变化检测模型精度,有效抑制这类伪变化尤为重要。
针对此问题,本发明实施例提出所使用的林地变化检测模型,其基于深度学习体系的语义分割技术,使用标准的编码器-解码器架构。编码器部分采用Swin Transformer系列骨干网络作为特征提取手段,解码器部分采用特征金字塔网络(FPN)用于特征恢复。在解码器末端,一个基于对象上下文技术的OCR分割头被用于精细化变化区域的边界。
本发明实施例所使用的模型特点为有效利用全局信息。在实际调研中发现,人工目视解译变化图斑时,解译人员通常根据变化区域周边背景来辅助判断林地变化。从该角度出发,设计模型时应考虑增大模型的感受野,使用更多背景信息辅助进行变化判断。编码器采用Transformer系列骨干网络,该系列骨干网络通过计算全局自注意力来捕获长距离的信息关联,相比于传统卷积神经网络(CNN)的骨干网络,其提取特征过程更接近于人工目视解译;解码器选择FPN,该网络通过融合多尺度特征图,保证低分辨率语义信息和高分辨率空间信息的结合使用,即全局信息的有效融合。所使用模型整体结构如图3所示。
步骤3:损失函数与优化器
变化检测任务作为特殊的语义分割子任务,变化区域作为正样本,非变化区域作为负样本,正负样本量分布不均衡,通常正样本远少于负样本。因此,在模型训练阶段,需要针对样本不均衡设计损失函数。
本发明实施例设计的损失函数为复合损失函数,包括Dice Loss和Focal Loss,可表示为下式:
L=Lfocal+Ldice (1)
Focal Loss和Dice Loss均适用于样本不平衡场景,由于仅使用Dice Loss会使训练不稳定,因此加入Focal loss用于辅助训练。这两种Loss的计算公式为:
Lfocal=-α(1-pt)γlog(pt) (2)
Figure BDA0003896170240000081
Figure BDA0003896170240000082
式中,α,γ为控制样本权重的超参数,默认为0.25和2,p为概率,
Figure BDA0003896170240000083
为变化图,Y为地面真值。
本发明实施例采用的优化器为Adamw,学习率衰减策略为带有热重启的余弦衰减法,初始学习率默认为1e-3。
步骤4:数据增强
本发明实施例使用的数据增强策略包括空间变换和光谱变换,空间方面采用水平、垂直翻转等,光谱方面采用随机高斯噪声等。训练迭代过程中,随机选取一种空间变换和一种光谱变换进行组合,并使用Cutmix在不同训练批次中进行数据的二次增强。数据增强方式如图4所示。
步骤五、模型训练
模型训练阶段,采取多尺度策略以提高模型对于不同尺度变化区域的泛化性,由于模型结构中使用了OCR分割头,因此模型在前向传播的过程中额外输出软对象区域(softobject region)用于深监督训练。
训练过程中,以测试集的F1分数作为模型效果的评价指标,保存效果最好的模型。模型训练流程如图5所示。
步骤六、模型部署
模型训练完成后进入实际部署阶段,使用有重叠区域的滑动窗口对两幅待预测影像进行预测,重叠区域保证了最终结果没有明显的边缘拼接痕迹。预测阶段将测试时增强(Test Time Augmentation,TTA)作为可选项,用于进一步增强模型预测效果。本发明实施例在预测的最终阶段集成了结果后处理与结果矢量化,供操作人员进一步复核检验。
本发明实施例提供的端到端林地变化检测***包括:
数据预处理模块,用于对原始数据矢量栅格化以及滑动剪裁并划分数据集;
模型构建模块,用于基于深度学习的语义分割技术构建林地变化检测模型;
损失函数与优化器设计模块,用于设计复合损失函数以及Adamw优化器;
数据增强模块,用于采用空间变换和光谱变换的增强策略进行训练迭代;
模型训练模块,用于采取多尺度策略进行林地变化检测模型的训练;
模型部署模块,用于使用有重叠区域的滑动窗口对待预测影像进行预测。
二、实施例相关效果的证据。本发明实施例在研发或者使用过程中取得了一些积极效果,和现有技术相比的确具备很大的优势,下面内容结合试验过程的数据、图表等进行描述。
案例一:湖北省2019~2020年林地变更调查(高分影像案例)
(1)数据来源:国产高分系列,假彩色合成数据共两期(2019,2020)。
(2)训练样本:组织专业人员,目视解译随县等地区林地变化。按地区裁剪原始影像得到样本影像(如:随县2019年影像,随县2020年影像,随县变化图斑矢量文件),并将变化图斑栅格化为同尺度样本标签。对应裁剪为256×256分辨率大小后划分为深度学习数据集。
目视解译效果如图6所示(方框区域为林地变化区域)。
裁剪效果如图7所示(以前时相影像的裁剪结果为例)。
(3)模型训练:定义本发明实施例使用的林地变化检测模型,预训练权重为ImageNet-22k上的UperNet_Swin-Transformer权重(Swin-T),优化器使用带热重启的余弦衰减策略,数据增强方式为空间变换与光谱变换的随机组合,初始学习率为1e-3,在NVIDIARTX 3090上以16的batch size训练100个Epoch。以F1分数为评价指标,保存最优模型。
(4)结果预测与后处理:导入最优模型和待预测影像数据,构建滑动窗口预测器,以50%的重叠率滑动预测各地区双时相影像。预测结果进行形态学后处理,删除细小破碎图斑,填充孔洞。根据项目需求,计算变化图斑面积,删除小于阈值的变化区域。将变化图进行矢量化,得到变化区域矢量文件。
局部预测结果示例(256×256分辨率)如图8所示。
(5)快速人工核验:组织人员对变化区域的矢量文件进行检查,剔除错检图斑。
案例一成果展示(1024×1024尺度,方框区域为变化区域)如图9所示。
(6)成果展示(省级尺度,方框区域为变化区域)如图10所示。
案例二:长沙市2017~2020年林地变更调查(Sentinel-2影像案例)
(1)数据来源:Sentinel-2L1C级数据,真彩色合成数据共两期(2017,2020)。
(2)训练样本:训练样本来源与处理方法同案例一。
预处理完成后,部分数据集如图11所示。
(3)模型训练:定义本方法使用的林地变化检测模型,预训练权重为ImageNet-22k上的UperNet_Swin-Transformer权重(Swin-S),优化器使用带热重启的余弦衰减策略,数据增强方式为空间变换与光谱变换的随机组合,在前向传播前进行CutMix二次扩增训练数据。初始学习率为1e-3,在NVIDIA RTX3090上以16的batch size训练55个Epoch。以F1分数为评价指标,保存最优模型。
(4)结果预测与后处理:导入最优模型和待预测影像数据,构建滑动窗口预测器,以50%的重叠率滑动预测各地区双时相影像。预测结果进行形态学后处理,删除细小破碎图斑,填充孔洞。根据项目需求,计算变化图斑面积,删除小于阈值的变化区域。将变化图进行矢量化,得到变化区域矢量文件,设计界面以交互方式显示。
局部结果展示(方框区域为变化区域):
2017年影像如图12所示,2020年影像如图13所示。
应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行***,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种端到端林地变化检测方法,其特征在于,所述端到端林地变化检测方法包括:
对原始数据进行矢量栅格化以及滑动剪裁并划分数据集;基于深度学习体系的语义分割技术构建林地变化检测模型;设计损失函数与优化器,采用数据增强策略训练数据集;训练模型并在模型训练完成后进入模型实际部署阶段。
2.如权利要求1所述的端到端林地变化检测方法,其特征在于,所述端到端林地变化检测方法包括以下步骤:
步骤一,数据预处理:进行矢量栅格化以及滑动剪裁并划分数据集;
步骤二,模型构建:基于深度学习的语义分割技术构建林地变化检测模型;
步骤三,损失函数与优化器设计:设计复合损失函数以及Adamw优化器;
步骤四,数据增强:采用空间变换和光谱变换的增强策略进行训练迭代;
步骤五,模型训练:采取多尺度策略进行林地变化检测模型的训练;
步骤六,模型部署:使用有重叠区域的滑动窗口对待预测影像进行预测。
3.如权利要求2所述的端到端林地变化检测方法,其特征在于,所述步骤一中的数据预处理包括:
原始遥感影像数据包括:经过地理配准的两幅不同时相的遥感影像、人工目视解译勾绘的变化图斑,所述数据预处理步骤如下:
(1)变化图斑矢量栅格化,像元分辨率与遥感影像保持一致;
(2)两幅不同时相的遥感影像按时间分为前时相影像与后时相影像,与变化图斑的栅格化数据一同裁剪为256×256分辨率大小的图像集,裁剪时采用滑动窗口策略,根据数据量适当保留30~50%的重叠区域以消除裁剪边界对模型训练效果的影响;裁剪过程中,保证各组图像在原始影像中的位置一一对应;
(3)按照训练集:测试集:验证集=8:1:1的比例,对应划分数据集。
4.如权利要求2所述的端到端林地变化检测方法,其特征在于,所述步骤二中的模型构建包括:
所述林地变化检测模型基于深度学习体系的语义分割技术,使用标准的编码器-解码器架构;编码器部分采用Swin Transformer系列骨干网络作为特征提取手段,解码器部分采用特征金字塔网络FPN用于特征恢复;在解码器末端,基于对象上下文技术的OCR分割头被用于精细化变化区域的边界;
所述步骤三中的损失函数与优化器设计包括:
所述损失函数为复合损失函数,包括Dice Loss和FocalLoss,表示为:
L=Lfocal+Ldice
Focal Loss和Dice Loss的计算公式为:
Lfocal=-α(1-pt)γlog(pt);
Figure FDA0003896170230000021
Figure FDA0003896170230000022
式中,α,γ为控制样本权重的超参数,默认为0.25和2;p为概率;
Figure FDA0003896170230000023
为变化图;Y为地面真值;
采用的优化器为Adamw,学习率衰减策略为带有热重启的余弦衰减法,初始学习率默认为1e-3。
5.如权利要求2所述的端到端林地变化检测方法,其特征在于,所述步骤四中的数据增强包括:
所述数据增强策略包括空间变换和光谱变换,空间方面采用水平、垂直翻转,光谱方面采用随机高斯噪声;在训练迭代过程中,随机选取空间变换和光谱变换进行组合,并使用Cutmix在不同训练批次中进行数据的二次增强。
6.如权利要求2所述的端到端林地变化检测方法,其特征在于,所述步骤五中的模型训练包括:
在林地变化检测模型训练阶段,采取多尺度策略提高模型对于不同尺度变化区域的泛化性,模型在前向传播的过程中额外输出软对象区域用于深监督训练;在模型训练过程中,以测试集的F1分数作为模型效果的评价指标;
所述步骤六中的模型部署包括:
模型训练完成后进入实际部署阶段,使用有重叠区域的滑动窗口对两幅待预测影像进行预测;预测阶段将测试时增强TTA作为可选项,用于增强模型预测效果;在预测的最终阶段集成结果后处理与结果矢量化,用于复核检验。
7.一种应用如权利要求1~6任意一项所述的端到端林地变化检测方法的端到端林地变化检测***,其特征在于,所述端到端林地变化检测***包括:
数据预处理模块,用于对原始数据矢量栅格化以及滑动剪裁并划分数据集;
模型构建模块,用于基于深度学习的语义分割技术构建林地变化检测模型;
损失函数与优化器设计模块,用于设计复合损失函数以及Adamw优化器;
数据增强模块,用于采用空间变换和光谱变换的增强策略进行训练迭代;
模型训练模块,用于采取多尺度策略进行林地变化检测模型的训练;
模型部署模块,用于使用有重叠区域的滑动窗口对待预测影像进行预测。
8.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1~6任意一项所述的端到端林地变化检测方法的步骤。
9.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1~6任意一项所述的端到端林地变化检测方法的步骤。
10.一种信息数据处理终端,其特征在于,所述信息数据处理终端用于实现如权利要求7所述的端到端林地变化检测***。
CN202211273622.2A 2022-10-18 2022-10-18 一种端到端林地变化检测方法、***、介质、设备及终端 Pending CN115527121A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211273622.2A CN115527121A (zh) 2022-10-18 2022-10-18 一种端到端林地变化检测方法、***、介质、设备及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211273622.2A CN115527121A (zh) 2022-10-18 2022-10-18 一种端到端林地变化检测方法、***、介质、设备及终端

Publications (1)

Publication Number Publication Date
CN115527121A true CN115527121A (zh) 2022-12-27

Family

ID=84703700

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211273622.2A Pending CN115527121A (zh) 2022-10-18 2022-10-18 一种端到端林地变化检测方法、***、介质、设备及终端

Country Status (1)

Country Link
CN (1) CN115527121A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115984702A (zh) * 2023-02-08 2023-04-18 生态环境部卫星环境应用中心 一种基于高分影像监测矿区林地变化的方法
CN116051519A (zh) * 2023-02-02 2023-05-02 广东国地规划科技股份有限公司 双时相影像建筑物变化检测方法、装置、设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116051519A (zh) * 2023-02-02 2023-05-02 广东国地规划科技股份有限公司 双时相影像建筑物变化检测方法、装置、设备及存储介质
CN116051519B (zh) * 2023-02-02 2023-08-22 广东国地规划科技股份有限公司 双时相影像建筑物变化检测方法、装置、设备及存储介质
CN115984702A (zh) * 2023-02-08 2023-04-18 生态环境部卫星环境应用中心 一种基于高分影像监测矿区林地变化的方法

Similar Documents

Publication Publication Date Title
CN115527121A (zh) 一种端到端林地变化检测方法、***、介质、设备及终端
CN110956126B (zh) 一种联合超分辨率重建的小目标检测方法
US11551337B2 (en) Boundary-aware object removal and content fill
Ma et al. A real-time crack detection algorithm for pavement based on CNN with multiple feature layers
CN108986122A (zh) 室内泊车引导地图智能重构方法
CN114898097B (zh) 图像识别方法及***
Li et al. RoadID: a dedicated deep convolutional neural network for multipavement distress detection
CN114494870A (zh) 一种双时相遥感图像变化检测方法、模型构建方法和装置
CN114549972B (zh) 露天矿采场提取方法、装置、设备及介质
CN116597270A (zh) 基于注意力机制集成学习网络的道路损毁目标检测方法
CN113378642B (zh) 一种对农村违法占地建筑物进行检测的方法
Hong et al. Semi-supervised domain adaptation for segmentation models on different monitoring settings
Duan et al. Tunnel lining crack detection model based on improved YOLOv5
Wang et al. Instance segmentation of soft‐story buildings from street‐view images with semiautomatic annotation
CN112801109A (zh) 一种基于多尺度特征融合的遥感图像分割方法及***
CN116912700A (zh) 基于特征增强和细化的河湖治理违规问题的变化检测方法
CN114092813B (zh) 一种工业园区图像提取方法、***、电子设备和存储介质
Li et al. An integrated underwater structural multi-defects automatic identification and quantification framework for hydraulic tunnel via machine vision and deep learning
CN105787969A (zh) 一种基于dsp的高效两阶段圆形检测方法
Yin et al. U-Net-STN: A Novel End-to-End Lake Boundary Prediction Model. Land 2023, 12, 1602
Ruiz-Lendínez et al. Deep learning methods applied to digital elevation models: state of the art
Gu et al. Advances in Rapid Damage Identification Methods for Post-Disaster Regional Buildings Based on Remote Sensing Images: A Survey
CN117710374B (zh) 基于深度学习的跑冒滴漏检测方法、装置、设备及介质
Kong et al. Segmentation of borehole acoustic reflection image using feature pyramid network and transfer learning
CN117409205B (zh) 一种用于电力设备的异物搭挂检测和分割方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination