CN111144487A - 一种遥感影像样本库的建立与更新方法 - Google Patents

一种遥感影像样本库的建立与更新方法 Download PDF

Info

Publication number
CN111144487A
CN111144487A CN201911372783.5A CN201911372783A CN111144487A CN 111144487 A CN111144487 A CN 111144487A CN 201911372783 A CN201911372783 A CN 201911372783A CN 111144487 A CN111144487 A CN 111144487A
Authority
CN
China
Prior art keywords
sample
remote sensing
sensing image
data
sample data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911372783.5A
Other languages
English (en)
Other versions
CN111144487B (zh
Inventor
何建军
闫鹏飞
陈婷
苏东卫
乔月霞
闫东阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Twenty First Century Aerospace Technology Co ltd
Original Assignee
Twenty First Century Aerospace Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Twenty First Century Aerospace Technology Co ltd filed Critical Twenty First Century Aerospace Technology Co ltd
Priority to CN201911372783.5A priority Critical patent/CN111144487B/zh
Publication of CN111144487A publication Critical patent/CN111144487A/zh
Application granted granted Critical
Publication of CN111144487B publication Critical patent/CN111144487B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种遥感影像样本库的建立与更新方法,包括:在接收到建立遥感影像样本库的操作指令时,按照第一预设规则建立遥感影像样本库;在接收到从遥感影像样本数据库中提取指令时,根据提取需求,判断遥本库中是否存在满足第一预设条件的样本数据;在样本库中不存在满足第一预设条件的样本数据的情况下,接收对遥感影像数据中第一对象的标注,根据标注,使用迭代训练与预设的方法提取遥感影像数据中第二对象,以更新样本库;在样本库中的存在满足第一预设条件的样本数据的情况下,提取样本库中的样本数据,进行模型训练、遥感影像数据预测和优化处理,按照第二预设规则提取增量样本,将增量样本更新至样本库中。

Description

一种遥感影像样本库的建立与更新方法
技术领域
本发明涉及人工智能技术领域,具体涉及一种遥感影像样本库的建立与更新方法。
背景技术
近年来随着深度学习技术的快速发展,特别是在遥感影像信息提取等领域取得了长足进步,而深度学习对应的深度神经网络(Deep Neural NetWorks,DNN)工作的前提是网络得到充分的训练,在对深度神经网络进行训练时需要大量的样本作为训练数据。
样本标注是深度学习中训练数据的重要部分,在对遥感影像进行标注时,需要对遥感影像中的各类地物样本进行标注,并集合起来构建成一个样本库。样本库中存放各类地物的标注矢量数据和基期影像文件,在使用时可以根据样本类型从样本库中调用相应的数据,以便于对DNN进行训练。
但是,相关技术中对样本进行标注通常依赖于人工标注,需要消耗大量的人力物力,标注效率较低,效果不理想;传统的样本组织管理方式没有使用到空间数据库,不便于样本数据管理和使用。
发明内容
有鉴于此,本发明提供了一种遥感影像样本库的建立与更新方法,以解决相关技术中依赖于人工标注遥感影像数据中的样本,标注效率低,效果不理想的问题。
为实现上述发明目的,根据本发明的一个方面,提供了一种遥感影像样本库的建立与更新方法,包括:
(1)在接收到建立遥感影像样本库的操作指令时,根据第一预设规则建立所述遥感影像样本库;
(2)在接收到从所述遥感影像样本数据库中提取指令时,根据提取需求,判断样本库中是否存在满足第一预设条件的样本数据;
(3)在所述遥感影像样本库中不存在满足第一预设条件的样本数据的情况下,接收对遥感影像数据中第一对象的标注,根据所述标注,使用迭代训练与预设的方法提取遥感影像数据中第二对象,以更新所述遥感影像样本库;
(4)在所述遥感影像样本库中的存在满足第一预设条件的样本数据的情况下,提取所述遥感影像样本库中的样本数据,进行模型训练、遥感影像数据预测和优化处理,按照第二预设规则提取增量样本,将所述增量样本更新至所述样本库中。
在一种可选方式中,所述根据第一预设规则建立所述遥感影像样本库,包括:
(S1)将所述遥感影像样本库保存为空间数据库;
(S2)将所述空间数据库中的数据表结构设计为:影像ID、影像来源、影像地理位置、影像波段数、影像分辨率、成像时间、样本种类等;
其中,所述第一预设规则为按照需求将样本数据按照预设分幅格式或者第一预设大小数据块保存样本数据,所述按照标准分幅保存的样本数据为根据深度学习应用需求生产的样本数据,所述第一预设大小数据块保存样本数据为直接使用样本数据进行训练。
在一种可选方式中,所述根据提取需求,判断样本库中是否存在满足第一预设条件的样本数据,包括:
根据所述样本种类判断样本库中是否存在符合深度学习模型训练需求的样本数据;所述第一预设条件为所述样本库中样本数据的数量和质量是否符合深度学习模型训练需求。
在一种可选方式中,所述接收对所述遥感影像数据中的第一对象的标注,根据所述标注,使用迭代训练与预设的方法提取遥感影像数据中第二对象;包括:
(T1)获取经过预处理的遥感影像数据;
(T2)对所述遥感影像数据中的目标遥感影像数据中的目标对象进行标注得到样本数据;
(T3)根据样本数据进行模型训练,得到初级预测模型;
(T4)对所述目标遥感影像数据以外的遥感影像数据逐一执行预测和优化处理,将满足第二预设条件的预测样本数据和对应的遥感影像数据训练初级预测模型;
(T5)不断重复步骤T4,直至满足第三预设条件,得到优化预测模型;
(T6)利用训练好的优化预测模型预测遥感影像,得到样本标记数据;
其中,第一对象为标注得到的样本数据,第二对象为第一对象以外的未标注的样本数据。
在一种可选方式中,所述预处理包括以下处理中的至少一种:正射校正、影像融合、位深变换、影像匀色和影像镶嵌。
在一种可选方式中,所述预测和优化处理,将满足第二预设条件的预测标注数据和对应的遥感影像数据训练初级预测模型,包括:
(M1)根据所述预测样本数据的属性信息,构建所述预测样本数据的类型规则集,所述属性信息包括以下信息中的至少一种:所述预测样本数据对应的所述遥感影像数据的遥感指数、样本形状、结构、纹理、样本空间拓扑关系;
(M2)依据所述规则集计算所述预测样本数据的置信度;
(M3)根据所述置信度筛选所述预测样本数据。
在一种可选方式中,所述根据所述预测样本数据的属性信息,构建所述预测样本数据的类型规则集,所述方法还包括:在所述目标对象为第一类对象的情况下,接收对所述目标对象的轮廓的第一处理,删除所述预测样本数据中的离散点和空洞;或者,在所述目标对象为第二类对象的情况下,接收对所述目标对象的轮廓的第二处理。
在一种可选方式中,所述第一处理包括:轮廓腐蚀膨胀操作和轮廓平滑操作;所述第二处理包括:轮廓腐蚀膨胀操作和轮廓优化操作。
在一种可选方式中,所述轮廓腐蚀膨胀操作包括:使用特点大小的算子卷积处理所述预测样本数据,完成所述预测样本开运算;所述轮廓平滑操作包括:断开所述预测样本对应的轮廓中的连接小于或等于第一预设阈值的连接,并删除所述预测样本对应的轮廓中凸出度小于第二预设阈值的凸出部分。
在一种可选方式中,所述方法还包括:在所述地理区域内存在土地利用现状矢量图的情况下,将所述土地利用现状矢量图和对应的遥感影像数据添加至样本库中。
在一种可选方式中,所述土地利用现状矢量图为预设时间段内的土地利用矢量图,所述预设时间段为位于获取所述遥感影像数据的时刻之前,且与获取所述遥感影像的时刻间隔在预设间隔内的时间段。
在一种可选方式中,所述提取所述样本库中的样本数据,包括:
在所述样本数据为第一类标注样本数据的情况下,根据所述标注样本数据对应的遥感影像数据的地理空间位置裁切所述标注样本数据对应的遥感影像数据,生成相同大小的遥感影像块;所述第一类标注样本数据为所述样本数据对应的目标对象在遥感影像数据中分布小于或等于第三预设阈值的标注样本数据;或者,
在所述样本数据为第二类标注样本数据的情况下,按照从左到右、从上到下的顺序裁切所述第一标注样本数据对应的遥感影像数据,生成相同大小的遥感影像块;所述第二类标注样本数据为所述标注样本数据对应的目标对象在遥感影像数据中分布大于或等于第四预设阈值的标注样本数据。
在一种可选方式中,所述提取所述遥感影像样本库中的样本数据,进行模型训练、遥感影像数据预测和优化处理,按照第二预设规则提取增量样本,将所述增量样本更新至所述样本库中,包括:
(N1)根据所述样本数据进行模型训练,得到预测模型;
(N2)使用上述预测模型对为未标记的遥感影像进行预测和优化处理,得到符合第四预设条件的预测样本数据;
(N3)将上述预测样本数据中精度满足预设精度的样本数据更新到样本库中。
本发明提供的一种遥感影像样本库的建立与更新方法,解决了相关技术中人工标注遥感影像数据,标注效率低,标注结果不准确,效果不理想的问题;提高了对遥感影像数据标注的准确性和标注效率,提高了提高样本制作、管理效率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。
图1是本申请实施例提供的遥感影像样本库的建立与更新方法的实现流程图;
图2是本申请另一实施例提供的遥感影像样本库的建立与更新方法的实现流程图;
图3是本申请另一实施例提供的遥感影像样本库的建立与更新方法的实现流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
在本发明实施例的描述中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
图1是本申请实施例提供的遥感影像样本库的建立与更新方法的实现流程图。
参照图1所示,本申请实施例提供的遥感影像样本库的建立与更新方法,具体可以应用于台式电脑、笔记本电脑、大型计算机、平板电脑等智能终端;该方法包括以下步骤:
步骤101,在接收到建立遥感影像样本库的操作指令时,根据第一预设规则建立遥感影像样本库。
具体的,本申请实施例中,将遥感影像样本库保存为空间数据库;将空间数据库中的数据表结构设计为:影像ID、影像来源、影像地理位置、影像波段数、影像分辨率、成像时间、样本种类等;第一预设规则是指按照需求将样本数据按照预设分幅格式或者预设大小数据块保存样本数据,按照标准分幅保存样本数据能够根据深度学习应用需求生产任意大小和格式的样本数据,特定大小数据块保存样本数据能直接使用样本数据进行训练,不需要再裁切样本数据。
步骤102,在接收到从遥感影像样本数据库中提取指令时,根据提取需求,判断样本库中是否存在满足第一预设条件的样本数据。
具体的,本申请实施例中,根据样本种类判断样本库中是否存在符合深度学习模型训练需求的样本数据;第一预设条件为样本库中样本数据的数量和质量是否符合深度学习模型训练需求。
步骤103,在遥感影像样本库中不存在满足第一预设条件的样本数据的情况下,接收对遥感影像数据中第一对象的标注,根据标注,使用迭代训练与预设的方法提取遥感影像数据中第二对象,以更新遥感影像样本库。
具体的,本申请实施例中,获取到经过预处理后的遥感影像数据。本申请实施例中,接收人工对第一遥感影像数据中的目标遥感影像数据中的目标对象的标注,在一些具体示例中,人工标注是指通过专业的标注软件(例如,ARCGIS,MAPGIS等)从第一遥感影像数据中勾画出感兴趣的地物所在的空间位置,并保存到矢量标记文件中;具体的,本申请实施例中遥感影像数据中的目标对象可以是遥感影像数据中的特定地物;例如,在一些可能的应用场景中,目标对象可以是第一遥感影像数据中的大棚、风车、油罐管、高尔夫球场等人造地物或者是高山、湿地、湖泊等自然地物。具体的,本申请实施例中遥感影像数据中的目标遥感影像数据可以是遥感影像数据中的小部分遥感影像数据。
具体的,本申请实施例中,使用迭代训练与预设的方法提取新样本数据,根据样本数据进行模型训练,得到初级预测模型;对目标遥感影像数据以外的遥感影像数据逐一执行预测优化处理,将满足第二预设条件的预测样本数据和对应的遥感影像数据训练初级预测模型;不断重复上述步骤,直至满足第三预设条件,得到优化预测模型;利用训练好的优化预测模型预测遥感影像,得到样本标记数据。
具体的,本申请实施例中,根据样本数据进行模型训练,可以根据不同的地物类别选择不同的模型进行训练;例如,在一些具体示例中,对于道路、水面、建筑物等样本的提取可以选择深度监督显著(Deeply Supervised Salient,DSS)模型或者RCF模型,在另一些可能的示例中,对于风车、油管等可以使用Yolo模型。
具体的,本申请实施例中,可以将标注数据和对应的遥感影像数据保存到遥感影像样本样本库。具体的,本申请实施例中,标注样本数据是以矢量格式保存的矢量标注样本数据。
步骤104,在遥感影像样本库中的存在满足第一预设条件的样本数据的情况下,提取遥感影像样本库中的样本数据,进行模型训练、遥感影像数据预测和优化处理,按照第二预设规则提取增量样本,将增量样本更新至样本库中。
具体的,本申请实施例中,获取到经过预处理后的遥感影像数据。具体的,本申请实施例中,在样本数据为第一类标注样本数据的情况下,根据标注样本数据对应的遥感影像数据的地理空间位置裁切标注样本数据对应的遥感影像数据,生成相同大小的遥感影像块;类标注样本数据为样本数据对应的目标对象在遥感影像数据中分布小于或等于第三预设阈值的标注样本数据;或者,在样本数据为第二类标注样本数据的情况下,按照从左到右、从上到下的顺序裁切标注样本数据对应的遥感影像数据,生成相同大小的遥感影像块;第二类标注样本数据为标注样本数据对应的目标对象在遥感影像数据中分布大于或等于第四预设阈值的标注样本数据。
在一些具体示例中,第一类标注样本数据可以是稀疏样本数据,具体的,稀疏样本数据为遥感影像数据中分布较为稀疏的样本数据,例如风车、油管、高尔夫球场等分布较少的地物。
在一些具体示例中,第二类标注样本数据可以是非稀疏样本数据,具体的,非稀疏样本数据为遥感影像数据中分布密集的样本数据,例如道路、建筑、农田等地物。
具体的,本申请实施例中,进行机器学习模型训练、遥感影像数据预测和优化处理,将样本数据更新至样本库中,包括:根据样本数据进行模型训练,得到预测模型;使用上述预测模型对为未标记遥感影像进行预测优化处理,得到符合第四预设条件的预测样本数据;将上述符合第二预设规则的增量样本数据更新到样本库中。
具体的,本申请实施例中,可以将符合精度的标注数据和对应的遥感影像数据更新到遥感影像样本数据库。
本申请实施例提供的遥感影像样本库的建立与更新的处理方法,通过建立遥感影像样本库,用来保存样本数据;再根据模型训练的需求,判断样本库中的样本数据是否满足预设条件,若不满足预设条件,则通过对获取遥感影像数据中的目标对象的进行少量标注,得到样本数据,使用迭代训练与预设的方法提取新样本数据,更新样本库;若满足预设条件,则提取样本库中的样本数据,进行机器学习模型训练、遥感影像数据预测和优化处理,将样本数据更新至样本库中。解决了相关技术中人工标注遥感影像数据,标注效率低,标注结果不准确,效果不理想的问题;提高了对遥感影像数据标注的准确性和标注效率,提高了样本库建立的效率,节省了人力成本;方便了样本数据库的管理,提高了从样本数据库中提取标注样本矢量数据和遥感影像数据的效率
图2是本申请另一实施例提供的遥感影像样本库的建立与更新方法的实现流程图。
基于前述实施例,参照图2所示,本申请另一实施例提供的遥感影像样本库的建立与更新方法,包括以下步骤:
步骤201,遥感影像样本库中的存在不满足第一预设条件的样本数据。
具体的,本申请实施例中,样本库中的样本数据不符合模型训练的需求,可能是样本库中没有该类样本数据或者是样本数据数量和质量不符合需求。
步骤202,获取遥感影像数据中的目标对象的进行少量标注,得到样本数据。
具体的,本申请实施例中,预处理包括以下处理中的至少一种:正射校正、影像融合、位深变换、影像匀色和影像镶嵌。
具体的,本申请实施例中以目标对象为大棚作为一种具体示例进行说明,使用少量标注的大棚样本数据进行深度学***移、镜像等方法对训练数据进行扩增,增加样本数据。
步骤203,根据样本数据进行模型训练,得到初级预测模型。
具体的,本申请实施例中根据步骤202中标记的少量大棚的矢量标记数据文件和对应的遥感影像数据训练模型,得到大棚的初级预测模型。具体的,本能申请实施例中,使用DSS深度学习网络进行遥感影像大棚提取,DSS模型是在VGGNet模型上进行改进,增加了从较深侧输出到较浅侧输出的几个短连接。通过这种方式,更高级别的功能可以帮助降低侧面输出以更好地定位显着区域,而较低级别的功能可以帮助丰富更高级别的侧面输出和更精细的细节。将人工标注后的初始大棚样本数据输入DSS模型中进行大棚特征提取训练,学习训练得到大棚的初级预测模型。
步骤204,对目标遥感影像数据以外的遥感影像数据逐一执行预测优化处理,将满足第二预设条件的预测样本数据和对应的遥感影像数据训练初级预测模型。
具体的,本申请实施例中,当前处理的遥感影像数据可以是目标遥感影像数据以外的任意一个遥感影像数据;在对当前处理的遥感影像数据进行预测处理后,判断通过初级预测模型对当前处理的遥感影像数据进行预测标注的标注数据是否满足第一预设条件,以满足第一预设条件的预测标注数据和对应的遥感影像数据训练初级预测模型。具体的,本申请实施例中,第二预设条件可以是对预测标注数据进行筛选的条件,例如,在一些具体示例中,初级预测模型对遥感影像数据的预测标注结果可能并不准确,需要将预测不准确的预测标注数据剔除,以预测较为准确的预测标注数据作为模型训练的输入数据对预测模型继续训练,以提高预测模型对遥感影像数据处理的准确性。具体的,本申请实施例中,第二预设条件可以根据用户的实际应用需求进行设置,本申请实施例中,对第二预设条件不作具体限定。
具体的,本申请实施例中,在预测样本数据满足第二预设条件的情况下,以预测样本数据训练初级预测模型,包括:
(1)根据预测样本数据的属性信息,构建预测样本数据的类型规则集,属性信息包括以下信息中的至少一种:预测样本数据对应的遥感影像数据的遥感指数、样本形状、结构、纹理、样本空间拓扑关系;
(2)依据规则集计算预测样本数据的置信度;
(3)置信度筛选预测样本数据。
在一些可选方式中,根据预测样本数据的属性信息,构建预测样本数据的类型规则集之前,方法还包括:
在目标对象为第一类对象的情况下,接收对目标对象的轮廓的第一处理,并删除预测样本数据对应的遥感影像数据中的离散点和空洞;或者,在目标对象为第二类对象的情况下,接收对目标对象的轮廓的第二处理。
在一些可选方式中,第一处理包括:轮廓腐蚀膨胀操作和轮廓平滑操作;第二处理包括:轮廓腐蚀膨胀操作和轮廓优化操作;
其中,轮廓腐蚀膨胀操作包括:使用特点大小的算子卷积处理预测样本数据,完成预测样本开运算。卷积处理预测样本数据对应的遥感影像数据,获取遥感影像数据的局部最大值和最小值;根据局部最大值和最小值,开运算处理预测样本;
轮廓平滑操作包括:断开预测样本遥感影像数据对应的轮廓中的连接小于等于第一预设阈值的连接,并删除预测样本遥感影像数据对应的轮廓中凸出度小于第二预设阈值的凸出部分。
轮廓优化操作包括:根据第二类对象的轮廓边界特征,对目标边界进行特定优化操作。
具体的,本申请实施例中,第一预设阈值和第二预设阈值可以根据用户对遥感影像数据的实际处理需求进行设置,本申请实施例中,对第一预设阈值和第二预设阈值不作具体限定。
具体的,本申请实施例中,使用训练的初级预测模型对其它未标记的遥感影像区域进行预测,得到大棚预测结果。在一些具体示例中,将未标记的影像裁切为800*800的预测数据,为了保证预测结果的边界准确性,相邻两张的数据之间重叠50个像元的边界,将全部800*800的遥感影像数据进行预测得到预测结果数据,然后将所有预测结果数据拼接为裁切前大小的影像,若预测结果精度较高,则直接将预测结果输入DSS模型中继续进行训练,若精度较低则需要进行样本筛选处理。
在一些具体示例中,对大棚的预测结果数据进行样本筛选工作,包括错提样本剔除和样本边界优化处理。具体的,本申请实施例中,使用样本形状要素对提取的大棚结果进行错误剔除,大棚形状比较规整,多为矩形,利用矩形长宽比构建规则集,将不符合条件的提取结果进行剔除。然后利用规则进行样本边界优化,由于大棚为人造地物,边界比较规整,可以进行样本边界优化。先是利用膨胀腐蚀算法消除样本噪声,先腐蚀后膨胀可达到删除不包含结构元素的对象区域,平滑对象轮廓,断开狭小的连接,去掉细小的凸出部分;再利用大棚边界比较规整的原则对提取结果进行处理,先去除大棚多边形内角中的大钝角和尖锐角,保持多边形矩形形状,再调整多边形中可能与其垂直或平行的边,最后通过提取大棚结果栅格图中的角点,调整多边形角点位置,通过线性拟合多边形边界,调整多边形边界位置,使其边界更加符合实际情况;若经过筛选后的大棚样本精度不高,可以通过人工干预处理提高样本精度。
在一些具体示例中,将筛选后的大棚样本预测结果数据作为样本输入DSS模型中继续训练模型。具体的,首先,将提取的大棚矢量标注数据及其对应的遥感影像数据进行样本制作,得到800*800大小的样本数据;与模型初始训练中的样本格式保持一致,然后将800*800大小的大棚矢量标注数据及其对应的遥感影像数据输入到DSS网络中进行训练,再利用训练的DSS模型对其它未标记区域的影像数据进行预测,如果预测结果较好,可以继续进行训练学习,如果预测结果不理想则可以使用边界优化和人工干预处理。
步骤205,不断重复步骤204,直至满足第三预设条件,得到优化预测模型。
具体的,在一些具体示例中,第三预设条件可以是预测优化循环处理的循环次数;在另一些具体示例中,第三预设条件也可以是初级预测模型对第一遥感影像数据进行预测的准确率。本申请实施例中,对第三预设条件的具体形式也不作限定。
具体的,在一些具体示例中,不断重复步骤205,直到大棚预测模型预测的大棚精度符合需求,得到优化大棚预测模型。
步骤206,利用训练好的优化预测模型预测遥感影像,得到样本标记数据。
具体的,本申请实施例中,通过优化预测模型标注的遥感影像数据可以是目标遥感影像数据,通过优化预设模型在一次对目标遥感影像数据进行标注,提高了目标遥感影像数据中目标对象标注的准确性;在一些可能的示例中,通过优化预测模型标注的遥感影像数据也可以是除目标遥感影像数据之外的其他遥感影像数据,通过优化预测模型对遥感影像数据进行标注,提高了遥感影像数据的标注效率和标注准确率。
步骤207,将样本数据更新至样本库中。
本申请实施例中,通过标注少量的遥感影像数据,训练出初级预测模型;再利用初级预测模型预测遥感影像数据,根据满足条件的预测结果对初级预测模型进行重复训练,得到优化训练模型,利用优化后的训练模型对遥感影像数据进行标注,并将标注数据和对应的遥感影像数据更新至数据库中。解决了相关技术中人工标注遥感影像数据,标注效率低,标注结果不准确,效果不理想的问题;提高了对遥感影像数据标注的准确性和标注效率,提高了样本库建立的效率,节省了人力成本。
图3是本申请另一实施例提供的遥感影像样本库的建立与更新方法的实现流程图。
基于前述实施例,参照图3所示,本申请另一实施例提供的遥感影像样本库的建立与更新方法,包括以下步骤:
步骤301,遥感影像样本库中的存在满足第一预设条件的样本数据。
具体的,本申请实施例中,样本库中的样本数据符合模型训练的需求,即样本数据数量和质量符合模型训练的需求。
步骤302,提取样本库中的样本数据,制作样本数据。
具体的,本申请实施例中,以目标对象为大棚作为一种具体示例进行说明,在大棚样本库的应用中,大棚的分布比较集中,为稀疏样本,从样本库中提取出大棚所对应的标注样本矢量数据,然后按照大棚标注矢量数据所在区域进行影像裁切,生成800*800大小的影像块,并生成相对于的800*800大小标记文件,在样本标签中大棚区域值为255,其它区域的值为0。
步骤303,根据样本数据进行模型训练,得到预测模型。
具体的,本申请实施例中,根据从样本库中提取的大棚的矢量标记数据文件和对应的遥感影像数据训练模型,得到大棚的预测模型。
步骤304,遥感影像数据预测和优化处理,得到样本标记数据。
具体的,本申请实施例中,使用大棚预测模型对为未标记遥感影像进行预测和优化处理,得到符合第四预设条件的预测样本数据;具体的,本申请实施例中,第四预设条件与实施案例2中的第二预设条件相同。
步骤305,按照第二预设规则提取增量样本,将增量样本更新至所述样本库中。
具体的,本申请实施例中,对预测大棚结果进行样本筛选,若预测结果良好可以直接将大棚提取结果作为样本更新到数据库中。具体的,在一些具体示例中,第二预设规则是指所提取的样本准确率符合应用需求。
本申请实施例中,通过提取样本库中的样本数据,训练出预测模型;再利用预测模型对遥感影像数据进行标注,并将标注数据和对应的遥感影像数据更新至数据库中。解决了相关技术中人工标注遥感影像数据,标注效率低,标注结果不准确,效果不理想的问题;提高了对遥感影像数据标注的准确性和标注效率,提高了样本库建立的效率,节省了人力成本。

Claims (12)

1.一种遥感影像样本库的建立与更新方法,其特征在于,包括:
(1)在接收到建立遥感影像样本库的操作指令时,根据第一预设规则建立所述遥感影像样本库;
(2)在接收到从所述遥感影像样本数据库中提取指令时,根据提取需求,判断样本库中是否存在满足第一预设条件的样本数据;
(3)在所述遥感影像样本库中不存在满足第一预设条件的样本数据的情况下,接收对遥感影像数据中第一对象的标注,根据所述标注,使用迭代训练与预设的方法提取遥感影像数据中第二对象,以更新所述遥感影像样本库;
(4)在所述遥感影像样本库中的存在满足第一预设条件的样本数据的情况下,提取所述遥感影像样本库中的样本数据,进行模型训练、遥感影像数据预测和优化处理,按照第二预设规则提取增量样本,将所述增量样本更新至所述样本库中。
2.根据权利要求1所述的方法,其特征在于,所述根据第一预设规则建立所述遥感影像样本库,包括:
(S1)将所述遥感影像样本库保存为空间数据库;
(S2)将所述空间数据库中的数据表结构设计为:影像ID、影像来源、影像地理位置、影像波段数、影像分辨率、成像时间、样本种类等;
其中,所述第一预设规则为按照需求将样本数据按照预设分幅格式或者第一预设大小数据块保存样本数据,所述按照标准分幅保存的样本数据为根据深度学习应用需求生产的样本数据,所述第一预设大小数据块保存样本数据为直接使用样本数据进行训练。
3.根据权利要求1所述的方法,其特征在于,所述根据提取需求,判断样本库中是否存在满足第一预设条件的样本数据,包括:
根据所述样本种类判断样本库中是否存在符合深度学习模型训练需求的样本数据;所述第一预设条件为所述样本库中样本数据的数量和质量是否符合深度学习模型训练需求。
4.根据权利要求1所述的方法,其特征在于,所述接收对所述遥感影像数据中的第一对象的标注,根据所述标注,使用迭代训练与预设的方法提取遥感影像数据中第二对象;包括:
(T1)获取经过预处理的遥感影像数据;
(T2)对所述遥感影像数据中的目标遥感影像数据中的目标对象进行标注得到样本数据;
(T3)根据样本数据进行模型训练,得到初级预测模型;
(T4)对所述目标遥感影像数据以外的遥感影像数据逐一执行预测和优化处理,将满足第二预设条件的预测样本数据和对应的遥感影像数据训练初级预测模型;
(T5)不断重复步骤T4,直至满足第三预设条件,得到优化预测模型;
(T6)利用训练好的优化预测模型预测遥感影像,得到样本标记数据;
其中,第一对象为标注得到的样本数据,第二对象为第一对象以外的未标注的样本数据。
5.根据权利要求4所述的方法,其特征在于,所述预测和优化处理,将满足第二预设条件的预测标注数据和对应的遥感影像数据训练初级预测模型,包括:
(M1)根据所述预测样本数据的属性信息,构建所述预测样本数据的类型规则集,所述属性信息包括以下信息中的至少一种:所述预测样本数据对应的所述遥感影像数据的遥感指数、样本形状、结构、纹理、样本空间拓扑关系;
(M2)依据所述规则集计算所述预测样本数据的置信度;
(M3)根据所述置信度筛选所述预测样本数据。
6.根据权利要求5所述的方法,其特征在于,所述根据所述预测样本数据的属性信息,构建所述预测样本数据的类型规则集,所述方法还包括:在所述目标对象为第一类对象的情况下,接收对所述目标对象的轮廓的第一处理,删除所述预测样本数据中的离散点和空洞;或者,在所述目标对象为第二类对象的情况下,接收对所述目标对象的轮廓的第二处理。
7.根据权利要求6所述的方法,其特征在于,所述第一处理包括:轮廓腐蚀膨胀操作和轮廓平滑操作;所述第二处理包括:轮廓腐蚀膨胀操作和轮廓优化操作。
8.根据权利要求7所述的方法,其特征在于,所述轮廓腐蚀膨胀操作包括:使用特点大小的算子卷积处理所述预测样本数据,完成所述预测样本开运算;所述轮廓平滑操作包括:断开所述预测样本对应的轮廓中的连接小于或等于第一预设阈值的连接,并删除所述预测样本对应的轮廓中凸出度小于第二预设阈值的凸出部分。
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述地理区域内存在土地利用现状矢量图的情况下,将所述土地利用现状矢量图和对应的遥感影像数据添加至样本库中。
10.根据权利要求10所述的方法,其特征在于,所述土地利用现状矢量图为预设时间段内的土地利用矢量图,所述预设时间段为位于获取所述遥感影像数据的时刻之前,且与获取所述遥感影像的时刻间隔在预设间隔内的时间段。
11.根据权利要求1所述的方法,其特征在于,所述提取所述样本库中的样本数据,包括:
在所述样本数据为第一类标注样本数据的情况下,根据所述标注样本数据对应的遥感影像数据的地理空间位置裁切所述标注样本数据对应的遥感影像数据,生成相同大小的遥感影像块;所述第一类标注样本数据为所述样本数据对应的目标对象在遥感影像数据中分布小于或等于第三预设阈值的标注样本数据;或者,
在所述样本数据为第二类标注样本数据的情况下,按照从左到右、从上到下的顺序裁切所述标注样本数据对应的遥感影像数据,生成相同大小的遥感影像块;所述第二类标注样本数据为所述标注样本数据对应的目标对象在遥感影像数据中分布大于或等于第四预设阈值的标注样本数据。
12.根据权利要求1所述的方法,其特征在于,所述提取所述遥感影像样本库中的样本数据,进行模型训练、遥感影像数据预测和优化处理,按照第二预设规则提取增量样本,将所述增量样本更新至所述样本库中,包括:
(N1)根据所述样本数据进行模型训练,得到预测模型;
(N2)使用上述预测模型对为未标记的遥感影像进行预测和优化处理,得到符合第四预设条件的预测样本数据;
(N3)将上述预测样本数据中精度满足预设精度的样本数据更新到样本库中。
CN201911372783.5A 2019-12-27 2019-12-27 一种遥感影像样本库的建立与更新方法 Active CN111144487B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911372783.5A CN111144487B (zh) 2019-12-27 2019-12-27 一种遥感影像样本库的建立与更新方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911372783.5A CN111144487B (zh) 2019-12-27 2019-12-27 一种遥感影像样本库的建立与更新方法

Publications (2)

Publication Number Publication Date
CN111144487A true CN111144487A (zh) 2020-05-12
CN111144487B CN111144487B (zh) 2023-09-26

Family

ID=70521152

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911372783.5A Active CN111144487B (zh) 2019-12-27 2019-12-27 一种遥感影像样本库的建立与更新方法

Country Status (1)

Country Link
CN (1) CN111144487B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112884791A (zh) * 2021-02-02 2021-06-01 重庆市地理信息和遥感应用中心 一种构建大规模遥感影像语义分割模型训练样本集的方法
CN113223042A (zh) * 2021-05-19 2021-08-06 自然资源部国土卫星遥感应用中心 一种遥感影像深度学习样本智能采集方法及设备
CN113705593A (zh) * 2020-05-21 2021-11-26 孙民 产生训练数据的方法及电子装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105279519A (zh) * 2015-09-24 2016-01-27 四川航天***工程研究所 基于协同训练半监督学习的遥感影像水体提取方法及***
CN108764263A (zh) * 2018-02-12 2018-11-06 北京佳格天地科技有限公司 遥感影像的地物标注装置及方法
CN108921025A (zh) * 2018-06-01 2018-11-30 苏州中科天启遥感科技有限公司 一种协同变化检测的对象级分类样本自动选择方法
CN109670060A (zh) * 2018-12-10 2019-04-23 北京航天泰坦科技股份有限公司 一种基于深度学习的遥感影像半自动化标注方法
CN110298348A (zh) * 2019-06-12 2019-10-01 苏州中科天启遥感科技有限公司 遥感影像建筑物样本区域提取方法及***、存储介质、设备
CN110309809A (zh) * 2019-07-09 2019-10-08 广西壮族自治区基础地理信息中心 基于深度神经网络的高分辨率遥感卫星影像甘蔗提取方法
CN110502654A (zh) * 2019-08-26 2019-11-26 长光卫星技术有限公司 一种适用于多源异构遥感数据的目标库生成***

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105279519A (zh) * 2015-09-24 2016-01-27 四川航天***工程研究所 基于协同训练半监督学习的遥感影像水体提取方法及***
CN108764263A (zh) * 2018-02-12 2018-11-06 北京佳格天地科技有限公司 遥感影像的地物标注装置及方法
CN108921025A (zh) * 2018-06-01 2018-11-30 苏州中科天启遥感科技有限公司 一种协同变化检测的对象级分类样本自动选择方法
CN109670060A (zh) * 2018-12-10 2019-04-23 北京航天泰坦科技股份有限公司 一种基于深度学习的遥感影像半自动化标注方法
CN110298348A (zh) * 2019-06-12 2019-10-01 苏州中科天启遥感科技有限公司 遥感影像建筑物样本区域提取方法及***、存储介质、设备
CN110309809A (zh) * 2019-07-09 2019-10-08 广西壮族自治区基础地理信息中心 基于深度神经网络的高分辨率遥感卫星影像甘蔗提取方法
CN110502654A (zh) * 2019-08-26 2019-11-26 长光卫星技术有限公司 一种适用于多源异构遥感数据的目标库生成***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
邵振峰;张源;黄昕;朱秀丽;吴亮;万波;: "基于多源高分辨率遥感影像的2 m不透水面一张图提取" *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113705593A (zh) * 2020-05-21 2021-11-26 孙民 产生训练数据的方法及电子装置
CN112884791A (zh) * 2021-02-02 2021-06-01 重庆市地理信息和遥感应用中心 一种构建大规模遥感影像语义分割模型训练样本集的方法
CN113223042A (zh) * 2021-05-19 2021-08-06 自然资源部国土卫星遥感应用中心 一种遥感影像深度学习样本智能采集方法及设备

Also Published As

Publication number Publication date
CN111144487B (zh) 2023-09-26

Similar Documents

Publication Publication Date Title
US11727163B2 (en) System and method for construction estimation using aerial images
CN111144487A (zh) 一种遥感影像样本库的建立与更新方法
CN102289991B (zh) 一种基于视觉变量的地图注记自动分类配置方法
CN113223042B (zh) 一种遥感影像深度学习样本智能采集方法及设备
CN110083720B (zh) 实景语义结构模型的构建方法及装置
Gold et al. Map generalization by skeleton retraction
CN116994140A (zh) 基于遥感影像的耕地提取方法、装置、设备和介质
CN108765445B (zh) 一种肺气管分割方法及装置
CN110688756B (zh) 一种采集和制图一体化的竣工图制作方法
US20220391553A1 (en) Building information modeling systems and methods
CN115546116A (zh) 全覆盖式岩体不连续面提取与间距计算方法及***
CN111414907A (zh) 数据集标注方法、数据集标注装置和计算机可读存储介质
CN112990001A (zh) 应用于数字征迁的遥感影像单体建筑快速精准提取方法
CN112991490A (zh) 信息化的海图生产方法及***
CN113158856A (zh) 一种提取遥感图像中目标区域的处理方法和装置
Tan et al. Semantic enrichment for rooftop modeling using aerial LiDAR reflectance
CN109166183B (zh) 一种解剖标志点识别方法及识别设备
CN116343254A (zh) 剖面图识别方法、装置、电子设备和存储介质
CN115761782A (zh) 一种道路工程图纸标题栏信息提取方法
CN115600732A (zh) 一种基于大数据分析的城市规划方法及***
Chen et al. A new DEM generalization method based on watershed and tree structure
CN116956837A (zh) 工程量清单的项目确定方法及确定装置
CN116956838A (zh) 工程量清单的项目确定方法及确定装置
CN114565730A (zh) 地图矢量样本的处理方法、设备和计算机可读存储介质
CN111382645B (zh) 电子地图中识别过期建筑的方法和***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant