CN117349462A - 一种遥感智能解译样本数据集生成方法 - Google Patents
一种遥感智能解译样本数据集生成方法 Download PDFInfo
- Publication number
- CN117349462A CN117349462A CN202311662340.6A CN202311662340A CN117349462A CN 117349462 A CN117349462 A CN 117349462A CN 202311662340 A CN202311662340 A CN 202311662340A CN 117349462 A CN117349462 A CN 117349462A
- Authority
- CN
- China
- Prior art keywords
- sample
- data
- sample set
- vector
- change detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000012545 processing Methods 0.000 claims abstract description 28
- 238000002372 labelling Methods 0.000 claims abstract description 22
- 230000011218 segmentation Effects 0.000 claims description 65
- 230000008859 change Effects 0.000 claims description 63
- 238000001514 detection method Methods 0.000 claims description 59
- 238000012216 screening Methods 0.000 claims description 23
- 230000005540 biological transmission Effects 0.000 claims description 21
- 238000012795 verification Methods 0.000 claims description 20
- 238000011156 evaluation Methods 0.000 claims description 13
- 239000011159 matrix material Substances 0.000 claims description 13
- 238000012937 correction Methods 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000003062 neural network model Methods 0.000 claims description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 238000013523 data management Methods 0.000 claims description 3
- 238000011835 investigation Methods 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 abstract description 5
- 238000012549 training Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 244000025254 Cannabis sativa Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/55—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/70—Labelling scene content, e.g. deriving syntactic or semantic representations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Library & Information Science (AREA)
- Medical Informatics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本申请属于遥感影像技术领域,具体公开了一种遥感智能解译样本数据集生成方法,包括:对标注矢量的属性表进行处理;对影像数据和已有的标注矢量进行处理,将标注矢量转为栅格并将其与影像数据进行对齐;将设置好的影像数据进行切割,使用栅格处理工具对数据进行处理,生成大规模样本集;对样本集进行挑选;将样本集进行整理,并按区域进行命名。本申请利用已有的标注矢量数据,通过挖掘矢量数据和遥感影像之间的关系,批量化生产样本,大幅提升了数据集的规模,提升了效率,降低了制作样本集成本。
Description
技术领域
本申请涉及一种遥感智能解译样本数据集生成方法,属于遥感影像技术领域。
背景技术
遥感作为一项对地观测综合性技术,具有探测范围广、采集数据快、获取数据综合性与动态性强等特征,在山水林田湖草沙冰等自然资源监测工作中有其他技术无法比拟的优势,但是依靠传统人机交互进行识别解译,不仅效率较低,而且过多主观判断的加入也容易导致标准执行不统一,为了解决自然资源要素解译生产工作量大、人工采集耗费时间长等问题,需要引入人工智能等先进技术。目前大部分人工智能遥感智能解译大多采取监督学习的方法,利用监督学习的方法对海量遥感数据进行智能解译的基础是对同样海量的特定解译对象已标注样本的训练工作,因此建立遥感智能解译样本数据集非常重要,是实现遥感智能解译的首要条件。
目前大多数的遥感智能解译样本数据集生成方法是依靠传统人机交互解译、定性评价,再对遥感影像和标注矢量结果进行切分得到数据集,但是这样的方法耗时耗力,效率低下,质量难以保证,难以构建大规模的样本集。
发明内容
本发明的目的在于克服现有技术样本解译效率低的缺陷,提供了一种遥感智能解译样本数据集生成方法。
本申请提供了一种遥感智能解译样本数据集生成方法,该方法利用已有的标注矢量数据,通过挖掘矢量数据和遥感影像中像元和具体标注信息之间的关系,批量化生产样本,大幅提升了数据集的规模,提升了效率,降低了制作样本集成本。
所述遥感智能解译样本数据集生成方法,包括变化检测样本集的生成和语义分割样本集的生成,包括以下步骤:
步骤1:对标注矢量的属性表进行处理;
步骤2:对影像数据和影像数据已有的标注矢量进行处理,将标注矢量转为栅格并将其与影像数据进行对齐,得到已处理影像数据;
步骤3:将已处理影像数据进行切割,使用栅格处理工具对数据进行处理,生成大规模样本集;
步骤4:对样本集进行挑选;
步骤5:将样本集进行整理,并按区域进行命名。
可选地,所述步骤2中,对于变化检测样本:
所述影像数据包括两景影像,并保证所述两景影像的像元大小和空间参考坐标保持一致;所述影像数据和已有的标注矢量进行处理包括:
将两景影像进行裁剪,所述裁剪是以行列更小的为基准进行裁剪或根据地图边界进行裁剪;
使用ArcMap数据管理工具中的合并功能,将所有的变化矢量图层进行合并;
对合并的矢量图层添加面矢量,得到分类矢量;
所述步骤1和步骤2中,对于语义分割样本:
所述的标注矢量选自第三次全国国土调查,并按照预先设置的类别对标注矢量进行处理;所述影像数据和已有的标注矢量进行处理包括:使用ArcMap转换工具中的面转栅格功能将标注矢量图层转换为栅格数据。
可选地,所述类别至少包括耕地、园地、林地、草地、建设用地、道路、水体以及其他用地。
可选地,所述步骤1中,对于变化检测样本,所述标注矢量的属性表进行处理包括:为分类矢量图层属性表添加字段,并使用字段计算器批量赋值,设置变化灰度值、未变化灰度值以及影像区域外的灰度值;
所述步骤1中,对于语义分割样本,所述标注矢量的属性表进行处理包括:栅格数据中各类别的像元灰度值设置为不同的大小并设置影像区域外灰度值。
可选地,所述步骤3中,影像数据进行切割包括:使用栅格空间数据转换库对栅格数据进行处理,使用预设的固定分辨率对整个栅格数据进行自动化切割,生成固定分辨率的样本。
可选地,所述切割的顺序是从左上到右下依次对数据进行切割,切割窗口分辨率设置为512*512。
可选地,在切割时通过分割越界模块判断边缘是否存在分割越界,若存在分割越界,则舍弃边缘越界的样本;
所述分割越界模块包括判断单元、验证框单元和滑动窗口单元;
所述判断单元用于判断影像数据的大小;
所述验证框单元基于所述切割窗口设定,用于对分割边界进行检测;
所述滑动窗口单元设置在验证框单元上部,并在所述切割窗口内部按照预设轨迹滑动,用于判断分割边界是否越界。
可选地,所述步骤4中,通过样本筛选模块对样本进行挑选;
所述样本筛选模块包括传输单元和若干个筛选单元,每个所述筛选单元对应设置有一标记单元;
所述筛选单元用于读取每一样本的数值矩阵,并检测数值矩阵的灰度值;
所述标记单元用于标记每一样本的权值,并基于所述权值选择传输单元;
所述传输单元至少包括变化检测样本传输单元和语义分割样本传输单元;
所述筛选单元读取样本集中的每一个样本的数值矩阵,并检测数值矩阵的灰度值,所述标记单元对每一个样本进行权值标记,基于所述权值标记判断样本属性,所述样本属性包括变化检测样本和语义分割样本;所述变化检测样本传输单元将变化检测样本中未变化灰度值以及影像区域外的灰度值的样本全部剔除,得到变化检测样本集;所述语义分割样本传输单元将语义分割样本中影像区域外灰度值的样本全部剔除,得到语义分割样本集。
可选地,利用神经网络模型分别对所述变化检测样本集和语义分割样本集进行评估和修正,输出数据集;
所述神经网络模型内置有分割评估模块、检测评估模块和样本集修正模块;
所述分割评估模块与所述分割越界模块连接,用于将所述变化检测样本集和语义分割样本集的样本进行边缘越界判断,若存在分割边缘越界,则舍弃边缘越界的样本,所述样本集修正模块更新所述变化检测样本集和语义分割样本集;
所述检测评估模块与样本筛选模块连接,用于将所述变化检测样本集中未变化灰度值以及影像区域外的灰度值的样本全部剔除,所述样本集修正模块更新变化检测样本集;以及,将语义分割样本集中影像区域外灰度值的样本全部剔除,所述样本集修正模块更新语义分割样本集。
本申请能产生的有益效果包括:
1、本发明利用已有的标注矢量数据,通过挖掘矢量数据和遥感影像之间的关系,批量化生产样本,大幅提升了数据集的规模,提升了效率,降低了制作样本集成本。
2、本发明通过样本挑选算法对生成的样本进行处理,提升样本的质量,清除了非影像数据以及非变化数据,确保样本集的质量,大大降低了人工成本,提升了样本质量。
3、本发明通过深度学习算法以迭代的方式提升样本集的可用性,使用变化检测、语义分割等算法对生成的样本进行训练、测试,对于样本集中有问题的样本进行修改,不断对样本集进行改进,确保样本可以用于后期的行业应用。
4、本发明利用地学分析库,可以快速、批量裁剪影像和标注数据,并可以去除地理坐标等敏感信息,减少冗余操作,提高样本集的安全性。
附图说明
图1为本发明的遥感智能解译样本数据集生成方法示意图;
图2 为本发明样本筛选方法示意图;
图3为本发明变化检测算法召回率变化示意图;
图4为本发明变化检测算法精准率变化示意图;
图5为本发明语义分割样本集结果示意图;
图6为本发明变化检测样本集结果示意图;
图7为本发明中进行边缘检测时的示意图;
其中,图3和图4为本发明提供的深度学习模型训练结果图,即该模型在训练过程中,通过不断的迭代得到的召回率和精确率的曲线图。
具体实施方式
为了使本发明的目的、技术方案、设计方法及优点更加清楚明了,以下结合附图通过具体实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。
如图1所示,本发明提供了一种遥感智能解译样本数据集生成方法,用于生成通用变化检测和语义分割样本集流程图,其输入为遥感原始影像和标注矢量,经过数据处理,样本生成,样本质量提升,输出目标样本集;包括变化检测样本集的生成和语义分割样本集的生成,包括以下步骤:
S1:对标注矢量的属性表进行处理,对于变化检测样本,将变化灰度值设置为255,未变化灰度值设置为0,对于影像区域外的灰度值设置为200特殊值便于后期筛选,对于语义分割样本,将耕地、园地、林地、草地、建设用地、道路、水体以及其他用地的灰度值分别设置为30,60,90,120,150,180,210以及240。
S2:对影像和S1中处理好的标注矢量进行处理,将矢量转为栅格并将其与影像数据进行对齐,其中,对齐包括像元大小和行列大小。
S3:将S2中处理好的栅格数据进行切割,使用栅格处理工具对数据进行处理,生成大规模样本,采用从左上到右下的顺序,依次对数据进行切割,为了使用方便,将切割窗口大小设置为512*512,遇到边缘部分可能存在分割越界情况,故添加是否超出边界判断条件,若切割数据范围超过边界,则进行舍弃,在本实施例中,通过分割越界模块判断边缘是否存在分割越界,具体的,所述分割越界模块包括判断单元、验证框单元和滑动窗口单元;
所述判断单元用于判断影像数据的大小;
所述验证框单元基于所述切割窗口设定,用于对分割边界进行检测;
所述滑动窗口单元设置在验证框单元上部,并在所述切割窗口内部按照预设轨迹滑动,用于判断分割边界是否越界。
在上述中,所述验证框单元基于所述切割窗口设定是指:通过获取切割窗口的配置参数,将所述配置参数应用在所述验证框单元,其中,配置参数仅包含了规则参数,也就是说,所述验证框单元具有所述切割窗口的规格参数(一般不能设置相同或者大于切割窗口的大小,在本申请中,由于切割后的影像样本图像是既定大小的,因此将影像样本图像输入至指定位置,且该位置的规格大小与影像样本图像一致,因此不需要进行位置的重复定位),或者是小于切割窗口的规格参数。
当所述验证框单元的规格小于切割窗口的规格参数时,在进行对分割边界检测时,将所述验证框单元沿切割后的影像样本图像的某一个边进行设置,并使得影像样本图像的边缘的部分位于验证框单元内;同时设定所述验证框单元沿滑动窗口单元的移动而同步移动,以使得所述滑动窗口单元在滑动检测过程中能够对影像样本图像进行全面覆盖检测。
其中,所述验证框单元为一正方形的验证框,以正方形的中心构成的横向设置的第一轴线和竖向设置的第二轴线交叉,且所述验证框单元以第一轴线沿影像样本图像横向边缘移动,以第二轴线进行竖向边缘移动。
附图7中是由A位置移动至B位置的示意图。
S4:对样本进行挑选,将影像区域外,以及未含有变化区域的样本剔除;如图2所示,将样本集中的每一个样本进行读取数值矩阵,对于变化检测样本集中的样本,将含有影像区域外数值200的全部去除,并将未含有变化数值255的全部去除,对于语义分割数据集,将含有影像区域外数值200的全部去除即可。在本实施例中,通过样本筛选模块对样本进行挑选;具体的,所述样本筛选模块包括传输单元和若干个筛选单元,每个所述筛选单元对应设置有一标记单元;
所述筛选单元用于读取每一样本的数值矩阵,并检测数值矩阵的灰度值;
所述标记单元用于标记每一样本的权值,并基于所述权值选择传输单元;
所述传输单元至少包括变化检测样本传输单元和语义分割样本传输单元;
所述筛选单元读取样本集中的每一个样本的数值矩阵,并检测数值矩阵的灰度值,所述标记单元对每一个样本进行权值标记,基于所述权值标记判断样本属性,所述样本属性包括变化检测样本和语义分割样本;所述变化检测样本传输单元将变化检测样本中未变化灰度值以及影像区域外的灰度值的样本全部剔除,得到变化检测样本集;所述语义分割样本传输单元将语义分割样本中影像区域外灰度值的样本全部剔除,得到语义分割样本集。
S5:训练深度神经网络模型。对于变化检测样本集,使用基于FCNN设计的端到端变化检测算法fully-convolutional-change-detection,将样本集全部划分为训练集对模型进行训练,使用SGD优化器,动量为0.9,采用小批量梯度下降的策略进行模型参数更新,每一次的迭代选取定量的数据进行训练,误差随着训练迭代次数的增加而减少,最后不断收敛,将训练好的模型对样本集进行测试并可视化效果,精确率和召回率曲线如图3、图4所示,对于模型结果与标注结果有较大的差距的进行判断后选择性删除样本。对于语义分割样本集,使用DeepLabv3+高分辨率遥感影像语义分割,它的编码器的主体是带有空洞卷积的DCNN,可以采用常用的分类网络如ResNet,带有空洞卷积的空间金字塔池化模块,主要是为了引入多尺度信息,相比DeepLabv3,v3+引入了Decoder模块,其将底层特征与高层特征进一步融合,提升分割边界准确度,训练策略与上文的变化检测样本集训练策略一致。在本实施例中,神经网络模型在对样本集进行测试的同时,还可以对样本集进行评估和修正,具体的,通过分割评估模块、检测评估模块和样本集修正模块实现;所述分割评估模块与所述分割越界模块连接,用于将所述变化检测样本集和语义分割样本集的样本进行边缘越界判断,若存在分割边缘越界,则舍弃边缘越界的样本,所述样本集修正模块更新所述变化检测样本集和语义分割样本集;
所述检测评估模块与样本筛选模块连接,用于将所述变化检测样本集中未变化灰度值以及影像区域外的灰度值的样本全部剔除,所述样本集修正模块更新变化检测样本集;以及,将语义分割样本集中影像区域外灰度值的样本全部剔除,所述样本集修正模块更新语义分割样本集。
S6:将样本进行整理,并按区域进行命名,得到高质量、高可用的大规模样本集,如图5和图6所示。
基于上述方法,本发明还具体公开了变化检测样本集和语义分割样本集的生成方法,其中变化检测样本集的生成方法包括:
步骤A1、查看两景影像的像元大小和空间参考坐标系是否一致,若不一致调整为一致的像元大小和空间参考;
步骤A2、将两景影像进行裁剪,以便大小对齐,一般裁剪是以行列更小的为基准进行裁剪,也可以根据地图边界进行裁剪;
步骤A3 、使用ArcMap数据管理工具中的合并功能,将所有的变化矢量图层进行合并;
步骤A4、 对合并的矢量图层添加面矢量,以便包含整个全图,得到分类矢量;
步骤A5 、为分类矢量图层属性表添加字段,并使用字段计算器批量赋值,图斑值设为0,外框值设为255,以便于分类;
步骤A6 、使用ArcMap转换工具中的面转栅格功能将分类矢量转换为栅格;
步骤A7 、为了修改value值进行重分类,不同数值代表不同类别,可以自定义设置,在变化检测中一般变化设置为0,未变化设置为255。
步骤A8 、为了修改像素通道和NoData值,使用复制栅格工具,一般变化标注使用单通道即可;
步骤A9、使用GDAL(栅格空间数据转换库)对栅格数据进行处理,使用预设的固定大小对整个栅格数据进行自动化切割,生成固定分辨率的样本,比如512*512;
步骤A10、对样本进行挑选,将影像区域外以及没有发生变化的样本全部剔除,只留下含有变化的样本,即,将含有影像区域外数值200的全部去除,并将未含有变化数值255的全部去除;
步骤A11、采用变化检测算法对生成的样本进行模型训练,并对样本进行测试,查看样本用于训练是否达到理想的效果。
语义分割样本集的生成方法包括以下步骤:
步骤B1、将三调中的标注矢量按照设计的类别进行处理;
步骤B2、使用ArcMap转换工具中的面转栅格功能将标注矢量图层转换为栅格数据;
步骤B3、将栅格数据中各类别的像元灰度值设置为不同的大小;
步骤B4、将标注矢量和遥感影像通过切割的方式进行行列对齐和像元大小对齐;
步骤B5、使用GDAL(栅格空间数据转换库)对栅格数据进行处理,使用预设的固定大小对整个栅格数据进行自动化切割,生成固定分辨率的样本;
步骤B6、对样本进行挑选,将影像区域外的样本全部剔除,只留下含有完整数据的样本;
步骤B7、采用语义分割算法对生成的样本进行模型训练,并对样本进行测试,查看样本用于训练是否达到理想的效果;
以上所述,仅是本申请的实施例,并非对本申请做任何形式的限制,虽然本申请以较佳实施例揭示如上,然而并非用以限制本申请,任何熟悉本专业的技术人员,在不脱离本申请技术方案的范围内,利用上述揭示的技术内容做出些许的变动或修饰均等同于等效实施案例,均属于技术方案范围内。
Claims (9)
1.一种遥感智能解译样本数据集生成方法,包括变化检测样本集的生成和语义分割样本集的生成,其特征在于,包括以下步骤:
步骤1:对标注矢量的属性表进行处理;
步骤2:对影像数据和影像数据已有的标注矢量进行处理,将标注矢量转为栅格并将其与影像数据进行对齐,得到已处理影像数据;
步骤3:将已处理影像数据进行切割,使用栅格处理工具对数据进行处理,生成大规模样本集;
步骤4:对样本集进行挑选;
步骤5:将样本集进行整理,并按区域进行命名。
2.根据权利要求1所述的一种遥感智能解译样本数据集生成方法,其特征在于,所述步骤2中,对于变化检测样本:
所述影像数据包括两景影像,并保证所述两景影像的像元大小和空间参考坐标保持一致;所述影像数据和已有的标注矢量进行处理包括:
将两景影像进行裁剪,所述裁剪是以行列更小的为基准进行裁剪或根据地图边界进行裁剪;
使用ArcMap数据管理工具中的合并功能,将所有的变化矢量图层进行合并;
对合并的矢量图层添加面矢量,得到分类矢量;
所述步骤1和步骤2中,对于语义分割样本:
所述的标注矢量选自第三次全国国土调查,并按照预先设置的类别对标注矢量进行处理;所述影像数据和已有的标注矢量进行处理包括:使用ArcMap转换工具中的面转栅格功能将标注矢量图层转换为栅格数据。
3.根据权利要求2所述的一种遥感智能解译样本数据集生成方法,其特征在于,所述类别至少包括耕地、园地、林地、草地、建设用地、道路、水体以及其他用地。
4.根据权利要求3所述的一种遥感智能解译样本数据集生成方法,其特征在于,所述步骤1中,对于变化检测样本,所述标注矢量的属性表进行处理包括:为分类矢量图层属性表添加字段,并使用字段计算器批量赋值,设置变化灰度值、未变化灰度值以及影像区域外的灰度值;
所述步骤1中,对于语义分割样本,所述标注矢量的属性表进行处理包括:栅格数据中各类别的像元灰度值设置为不同的大小并设置影像区域外灰度值。
5.根据权利要求4所述的一种遥感智能解译样本数据集生成方法,其特征在于,所述步骤3中,影像数据进行切割包括:使用栅格空间数据转换库对栅格数据进行处理,使用预设的固定分辨率对整个栅格数据进行自动化切割,生成固定分辨率的样本。
6.根据权利要求5所述的一种遥感智能解译样本数据集生成方法,其特征在于,所述切割的顺序是从左上到右下依次对数据进行切割,切割窗口分辨率设置为512*512。
7.根据权利要求6所述的一种遥感智能解译样本数据集生成方法,其特征在于,在切割时通过分割越界模块判断边缘是否存在分割越界,若存在分割越界,则舍弃边缘越界的样本;
所述分割越界模块包括判断单元、验证框单元和滑动窗口单元;
所述判断单元用于判断影像数据的大小;
所述验证框单元基于所述切割窗口设定,用于对分割边界进行检测;
所述滑动窗口单元设置在验证框单元上部,并在所述切割窗口内部按照预设轨迹滑动,用于判断分割边界是否越界。
8.根据权利要求7所述的一种遥感智能解译样本数据集生成方法,其特征在于,所述步骤4中,通过样本筛选模块对样本进行挑选;
所述样本筛选模块包括传输单元和若干个筛选单元,每个所述筛选单元对应设置有一标记单元;
所述筛选单元用于读取每一样本的数值矩阵,并检测数值矩阵的灰度值;
所述标记单元用于标记每一样本的权值,并基于所述权值选择传输单元;
所述传输单元至少包括变化检测样本传输单元和语义分割样本传输单元;
所述筛选单元读取样本集中的每一个样本的数值矩阵,并检测数值矩阵的灰度值,所述标记单元对每一个样本进行权值标记,基于所述权值标记判断样本属性,所述样本属性包括变化检测样本和语义分割样本;所述变化检测样本传输单元将变化检测样本中未变化灰度值以及影像区域外的灰度值的样本全部剔除,得到变化检测样本集;所述语义分割样本传输单元将语义分割样本中影像区域外灰度值的样本全部剔除,得到语义分割样本集。
9.根据权利要求8所述的一种遥感智能解译样本数据集生成方法,其特征在于,利用神经网络模型分别对所述变化检测样本集和语义分割样本集进行评估和修正,输出数据集;
所述神经网络模型内置有分割评估模块、检测评估模块和样本集修正模块;
所述分割评估模块与所述分割越界模块连接,用于将所述变化检测样本集和语义分割样本集的样本进行边缘越界判断,若存在分割边缘越界,则舍弃边缘越界的样本,所述样本集修正模块更新所述变化检测样本集和语义分割样本集;
所述检测评估模块与样本筛选模块连接,用于将所述变化检测样本集中未变化灰度值以及影像区域外的灰度值的样本全部剔除,所述样本集修正模块更新变化检测样本集;以及,将语义分割样本集中影像区域外灰度值的样本全部剔除,所述样本集修正模块更新语义分割样本集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311662340.6A CN117349462B (zh) | 2023-12-06 | 2023-12-06 | 一种遥感智能解译样本数据集生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311662340.6A CN117349462B (zh) | 2023-12-06 | 2023-12-06 | 一种遥感智能解译样本数据集生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117349462A true CN117349462A (zh) | 2024-01-05 |
CN117349462B CN117349462B (zh) | 2024-03-12 |
Family
ID=89371507
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311662340.6A Active CN117349462B (zh) | 2023-12-06 | 2023-12-06 | 一种遥感智能解译样本数据集生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117349462B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110363798A (zh) * | 2019-07-24 | 2019-10-22 | 宁波市测绘设计研究院 | 一种遥感影像解译样本集的生成方法 |
CN112884791A (zh) * | 2021-02-02 | 2021-06-01 | 重庆市地理信息和遥感应用中心 | 一种构建大规模遥感影像语义分割模型训练样本集的方法 |
CN113223042A (zh) * | 2021-05-19 | 2021-08-06 | 自然资源部国土卫星遥感应用中心 | 一种遥感影像深度学习样本智能采集方法及设备 |
CN114299394A (zh) * | 2021-12-30 | 2022-04-08 | 珠海涵辰科技有限公司 | 一种遥感影像智能解译方法 |
CN114625820A (zh) * | 2022-02-16 | 2022-06-14 | 武汉大学 | 一种面向人工智能遥感影像解译的样本库***及组织方法 |
CN115526801A (zh) * | 2022-10-09 | 2022-12-27 | 航天宏图信息技术股份有限公司 | 基于条件对抗神经网络的遥感影像自动匀色方法和装置 |
WO2023000159A1 (zh) * | 2021-07-20 | 2023-01-26 | 海南长光卫星信息技术有限公司 | 高分辨率遥感影像半监督分类方法、装置、设备及介质 |
CN115909059A (zh) * | 2022-11-11 | 2023-04-04 | 河北省自然资源利用规划院 | 一种自然资源样本库建立方法和装置 |
WO2023077816A1 (zh) * | 2021-11-03 | 2023-05-11 | 中国华能集团清洁能源技术研究院有限公司 | 边界优化的遥感图像语义分割方法、装置、设备及介质 |
CN116434054A (zh) * | 2023-03-01 | 2023-07-14 | 浙江工业大学 | 一种基于线面结合的密集遥感地物提取方法 |
CN116486077A (zh) * | 2023-04-04 | 2023-07-25 | 中国科学院地理科学与资源研究所 | 遥感影像语义分割模型样本集生成方法和装置 |
CN116824133A (zh) * | 2023-09-04 | 2023-09-29 | 北京数慧时空信息技术有限公司 | 一种遥感图像智能解译方法 |
CN116822980A (zh) * | 2023-05-30 | 2023-09-29 | 西南交通大学 | 一种基矢量引导的典型地表要素智能监测方法及*** |
-
2023
- 2023-12-06 CN CN202311662340.6A patent/CN117349462B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110363798A (zh) * | 2019-07-24 | 2019-10-22 | 宁波市测绘设计研究院 | 一种遥感影像解译样本集的生成方法 |
CN112884791A (zh) * | 2021-02-02 | 2021-06-01 | 重庆市地理信息和遥感应用中心 | 一种构建大规模遥感影像语义分割模型训练样本集的方法 |
CN113223042A (zh) * | 2021-05-19 | 2021-08-06 | 自然资源部国土卫星遥感应用中心 | 一种遥感影像深度学习样本智能采集方法及设备 |
WO2023000159A1 (zh) * | 2021-07-20 | 2023-01-26 | 海南长光卫星信息技术有限公司 | 高分辨率遥感影像半监督分类方法、装置、设备及介质 |
WO2023077816A1 (zh) * | 2021-11-03 | 2023-05-11 | 中国华能集团清洁能源技术研究院有限公司 | 边界优化的遥感图像语义分割方法、装置、设备及介质 |
CN114299394A (zh) * | 2021-12-30 | 2022-04-08 | 珠海涵辰科技有限公司 | 一种遥感影像智能解译方法 |
CN114625820A (zh) * | 2022-02-16 | 2022-06-14 | 武汉大学 | 一种面向人工智能遥感影像解译的样本库***及组织方法 |
CN115526801A (zh) * | 2022-10-09 | 2022-12-27 | 航天宏图信息技术股份有限公司 | 基于条件对抗神经网络的遥感影像自动匀色方法和装置 |
CN115909059A (zh) * | 2022-11-11 | 2023-04-04 | 河北省自然资源利用规划院 | 一种自然资源样本库建立方法和装置 |
CN116434054A (zh) * | 2023-03-01 | 2023-07-14 | 浙江工业大学 | 一种基于线面结合的密集遥感地物提取方法 |
CN116486077A (zh) * | 2023-04-04 | 2023-07-25 | 中国科学院地理科学与资源研究所 | 遥感影像语义分割模型样本集生成方法和装置 |
CN116822980A (zh) * | 2023-05-30 | 2023-09-29 | 西南交通大学 | 一种基矢量引导的典型地表要素智能监测方法及*** |
CN116824133A (zh) * | 2023-09-04 | 2023-09-29 | 北京数慧时空信息技术有限公司 | 一种遥感图像智能解译方法 |
Non-Patent Citations (4)
Title |
---|
HAOJIN TANG 等: "A Spatial–Spectral Prototypical Network for Hyperspectral Remote Sensing Image", IEEE GEOSCIENCE AND REMOTE SENSING LETTERS, pages 1 - 5 * |
WELCOME_BACK: "使用ArcGis+Python(GDAL)制作语义分割遥感数据集", pages 1 - 10, Retrieved from the Internet <URL:https://blog.csdn.net/weixin_51205206/article/details/119737956> * |
郭子慧;刘伟;: "深度学习和遥感影像支持的矢量图斑地类解译真实性检查方法", 地球信息科学学报, no. 10, pages 2051 - 2061 * |
闫利;黎力;郝建明;: "一种改进型面向对象的遥感变化检测方法", 遥感信息, no. 03, pages 31 - 36 * |
Also Published As
Publication number | Publication date |
---|---|
CN117349462B (zh) | 2024-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110059694B (zh) | 电力行业复杂场景下的文字数据的智能识别方法 | |
Li et al. | Automatic crack recognition for concrete bridges using a fully convolutional neural network and naive Bayes data fusion based on a visual detection system | |
CN109919934B (zh) | 一种基于多源域深度迁移学习的液晶面板缺陷检测方法 | |
CN112287807B (zh) | 一种基于多分支金字塔神经网络的遥感影像道路提取方法 | |
CN109636772A (zh) | 基于深度学习的不规则形状金属加工表面的缺陷检测方法 | |
CN110516539A (zh) | 基于对抗网络的遥感影像建筑物提取方法、***、存储介质及设备 | |
CN111553303A (zh) | 基于卷积神经网络的遥感正射影像密集建筑物提取方法 | |
CN110136101A (zh) | 一种基于孪生距离比对的轮胎x光病疵检测方法 | |
CN110956207B (zh) | 一种光学遥感影像全要素变化检测方法 | |
CN112070727B (zh) | 一种基于机器学习的金属表面缺陷检测方法 | |
CN111985325B (zh) | 特高压环境评价中的航拍小目标快速识别方法 | |
CN112365497A (zh) | 基于TridentNet和Cascade-RCNN结构的高速目标检测方法和*** | |
CN112613428B (zh) | 基于平衡损失的Resnet-3D卷积牛视频目标检测方法 | |
CN107392252A (zh) | 计算机深度学习图像特征并量化感知度的方法 | |
CN112560716A (zh) | 一种基于低层特征融合的高分辨率遥感影像水体提取方法 | |
CN110751138A (zh) | 一种基于yolov3和CNN的盘头标识识别方法 | |
CN114782967B (zh) | 一种基于代码可视化学习的软件缺陷预测方法 | |
CN113205511A (zh) | 基于深层神经网络的电子元器件批量信息检测方法及*** | |
CN111738164A (zh) | 一种基于深度学习的行人检测方法 | |
CN115115954A (zh) | 基于无人机遥感的松材线虫病疫区变色立木智能识别方法 | |
CN114419430A (zh) | 一种基于SE-U-Net++模型的耕地地块提取方法及装置 | |
CN110188662A (zh) | 一种水表数字的ai智能识别方法 | |
CN117349462B (zh) | 一种遥感智能解译样本数据集生成方法 | |
CN109447968A (zh) | 图像区域生长算法的蜕变测试*** | |
CN115830302B (zh) | 一种多尺度特征提取融合配电网设备定位识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |