CN115546629A - 基于深度学习的遥感影像厂房识别方法和*** - Google Patents

基于深度学习的遥感影像厂房识别方法和*** Download PDF

Info

Publication number
CN115546629A
CN115546629A CN202211109160.0A CN202211109160A CN115546629A CN 115546629 A CN115546629 A CN 115546629A CN 202211109160 A CN202211109160 A CN 202211109160A CN 115546629 A CN115546629 A CN 115546629A
Authority
CN
China
Prior art keywords
semantic segmentation
sensing image
remote sensing
module
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211109160.0A
Other languages
English (en)
Inventor
苏晓
丁争
陈峻宇
申若飞
张卓成
张明晖
李浪
许华栋
白万崧
王德新
杨光兴
李毅
朱立夫
周兵
刘鸿燕
康晓
段丁丁
王成港
程锐
牛帆帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuxi Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
Aerospace Hongtu Information Technology Co Ltd
Original Assignee
Wuxi Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
Aerospace Hongtu Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuxi Power Supply Co of State Grid Jiangsu Electric Power Co Ltd, Aerospace Hongtu Information Technology Co Ltd filed Critical Wuxi Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
Priority to CN202211109160.0A priority Critical patent/CN115546629A/zh
Publication of CN115546629A publication Critical patent/CN115546629A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/176Urban or other man-made structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/16Image acquisition using multiple overlapping images; Image stitching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/70Labelling scene content, e.g. deriving syntactic or semantic representations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

一种基于深度学习的遥感影像厂房识别方法和***,所述方法包括:步骤1,采集遥感影像数据,筛选出有厂房的区域,裁剪出一系列子影像作为厂房原始样本;步骤2,对厂房原始样本进行标注和裁剪,构成语义分割数据集,并对语义分割数据集进行扩充;步骤3,搭建语义分割网络模型;步骤4,使用现有遥感影像语义分割数据集训练语义分割网络模型;步骤5,使用训练好的语义分割网络模型进行厂房提取;步骤6,将所有子图的预测图按裁剪时的起始点坐标进行拼接,得到一幅完整遥感影像的厂房语义分割结果图,根据厂房语义分割结果图的像素分布确定是否有厂房。实现对厂房的精确提取并获得地理坐标,还可根据运维路线评定厂房的风险等级。

Description

基于深度学习的遥感影像厂房识别方法和***
技术领域
本发明涉及电力传输领域,具体涉及基于深度学习的遥感影像厂房识别方法和***。
背景技术
电是现代社会最基本的能源,无论是在居民生活还是工业生产中,都发挥着巨大作用。为保障电力稳定与安全供应,对高压输电塔运行状态监测、输电线路的定期巡检、危险源排查尤为重要。对于输电距离远、设备所处环境恶劣的电网形态,人工巡检监测效率低下、危险性高。相比之下,利用卫星遥感观测技术具有观测范围广、动态及时且基本不受自然条件影响,优势十分明显。
一些现有的基于遥感影像的输电线路检测技术对数据要求较高,或过于简单粗糙,鲁棒性不高。如MIT林肯实验室基于高分辨率的SAR图像上进行白化滤波对电塔进行检测,密歇根大学Sarabandi等人则利用毫米极化的SAR图像进行输电线路的提取。另外,基于光学的输电线路检测也取得了一定发展,如构建导线在Cluster Randon(CR)频域空间的峰值特征,在可见光遥感影像上提取输电导线;利用深度学习的目标检测技术实现电塔检测等。对于输电线路沿线分布的危险源检测尚无针对性的方法。
输电线路危险源-厂房识别与其他目标物不同,具有样本量小、易混淆等特点,但也存在特征明显,如厂房一般位于郊区,成片分布,上表面平整、形状规则并且颜色特殊,可采用深度学习的方法进行提取。根据厂房的外在特点,厂房的识别选择语义分割的方法,但直接使用临时标注的小样本训练模型容易导致过拟合,泛化性差。若采用微调的方法,一般可供选择的预训练模型都是自然图像数据集训练得来,由于自然图像与遥感图像的差异,使用自然图像数据集训练的模型在遥感图像数据集作微调效果不佳。
发明内容
为解决现有技术中存在的不足,本发明的目的在于,提供一种基于深度学习的遥感影像厂房识别方法和***,使用多尺度特征融合和深监督方案,基于现有遥感数据集作迁移学习,训练样本使用新的样本滑窗裁剪策略生成,通过模型训练得到语义分割模型,实现对厂房的精确提取并获得地理坐标,还可根据运维路线评定厂房的风险等级。
本发明采用如下的技术方案。
一种基于深度学习的遥感影像厂房识别方法,包括:
步骤1,采集遥感影像数据,筛选出有厂房的区域,裁剪出一系列子影像作为厂房原始样本;
步骤2,对厂房原始样本进行标注和裁剪,构成语义分割数据集,并对语义分割数据集进行扩充;
步骤3,搭建语义分割网络模型;
步骤4,使用现有遥感影像语义分割数据集训练语义分割网络模型;
步骤5,使用训练好的语义分割网络模型进行厂房提取;
步骤6,将所有子图的预测图按裁剪时的起始点坐标进行拼接,得到一幅完整遥感影像的厂房语义分割结果图,根据厂房语义分割结果图的像素分布确定是否有厂房。
优选地,步骤2中,对厂房原始样本进行裁剪采用滑窗法,从左上角开始,对于没有标注的子图,按设定步长选择性保留作为负样本,其余丢弃,以此控制负样本数量;对于有标注的子图,在标注目标周围随机平移多次生成多张不同的子图作为正样本,扩充正样本,依次遍历完整幅影像,构成语义分割数据集,其中,根据厂房在影像中分布密度确定标注目标周围随机平移次数。
步骤2中,对语义分割数据集进行扩充包括:旋转、翻转、饱和度、亮度、长宽扭曲、缩放、平移和裁剪增强操作。
优选地,步骤3中,语义分割网络模型包括:特征主干网络模块,输出层像素点分类模块,目标函数模块。
优选地,特征主干网络模块为先做下采样再做上采样的U型对称网络,并将中间填满,整个网络提取不同层次的图像抽象特征,并将不同层次的图像抽象特征通过特征堆叠的方式整合,确保边缘信息在下采样、上采样过程中不丢失,同时,将网络顶部的所有层直接连接到输出层,实现深监督。
优选地,输出层像素点分类模块使用sigmoid函数,其输入为基础网络的输出,该层作用是将值较分散基础网络输出层映射到(0,1),然后设定阈值,大于阈值判定为前景并将像素置1,其他为背景并将像素置0,网络输出最终的分割结果图,计算公式如下:
Figure BDA0003843183160000031
式中,
x表示激活函数的输入,主干网络模块的输出矩阵。
优选地,使用Dice Loss与BCE Loss结合,计算公式如下所示:
Figure BDA0003843183160000032
Figure BDA0003843183160000033
式中,
A表示网络输出层,
B表示标注生成的掩膜,
yi表示输出层中与输入图像每个像素点对应的预测值,
Figure BDA0003843183160000034
表示标注图像掩膜与输入图像每个像素点对应的标签值,
ωi表示权重参数。
一种基于深度学习的遥感影像厂房识别***,包括:采集模块,数据预处理模块,模型搭建模块,模型训练模块,提取模块,判断模块,其中,
采集模块用于采集遥感影像数据,筛选出有厂房的区域,裁剪出一系列子影像作为厂房原始样本;
数据预处理模块用于对厂房原始样本进行标注和裁剪,构成语义分割数据集,并对语义分割数据集进行扩充;
模型搭建模块用于搭建语义分割网络模型;
模型训练模块用于使用现有遥感影像语义分割数据集训练语义分割网络模型;
提取模块用于使用训练好的语义分割网络模型进行厂房提取;
判断模块用于将所有子图的预测图按裁剪时的起始点坐标进行拼接,得到一幅完整遥感影像的厂房语义分割结果图,根据厂房语义分割结果图的像素分布确定是否有厂房。
一种终端,包括处理器及存储介质;所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行一种基于深度学习的遥感影像厂房识别方法的步骤。
计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现一种基于深度学习的遥感影像厂房识别方法的步骤。
本发明的有益效果在于,与现有技术相比,
(1)本发明采用迁移学习,同时使用多种增强手段做数据增强,有效解决了厂房目标在遥感影像中样本量小的问题;
(2)本发明采用一种新的样本滑窗裁剪策略,控制负样本数量,增加正样本数量,从数据集角度有效解决正负样本不平衡问题;
(3)本发明使用多尺度特征融合和深监督方案,将关注细节等局部性特征的深层网络输出与关注全局性特征的浅层网络输出融合,实现对厂房目标的精确分割,准确确定厂房位置,解决分辨率有限的遥感影像场景下前景目标易与其他背景混淆等难点。
(4)本发明还提出基于输电线路危险源(如厂房)的风险区域划分与风险等级确定策略,科学排查输电线路危险源,为提高输电、用电安全性,提供有力保障。
附图说明
图1表示本发明提供基于深度学习的遥感影像厂房识别方法的流程图;
图2表示语义分割网络结构图;
图3表示训练语义分割网络模型过程;
图4表示厂房提取示例图。
具体实施方式
下面结合附图对本申请作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本申请的保护范围。
实施例1。
基于深度学习的遥感影像厂房识别方法,包括以下步骤:
步骤1,采集遥感影像数据,筛选出有厂房的区域,裁剪出一系列子影像作为厂房原始样本。
从开源遥感数据平台(如水经注)采集遥感影像数据,在遥感处理软件(如PIE-Map)中预览影像并筛选出有厂房的区域,使用软件自带裁剪工具裁剪出一系列子影像作为厂房原始样本。
步骤2,对厂房原始样本进行标注和裁剪,构成语义分割数据集,并对语义分割数据集进行扩充。
本实施例优选地,使用标注软件(如LabelMe)或者遥感影像专用处理软件(如ArcGis)对原始样本进行标注,每幅影像对应生成一幅以厂房为前景的掩膜。然后根据厂房分布尺寸和硬件条件设定一个合适的尺寸(如1024×1024),按一定重叠率将尺寸不一的原始样本以及对应掩膜裁剪为统一尺寸的子图。裁剪时采用滑窗法,从左上角开始,对于没有标注的子图,按设定步长(如设定为2,即滑窗两次保存一次)选择性保留作为负样本,其余丢弃,以此控制负样本数量;对于有标注的子图,在标注目标周围随机平移多次(根据厂房在影像中分布密度确定)生成多张不同的子图作为正样本,扩充正样本,依次遍历完整幅影像,构成语义分割数据集。
对步骤1得到的数据集做旋转、翻转、饱和度、亮度、长宽扭曲、缩放、平移和裁剪等增强操作,扩充数据集,同时提高样本多样性,也有利于提升训练模型的泛化能力。
步骤3,搭建语义分割网络模型,语义分割网络结构主要包括特征主干网络、像素点的分类模块、目标函数模块三部分。
主干网络模块主要包括下采样、上采样环节,下采样相当于编码,将输入图像的特征进行抽象表示,上采样相当于解码,把抽象的特征再还原解码到原图的尺寸。
该模块的基础网络由输入层、卷积层、长连接层、输出层构成,网络由浅到深对应特征层次的提升和感受野的增大,通过长连接将所有浅层特征与同维度的深层特征相连,采用特征层堆叠对其进行整合,确保浅层次的全局性特征和深层次的局部性特征都被网络关注,最终携带至输出层,输出层的宽、高维度与输入图像一致。
本实施例优选一个先做下采样再做上采样的U型对称网络,并将中间填满,整个网络抓取不同层次的特征,将它们通过特征堆叠的方式整合,确保边缘信息在下采样、上采样过程中不丢失。另外,将网络顶部的所有层(特征图宽高尺寸与输出层相同)直接连接到输出层,实现深监督,结构如图2所示。
输出层像素点分类模块使用sigmoid函数,其输入为基础网络的输出,该层作用是将值较分散基础网络输出层映射到(0,1),然后设定阈值(如0.5),大于阈值判定为前景并将像素置1,其他为背景并将像素置0,网络输出最终的分割结果图。计算公式:
Figure BDA0003843183160000061
x表示激活函数的输入,主干网络模块的输出矩阵;
sigmoid(x)表示激活函数名称。
目标函数的作用是训练模型过程中计算基础网络预测输出与标注掩膜掩膜之间的偏差,反向传播时对目标函数执行梯度下降同时不断更新网络参数以达到训练目的。
本实施例优选使用Dice Loss与BCE Loss结合。计算公式:
Figure BDA0003843183160000062
式中:
A表示网络输出层,
B表示标注生成的掩膜。
计算公式:
Figure BDA0003843183160000063
式中:
yi为输出层中与输入图像每个像素点对应的预测值,
Figure BDA0003843183160000064
为标注图像掩膜与输入图像每个像素点对应的标签值,
ωi为权重参数,训练时自学习。
步骤4,使用现有遥感影像语义分割数据集训练语义分割网络模型。
本实施例优选地,基础模型选择使用现有遥感影像语义分割数据集,如建筑、道路、水体等开源语义分割数据集训练得到的模型。
如图3所示,训练流程:使用厂房数据集进行迁移学习,用训练好的基础模型权重参数初始化网络,将数据集划分为训练集和验证集,每次迭代进行一次训练和验证,在训练阶段,将训练集中的样本图像分批次喂入完成参数初始化的网络,完成所有层的前向传播后得到输出层矩阵,然后计算目标函数值,即该批次的损失,接着在反向传播中执行梯度下降更新网络参数,直至网络收敛;验证阶段只执行前向传播,并计算评价指标,如网络输出层与图像标注掩膜的交并比。每轮训练和验证结束后进行下一轮,直到网络收敛、损失不再明显下降,完成训练。
步骤5,使用训练好的语义分割网络模型进行厂房提取,将待处理遥感影像滑窗裁剪为预设尺寸的子图,再将这些子图喂入训练好的模型进行预测,输出结果,如图4所示为厂房提取示例图。
步骤6,将所有子图的预测图按裁剪时的起始点坐标进行拼接,得到一幅完整遥感影像的厂房语义分割结果,最终根据结果图的像素分布确定是否有厂房,以及厂房分布位置。
风险等级确定,在基于输电路线沿线设定的运维线路周边按距离划定风险区域,由近到远依次为重点区、次重点区和一般区。厂房作为输电线路危险源之一,有必要根据厂房位置所属风险区域确定级别,位于重点区、次重点区和一般区的厂房分别对应一级、二级、三级风险等级。
实施例2。
基于深度学习的遥感影像厂房识别***包括:采集模块,数据预处理模块,模型搭建模块,模型训练模块,提取模块,判断模块,其中:
采集模块用于采集遥感影像数据,筛选出有厂房的区域,裁剪出一系列子影像作为厂房原始样本;
数据预处理模块用于对厂房原始样本进行标注和裁剪,构成语义分割数据集,并对语义分割数据集进行扩充;
模型搭建模块用于搭建语义分割网络模型;
模型训练模块用于使用现有遥感影像语义分割数据集训练语义分割网络模型;
提取模块用于使用训练好的语义分割网络模型进行厂房提取;
判断模块用于将所有子图的预测图按裁剪时的起始点坐标进行拼接,得到一幅完整遥感影像的厂房语义分割结果图,根据厂房语义分割结果图的像素分布确定是否有厂房。
实施例3。
本发明实施例三提供了一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如本发明实施例一所述的基于深度学习的遥感影像厂房识别方法中的步骤。
详细步骤与实施例1提供的基于深度学习的遥感影像厂房识别方法相同,在此不再赘述。
实施例4。
本发明实施例4提供了一种电子设备。
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本发明实施例一所述的基于深度学习的遥感影像厂房识别方法中的步骤。
本发明的有益效果在于,与现有技术相比,
(1)本发明采用迁移学习,同时使用多种增强手段做数据增强,有效解决了厂房目标在遥感影像中样本量小的问题;
(2)本发明采用一种新的样本滑窗裁剪策略,控制负样本数量,增加正样本数量,从数据集角度有效解决正负样本不平衡问题;
(3)本发明使用多尺度特征融合和深监督方案,将关注细节等局部性特征的深层网络输出与关注全局性特征的浅层网络输出融合,实现对厂房目标的精确分割,准确确定厂房位置,解决分辨率有限的遥感影像场景下前景目标易与其他背景混淆等难点。
(4)本发明还提出基于输电线路危险源(如厂房)的风险区域划分与风险等级确定策略,科学排查输电线路危险源,为提高输电、用电安全性,提供有力保障。
本公开可以是***、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其它自由传播的电磁波、通过波导或其它传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(***)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其它设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (10)

1.一种基于深度学习的遥感影像厂房识别方法,其特征在于,所述方法包括:
步骤1,采集遥感影像数据,筛选出有厂房的区域,裁剪出一系列子影像作为厂房原始样本;
步骤2,对厂房原始样本进行标注和裁剪,构成语义分割数据集,并对语义分割数据集进行扩充;
步骤3,搭建语义分割网络模型;
步骤4,使用现有遥感影像语义分割数据集训练语义分割网络模型;
步骤5,使用训练好的语义分割网络模型进行厂房提取;
步骤6,将所有子图的预测图按裁剪时的起始点坐标进行拼接,得到一幅完整遥感影像的厂房语义分割结果图,根据厂房语义分割结果图的像素分布确定是否有厂房。
2.根据权利要求1所述的一种基于深度学习的遥感影像厂房识别方法,其特征在于,
步骤2中,对厂房原始样本进行裁剪采用滑窗法,从左上角开始,对于没有标注的子图,按设定步长选择性保留作为负样本,其余丢弃,以此控制负样本数量;对于有标注的子图,在标注目标周围随机平移多次生成多张不同的子图作为正样本,扩充正样本,依次遍历完整幅影像,构成语义分割数据集,其中,根据厂房在影像中分布密度确定标注目标周围随机平移次数。
3.根据权利要求1所述的一种基于深度学习的遥感影像厂房识别方法,其特征在于,
步骤2中,对语义分割数据集进行扩充包括:旋转、翻转、饱和度、亮度、长宽扭曲、缩放、平移和裁剪增强操作。
4.根据权利要求1所述的一种基于深度学习的遥感影像厂房识别方法,其特征在于,
步骤3中,语义分割网络模型包括:特征主干网络模块,输出层像素点分类模块,目标函数模块。
5.根据权利要求4所述的一种基于深度学习的遥感影像厂房识别方法,其特征在于,
特征主干网络模块为先做下采样再做上采样的U型对称网络,并将中间填满,整个网络提取不同层次的图像抽象特征,并将不同层次的图像抽象特征通过特征堆叠的方式整合,确保边缘信息在下采样、上采样过程中不丢失,同时,将网络顶部的所有层直接连接到输出层,实现深监督。
6.根据权利要求4所述的一种基于深度学习的遥感影像厂房识别方法,其特征在于,
输出层像素点分类模块使用sigmoid函数,其输入为基础网络的输出,该层作用是将值较分散基础网络输出层映射到(0,1),然后设定阈值,大于阈值判定为前景并将像素置1,其他为背景并将像素置0,网络输出最终的分割结果图,计算公式如下:
Figure FDA0003843183150000021
式中,
x表示激活函数的输入,主干网络模块的输出矩阵。
7.根据权利要求1所述的一种基于深度学习的遥感影像厂房识别方法,其特征在于,
步骤3中,使用Dice Loss与BCE Loss结合,计算公式如下所示:
Figure FDA0003843183150000022
Figure FDA0003843183150000023
式中,
A表示网络输出层,
B表示标注生成的掩膜,
yi表示输出层中与输入图像每个像素点对应的预测值,
Figure FDA0003843183150000024
表示标注图像掩膜与输入图像每个像素点对应的标签值,
ωi表示权重参数。
8.一种利用权利要求1-7任一项权利要求所述方法的一种基于深度学习的遥感影像厂房识别***,包括:采集模块,数据预处理模块,模型搭建模块,模型训练模块,提取模块,判断模块,其特征在于,
采集模块用于采集遥感影像数据,筛选出有厂房的区域,裁剪出一系列子影像作为厂房原始样本;
数据预处理模块用于对厂房原始样本进行标注和裁剪,构成语义分割数据集,并对语义分割数据集进行扩充;
模型搭建模块用于搭建语义分割网络模型;
模型训练模块用于使用现有遥感影像语义分割数据集训练语义分割网络模型;
提取模块用于使用训练好的语义分割网络模型进行厂房提取;
判断模块用于将所有子图的预测图按裁剪时的起始点坐标进行拼接,得到一幅完整遥感影像的厂房语义分割结果图,根据厂房语义分割结果图的像素分布确定是否有厂房。
9.一种终端,包括处理器及存储介质;其特征在于:
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行根据权利要求1-8任一项所述一种基于深度学习的遥感影像厂房识别方法的步骤。
10.计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-8任一项所述一种基于深度学习的遥感影像厂房识别方法的步骤。
CN202211109160.0A 2022-09-13 2022-09-13 基于深度学习的遥感影像厂房识别方法和*** Pending CN115546629A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211109160.0A CN115546629A (zh) 2022-09-13 2022-09-13 基于深度学习的遥感影像厂房识别方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211109160.0A CN115546629A (zh) 2022-09-13 2022-09-13 基于深度学习的遥感影像厂房识别方法和***

Publications (1)

Publication Number Publication Date
CN115546629A true CN115546629A (zh) 2022-12-30

Family

ID=84725299

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211109160.0A Pending CN115546629A (zh) 2022-09-13 2022-09-13 基于深度学习的遥感影像厂房识别方法和***

Country Status (1)

Country Link
CN (1) CN115546629A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117475365A (zh) * 2023-12-26 2024-01-30 国网天津市电力公司高压分公司 一种输电通道风险识别方法、***、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117475365A (zh) * 2023-12-26 2024-01-30 国网天津市电力公司高压分公司 一种输电通道风险识别方法、***、设备及存储介质

Similar Documents

Publication Publication Date Title
CN108596886A (zh) 基于深度学习的航拍图像绝缘子掉片故障快速检测方法
CN113780296A (zh) 基于多尺度信息融合的遥感图像语义分割方法及***
CN114943876A (zh) 一种多级语义融合的云和云影检测方法、设备及存储介质
CN115546630A (zh) 基于遥感影像特征目标检测的工地提取方法和***
CN110807376A (zh) 基于遥感图像的城外道路提取方法及装置
CN112990086A (zh) 遥感影像建筑物检测方法、装置及计算机可读存储介质
CN113139543A (zh) 目标对象检测模型的训练方法、目标对象检测方法和设备
CN113537070B (zh) 一种检测方法、装置、电子设备及存储介质
CN114898097B (zh) 图像识别方法及***
CN116110036B (zh) 基于机器视觉的电力铭牌信息缺陷等级判断方法及装置
CN113947188A (zh) 目标检测网络的训练方法和车辆检测方法
CN114187505A (zh) 输电线路防振锤脱落的检测方法、装置、介质及终端设备
CN115546629A (zh) 基于深度学习的遥感影像厂房识别方法和***
CN115619719A (zh) 一种基于改进Yolo v3网络模型的松材线虫病疫木检测方法
CN116452850A (zh) 一种基于数据挖掘和深度学习的道路积水区域识别方法
CN115546664A (zh) 一种基于级联网络的绝缘子自爆检测方法及***
CN113902793B (zh) 基于单视觉遥感影像端到端建筑物高度预测方法、***和电子设备
CN118038153A (zh) 配电架空线路的防外破识别方法、装置、设备和介质
CN113536944A (zh) 基于图像识别的配电线路巡检数据识别及分析方法
CN117456356A (zh) 一种基于深度学习的城市内涝视频识别预警方法
CN117197571A (zh) 一种光伏组件故障检测方法、装置、电子设备及存储介质
Gan et al. Water level classification for flood monitoring system using convolutional neural network
CN115937492A (zh) 一种基于特征识别的变电设备红外图像识别方法
CN116071299A (zh) 一种绝缘子rtv喷涂缺陷检测方法及***
CN109377483A (zh) 瓷绝缘子裂纹检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination