CN114972982A - 基于改进过采样的遥感图像目标检测样本不均衡处理方法 - Google Patents

基于改进过采样的遥感图像目标检测样本不均衡处理方法 Download PDF

Info

Publication number
CN114972982A
CN114972982A CN202210425413.9A CN202210425413A CN114972982A CN 114972982 A CN114972982 A CN 114972982A CN 202210425413 A CN202210425413 A CN 202210425413A CN 114972982 A CN114972982 A CN 114972982A
Authority
CN
China
Prior art keywords
category
remote sensing
categories
image
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210425413.9A
Other languages
English (en)
Inventor
郭争强
朱巍
王港
冯清泉
武晓博
聂宗哲
王敏
梁硕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
CETC 54 Research Institute
Original Assignee
National University of Defense Technology
CETC 54 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology, CETC 54 Research Institute filed Critical National University of Defense Technology
Priority to CN202210425413.9A priority Critical patent/CN114972982A/zh
Publication of CN114972982A publication Critical patent/CN114972982A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/242Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于改进过采样的遥感图像目标检测类别不均衡处理方法,首先统计遥感数据集中类别数量、各类目标数量;然后判断数据集是否存在类别不均衡问题,若不存在,则结束,若存在,则转到下一步;其次,对目标量少的类别图像进行扩充;最后,得到目标扩充后的数据集。本发明能够克服当前过采样技术易导致模型过拟合的缺陷,从而解决遥感图像目标检测类别不均衡问题。

Description

基于改进过采样的遥感图像目标检测样本不均衡处理方法
技术领域
本领域涉及遥感图像处理领域,具体涉及遥感图像目标检测类别不均衡问题的处理方法。
背景技术
遥感图像目标检测类别不均衡指的是数据集中各类别目标数量不均衡,在遥感数据集中尤为常见,主要是因为自然界中各类地物的数目差异较大,比如在城市中汽车和飞机的比例,这中类别比例甚至超过了1000∶1。已经证明,类别不均衡会对机器学习、深度学习算法精准度产生不利影响,它既影响训练阶段算法的收敛性,也影响测试阶段算法的泛化性。
在遥感图像目标检测中,对类别不均衡问题的解决方法一般包括以下三类:第一类是损失函数调整,损失函数决定模型训练中权重调整方式,对类别不均衡数据集一般采用焦点损失函数或者加权损失函数,此类算法对没有直接解决类别不均衡问题,因此对模型性能提升有限。第二类是采样法,采样法一般分为过采样和降采样,过采样指对目标量较少的类别图像进行多次随机采样,降采样是指从目标多的类别图像中剔除一部分。过采样算法一般认为会造成模型对目标量少的类别过拟合,主要是因为当前过采样方法是对包含该类别图像的简单复制,导致模型对该类目标过拟合,从而泛化性能下降,另一方面,当前过采样技术中类别扩充的比例仅基于数据集中包含该类别的图像数与数据集总图像数的比例决定,而不考虑该类别目标数量,由此可能造成对目标数量大但密集分布的类别图像进行不必要的过采样。降采样则会丢弃大量图像,对模型收敛不利。第三类是样本加权法,样本加权法本质上是过采样和降采样的结合,即对目标量多的类别图像进行降采样,对目标量少的类别图像进行过采样,该方法一般会降低数据集图像总量以寻求类别之间的数量上的平衡,从而导致模型过拟合。
发明内容
本发明的目的是提供一种基于改进过采样的遥感图像目标检测类别不均衡处理方法,以改进现有遥感图像目标检测类别不均衡情况下过采样方法存在的缺陷。
为了解决上述技术问题,本发明提供的技术方案为:
一种基于改进过采样的遥感图像目标检测样本不均衡处理方法,包括如下步骤:
S1,统计遥感数据集中的类别数量n和各类别目标数[N1,N2,N3,...,Nn];
S2,判断是否存在类别不均衡问题,若存在类别不均衡,则转到步骤S3,否则结束该流程;
S3,对目标量少的类别图像进行扩充;
S4:得到目标扩充后的数据集。
进一步的,步骤S2的具体方式为:取各类别目标数的最大值,除以各类别目标数的最小值,若结果大于10则存在类别不均衡。
进一步的,步骤S3的具体方式为:
1)计算各类别所在图像数与总图像数的比例[f1,f2,f3,...,fn],定义扩充阈值t,筛选比例小于阈值的类别作为候选类别;
2)筛选候选类别中的不均衡类别作为待扩充类别,不均衡类别的判定方式如步骤S2所述;该步骤通过样本数量在候选类别中进一步筛选待扩充类别,通过该步骤能够避免扩充目标数量多的类别;
3)确定各待扩充类别的扩充倍数,确定方式如下:
Figure BDA0003609437580000031
其中,rc表示第c类的扩充倍数,fc表示第c类所在图像与总图像数的比例,t为阈值;
4)对包含待扩充类别的图像进行扩充,图像扩充倍数取值如下:
ri=maxc∈i(rc)
其中,ri表示当前图像扩充倍数,i表示图像,rc表示第c类的扩充倍数;
5)从候选方法中依次选取ri个变换方法,对当前图像进行扩充;所述候选方法包括顺时针90度旋转、顺时针180度旋转、水平翻转、垂直翻转、向外放大10%、向内缩小10%、左上角裁剪、右下角裁剪、添加高斯噪声、色彩变换。
本发明相比于现有技术具有如下有益效果:
1.本发明针对现有过采样技术对待扩充类别图像简单复制容易导致模型对样本过拟合,泛化性能下降的缺陷,提出一种改进的过采样的方法,该方法结合当前旋转、翻转、随机裁剪等数据增强方法对类别少的图像进行扩充。
2.本发明针对现有过采样技术中待扩充类别选取不合理,存在对目标数量多但分布密集情况下进行类别图像扩充的缺陷,提出一种改进的扩充类别确定流程,该流程在当前技术基础上,充分考虑类别目标数量,能够获取合理的待扩充类别。
附图说明
图1是本发明实施例中遥感图像目标检测类别不均衡处理方法的流程图。
图2是改进过采样方法的流程图。
具体实施方式
以下将结合实施例对本发明的构思、技术方案优势及产生的技术效果进行清楚、完整地描述,以充分理解本发明的目的、特征和效果。需要说明的是,此处所描述的具体实施例仅用以解释本发明,并不限定本发明。
一种基于改进过采样的遥感图像目标检测类别不均衡处理方法,该方法首先统计遥感数据集中类别数量、各类目标数量;然后,判断数据集是否存在类别不均衡问题,若不存在,则结束,若存在,则转到下一步;接着,对目标量少的类别图像进行扩充;最后,得到目标扩充后的数据集。
具体来说,如图1所示,包括以下步骤:
S1:统计遥感数据集中类别数量n和各类别目标数[N1,N2,N3,…,Nn]。
S2:判断是否存在类别不均衡问题:
取各类别目标数的最大值除以各类别目标数的最小值,结果大于10则存在类别不平衡,转到第三步,结果小于10则不存在类别不均衡,结束该流程。
S3:采用改进过采样方法对目标量少的类别图像进行扩充;如图2所示,具体方式如下:
1)计算各类别所在图像数与总图像数比例[f1,f2,f3,…,fn],人为定义扩充阈值t,筛选比例小于阈值的类别作为候选类别。
2)筛选候选类别中的不均衡类别,不均衡类别判定方法如S2所述,获得待扩充类别。
3)确定各类别扩充倍数,确定方式如下:
Figure BDA0003609437580000041
其中,rc表示第c类的扩充倍数,fc表示第c类所在图像与总图像数的比例,t为人为设定的阈值。
4)对包含待扩充类别的图像进行扩充,图像扩充倍数取值如下:
ri=maxc∈i(rc)
其中,ri表示当前图像扩充倍数,i表示图像,rc表示第c类的扩充倍数。
5)对当前图像进行扩充,扩充方法从候选方法中依次选取ri个,候选方法包括顺时针90度旋转、顺时针180度旋转、水平翻转、垂直翻转、向外放大10%、向内缩小10%、左上角裁剪、右下角裁剪、添加高斯噪声、色彩变换。
S4:得到目标扩充后的数据集。
总之,本发明能够克服当前过采样技术易导致模型过拟合的缺陷,从而解决遥感图像目标检测类别不均衡问题。

Claims (3)

1.一种基于改进过采样的遥感图像目标检测样本不均衡处理方法,其特征在于,包括如下步骤:
S1,统计遥感数据集中的类别数量n和各类别目标数[N1,N2,N3,...,Nn];
S2,判断是否存在类别不均衡问题,若存在类别不均衡,则转到步骤S3,否则结束该流程;
S3,对目标量少的类别图像进行扩充;
S4:得到目标扩充后的数据集。
2.如权利要求1所述的一种基于改进过采样的遥感图像目标检测样本不均衡处理方法,其特征在于,步骤S2的具体方式为:取各类别目标数的最大值,除以各类别目标数的最小值,若结果大于10则存在类别不均衡。
3.如权利要求2所述的一种基于改进过采样的遥感图像目标检测样本不均衡处理方法,其特征在于,步骤S3的具体方式为:
1)计算各类别所在图像数与总图像数的比例[f1,f2,f3,...,fn],定义扩充阈值t,筛选比例小于阈值的类别作为候选类别;
2)筛选候选类别中的不均衡类别作为待扩充类别,不均衡类别的判定方式如步骤S2所述;
3)确定各待扩充类别的扩充倍数,确定方式如下:
Figure FDA0003609437570000011
其中,rc表示第c类的扩充倍数,fc表示第c类所在图像与总图像数的比例,t为阈值;
4)对包含待扩充类别的图像进行扩充,图像扩充倍数取值如下:
ri=maxc∈i(rc)
其中,ri表示当前图像扩充倍数,i表示图像,rc表示第c类的扩充倍数;
5)从候选方法中依次选取ri个变换方法,对当前图像进行扩充;所述候选方法包括顺时针90度旋转、顺时针180度旋转、水平翻转、垂直翻转、向外放大10%、向内缩小10%、左上角裁剪、右下角裁剪、添加高斯噪声、色彩变换。
CN202210425413.9A 2022-04-22 2022-04-22 基于改进过采样的遥感图像目标检测样本不均衡处理方法 Pending CN114972982A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210425413.9A CN114972982A (zh) 2022-04-22 2022-04-22 基于改进过采样的遥感图像目标检测样本不均衡处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210425413.9A CN114972982A (zh) 2022-04-22 2022-04-22 基于改进过采样的遥感图像目标检测样本不均衡处理方法

Publications (1)

Publication Number Publication Date
CN114972982A true CN114972982A (zh) 2022-08-30

Family

ID=82979930

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210425413.9A Pending CN114972982A (zh) 2022-04-22 2022-04-22 基于改进过采样的遥感图像目标检测样本不均衡处理方法

Country Status (1)

Country Link
CN (1) CN114972982A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117523345A (zh) * 2024-01-08 2024-02-06 武汉理工大学 一种目标检测数据平衡方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117523345A (zh) * 2024-01-08 2024-02-06 武汉理工大学 一种目标检测数据平衡方法及装置
CN117523345B (zh) * 2024-01-08 2024-04-23 武汉理工大学 一种目标检测数据平衡方法及装置

Similar Documents

Publication Publication Date Title
CN107316061B (zh) 一种深度迁移学***衡分类集成方法
CN108765465B (zh) 一种无监督sar图像变化检测方法
CN109886357B (zh) 一种基于特征融合的自适应权重深度学习目标分类方法
KR102263397B1 (ko) 뉴럴 네트워크 학습에 이용될 오토 라벨링된 이미지 중에서 라벨 검수를 위한 샘플 이미지를 획득하는 방법 및 이를 이용한 샘플 이미지 획득 장치
CN109671071B (zh) 一种基于深度学习的地下管道缺陷定位及等级判定方法
CN101923711B (zh) 基于邻域相似性及掩模增强的sar图像变化检测方法
CN113781482B (zh) 一种复杂环境下机械零件裂纹缺陷检测方法及***
CN114283287B (zh) 基于自训练噪声标签纠正的鲁棒领域自适应图像学习方法
CN110781924A (zh) 一种基于全卷积神经网络的侧扫声纳图像特征提取方法
CN111898685B (zh) 一种基于长尾分布数据集的目标检测方法
CN112949520B (zh) 一种基于多尺度小样本的航拍车辆检测方法及检测***
CN116258707A (zh) 一种基于改进的YOLOv5算法的PCB表面缺陷检测方法
CN105374047B (zh) 基于改进的双边滤波与聚类的sar图像变化检测方法
CN113469951B (zh) 一种基于级联区域卷积神经网络的轮毂缺陷检测方法
CN110766058A (zh) 一种基于优化rpn网络的战场目标检测方法
CN114972982A (zh) 基于改进过采样的遥感图像目标检测样本不均衡处理方法
CN112819063B (zh) 一种基于改进的Focal损失函数的图像识别方法
CN112560614A (zh) 一种基于候选框特征修正的遥感图像目标检测方法及***
CN105184829B (zh) 一种紧密空间目标检测和高精度质心定位方法
CN111738114A (zh) 基于无锚点精确采样遥感图像车辆目标检测方法
CN114743084A (zh) 一种基于超分预处理与改进YOLOv5x的输电线路故障检测方法
CN115457415A (zh) 基于yolo-x模型的目标检测方法、装置、电子设备和存储介质
CN114549909A (zh) 一种基于自适应阈值的伪标签遥感图像场景分类方法
CN111368625B (zh) 一种基于级联优化的行人目标检测方法
CN115690100B (zh) 半监督信号点检测模型训练方法、信号点检测方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination