CN116206257A - 一种基于多尺度特征解耦的机场飞行区目标实时检测方法 - Google Patents

一种基于多尺度特征解耦的机场飞行区目标实时检测方法 Download PDF

Info

Publication number
CN116206257A
CN116206257A CN202310057411.3A CN202310057411A CN116206257A CN 116206257 A CN116206257 A CN 116206257A CN 202310057411 A CN202310057411 A CN 202310057411A CN 116206257 A CN116206257 A CN 116206257A
Authority
CN
China
Prior art keywords
feature
feature map
target detection
decoupling
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310057411.3A
Other languages
English (en)
Inventor
吉咸阳
朱伟
胡迪
董小舒
王啸
辛付豪
邢志强
齐美彬
庄硕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Laisi Electronic Equipment Co ltd
Original Assignee
Nanjing Laisi Electronic Equipment Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Laisi Electronic Equipment Co ltd filed Critical Nanjing Laisi Electronic Equipment Co ltd
Priority to CN202310057411.3A priority Critical patent/CN116206257A/zh
Priority to PCT/CN2023/093922 priority patent/WO2024152477A1/zh
Publication of CN116206257A publication Critical patent/CN116206257A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/70Labelling scene content, e.g. deriving syntactic or semantic representations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于多尺度特征解耦的机场飞行区目标实时检测方法,其步骤包括:1、获取机场飞行区监控视频,构建机场飞行区目标检测数据集;2、构建多尺度特征融合模块,实现不同尺度目标的检测;3、将目标检测中的分类和定位任务进行解耦,构建基于特征解耦的学习网络;4、将基于特征解耦的学习网络和多尺度特征融合模块加入到YOLOv5目标检测网络,结合损失函数来训练优化目标检测模型。本发明利用多尺度特征融合模块聚合浅层细节信息和深层语义信息,增强了不同尺度目标的检测能力,并利用特征解耦学习网络解耦分类和定位任务,分别学习旋转不变和旋转协变特征,提升了目标检测的准确性。

Description

一种基于多尺度特征解耦的机场飞行区目标实时检测方法
技术领域
本发明涉及一种目标实时检测方法,特别是一种基于多尺度特征解耦的机场飞行区目标实时检测方法。
背景技术
随着经济社会的发展,民航运输产业蓬勃发展,其中机场飞行区承担着飞机泊位、接送旅客等重要任务,机场飞行区的目标实时检测是保障机场场面上航空器、车辆、工作人员安全高效运行的基础,实现机场飞行区的智能监控对于机场的安全运行有着重要作用。
目前,机场常用的飞行区监视***包括工作人员目视、监视雷达和视频监控等多种方法。其中,监视雷达只能对目标进行探测和定位,无法识别被探测目标类型,而且由于飞机、廊桥、候机楼等物体的遮挡,其检测范围也存在一定的盲区。近年来,随着监控视频和计算机视觉的发展,基于图像的目标检测技术广泛应用于交通、体育赛事等人类生活的各个方面,也应用于机场监控,识别并定位机场中的典型目标,实时感知机场各类目标的运行情况。
然而,由于机场环境复杂、天气变化、各类目标尺度大小不同等因素,机场飞行区目标的精准检测面临着很大的挑战。首先,机场环境复杂,大部分摄像头安装在航站楼上,导致地面目标在图像中占有的像素点较少,影响检测效果;其次,机场飞行区目标检测需要全天候实时检测,在雨雾雪、白天夜晚等不同天气、不同光照条件下,采集的图像差异较大,对目标检测模型的泛化性能要求高;而且,机场飞行区的飞机、牵引车、行李车、清水车、餐车、工作人员等待检测目标尺度大小不一,类间目标差异大,小目标检测难度高。
发明内容
发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种基于多尺度特征解耦的机场飞行区目标实时检测方法。
为了解决上述技术问题,本发明公开了一种基于多尺度特征解耦的机场飞行区目标实时检测方法,包括如下步骤:
步骤1,构建机场飞行区目标检测数据集;
步骤2,构建多尺度特征融合模块:设计基于通道注意力机制和空间注意力机制的多尺度特征融合模块;
步骤3,构建基于特征解耦的学习网络:用于解耦分类任务和回归任务,通过不同的网络分支获取目标的类别和位置;
步骤4,构建目标检测模型,即将多尺度特征融合模块和基于特征解耦的学习网络加入到YOLOv5目标检测架构,得到目标检测模型;
步骤5,目标检测模型训练、验证及应用:基于步骤1所构建的机场飞行区目标检测数据集,训练步骤4所构建的目标检测模型,并进行验证,完成基于多尺度特征解耦的机场飞行区目标实时检测。
有益效果:
(1)本发明利用多尺度特征融合模块提取了图像的特征信息,有利于提升不同尺度大小的目标检测能力。
(2)本发明构建的多尺度特征融合模块包含了通道注意力和空间注意力模块,能够突出关键位置的特征信息,而且复杂度小,只增加了少量的参数,可以高效地嵌入到目标检测模型中。
(3)本发明利用特征解耦网络提升了分类和定位分支对特征平移和旋转的敏感性,通过非对称卷积和空洞卷积提高了分类分支对目标旋转变化的鲁棒性,通过可变形卷积提升了目标框定位的准确度。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述和/或其他方面的优点将会变得更加清楚。
图1是本发明的总体流程示意图。
图2是多尺度特征融合模块示意图。
图3是目标检测预测网络中特征解耦网络示意图。
图4是本发明实施过程中视频数据和特征解耦的机场飞行区目标实时检测模型得到的结果示例示意图。
具体实施方式
本发明提出了一种基于多尺度特征解耦的机场飞行区目标实时检测方法,如图1所示,具体流程如下:
步骤一、构建机场飞行区目标检测数据集:在飞机的侧面位置布置监控摄像头,获取原始的机场飞行区监控视频,并对上述获取的视频进行抽帧处理获得单帧图像,人工挑选包含待检测目标的典型图像,使用目标检测标注软件标定图像中的每个待检测目标,生成一个标注文本,文本文件中包含有待检测目标的类别和检测框的大小、位置等信息,全部图像标注完成后即构成一个机场飞行区目标检测数据集,随后按照8:1:1的比例划分为训练集、验证集和测试集;
步骤二、构建多尺度特征融合模块,如图2所示,步骤如下:
步骤2.1:选择跨阶段局部网络(Cross Stage Partial Network,CSPNet)作为基础的特征提取网络(参考:CSPNet:A New Backbone that can Enhance LearningCapability of CNN[C]//2020IEEE/CVF Conference on Computer Vision and PatternRecognition Workshops(CVPRW).IEEE,2020.),CSPNet是由局部密集块和局部过渡层组成,能够减少网络的计算量和提高网络运行速度,输入图像通过CSPNet后得到不同尺寸大小的特征图C3、C4和C5,特征图尺寸大小分别为80×80,40×40,20×20;
步骤2.2:特征图C5经过上采样处理,得到特征图CS5,尺寸大小为40×40;
步骤2.3:特征图C4经过空间注意力模块,即C4分别经过最大值池化和均值池化操作,得到的特征图进行拼接;拼接后的特征图经过2D卷积和Sigmoid激活函数后得到特征图的空间权重;再与特征图C4相乘,得到含有空间权重信息的特征图CSA4,尺寸大小为40×40;
步骤2.4:特征图C4经过通道注意力模块,即C4分别经过通道级全局最大值池化和均值池化,得到的特征图分别进行1D卷积后聚合在一起;聚合后的特征图与特征图C4相乘,得到含有通道权重信息的特征图CCA4,尺寸大小为40×40;
步骤2.5:将步骤2.2中获得的特征图CS5、步骤2.3中获得的特征图CSA4和步骤2.4中获得的特征图CCA4相加,得到融合后的特征图F1,如图2所示,尺寸大小为40×40;
步骤2.6:特征图C4经过上采样处理,得到特征图CS4,尺寸大小为80×80;
步骤2.7:特征图C3经过空间注意力模块,即C3分别经过最大值池化和均值池化操作,得到的特征图进行拼接;拼接后的特征图经过2D卷积和Sigmoid激活函数后得到特征图的空间权重;再与特征图C3相乘,得到含有空间权重信息的特征图CSA3,尺寸大小为80×80;
步骤2.8:特征图C3经过通道注意力模块,即C3分别经过通道级全局最大值池化和均值池化,得到的特征图分别进行1D卷积后聚合在一起;聚合后的特征图与特征图C3相乘,得到含有通道权重信息的特征图CCA3,尺寸大小为80×80;
步骤2.9:将步骤2.6中获得的特征图CS4、步骤2.7中获得的特征图CSA3和步骤2.8中获得的特征图CCA3相加,得到融合后的特征图F2,尺寸大小为80×80;
步骤2.10:特征图C5经过2D卷积处理,得到特征图F3,尺寸大小为20×20;
步骤三、构建基于特征解耦的学习网络,如图3所示,在目标检测模型的预测模块中,解耦分类任务和回归任务,通过不同的网络分支获取目标的类别和位置,步骤如下:
步骤3.1:步骤2中获取的特征图F1、F2和F3作为目标检测头的输入,后面分别添加分类分支和回归分支;
步骤3.2:在特征图F3后面添加一个卷积层,得到特征图P3;
步骤3.3:在分类网络分支中,特征图P3后面分别添加非对称卷积和空洞卷积模块;再将非对称卷积和空洞卷积后的特征图进行相加;再经过卷积层输出目标的类别信息;
步骤3.4:在回归网络分支中,特征图P3后面添加可变形卷积;再经过卷积层输出目标的位置信息;
步骤3.5:同步骤3.2、3.3、3.4一样,在特征图F2和F1后分别添加分类网络分支和回归网络分支,得到目标的类别信息和位置信息;
步骤四、将多尺度特征融合模块和基于特征解耦的学习网络加入到YOLOv5目标检测架构,步骤如下:
步骤4.1:选择YOLOv5的目标检测架构,在基础的特征提取网络中加入多尺度特征融合模块;
步骤4.2:在多尺度预测分支中,添加基于特征解耦的学习网络;
步骤4.3:设置目标检测模型的参数,在机场飞行区目标检测数据集的训练样本中应用k均值聚类算法,得到9种不同大小的先验框;网络初始学习率设置为0.01;使用随机梯度下降法(SGD)作为优化器;最大迭代次数设置为200;批量训练的大小设置为16;模型保存类型设置为pth格式;
步骤4.4:训练目标检测模型:载入预训练模型,利用步骤一构建的机场飞行区目标检测数据集对模型参数进行调节;
步骤4.5:优化模型:根据验证集的结果,调整训练参数,优化目标检测模型。
步骤4.6:部署模型:将优化后的目标检测模型应用于监控视频,获取视频中的目标类别和位置信息。
步骤五、目标检测模型训练、验证及应用:根据步骤4.3中设置的参数,基于构建的机场飞行区目标检测数据集训练目标检测模型,并对测试集图像中进行测试和验证,将验证后的模型应用于机场飞行区监控视频,在待检测视频中识别出目标类别的位置,输出对应的目标类别信息和目标框信息,检测结果示例如图4所示。
具体实现中,本申请提供计算机存储介质以及对应的数据处理单元,其中,该计算机存储介质能够存储计算机程序,所述计算机程序通过数据处理单元执行时可运行本发明提供的一种基于多尺度特征解耦的机场飞行区目标实时检测方法的发明内容以及各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,ROM)或随机存储记忆体(random access memory,RAM)等。
本领域的技术人员可以清楚地了解到本发明实施例中的技术方案可借助计算机程序以及其对应的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机程序即软件产品的形式体现出来,该计算机程序软件产品可以存储在存储介质中,包括若干指令用以使得一台包含数据处理单元的设备(可以是个人计算机,服务器,单片机,MUU或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本发明提供了一种基于多尺度特征解耦的机场飞行区目标实时检测方法的思路及方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。

Claims (10)

1.一种基于多尺度特征解耦的机场飞行区目标实时检测方法,其特征在于,包括如下步骤:
步骤1,构建机场飞行区目标检测数据集;
步骤2,构建多尺度特征融合模块:设计基于通道注意力机制和空间注意力机制的多尺度特征融合模块;
步骤3,构建基于特征解耦的学习网络:用于解耦分类任务和回归任务,通过不同的网络分支获取目标的类别和位置;
步骤4,构建目标检测模型,即将多尺度特征融合模块和基于特征解耦的学习网络加入到YOLOv5目标检测架构,得到目标检测模型;
步骤5,目标检测模型训练、验证及应用:基于步骤1所构建的机场飞行区目标检测数据集,训练步骤4所构建的目标检测模型,并进行验证,完成基于多尺度特征解耦的机场飞行区目标实时检测。
2.如权利要求1所述的一种基于多尺度特征解耦的机场飞行区目标实时检测方法,其特征在于,步骤1中所述的构建机场飞行区目标检测数据集,具体方法包括:
在飞机的侧面位置布置监控摄像头,获取原始的机场飞行区监控视频,并对所述获取的视频进行抽帧处理获得单帧图像,人工挑选所述单帧图像中包含待检测目标的典型图像,标定所述典型图像中的每个待检测目标,生成一个标注文本文件,标注文本文件中包含:待检测目标的类别、检测框的大小以及位置信息,全部典型图像标注完成后即构成一个机场飞行区目标检测数据集。
3.如权利要求2所述的一种基于多尺度特征解耦的机场飞行区目标实时检测方法,其特征在于,步骤1所述的机场飞行区目标检测数据集中,按照8:1:1的比例划分为训练集、验证集和测试集。
4.如权利要求3所述的一种基于多尺度特征解耦的机场飞行区目标实时检测方法,其特征在于:步骤2中所述构建多尺度特征融合模块,具体方法如下:
步骤2.1,选择CSPNet作为基础的特征提取网络,输入待检测图像后得到不同尺寸大小的特征图C3、C4和C5,特征图尺寸大小分别为80×80,40×40和20×20;
步骤2.2,特征图C5经过上采样处理,得到特征图CS5,尺寸大小为40×40;
步骤2.3,特征图C4经过空间注意力模块,即C4分别经过最大值池化和均值池化操作,得到的特征图进行拼接;拼接后的特征图经过2D卷积和Sigmoid激活函数后得到特征图C4的空间权重;再将空间权重与特征图C4相乘,得到含有空间权重信息的特征图CSA4,尺寸大小为40×40;
步骤2.4,特征图C4经过通道注意力模块,即C4分别经过通道级全局最大值池化和均值池化,得到的特征图分别进行1D卷积后聚合在一起;聚合后的特征图与特征图C4相乘,得到含有通道权重信息的特征图CCA4,尺寸大小为40×40;
步骤2.5,将步骤2.2中获得的特征图CS5、步骤2.3中获得的特征图CSA4和步骤2.4中获得的特征图CCA4相加,得到融合后的特征图F1;
步骤2.6,特征图C4经过上采样处理,得到特征图CS4,尺寸大小为80×80;
步骤2.7,特征图C3经过空间注意力模块,即C3分别经过最大值池化和均值池化操作,得到的特征图进行拼接;拼接后的特征图经过2D卷积和Sigmoid激活函数后得到特征图C3的空间权重;再将空间权重与特征图C3相乘,得到含有空间权重信息的特征图CSA3,尺寸大小为80×80;
步骤2.8,特征图C3经过通道注意力模块,即C3分别经过通道级全局最大值池化和均值池化,得到的特征图分别进行1D卷积后聚合在一起;聚合后的特征图与特征图C3相乘,得到含有通道权重信息的特征图CCA3,尺寸大小为80×80;
步骤2.9:将步骤2.6中获得的特征图CS4、步骤2.7中获得的特征图CSA3和步骤2.8中获得的特征图CCA3相加,得到融合后的特征图F2;
步骤2.10:特征图C5经过2D卷积处理,得到特征图F3。
5.如权利要求书4所述的一种基于多尺度特征解耦的机场飞行区目标实时检测方法,其特征在于,步骤3中所述的构建基于特征解耦的学习网络,所述学习网络包括:分类网络分支和回归网络分支,具体方法为:
步骤3.1,步骤2中获取的特征图F1、F2和F3作为所述学习网络中目标检测头的输入,后面分别添加分类网络分支和回归网络分支;
步骤3.2,在特征图F3对应的目标检测头的输出后面添加一个卷积层,得到特征图P3;
步骤3.3,在分类网络分支中,特征图P3后面分别添加非对称卷积和空洞卷积模块;再将非对称卷积和空洞卷积后的特征图进行相加;再经过卷积层输出目标的类别信息;
步骤3.4,在回归网络分支中,特征图P3后面添加可变形卷积;再经过卷积层输出目标的位置信息;
步骤3.5,同步骤3.2至步骤3.4,在特征图F2和F1后分别添加分类网络分支和回归网络分支,得到目标的类别信息和位置信息。
6.如权利要求5所述的一种基于多尺度特征解耦的机场飞行区目标实时检测方法,其特征在于,步骤4中所述的构建目标检测模型,即选择YOLOv5的目标检测架构,在所述目标检测架构中基础的特征提取网络中加入多尺度特征融合模块,并在所述目标检测架构中的多尺度预测分支中,添加基于特征解耦的学习网络。
7.如权利要求书6所述的一种基于多尺度特征解耦的机场飞行区目标实时检测方法,其特征在于,步骤4中所述的构建目标检测模型,具体方法为:
步骤4.1,选择YOLOv5的目标检测架构,在所述目标检测架构中基础的特征提取网络中加入多尺度特征融合模块;
步骤4.2,在所述目标检测架构中的多尺度预测分支中,添加基于特征解耦的学习网络,得到目标检测模型;
步骤4.3,设置所述目标检测模型的参数:先验框大小、网络学习率、优化函数、最大迭代次数、批量训练的大小以及模型保存位置。
8.如权利要求书7所述的一种基于多尺度特征解耦的机场飞行区目标实时检测方法,其特征在于,步骤5中所述的目标检测模型训练、验证及应用,具体方法包括:
步骤5.1,训练目标检测模型:载入步骤4中得到的目标检测模型,进行预训练,利用步骤1构建的机场飞行区目标检测数据集对模型参数进行调节;
步骤5.2,优化模型:使用验证集进行验证,并根据验证的结果,调整训练参数,优化目标检测模型;
步骤5.3,部署模型:将优化后的目标检测模型应用于监控视频,获取视频中的目标类别和位置信息。
9.如权利要求书8所述的一种基于多尺度特征解耦的机场飞行区目标实时检测方法,其特征在于,步骤5.2所述的使用验证集进行验证,即在验证集图像中进行验证,在待检测视频中识别出目标类别的位置,输出对应的目标类别信息和目标框信息。
10.如权利要求书9所述的一种基于多尺度特征解耦的机场飞行区目标实时检测方法,其特征在于,步骤1中所述的标定所述典型图像中的每个待检测目标,即使用目标检测标注软件进行标定。
CN202310057411.3A 2023-01-17 2023-01-17 一种基于多尺度特征解耦的机场飞行区目标实时检测方法 Pending CN116206257A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202310057411.3A CN116206257A (zh) 2023-01-17 2023-01-17 一种基于多尺度特征解耦的机场飞行区目标实时检测方法
PCT/CN2023/093922 WO2024152477A1 (zh) 2023-01-17 2023-05-12 一种基于多尺度特征解耦的机场飞行区目标实时检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310057411.3A CN116206257A (zh) 2023-01-17 2023-01-17 一种基于多尺度特征解耦的机场飞行区目标实时检测方法

Publications (1)

Publication Number Publication Date
CN116206257A true CN116206257A (zh) 2023-06-02

Family

ID=86514054

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310057411.3A Pending CN116206257A (zh) 2023-01-17 2023-01-17 一种基于多尺度特征解耦的机场飞行区目标实时检测方法

Country Status (2)

Country Link
CN (1) CN116206257A (zh)
WO (1) WO2024152477A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117611791A (zh) * 2023-10-20 2024-02-27 哈尔滨工业大学 一种基于特征分离可变形卷积的飞行目标检测方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210370993A1 (en) * 2020-05-27 2021-12-02 University Of South Carolina Computer vision based real-time pixel-level railroad track components detection system
CN112364855B (zh) * 2021-01-14 2021-04-06 北京电信易通信息技术股份有限公司 一种基于多尺度特征融合的视频目标检测方法及***
CN113780211A (zh) * 2021-09-16 2021-12-10 河北工程大学 一种基于改进型Yolov4-tiny的轻量级飞机检测方法
CN114202672A (zh) * 2021-12-09 2022-03-18 南京理工大学 一种基于注意力机制的小目标检测方法
CN115409817B (zh) * 2022-08-30 2024-01-26 中南大学 一种基于yolo的轻量高效的检测网络

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117611791A (zh) * 2023-10-20 2024-02-27 哈尔滨工业大学 一种基于特征分离可变形卷积的飞行目标检测方法

Also Published As

Publication number Publication date
WO2024152477A1 (zh) 2024-07-25

Similar Documents

Publication Publication Date Title
CN110472627B (zh) 一种端到端的sar图像识别方法、装置及存储介质
Xie et al. SegCloud: A novel cloud image segmentation model using a deep convolutional neural network for ground-based all-sky-view camera observation
CN111368712A (zh) 一种基于深度学习的高光谱图像伪装目标检测方法
WO2017151673A1 (en) Synthesizing training data for broad area geospatial object detection
FR3103048A1 (fr) Procede et dispositif de generation de donnees synthetiques d'apprentissage pour machine d'intelligence artificielle pour l'aide a l'atterrissage d'aeronef
CN113420607A (zh) 无人机多尺度目标检测识别方法
CN111767927A (zh) 一种基于全卷积网络的轻量级车牌识别方法及***
CN108875754B (zh) 一种基于多深度特征融合网络的车辆再识别方法
CN108875593A (zh) 基于卷积神经网络的可见光图像天气识别方法
CN112270331A (zh) 一种基于yolov5改进的广告牌检测方法
CN112287983B (zh) 一种基于深度学习的遥感图像目标提取***和方法
Xing et al. Traffic sign recognition using guided image filtering
WO2024152477A1 (zh) 一种基于多尺度特征解耦的机场飞行区目标实时检测方法
CN114519819B (zh) 一种基于全局上下文感知的遥感图像目标检测方法
CN115861756A (zh) 基于级联组合网络的大地背景小目标识别方法
Wang et al. Multiscale traffic sign detection method in complex environment based on YOLOv4
CN113177528B (zh) 基于多任务学习策略训练网络模型的车牌识别方法及***
CN114048536A (zh) 一种基于多任务神经网络的道路结构预测与目标检测方法
CN112785610B (zh) 一种融合低层特征的车道线语义分割方法
CN111898427A (zh) 一种基于特征融合深度神经网络的多光谱行人检测方法
Talaat et al. Enhanced aerial vehicle system techniques for detection and tracking in fog, sandstorm, and snow conditions
Roy et al. AWDMC-Net: classification of adversarial weather degraded multiclass scenes using a convolution neural network
Wu et al. Research on asphalt pavement disease detection based on improved YOLOv5s
CN114550016B (zh) 一种基于上下文信息感知的无人机定位方法及***
Wang et al. Improving YOLOX network for multi-scale fire detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination