CN112613504A - 一种声呐水下目标检测方法 - Google Patents

一种声呐水下目标检测方法 Download PDF

Info

Publication number
CN112613504A
CN112613504A CN202011492415.7A CN202011492415A CN112613504A CN 112613504 A CN112613504 A CN 112613504A CN 202011492415 A CN202011492415 A CN 202011492415A CN 112613504 A CN112613504 A CN 112613504A
Authority
CN
China
Prior art keywords
prediction
target
image
boundary
sonar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011492415.7A
Other languages
English (en)
Inventor
曾丹
陆恬昳
徐霁轩
蔡周吟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Shanghai for Science and Technology
Original Assignee
University of Shanghai for Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Shanghai for Science and Technology filed Critical University of Shanghai for Science and Technology
Priority to CN202011492415.7A priority Critical patent/CN112613504A/zh
Publication of CN112613504A publication Critical patent/CN112613504A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Multimedia (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种声呐水下目标检测方法,具体步骤包括:通过对水下目标图像进行预处理,得到待检测数据;提取待检测数据特征,然后选择先验框,提取特征图,对特征图中的先验框进行处理计算,得到边界框值,根据边界框值,得到检测结果,并对检测结果进行修正。本发明对前视声呐中的目标检测提供了一种方法,相较于传统方法,减少了时间,提升了检测的准确度和速度,能有效识别特定目标,并且可以对连续帧的声呐图像进行处理,较为准确的在前视声呐图像中显示当前图像中目标的位置和类型,能够达到实时检测的效果。

Description

一种声呐水下目标检测方法
技术领域
本发明属于人工智能与水声电子信息的交叉领域,具体涉及一种基于YOLOv3深度学习网络的前视声呐图像目标检测识别方法。
背景技术
由于水下恶劣危险的环境,海洋产业在发展中面临着迫切的产业智能化升级需求。为了解决该类问题,光学技术、声学技术和AI算法逐渐融入到海洋产业中去。随着技术的发展,水下目标检测技术发展很快,比如水下地形地貌的探测、鱼雷的探测技术等等,而声学图像在水下目标检测中探程远、实用性强,声呐水下目标的检测有着广泛的应用前景和发展空间。
声呐设备主要包括前视声呐、侧扫声呐和合成孔径声呐在航行器行进过程中不断发射和接收声呐信号,实现检测。前视声呐分为单波束和多波束两种,其中单波束前视声呐形成一个波束,利用基阵的自然方向性进行定向,一次收发过程中只能观察一个波束所覆盖的空间,探测较大的固定区域时,需要转动波束使其覆盖整个区域多波束前视声呐可同时发射多个波束形成扇形探测区,可进行条带式测量。声呐设备采集到的图像干扰大,受噪声影响大,水下小目标的检测存在着许多问题。目前,声呐的工作性能除了受自身技术参数的限制之外,还受环境因素影响很大,这将导致声波的折射、扩散、吸收、噪声等问题。
深度学习模型由于强大的表示能力,加之数据量的积累和计算力的进步,成为机器视觉的热点,而目标检测识别则是机器视觉中的重要问题。对于图像的理解可以分为好几个层次,分类是指将图像归为某一类别,检测,给出的是对整张图片的内容描述,是对目标的类别的识别和位置的确定,分割任务则是值对背景的分离和对目标轮廓的分离。近些年的水下目标检测方法主要有基于模板匹配的方法、基于数理统计的方法、浅层神经网络的方法等等。
现有声呐水下目标检测技术中存在声呐数据集少,用于网络训练的数据集不足;声呐图像不清晰,干扰多,声呐图像位置不定,不同目标直接特征差异不大或是相同目标由于背景干扰导致差异较大的情况同时存在;声呐图像目标识别率不同等问题。
发明内容
针对上述现有技术所存在的问题,本发明提供一种可以使用任意数据集,检测准确率高且目标识别准确的声呐水下目标检测方法,具体包括以下步骤:
步骤一:采集预训练水下目标图像,对预训练水下目标图像进行预处理,得到训练数据集;
步骤二:构建特征提取网络,基于训练数据集,训练特征提取网络;
步骤三:采集水下目标图像,对所述水下目标图像进行预处理,得到待检测数据集;将待检测数据集输入特征提取网络,通过所述特征提取网络,将所述待检测数据集划分网格,并提取所述水下图像特征;
步骤四:基于所述水下目标图像的特征,对待检测数据集进行k-means聚类,然后选择预测边界框,将所述预测边界框的聚类簇和尺度进行排序,根据所述排序结果,将所述聚类簇均分到各个尺度上,得到不同尺度的特征图;
步骤五:构建边界框预测网络,基于所述特征图,通过边界框预测网络进行卷积预测,得到预测边界框值;
步骤六:对预测边界框值进行后处理,得到对应数据的检测结果;
步骤七:对水下目标图像数据的相邻帧分别进行检测,得到相邻帧的检测结果,根据相邻帧的检测结果,对图像预测结果进行修正。
优选的,所述步骤二基于DarkNet53构建特征提取网络。
优选的,所述步骤一中的预训练水下目标图像为前视声呐扇形图像中截取的矩形图像。
优选的,所述步骤一中的预处理,具体步骤为:对截取的矩形图像调整形状大小,然后对大小调整后的图像进行背景填充。
优选的,所述步骤七中所述待检测数据为连续帧的待检测数据时,通过前后帧的关联性对预测结果进行优化。
优选的,所述步骤五,具体步骤包括:基于RPN网络,构建边界框预测网络,所述边界框预测网络使用直接的位置预测,得到预测边界框的值。
优选的,所述步骤六,具体步骤包括,
根据预测边界框的左下角网格的偏移量,使用Sigmoid限制,控制所述偏移量在0-1,将预测边界框的中心约束在当前中心所在网格中,得到处理后的预测边界框;
基于处理后的预测边界框,通过非极大值抑制算法,将处理后的预测边界框按类别划分,根据得分降序排列,计算其中一个边界框和其他边界框的交并比,通过设定交并比的阈值,筛选边界框,得到目标边界框;基于目标边界框,使用逻辑回归计算每个预测边界框的目标置信度,使用平方误差计算目标边界框参数,得到检测结果;
所述检测结果为目标置信度和目标边界框参数。
优选的,所述步骤五边界框预测网络的卷积核的数量为(4+1+c)*k个,其中每个预测边界框包括:4*k个表示目标边界框的偏移量的参数,k个表示目标边界框内包含目标概率的参数,c*k个表示预测k个预设边界框对应c个目标类别概率的参数。
优选的,所述步骤四中特征图包括两个维度包括平面维度和深度维度;
所述平面维度为m*m,对应的有m*m个网格用于预测;
所述深度的维度为(4+1+c)*k。
本发明的有益效果:
1、针对前视声呐数据,从数据集处理出发,对于一系列的前视声呐数据,框出待检测目标所在区域,制作对应数据集,针对不同目标大小的区域进行不同预处理,针对前视声呐图像数据,处理出能适合深度学习网络输入且学习的图像数据,待检测区域大小可任意,预处理部分针对待检测区域做对应处理后输入检测网络,网络也能够完整运行并达到同样的技术效果;
2、本发明使用深度学习的方法,将经过处理的前视声呐图像数据集送入网络中训练,提取特征,使用深度神经网络实现目标检测的功能,检测速率、准确率与召回率指标高;
3、本发明将前视声呐图像输入到YOLOv3网络模型中,在模型中完成特征提取、目标检测、目标分类。最终准确给出目标置信度结果、目标类别以及目标所处相对于图像的位置。同时可以通过有关联的前后帧声呐数据,在判断模块中按照一定策略对当前声呐图片检测结果进行调整,同样可以达到上述效果;
4、本发明采用多尺度预测,对于声呐图像中不同大小的目标可同时使用一个网络进行预测,无需反复训练模型。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为基于YOLOv3的前视声呐图像目标检测识别方法的流程图;
图2为基于YOLOv3的前视声呐图像目标检测识别方法的神经网络部分的结构图;
图3为基于YOLOv3的前视声呐图像目标检测识别方法神经网络训练过程的曲线图,其中图3(a)-(h)分别对应广义交并比变化曲线、Obj值变化曲线、查准率变化曲线、查全率变化曲线、验证集广义交并比变化曲线、验证集Obj值变化曲线、平均精度变化曲线、F1值变化曲线;
图4为经过预处理后的需要放入网络进行训练的图像数据示例图,图4(a)-(d)对应第一类目标图像示例图,图4(e)为第二类目标图像示例图,图4(f)为第三类目标图像示例图,图4(g)为第四类目标图像示例图,四类目标分别为雷,管线,基阵和潜标;
图5为不同类别目标的检测结果示例图,其中图5(a)-(d)分别对应第一类、第二类、第三类和第四类目标图像的输出结果图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决在联邦机器学***性的问题,本发明提供了如下方案:
参照图1,本发明提供了一种声呐水下目标检测方法,包括以下步骤:
步骤一:从前视声呐中获取的待检测区域部分开始,采集预训练水下目标图像,对预训练水下目标图像进行预处理,得到训练数据集;预训练水下目标图像为前视声呐扇形图像中截取的矩形图像。预处理具体步骤为:对截取的矩形图像调整形状大小,然后对大小调整后的图像进行背景填充。
步骤二:基于DarkNet53构建特征提取网络,基于训练数据集,训练特征提取网络。
如图4所示,采集图像后经过预处理得到前视声呐图像数据,通过对扇形图像进行直接裁剪然后对其进行尺寸调整,或是截取扇形图中的实际目标大小的区域进行尺寸调整后将含有目标的图像周围填充背景两种方法得到。同时在使用截取到的图像填充到固定尺寸前,对其进行了旋转、翻折等操作扩充训练数据集,将包含四类目标的数据集送入网络训练,获得用于对应四类目标检测的神经网络模型。
步骤三:采集水下目标图像,对所述水下目标图像进行预处理,得到待检测数据集;将待检测数据集输入特征提取网络,通过所述特征提取网络,将所述待检测数据集划分网格,并提取所述水下图像特征。
步骤四:基于所述水下目标图像的特征,对待检测数据集进行k-means聚类,然后选择预测边界框,将所述预测边界框的聚类簇和尺度进行排序,根据所述排序结果,将所述聚类簇均分到各个尺度上,得到不同尺度的特征图。
特征提取网络和聚类得到特征图中的网络结构组合构成目标检测网络,所述目标检测网络结构如图2所示,使用特征提取网络提取特征,通过划分单元格,对待检测数据进行目标检测,采用Leaky ReLu作为激活函数,采用端到端进行训练,使用batchnormalization作为正则化、加速收敛和避免过拟合的方法,以提取图像特征。
其中,CBL是目标检测网络中最小的组件,指的是对输入进行卷积Conv、归一化Bn和使用激活函数激活三个操作,本发明中使用的激活函数为Leaky ReLu函数。res模块指的是仿照残差网络设计的残差块,在残差块中,输入可通过跨层的数据线路更快地向前传播。目标检测网络流程如下:输入图像到包含CBL组件和res组件的基础网络,在三个不同的网络部位输出三个值,即对应的三个尺度的特征图。三个不同尺度的特征图分为三个分支,第一个分支直接进入CBL组件后输出,第二个分支将第一个分支中经过一次CBL组件输出的值与从基础网络提取到的特征图输出相结合后进入CBL组件得到输出,同样的,第三个分支对第二个分支第一组CBL输出的结果和基础网络输出的结果进行张量拼接,后对其继续进行CBL的处理得到结果。
步骤五:基于RPN网络,构建边界框预测网络,边界框预测网络的卷积核的数量为(4+1+c)*k个,其中每个预测边界框包括:4*k个参数表示目标边界框的偏移量,k个参数表示目标边界框内包含目标的概率,c*k个参数表示预测k个预设边界框对应c个目标类别的概率。特征图包括两个维度包括平面维度和深度维度;所述平面维度为m*m,对应的有m*m个网格用于预测;所述深度的维度为(4+1+c)*k。
所述边界框预测网络使用直接的位置预测,得到预测边界框的值。
步骤六:对预测边界框的值进行后处理,得到对应数据的检测结果。
根据预测边界框的值(预测边界框的左下角网格坐标相对x,y方向偏移量tx.ty,预测边界框尺度缩放值tw,th),通过sigmoid函数将预测边界框的左下角网格坐标的偏移量tx和ty压缩在0-1之间,将预测边界框的中心约束在当前中心所在网格中,得到处理后的预测边界框;
由于每个网格都含有3个处理后的预测框,具体使用哪个处理后的预测边界框作为目标边界框取决于框与ground truth的交并比(Intersection-over-Union,IOU),IOU最大的参与目标框与ground truth的匹配,与ground truth匹配的目标框计算坐标误差、置信度误差以及分类误差,而其它的不参与匹配的只计算置信度误差。边界框预测网络通过目标边界框的微小偏移量和尺度缩放值,来减少损失,获得准确的模型。对于匹配的目标边界框,使用逻辑回归即通过平移加尺度缩放来对每个边界框进行微调,最终预测获得每个边界框的目标置信度,使用平方误差计算边界框参数,最终得到目标边界框参数包括目标边界框左上角坐标bx,by和目标边界框宽度和高度bw,bh以及目标置信度confidence。
所述目标边界框参数由如下公式可得:
bx=σ(tx)+cx
by=σ(ty)+cy
bw=pwetw
bh=pheth
训练过程中损失值的变化曲线如图3(a)-(h)所示,其中还包括模型对目标检测结果的计算指标精度(precision)和召回率(recall)的变化。
步骤七:根据水下目标图像数据的相邻帧,将相邻帧的图像数据分别依次输入目标检测网络和边界框预测网络,得到相邻帧的检测结果,根据相邻帧的检测结果加权求得最终的检测结果,再根据设定的阈值进行判断,对图像预测结果进行修正。所述待检测数据为连续帧的待检测数据时,通过判断模块的相应策略,通过前后帧的关联性修正当前帧检测结果的置信度。
本发明的有益效果:
1、针对前视声呐数据,从数据集处理出发,对于一系列的前视声呐数据,框出待检测目标所在区域,制作对应数据集,针对不同目标大小的区域进行不同预处理,针对前视声呐图像数据,处理出能适合深度学习网络输入且学习的图像数据,待检测区域大小可任意,预处理部分针对待检测区域做对应处理后输入检测网络,网络也能够完整运行并达到同样的技术效果;2、本发明使用深度学习的方法,将经过处理的前视声呐图像数据集送入网络中训练,提取特征,使用深度神经网络实现目标检测的功能,检测速率、准确率与召回率指标高;3、本发明将前视声呐图像输入到YOLOv3网络模型中,在模型中完成特征提取、目标检测、目标分类。最终准确给出目标置信度结果、目标类别以及目标所处相对于图像的位置。同时可以通过有关联的前后帧声呐数据,在判断模块中按照一定策略对当前声呐图片检测结果进行调整,同样可以达到上述效果;4、本发明采用多尺度预测,对于声呐图像中不同大小的目标可同时使用一个网络进行预测,无需反复训练模型。
图5为将使用本发明所述技术方案,最终得到对应的四类目标检测输出图像,最终结果会同时给出对应的文本记录目标的种类、位置和置信度。
以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (9)

1.一种声呐水下目标检测方法,其特征在于,包括以下步骤:
步骤一:采集预训练水下目标图像,对预训练水下目标图像进行预处理,得到训练数据集;
步骤二:构建特征提取网络,基于训练数据集,训练特征提取网络;
步骤三:采集水下目标图像,对所述水下目标图像进行预处理,得到待检测数据集;将待检测数据集输入特征提取网络,通过所述特征提取网络,将所述待检测数据集划分网格,并提取所述水下图像特征;
步骤四:基于所述水下目标图像的特征,对待检测数据集进行k-means聚类,然后选择预测边界框,将所述预测边界框的聚类簇和尺度进行排序,根据所述排序结果,将所述聚类簇均分到各个尺度上,得到不同尺度的特征图;
步骤五:构建边界框预测网络,基于所述特征图,通过边界框预测网络进行卷积预测,得到预测边界框值;
步骤六:对预测边界框值进行后处理,得到对应数据的检测结果;
步骤七:对水下目标图像数据的相邻帧分别进行检测,得到相邻帧的检测结果,根据相邻帧的检测结果,对图像预测结果进行修正。
2.根据权利要求1所述一种声呐水下目标检测方法,其特征在于:
所述步骤二基于DarkNet53构建特征提取网络。
3.根据权利要求1所述一种声呐水下目标检测方法,其特征在于:
所述步骤一中的预训练水下目标图像为前视声呐扇形图像中截取的矩形图像。
4.根据权利要求3所述一种声呐水下目标检测方法,其特征在于:
所述步骤一中的预处理,具体步骤为:对截取的矩形图像调整形状大小,然后对大小调整后的图像进行背景填充。
5.根据权利要求1所述一种声呐水下目标检测方法,其特征在于:
所述步骤七中所述待检测数据为连续帧的待检测数据时,通过前后帧的关联性对预测结果进行优化。
6.根据权利要求1所述一种声呐水下目标检测方法,其特征在于:
所述步骤五,具体步骤包括:基于RPN网络,构建边界框预测网络,所述边界框预测网络使用直接的位置预测,得到预测边界框的值;
所述预测边界框的值包括预测边界框的左下角网格的偏移量和预测边界框尺度缩放值。
7.根据权利要求1所述一种声呐水下目标检测方法,其特征在于:
所述步骤六,具体步骤包括,
根据预测边界框的左下角网格的偏移量,使用Sigmoid限制,控制所述偏移量在0-1,将预测边界框的中心约束在当前中心所在网格中,得到处理后的预测边界框;
基于处理后的预测边界框,通过非极大值抑制算法,将处理后的预测边界框按类别划分,根据得分降序排列,计算其中一个边界框和其他边界框的交并比,通过设定交并比的阈值,筛选边界框,得到目标边界框;基于目标边界框,使用逻辑回归计算每个预测边界框的目标置信度,使用平方误差计算目标边界框参数,得到检测结果;
所述检测结果为目标置信度和目标边界框参数。
8.根据权利要求6所述一种声呐水下目标检测方法,其特征在于:
所述步骤五边界框预测网络的卷积核的数量为(4+1+c)*k个,其中每个预测边界框包括:4*k个表示目标边界框的偏移量的参数,k个表示目标边界框内包含目标概率的参数,c*k个表示预测k个预设边界框对应c个目标类别概率的参数。
9.根据权利要求8所述一种声呐水下目标检测方法,其特征在于:
所述步骤四中特征图包括两个维度包括平面维度和深度维度;
所述平面维度为m*m,对应的有m*m个网格用于预测;
所述深度的维度为(4+1+c)*k。
CN202011492415.7A 2020-12-17 2020-12-17 一种声呐水下目标检测方法 Pending CN112613504A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011492415.7A CN112613504A (zh) 2020-12-17 2020-12-17 一种声呐水下目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011492415.7A CN112613504A (zh) 2020-12-17 2020-12-17 一种声呐水下目标检测方法

Publications (1)

Publication Number Publication Date
CN112613504A true CN112613504A (zh) 2021-04-06

Family

ID=75239914

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011492415.7A Pending CN112613504A (zh) 2020-12-17 2020-12-17 一种声呐水下目标检测方法

Country Status (1)

Country Link
CN (1) CN112613504A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113379710A (zh) * 2021-06-18 2021-09-10 上海大学 一种水下目标声呐精准测量***和方法
CN113702978A (zh) * 2021-08-04 2021-11-26 中国科学院声学研究所 一种基于前视声呐的海底管道检测定位方法及***
CN113807324A (zh) * 2021-11-02 2021-12-17 中国人民解放军32021部队 一种声呐图像识别方法、装置、电子设备和储存介质
CN117434524A (zh) * 2023-10-12 2024-01-23 中国科学院声学研究所 合成孔径声纳图像感兴趣小目标回波数据属性辨识方法
CN117434524B (zh) * 2023-10-12 2024-07-09 中国科学院声学研究所 合成孔径声纳图像感兴趣小目标回波数据属性辨识方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101968884A (zh) * 2009-07-28 2011-02-09 索尼株式会社 检测视频图像中的目标的方法和装置
CN108038837A (zh) * 2017-12-08 2018-05-15 苏州科达科技股份有限公司 视频中目标检测方法及***
CN110287877A (zh) * 2019-06-25 2019-09-27 腾讯科技(深圳)有限公司 视频目标的处理方法及装置
CN110837870A (zh) * 2019-11-12 2020-02-25 东南大学 基于主动学习的声呐图像目标识别方法
US20200293891A1 (en) * 2019-04-24 2020-09-17 Jiangnan University Real-time target detection method deployed on platform with limited computing resources
CN112052817A (zh) * 2020-09-15 2020-12-08 中国人民解放军海军大连舰艇学院 基于迁移学习的改进YOLOv3模型侧扫声纳沉船目标自动识别方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101968884A (zh) * 2009-07-28 2011-02-09 索尼株式会社 检测视频图像中的目标的方法和装置
CN108038837A (zh) * 2017-12-08 2018-05-15 苏州科达科技股份有限公司 视频中目标检测方法及***
US20200293891A1 (en) * 2019-04-24 2020-09-17 Jiangnan University Real-time target detection method deployed on platform with limited computing resources
CN110287877A (zh) * 2019-06-25 2019-09-27 腾讯科技(深圳)有限公司 视频目标的处理方法及装置
CN110837870A (zh) * 2019-11-12 2020-02-25 东南大学 基于主动学习的声呐图像目标识别方法
CN112052817A (zh) * 2020-09-15 2020-12-08 中国人民解放军海军大连舰艇学院 基于迁移学习的改进YOLOv3模型侧扫声纳沉船目标自动识别方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
HONGBO YANG等: "Research on underwater object recognition based on YOLOv3", 《MICROSYSTEM TECHNOLOGIES》 *
JOSEPH REDMON等: "YOLOv3: An Incremental Improvement", 《COMPUTER VISION AND PATTERN RECOGNITION》 *
刘韦伯: "基于深度学习的水下目标图像识别方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
曾文冠等: "基于卷积神经网络的声呐图像目标检测识别", 《第十七届船舶水下噪声学术讨论会论文集》 *
王晓: "基于卷积神经网络的彩色成像声呐目标检测", 《中国优秀硕士学位论文全文数据库 工程科技II辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113379710A (zh) * 2021-06-18 2021-09-10 上海大学 一种水下目标声呐精准测量***和方法
CN113379710B (zh) * 2021-06-18 2024-02-02 上海大学 一种水下目标声呐精准测量***和方法
CN113702978A (zh) * 2021-08-04 2021-11-26 中国科学院声学研究所 一种基于前视声呐的海底管道检测定位方法及***
CN113702978B (zh) * 2021-08-04 2023-07-18 中国科学院声学研究所 一种基于前视声呐的海底管道检测定位方法及***
CN113807324A (zh) * 2021-11-02 2021-12-17 中国人民解放军32021部队 一种声呐图像识别方法、装置、电子设备和储存介质
CN117434524A (zh) * 2023-10-12 2024-01-23 中国科学院声学研究所 合成孔径声纳图像感兴趣小目标回波数据属性辨识方法
CN117434524B (zh) * 2023-10-12 2024-07-09 中国科学院声学研究所 合成孔径声纳图像感兴趣小目标回波数据属性辨识方法

Similar Documents

Publication Publication Date Title
CN110472627B (zh) 一种端到端的sar图像识别方法、装置及存储介质
CN111091105B (zh) 基于新的边框回归损失函数的遥感图像目标检测方法
CN111832655B (zh) 一种基于特征金字塔网络的多尺度三维目标检测方法
CN107609525B (zh) 基于剪枝策略构建卷积神经网络的遥感图像目标检测方法
CN112613504A (zh) 一种声呐水下目标检测方法
CN110084234B (zh) 一种基于实例分割的声呐图像目标识别方法
CN112766087A (zh) 一种基于知识蒸馏的光学遥感图像舰船检测方法
CN113033520B (zh) 一种基于深度学习的树木线虫病害木识别方法及***
CN109492596B (zh) 一种基于K-means聚类和区域推荐网络的行人检测方法及***
CN113160062B (zh) 一种红外图像目标检测方法、装置、设备及存储介质
CN112861919A (zh) 一种基于改进YOLOv3-tiny的水下声纳图像目标检测方法
CN113484875B (zh) 一种基于混合高斯排序的激光雷达点云目标分级识别方法
CN113223027A (zh) 基于PolarMask的未成熟柿子分割方法及***
CN112200846A (zh) 融合无人机影像与地基雷达点云的林分因子提取方法
CN116468995A (zh) 一种联合slic超像素和图注意力网络的声呐图像分类方法
CN115937659A (zh) 基于Mask-RCNN的室内复杂环境下多目标检测方法
CN115965862A (zh) 基于掩码网络融合图像特征的sar舰船目标检测方法
CN116580322A (zh) 一种地面背景下无人机红外小目标检测方法
CN112132207A (zh) 基于多分支特征映射目标检测神经网络构建方法
CN116468950A (zh) 一种类别引导中心点邻域搜索半径的三维目标检测方法
CN115810144A (zh) 一种基于区域预检测的水中悬浮声呐目标识别方法
CN115861944A (zh) 一种基于激光雷达的交通目标检测***
CN115240058A (zh) 一种联合图像精准分割和目标阴影信息的侧扫声呐目标检测方法
CN115496998A (zh) 一种遥感影像码头目标检测方法
CN117173549B (zh) 复杂场景下合成孔径声纳图像多尺度目标检测方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210406