CN110245602A - 一种基于深度卷积特征的水下静目标识别方法 - Google Patents
一种基于深度卷积特征的水下静目标识别方法 Download PDFInfo
- Publication number
- CN110245602A CN110245602A CN201910504165.5A CN201910504165A CN110245602A CN 110245602 A CN110245602 A CN 110245602A CN 201910504165 A CN201910504165 A CN 201910504165A CN 110245602 A CN110245602 A CN 110245602A
- Authority
- CN
- China
- Prior art keywords
- network
- underwater
- depth
- identification method
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
一种基于深度卷积特征的水下静目标识别方法,属于水下目标识别技术领域。该方法是以深度卷积神经网络为基础的识别方法,同时结合迁移学习策略来解决深度网络与小样本目标不匹配问题。水下目标智能识别方法主要分为三部分:一是水下图像收集清理与预处理;二是按照经典模型设计水下目标识别一次网络并进行训练,可以称为预训练过程,一次网络是水下目标识别网络的基础框架;三是通过迁移学习策略设计水下目标识别二次网络UW‑original,并将第一部分中处理好的水下数据集输入二次网络进行训练,训练完成得到最终水下目标智能识别网络UW‑final。
Description
技术领域
本发明属于水下目标识别技术领域,具体涉及一种基于深度卷积特征的水下静目标识别方法。
背景技术
目前水下目标主要分为三种:水下光学图像目标、水下声呐探测回波目标、水下噪声目标。针对光学图像目标,目前主流的神经网络方法是卷积神经网络方法;针对声目标,主流的神经网络方法是深度置信网络和长短期记忆网络。因此,当将深度学习方法应用水下目标识别时,针对不同的目标,应选用不同的神经网络。本文研究的重点是水下光学目标,因此选择卷积神经网络方法。
本发明利用深度卷积特征进行水下静目标识别,深度卷积特征的核心是深度卷积神经网络,更进一步说是深度学习。深度学习理论上的难点在于超参数(如网络层数、神经元个数、迭代次数等)的不确定性和众多参数(如权重、偏置等)的难优化性。此外,深度学习应用上的局限性也在于数据量的大小和硬件计算能力。如前文所述,目前深度学习的基础是建立在大数据之上,而水下图像并不具备大数据的优势,因此,将深度学习应用于水下目标识别领域,深度网络和小样本目标之间的矛盾是亟需解决的一个问题。
因此,本领域需要一种针对深度网络和小样本目标之间的矛盾的目标识别方案和具体网络设计。
发明内容
本发明的目的在于提供一种基于深度卷积特征的水下静目标识别方法,解决将卷积网络用于识别水下目标时存在的瓶颈问题,提出使用迁移学习策略来解决深度网络和小样本目标之间的矛盾。
本发明的目的是这样实现的:
一种基于深度卷积特征的水下静目标识别方法,包括如下步骤:
步骤1:在水下特定领域进行数据集收集清理,通过数据增强技术来扩充水下识别目标;
所述步骤1中数据增强技术包括对图像进行上下左右翻转、对图像随机进行光照变换和对图像随机进行对比度变换;
步骤2:通过设计的一次网络对已有大样本数据集进行训练,获得光学图像的通用特征;
所述步骤2中一次网络设计以VGGNet网络为基础,在网络深度上进行拓展,建立水下目标智能识别一次网络;根据水下深度网络设计原则,水下目标识别一次网络初始框架设置为6层,初始框架中池化层采用最大池化,激活函数使用LeakeyReLU函数,同时为了防止过拟合,引入Dropout、L1、L2等正则化方法。
步骤3:将一次网络结构进行直推式模型迁移构成二次网络的雏形,再结合水下目标的小样本特点,迁移网络中的部分全连接层使用单位卷积核进行替换,形成二次网络;
所述步骤3中二次网络设计需要考虑一次网络向二次网络的迁移学习方法和数据量的差异性带来的影响,二次网络分为两部分,一是迁移学习方法的选择;二是网络差异化设计;二次网络的参数量通过采用单位卷积核部分替代全连接层来减少。
步骤4:训练完成得到最终水下目标智能识别网络UW-final。
本发明有益效果在于:
本发明首先引入了目前深度学习的难点和将其直接用于水下目标识别的困难之处。基于此,总体上分析设计了水下目标智能识别框架,结合水下目标的小样本特点,通过迁移学习策略进行了二次网络设计并分析讨论了模型中主要超参数的选择优化问题,同时提出使用数据增强技术进一步减少数据量不足的影响。
附图说明
图1为本发明的水下目标智能识别总体框架示意图;
图2为本发明的一次网络前向建模流程图;
图3为本发明的一次网络初始框架参数列表;
图4为本发明的二次网络设计示意图。
具体实施方式
下面结合附图对本发明做更进一步描述。
本发明以深度卷积神经网络为基础识别方法,同时结合迁移学习策略来解决深度网络与小样本目标不匹配问题,由此建立的水下目标智能识别总体框架如下图1所示。水下目标智能识别总体框架主要分为三部分:一是水下图像收集清理与预处理;二是按照经典模型设计水的下目标识别一次网络并进行训练,可以称为预训练过程,一次网络是水下目标识别网络的基础框架;三是通过迁移学习策略设计水下目标识别二次网络UW-original,并将第一部分中处理好的水下数据集输入二次网络进行训练,训练完成得到最终水下目标智能识别网络UW-final。
1.深度学习的基础之一就是大数据集,目前水下图像普遍存在数据量少的问题,因此本发明将使用数据增强技术来扩充水下识别目标,从一定程度上解决数据量少的问题:
(1)对图像进行上下左右翻转;
(2)对图像随机进行光照变换;
(3)对图像随机进行对比度变换。
水下图像经过数据增强之后,数量增加为原来的四倍,同时经过随机改变光照强度和对比度之后,图像的多样性得到了进一步加强。
2.以VGGNet网络为基础,卷积神经网络前向建模流程如下图2所示,在网络深度上进行拓展,建立水下目标智能识别一次网络。根据水下深度网络设计原则,水下目标识别一次网络初始框架设置为6层,如图3所示。初始框架中池化层采用最大池化,激活函数使用LeakeyReLU函数,同时为了防止过拟合引入Dropout、L1、L2等正则化方法。
3.二次网络设计需要考虑一次网络向二次网络的迁移学习方法和数据量的差异性带来的影响,因此二次网络分为两部分,一是迁移学习方法的选择,二是网络差异化设计。
(1)二次网络与一次网络之间可以通过直推式模型迁移方式进行迁移。
(2)二次网络的训练目标属于小样本,网络全连接层过多的参数会导致二次网络在特定水下目标训练上产生过拟合效应,因此本专利提出使用单位卷积核部分替代全连接层来减少二次网络的参数量,既能起到特征融合的作用提高特征抽象性,又能在一定程度降低过拟合效应,二次网络设计如图4所示。
综上所述,二次网络从一次网络迁移得来,即共享通用特征,同时为了避免过拟合效应,使用单位卷积核部分代替全连接层。提出的使用单位卷积核部分替代全连接层来减少二次网络的参数量,既能起到特征融合的作用提高特征抽象性,又能在一定程度降低过拟合效应。
4.训练完成得到最终水下目标智能识别网络UW-final。
本发明提出一种基于深度卷积特征的水下静目标识别方法,该方法是以深度卷积神经网络为基础的识别方法,同时结合迁移学习策略来解决深度网络与小样本目标不匹配问题。水下目标智能识别方法主要分为三部分:一是水下图像收集清理与预处理;二是按照经典模型设计水下目标识别一次网络并进行训练,可以称为预训练过程,一次网络是水下目标识别网络的基础框架;三是通过迁移学习策略设计水下目标识别二次网络UW-original,并将第一部分中处理好的水下数据集输入二次网络进行训练,训练完成得到最终水下目标智能识别网络UW-final。
Claims (4)
1.一种基于深度卷积特征的水下静目标识别方法,其特征在于,包括:
步骤一、在水下特定领域进行数据集收集清理,通过数据增强技术来扩充水下识别目标;
步骤二、通过设计的一次网络对已有大样本数据集进行训练,获得光学图像的通用特征;
步骤三、将一次网络结构进行直推式模型迁移构成二次网络的雏形,结合水下目标的小样本特点,迁移网络中的部分全连接层使用单位卷积核进行替换,形成二次网络;
步骤四、训练完成得到最终水下目标智能识别网络UW-final。
2.根据权利要求1所述的一种基于深度卷积特征的水下静目标识别方法,其特征在于:所述的步骤一中数据增强技术包括对图像进行上下左右翻转、对图像随机进行光照变换和对图像随机进行对比度变换。
3.根据权利要求1所述的一种基于深度卷积特征的水下静目标识别方法,其特征在于:所述的步骤二中一次网络设计以VGGNet网络为基础,在网络深度上进行拓展,建立水下目标智能识别一次网络;根据水下深度网络设计原则,水下目标识别一次网络初始框架设置为6层,初始框架中池化层采用最大池化,激活函数使用LeakeyReLU函数,同时为了防止过拟合,引入Dropout、L1、L2正则化方法。
4.根据权利要求1所述的一种基于深度卷积特征的水下静目标识别方法,其特征在于:所述的步骤三中二次网络分为两部分,一是迁移学习方法的选择;二是网络差异化设计;二次网络的参数量通过采用单位卷积核部分替代全连接层来减少。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910504165.5A CN110245602A (zh) | 2019-06-12 | 2019-06-12 | 一种基于深度卷积特征的水下静目标识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910504165.5A CN110245602A (zh) | 2019-06-12 | 2019-06-12 | 一种基于深度卷积特征的水下静目标识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110245602A true CN110245602A (zh) | 2019-09-17 |
Family
ID=67886632
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910504165.5A Pending CN110245602A (zh) | 2019-06-12 | 2019-06-12 | 一种基于深度卷积特征的水下静目标识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110245602A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110751869A (zh) * | 2019-10-12 | 2020-02-04 | 南京摄星智能科技有限公司 | 一种基于对抗鉴别式迁移法的拟态环境与战场态势策略转移技术 |
CN110781924A (zh) * | 2019-09-29 | 2020-02-11 | 哈尔滨工程大学 | 一种基于全卷积神经网络的侧扫声纳图像特征提取方法 |
CN111199213A (zh) * | 2020-01-03 | 2020-05-26 | 云南电网有限责任公司电力科学研究院 | 一种变电站用设备缺陷检测方法及装置 |
CN112132024A (zh) * | 2020-09-22 | 2020-12-25 | 中国农业大学 | 水下目标识别网络优化方法及装置 |
CN114266977A (zh) * | 2021-12-27 | 2022-04-01 | 青岛澎湃海洋探索技术有限公司 | 基于超分辨可选择网络的多auv的水下目标识别方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109100710A (zh) * | 2018-06-26 | 2018-12-28 | 东南大学 | 一种基于卷积神经网络的水下目标识别方法 |
CN109543585A (zh) * | 2018-11-16 | 2019-03-29 | 西北工业大学 | 基于卷积神经网络的水下光学目标检测与识别方法 |
-
2019
- 2019-06-12 CN CN201910504165.5A patent/CN110245602A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109100710A (zh) * | 2018-06-26 | 2018-12-28 | 东南大学 | 一种基于卷积神经网络的水下目标识别方法 |
CN109543585A (zh) * | 2018-11-16 | 2019-03-29 | 西北工业大学 | 基于卷积神经网络的水下光学目标检测与识别方法 |
Non-Patent Citations (2)
Title |
---|
溪客: "精小的1*1卷积核", 《HTTPS://ZHUANLAN.ZHIHU.COM/P/61661851》 * |
王柯力: "基于迁移学习的水下动物图像识别方法", 《计算机应用》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110781924A (zh) * | 2019-09-29 | 2020-02-11 | 哈尔滨工程大学 | 一种基于全卷积神经网络的侧扫声纳图像特征提取方法 |
CN110781924B (zh) * | 2019-09-29 | 2023-02-14 | 哈尔滨工程大学 | 一种基于全卷积神经网络的侧扫声纳图像特征提取方法 |
CN110751869A (zh) * | 2019-10-12 | 2020-02-04 | 南京摄星智能科技有限公司 | 一种基于对抗鉴别式迁移法的拟态环境与战场态势策略转移技术 |
CN110751869B (zh) * | 2019-10-12 | 2021-11-05 | 南京星耀智能科技有限公司 | 一种基于对抗鉴别式迁移法的拟态环境与战场态势策略转移技术 |
CN111199213A (zh) * | 2020-01-03 | 2020-05-26 | 云南电网有限责任公司电力科学研究院 | 一种变电站用设备缺陷检测方法及装置 |
CN111199213B (zh) * | 2020-01-03 | 2023-09-26 | 云南电网有限责任公司电力科学研究院 | 一种变电站用设备缺陷检测方法及装置 |
CN112132024A (zh) * | 2020-09-22 | 2020-12-25 | 中国农业大学 | 水下目标识别网络优化方法及装置 |
CN112132024B (zh) * | 2020-09-22 | 2024-02-27 | 中国农业大学 | 水下目标识别网络优化方法及装置 |
CN114266977A (zh) * | 2021-12-27 | 2022-04-01 | 青岛澎湃海洋探索技术有限公司 | 基于超分辨可选择网络的多auv的水下目标识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110245602A (zh) | 一种基于深度卷积特征的水下静目标识别方法 | |
CN106022237B (zh) | 一种端到端的卷积神经网络的行人检测方法 | |
CN106228162B (zh) | 一种基于深度学习的移动机器人快速物体识别方法 | |
CN110516539A (zh) | 基于对抗网络的遥感影像建筑物提取方法、***、存储介质及设备 | |
CN104517122A (zh) | 一种基于优化卷积架构的图像目标识别方法 | |
CN108399406A (zh) | 基于深度学习的弱监督显著性物体检测的方法及*** | |
CN105528638A (zh) | 灰色关联分析法确定卷积神经网络隐层特征图个数的方法 | |
CN109241982A (zh) | 基于深浅层卷积神经网络的目标检测方法 | |
CN108304826A (zh) | 基于卷积神经网络的人脸表情识别方法 | |
CN104615983A (zh) | 基于递归神经网络和人体骨架运动序列的行为识别方法 | |
CN111639679A (zh) | 一种基于多尺度度量学习的小样本学习方法 | |
CN108197294A (zh) | 一种基于深度学习的文本自动生成方法 | |
Li et al. | Pavement crack detection algorithm based on densely connected and deeply supervised network | |
CN106022273A (zh) | 基于动态样本选择策略的bp神经网络手写体识别*** | |
CN105160400A (zh) | 基于l21范数的提升卷积神经网络泛化能力的方法 | |
CN108763376A (zh) | 融合关系路径、类型、实体描述信息的知识表示学习方法 | |
Lv et al. | Deep learning model of image classification using machine learning | |
CN106709482A (zh) | 基于自编码器的人物亲缘关系识别方法 | |
CN108427665A (zh) | 一种基于lstm型rnn模型的文本自动生成方法 | |
CN107247952B (zh) | 基于深层监督的循环卷积神经网络的视觉显著性检测方法 | |
CN109685030A (zh) | 一种基于卷积神经网络的马克杯杯口缺陷检测分类方法 | |
CN110852199A (zh) | 一种基于双帧编码解码模型的前景提取方法 | |
CN109740012A (zh) | 基于深度神经网络对图像语义进行理解和问答的方法 | |
CN117011274A (zh) | 自动化玻璃瓶检测***及其方法 | |
CN115168720A (zh) | 内容交互预测方法以及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190917 |
|
RJ01 | Rejection of invention patent application after publication |