CN109460774B - 一种基于改进的卷积神经网络的鸟类识别方法 - Google Patents

一种基于改进的卷积神经网络的鸟类识别方法 Download PDF

Info

Publication number
CN109460774B
CN109460774B CN201811091554.1A CN201811091554A CN109460774B CN 109460774 B CN109460774 B CN 109460774B CN 201811091554 A CN201811091554 A CN 201811091554A CN 109460774 B CN109460774 B CN 109460774B
Authority
CN
China
Prior art keywords
bird
neural network
convolutional neural
training
improved
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201811091554.1A
Other languages
English (en)
Other versions
CN109460774A (zh
Inventor
邹腊梅
熊紫华
张松伟
李长峰
李晓光
陈婷
杨卫东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN201811091554.1A priority Critical patent/CN109460774B/zh
Publication of CN109460774A publication Critical patent/CN109460774A/zh
Application granted granted Critical
Publication of CN109460774B publication Critical patent/CN109460774B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于改进的卷积神经网络的鸟类识别方法,包括:利用鸟类识别器对待识别的鸟类图像进行识别,得到待识别的鸟类图像的鸟类类别;所述鸟类识别器的训练包括:构建样本鸟类图像的数据集;在卷积神经网络的ResNet50输入层之后增加BN层,在5层卷积层之后增加2层卷积层,在FC层之前增加Dropout层,得到改进的卷积神经网络;利用样本鸟类图像的数据集训练改进的卷积神经网络,得到鸟类识别器。本发明基于迁移学习的思想,对卷积神经网络进行改进,将其应用在鸟类属性识别上,在样本量有限的前提下,获得了比改进之前的网络更好的结果。

Description

一种基于改进的卷积神经网络的鸟类识别方法
技术领域
本发明属于图像识别和生物辨识领域,更具体地,涉及一种基于改进的卷积神经网络的鸟类识别方法。
背景技术
近年来,以卷积神经网络为代表的深度学习算法在很多计算机视觉领域都取得突破性的进展,尤其是图像分类、目标跟踪、图像分割、目标检测等。但是当数据集发生变化时,卷积神经网络学习到的特征和具体任务的匹配度就不高了,其模型的泛化能力就还有待提升,因此需要针对具体的任务和需求,设计出基于特征任务的卷积神经网络,以满足现实场景的需求。
然而现有技术中关于鸟类识别的准确率较低。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种基于改进的卷积神经网络的鸟类识别方法,由此解决现有技术中关于鸟类识别的准确率较低的技术问题。
为实现上述目的,本发明提供了一种基于改进的卷积神经网络的鸟类识别方法,包括:
利用鸟类识别器对待识别的鸟类图像进行识别,得到待识别的鸟类图像的鸟类类别;所述鸟类识别器的训练包括:
(1)构建样本鸟类图像的数据集;
(2)在卷积神经网络的ResNet50输入层之后增加BN层,在5层卷积层之后增加2层卷积层,在FC层之前增加Dropout层,得到改进的卷积神经网络;
(3)利用样本鸟类图像的数据集训练改进的卷积神经网络,得到鸟类识别器。
进一步地,样本鸟类图像的数据集中同一种类别的样本鸟类图像具有不同的背景和不同的姿态。
进一步地,背景包括:海面、森林、天空和草地。
进一步地,姿态包括:行走、站立、跳跃和觅食。
进一步地,2层卷积层的卷积核依次为3x3和1x1。
进一步地,步骤(3)包括:
(3.1)将数据集划分为训练集和验证集,采用水平翻转、[-5°,5°]的角度随机旋转、[-5,5]个像素水平平移的方式对训练集进行增强,验证集不采取任何增强措施;
(3.2)使用数据集对改进的卷积神经网络进行预训练,得到初始网络参数,利用初始网络参数型对改进的卷积神经网络进行参数初始化;
(3.3)使用SGD优化器进行参数更新,并将L2正则化系数设置为e-4,利用增强的训练集训练改进的卷积神经网络,利用验证集进行验证,训练N轮后,得到鸟类识别器。
进一步地,预训练过程中,对改进的卷积神经网络的前4层卷积层的参数进行冻结。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
(1)本发明为保证模型在增加深度时的泛化能力,同时避免多次归一化的繁琐,在ResNet50输入层之后增加BN层;增加网络的深度是有助于提升模型的识别准确率的,因此,本发明在ResNet50基础之上增加两层卷积层。由于增加深度可以获得较高的训练准确率,但随之也使得模型的泛化能力下降,为提升模型的泛化能力,降低过拟合,本发明在FC层之前又增加一层Dropout层,防止过拟合。本发明通过以上方式对卷积神经网络的改进,保证鸟类数据可以获得更高的识别准确率。
(2)本发明在最后一层卷积层使用1x1的卷积核,保证增加网络的深度不会给模型带来过多的参数量而导致模型泛化能力下降,本发明基于迁移学习的思想,对卷积神经网络进行改进,将其应用在鸟类属性识别上,在样本量有限的前提下,获得了比改进之前的网络更好的结果。
附图说明
图1本发明实施例提供的一种基于改进的卷积神经网络的鸟类识别方法的流程图;
图2是本发明实施例提供的改进的卷积神经网络的结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
如图1所示,一种基于改进的卷积神经网络的鸟类识别方法,包括:
利用鸟类识别器对待识别的鸟类图像进行识别,得到待识别的鸟类图像的鸟类类别;所述鸟类识别器的训练包括:
(1)构建样本鸟类图像的数据集;
(2)在卷积神经网络的ResNet50输入层之后增加BN层,在5层卷积层之后增加2层卷积层,在FC层之前增加Dropout层,得到改进的卷积神经网络;
(3)利用样本鸟类图像的数据集训练改进的卷积神经网络,得到鸟类识别器。
进一步地,样本鸟类图像的数据集中同一种类别的样本鸟类图像具有不同的背景和不同的姿态。
进一步地,背景包括:海面、森林、天空和草地。
进一步地,姿态包括:行走、站立、跳跃和觅食。
进一步地,2层卷积层的卷积核依次为3x3和1x1。
进一步地,步骤(3)包括:
(3.1)将数据集划分为训练集和验证集,采用水平翻转、[-5°,5°]的角度随机旋转、[-5,5]个像素水平平移的方式对训练集进行增强,验证集不采取任何增强措施;
(3.2)使用数据集对改进的卷积神经网络进行预训练,得到初始网络参数,利用初始网络参数型对改进的卷积神经网络进行参数初始化;
(3.3)使用SGD优化器进行参数更新,并将L2正则化系数设置为e-4,利用增强的训练集训练改进的卷积神经网络,利用验证集进行验证,训练N轮后,得到鸟类识别器。
进一步地,预训练过程中,对改进的卷积神经网络的前4层卷积层的参数进行冻结。
实施例1
一种基于改进的卷积神经网络的鸟类识别方法,包括:
利用鸟类识别器对待识别的鸟类图像进行识别,得到待识别的鸟类图像的鸟类类别;所述鸟类识别器的训练包括:
(1)构建样本鸟类图像的数据集;
(2)在卷积神经网络的ResNet50输入层之后增加BN层,在5层卷积层之后增加2层卷积层,在FC层之前增加Dropout层,得到改进的卷积神经网络;
(3)利用样本鸟类图像的数据集训练改进的卷积神经网络,得到鸟类识别器。
步骤(1)的具体实施方式为:从真实场景中获得不同种类的鸟类数据,数据集中同一类别的鸟类具有不同的背景(如,海面、森林、天空、草地等)及不同的姿态(如,行走、站立、跳跃、觅食等),保证模型能够在真实环境下得到较好的结果,提升模型的泛化能力。总计共9313张鸟类图像,83个类别,并将其中的80%作为训练集,余下的20%作为验证集。
通过以下方式对卷积神经网络的改进,保证鸟类数据可以获得更高的识别准确率。改进后的结构如图2所示,各层参数如表1所示。
表1各层参数
Figure BDA0001802587870000051
如表1所示,7×7、3×3和1×1分别表示7×7、3×3和1×1的卷积核,其后的数字表示特征图个数,如64表示64个特征图。
步骤(2)的具体实施方式为:
(2.1)为保证模型在增加深度时的泛化能力,同时避免多次归一化的繁琐,在ResNet50输入层之后增加BN层;
(2.2)增加网络的深度是有助于提升模型的识别准确率的,因此,在ResNet50基础之上增加两层卷积层。此外,为保证增加网络的深度不会给模型带来过多的参数量而导致模型泛化能力下降,最后一层卷积层使用1x1的卷积核;
(2.3)增加深度可以获得较高的训练准确率,但随之也使得模型的泛化能力下降,为提升模型的泛化能力,降低过拟合,在FC层之前又增加一层Dropout层。
步骤(3)的具体实施方式为:
(3.1)数据增强:采用水平翻转、[-5°,5°]的角度随机旋转、[-5,5]个像素水平平移的方式对训练数据集进行增强,验证集不采取任何增强措施;
(3.2)迁移学习:使用数据集对改进的卷积神经网络进行预训练,得到初始网络参数,利用初始网络参数型对改进的卷积神经网络进行参数初始化;对conv1~conv4层的参数进行冻结,只更新余下的层;
(3.3)训练参数:本发明使用SGD(随机梯度下降)优化器进行参数更新,并将L2正则化系数设置为e-4,防止过拟合,将网络训练60轮,并且1-15轮、15-30轮、30-40轮、40-50轮、50-60轮的学习率分别为0.001、0.0005、0.0001、0.00005、0.00001。
本发明构建一种改进后的卷积神经网络,并通过学习训练在鸟类数据集上获得更高的识别准确率。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种基于改进的卷积神经网络的鸟类识别方法,其特征在于,包括:
利用鸟类识别器对待识别的鸟类图像进行识别,得到待识别的鸟类图像的鸟类类别;所述鸟类识别器的训练包括:
(1)构建样本鸟类图像的数据集;
(2)在卷积神经网络的ResNet50输入层之后增加BN层,在5层卷积层之后增加2层卷积层,最后一层卷积层使用1x1的卷积核,在FC层之前增加Dropout层,得到改进的卷积神经网络;
(3)利用样本鸟类图像的数据集训练改进的卷积神经网络,得到鸟类识别器;
所述步骤(3)包括:
(3.1)将数据集划分为训练集和验证集,采用水平翻转、[-5°,5°]的角度随机旋转、[-5,5]个像素水平平移的方式对训练集进行增强,验证集不采取任何增强措施;
(3.2)使用数据集对改进的卷积神经网络进行预训练,得到初始网络参数,利用初始网络参数对改进的卷积神经网络进行参数初始化;
(3.3)对改进的卷积神经网络的前4层卷积层的参数进行冻结,使用SGD优化器对余下层进行参数更新,并将L2正则化系数设置为e-4,利用增强的训练集训练改进的卷积神经网络,利用验证集进行验证,训练N轮后,得到鸟类识别器;
所述样本鸟类图像的数据集中同一种类别的样本鸟类图像具有不同的背景和不同的姿态。
2.如权利要求1所述的一种基于改进的卷积神经网络的鸟类识别方法,其特征在于,所述背景包括:海面、森林、天空和草地。
3.如权利要求1所述的一种基于改进的卷积神经网络的鸟类识别方法,其特征在于,所述姿态包括:行走、站立、跳跃和觅食。
4.如权利要求1-3任一所述的一种基于改进的卷积神经网络的鸟类识别方法,其特征在于,所述2层卷积层的卷积核依次为3x3和1x1。
CN201811091554.1A 2018-09-18 2018-09-18 一种基于改进的卷积神经网络的鸟类识别方法 Expired - Fee Related CN109460774B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811091554.1A CN109460774B (zh) 2018-09-18 2018-09-18 一种基于改进的卷积神经网络的鸟类识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811091554.1A CN109460774B (zh) 2018-09-18 2018-09-18 一种基于改进的卷积神经网络的鸟类识别方法

Publications (2)

Publication Number Publication Date
CN109460774A CN109460774A (zh) 2019-03-12
CN109460774B true CN109460774B (zh) 2022-04-22

Family

ID=65606809

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811091554.1A Expired - Fee Related CN109460774B (zh) 2018-09-18 2018-09-18 一种基于改进的卷积神经网络的鸟类识别方法

Country Status (1)

Country Link
CN (1) CN109460774B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110059641B (zh) * 2019-04-23 2023-02-03 重庆工商大学 基于多预置点的深度鸟类识别算法
CN110063326A (zh) * 2019-04-30 2019-07-30 济南浪潮高新科技投资发展有限公司 基于卷积神经网络的智能驱鸟方法
CN110148408A (zh) * 2019-05-29 2019-08-20 上海电力学院 一种基于深度残差的中文语音识别方法
CN110837771A (zh) * 2019-09-17 2020-02-25 常熟理工学院 一种基于卷积神经网络的鸟类识别方法和装置
CN110969107A (zh) * 2019-11-25 2020-04-07 上海交通大学 基于网络模型鸟类种群识别分析方法及***
CN112508072B (zh) * 2020-11-30 2024-04-26 云南省烟草质量监督检测站 基于残差卷积神经网络的卷烟真假识别方法、装置和设备
CN113255661B (zh) * 2021-04-15 2022-07-12 南昌大学 一种输电线路涉鸟故障相关鸟种图像识别方法
CN117611885A (zh) * 2023-11-17 2024-02-27 贵州省生物研究所 一种基于Canny边缘检测的候鸟生态调控方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106954049A (zh) * 2017-05-13 2017-07-14 西安费斯达自动化工程有限公司 全景和精准图像跟踪***的机场鸟类信息获取方法
CN107292340A (zh) * 2017-06-19 2017-10-24 南京农业大学 基于卷积神经网络的侧线鳞识别方法
CN107729363A (zh) * 2017-09-06 2018-02-23 上海交通大学 基于GoogLeNet网络模型鸟类种群识别分析方法
CN107977609A (zh) * 2017-11-20 2018-05-01 华南理工大学 一种基于cnn的指静脉身份验证方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3735552B2 (ja) * 2001-09-28 2006-01-18 株式会社東芝 時空間領域情報の処理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106954049A (zh) * 2017-05-13 2017-07-14 西安费斯达自动化工程有限公司 全景和精准图像跟踪***的机场鸟类信息获取方法
CN107292340A (zh) * 2017-06-19 2017-10-24 南京农业大学 基于卷积神经网络的侧线鳞识别方法
CN107729363A (zh) * 2017-09-06 2018-02-23 上海交通大学 基于GoogLeNet网络模型鸟类种群识别分析方法
CN107977609A (zh) * 2017-11-20 2018-05-01 华南理工大学 一种基于cnn的指静脉身份验证方法

Also Published As

Publication number Publication date
CN109460774A (zh) 2019-03-12

Similar Documents

Publication Publication Date Title
CN109460774B (zh) 一种基于改进的卷积神经网络的鸟类识别方法
US11348249B2 (en) Training method for image semantic segmentation model and server
WO2020238293A1 (zh) 图像分类方法、神经网络的训练方法及装置
EP3084682B1 (en) System and method for identifying faces in unconstrained media
WO2019100724A1 (zh) 训练多标签分类模型的方法和装置
CN112750140B (zh) 基于信息挖掘的伪装目标图像分割方法
CN106372581B (zh) 构建及训练人脸识别特征提取网络的方法
CN112069929B (zh) 一种无监督行人重识别方法、装置、电子设备及存储介质
CN109871821B (zh) 自适应网络的行人重识别方法、装置、设备及存储介质
CN110222718B (zh) 图像处理的方法及装置
CN112084917A (zh) 一种活体检测方法及装置
CN107862680B (zh) 一种基于相关滤波器的目标跟踪优化方法
CN111108508B (zh) 脸部情感识别方法、智能装置和计算机可读存储介质
CN111476806A (zh) 图像处理方法、装置、计算机设备和存储介质
CN113705596A (zh) 图像识别方法、装置、计算机设备和存储介质
WO2023088174A1 (zh) 目标检测方法及装置
CN116524183A (zh) 一种基于多任务适配器微调的伪装目标检测方法
CN112529068A (zh) 一种多视图图像分类方法、***、计算机设备和存储介质
CN115984930A (zh) 微表情识别方法、装置、微表情识别模型的训练方法
CN115272794A (zh) 模型训练方法、计算机设备及存储介质
Gaston et al. Matching larger image areas for unconstrained face identification
CN111091140A (zh) 目标分类方法、装置及可读存储介质
CN115563519A (zh) 面向非独立同分布数据的联邦对比聚类学习方法及***
CN111414922A (zh) 特征提取方法、图像处理方法、模型训练方法及装置
CN111091198B (zh) 一种数据处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220422