CN111242214A - 一种基于图像的小型动物识别方法 - Google Patents

一种基于图像的小型动物识别方法 Download PDF

Info

Publication number
CN111242214A
CN111242214A CN202010030628.1A CN202010030628A CN111242214A CN 111242214 A CN111242214 A CN 111242214A CN 202010030628 A CN202010030628 A CN 202010030628A CN 111242214 A CN111242214 A CN 111242214A
Authority
CN
China
Prior art keywords
layer
image
formula
convolutional
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010030628.1A
Other languages
English (en)
Inventor
孟利民
盛锡鸣
应颂翔
蒋维
林梦嫚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN202010030628.1A priority Critical patent/CN111242214A/zh
Publication of CN111242214A publication Critical patent/CN111242214A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

一种基于图像的小型动物识别方法,包括以下步骤:步骤1:将图像缩小为32×32;步骤2:将32×32的图像输入到RBG三色通道;步骤3:将32×32×3的图像输入到卷积神经网络模型,识别分类;步骤4:将识别的结果输出,在卷积神经网络的卷积层中加入的L2正则化项,正则化项的引入平衡了偏差与方差、拟合能力与泛化能力、经验风险与结构风险;卷积层使用的激励函数为Relu函数,Relu函数会使一部分神经元的输出为0;全链接层加入了dropout方法,dropout方法能够在训练中随机删除神经元以及它们之间所属关系。本发明提高泛化能力,增强识别度。

Description

一种基于图像的小型动物识别方法
技术领域
本发明涉及图像识别领域,特别是涉及一种基于图像的小型动物识别方法。
背景技术
随着经济全球化进程的加快,越来越多的人开始饲养宠物,尤其是小型动物,国内常见的例如猫、狗,国外常见的例如蜥蜴、蛇等。但是很多非饲养小型动物的人不了解且不熟悉相应小型动物的生活习性导致与其嬉戏打闹时被其误伤,所以识别并了解与自己相处的小型动物的习性是非常重要的。小型动物图像的识别常用卷积神经网络,但是训练一般的卷积神经网络模型需要大量的样本数据,费时费力,故一种少样本的卷积神经网络模型能够带来极大的便利,省时省力。
发明内容
常用卷积神经网络模型训练需要大量的样本数据,样本数据数量不够则会产生过拟合的问题从而导致动物识别率降低,本发明提供了一种基于图像的小型动物识别方法,能够优化少样本产生过拟合导致的模型精度降低问题,提高识别的准确度。
为了解决上述技术问题,本发明提供如下的技术方案:
一种基于图像的小型动物识别方法,包括以下步骤:
步骤1:将图像缩小为32×32的图像;
步骤2:输入层输入图片的长度,宽度和深度。长和宽代表图像大小,本发明输入的为步骤1中缩小后的32×32大小的图像,其长度为32,宽度为32;深度代表图像的彩色通道,输入的为RGB三色通道,故彩色图像深度为3,即输入的图像为32×32×3;
步骤3:构建卷积神经网络结构,过程如下:
步骤3-1:卷积层C1对输入层输入的图像矩阵进行卷积操作,提取特征,经过激励函数的作用得到特征图,卷积层特征图公式如式(1)所示。
Figure BDA0002364162920000011
式(1)中,
Figure BDA0002364162920000012
代表第l层第j个神经元,f为激励函数,Mj代表前一层输出特征图集合,
Figure BDA0002364162920000013
代表第l-1层上第i个神经元,*代表卷积运算,
Figure BDA0002364162920000014
代表l-1层第i个神经元到l层第j个神经元的卷积核矩阵,
Figure BDA0002364162920000021
代表l层第j个神经元的偏置;
激励函数为Relu函数,Relu函数如式(2)所示。
Relu(x)=max(0,x) (2)
在样本数小于参数个数的情况下,样本矩阵很可能是不可逆的,而引入正则化项则会解决这个问题;正则化项的引入平衡了偏差与方差、拟合能力与泛化能力、经验风险与结构风险,使用L2正则化方法如式(3)所示。
Figure BDA0002364162920000022
C0代表原始的代价参数,w为共享权重,λ为给定的正则项系数,n代表神经元个数,则化项的系数为1×10-4
卷积层C1通过32个5×5的卷积核同时对权重进行L2正则化,得到32个28×28×3的特征图;
步骤3-2:亚采样层S1根据图像的局部相关原理,对卷积层输出的特征图在相邻的小区域内进行聚合取样,在减少特征和参数的同时,保留图像的有用信息,使用Stochastic-pooling方法,对像素点按照数值大小赋予概率,再按照概率进行亚采样;
亚采样层S1在2×2的区域内对步骤3-1中的卷积层C1产生的特征图进行亚采样,步长为1,得到32个14×14×3的特征图;
步骤3-3:卷积层C2同步骤3-1中的卷积层C1提取特征图的方式一样,唯一区别为卷积层C2的卷积核为3×3,其卷积层特征图公式如式(1)所示,使用的激励函数如式(2)所示,使用的L2正则化方法如式(3)所示;
卷积层C2通过32个3×3的卷积核同时对权重进行L2正则化,得到1024个12×12×3的特征图;
步骤3-4:亚采样层S2与步骤3-2中的亚采样层S1方法相同,亚采样层S2在2×2的区域内对卷积层C2产生的特征图进行亚采样,步长为1,得到1024个6×6×3的特征图;
步骤3-5:对步骤3-4中的特征图采取flatten操作,产生一维特征向量输入全链接层,全链接层有三层分别是:
全链接层F1的大小为256;
全链接层F2的大小为128,然后采用dropout方法对某一层的神经元按照一定概率激活,dropout的概率参数为0.5,全链接层F2的激励函数使用Relu函数,具体表达式如式(2)所示;
全链接层F3的大小为64,然后采用dropout方法对某一层的神经元按照一定概率激活,dropout的概率参数为0.5,全链接层F3的激励函数使用Relu函数,具体表达式如式(2)所示;
步骤4:输出层为分类器,作用为输出属于各个类别的概率,并且所有类别的概率值之和为1,使用的分类器函数为soft-max函数,soft-max函数公式见式(4):
Figure BDA0002364162920000031
式(4)中,h(x(i))表示样本i属于第k类的概率,总类别数为K。
本发明的技术构思为:考虑到训练模型的耗时耗力以及需要的样本数量庞大等问题,在卷积层引入L2正则化项,使用Relu函数以及在全链接层加入dropout方法可以有效优化过拟合导致的模型精度降低问题。
本发明的有益效果如下:本方法在样本数小于参数个数的情况下,样本矩阵很可能是不可逆的,而在卷积层引入正则化项则会解决这个问题。正则化项的引入平衡了偏差与方差、拟合能力与泛化能力、经验风险与结构风险,故能够提高识别的准确度。使用Relu函数作为激励函数会使一部分神经元的输出为0,这样就造成了网络的稀疏性,减少了参数的相互依存关系,也能够缓解过拟合问题的发生,提高识别准确度。
附图说明
图1为本方法的整体流程图。
图2为CNN网络流程图。
图3为CNN网络结构图。
具体实施方式
下面结合附图对本发明做进一步说明。
参照图1~图3,一种基于图像的小型动物识别方法,整个过程如图1所示,分为四个步骤,其中比较关键的步骤为第三步。
如图2所示,将图像输入卷积神经网络后,输入层将图像缩小成32×32大小,再输入RGB三色通道,即输入图像为32×32×3。
然后将32×32×3的图像输入到加入L2正则化的卷积层C1,卷积层C1的卷积核为32个5×5的卷积核,卷积层C1对输入层输入的图像矩阵进行卷积操作,提取特征,经过激励函数的作用,然后得到32个28×28×3的特征图。卷积层C1的激励函数为Relu函数,公式如下:
Relu(x)=max(0,x)
卷积层特征图公式具体如下:
Figure BDA0002364162920000041
在样本数小于参数个数的情况下,样本矩阵很可能是不可逆的,而引入正则化项则会解决这个问题,正则化项的引入平衡了偏差与方差、拟合能力与泛化能力、经验风险与结构风险,使用的L2正则化方法公式具体如下:
Figure BDA0002364162920000042
然后将32个28×28×3的特征图输入亚采样层S1,亚采样层S1使用Stochastic-pooling的方法在2×2的区域内对卷积层C1产生的特征图进行亚采样,步长为1,得到32个14×14×3的特征图;
然后将32个14×14×3的特征图输入到加入L2正则化的卷积层C2,卷积层C1的卷积核为32个3×3的卷积核,卷积层C1对输入层输入的图像矩阵进行卷积操作,提取特征,经过激励函数的作用,然后得到1024个12×12×3的特征图。卷积层C1的激励函数为Relu函数,公式如下:
Relu(x)=max(0,x)
卷积层特征图公式如下:
Figure BDA0002364162920000043
使用的L2正则化方公式法如下:
Figure BDA0002364162920000044
然后将1024个12×12×3的特征图输入亚采样层S2,亚采样层S2使用Stochastic-pooling的方法在2×2的区域内对卷积层C2产生的特征图进行亚采样,步长为1,得到1024个6×6×3的特征图。
然后将1024个6×6×3的特征图采取flatten操作,产生一维特征向量。
然后将产生的一维向量输入全链接层F1,全链接层F1大小为256。
然后将全链接层F1产生的结果输入全链接层F2,全链接层F2大小为128,再用dropout方法对某一层的神经元按照一定概率激活。dropout方法的概率参数为0.5。
然后将全链接层F2产生的结果输入全链接层F3,全链接层F3大小为64,再用dropout方法对某一层的神经元按照一定概率激活。dropout方法的概率参数为0.5。
最后将结果分类输出。
如上所述为本发明一种基于图像的小型动物识别方法的实施例介绍,本发明引入的卷积神经网络含一个输入层,两个加入L2正则化的卷积层,两个亚采样层,三个加入dropout方法的全链接层以及一个输出层,通过该卷积神经网络,能够达到增强小型动物识别率的要求。
这里需要指出的是,本发明中的具体实施只是列举了本发明的个别实例,使用本发明的设计思想及其等效变化实现的方案,均应属于本发明的保护范围。

Claims (1)

1.一种基于图像的小型动物识别方法,其特征在于,所述方法包括以下步骤:
步骤1:将图像缩小为32×32的图像;
步骤2:输入层输入图片的长度,宽度和深度,长和宽代表图像大小,本发明输入的为步骤1中缩小后的32×32大小的图像,其长度为32,宽度为32;深度代表图像的彩色通道,输入的为RGB三色通道,故彩色图像深度为3,即输入的图像为32×32×3;
步骤3:构建卷积神经网络结构,过程如下:
步骤3-1:卷积层C1对输入层输入的图像矩阵进行卷积操作,提取特征,经过激励函数的作用得到特征图,卷积层特征图公式如式(1)所示:
Figure FDA0002364162910000011
式(1)中,
Figure FDA0002364162910000012
代表第1层第j个神经元,f为激励函数,Mj代表前一层输出特征图集合,
Figure FDA0002364162910000013
代表第l-1层上第i个神经元,*代表卷积运算,
Figure FDA0002364162910000014
代表l-1层第i个神经元到l层第j个神经元的卷积核矩阵,
Figure FDA0002364162910000015
代表1层第j个神经元的偏置;
激励函数为Relu函数,Relu函数如式(2)所示:
Relu(x)=max(0,x) (2)
在样本数小于参数个数的情况下,样本矩阵很可能是不可逆的,而引入正则化项则会解决这个问题;正则化项的引入平衡了偏差与方差、拟合能力与泛化能力、经验风险与结构风险,使用L2正则化方法如式(3)所示:
Figure FDA0002364162910000016
C0代表原始的代价参数,w为共享权重,λ为给定的正则顶系数,n代表神经元个数,则化项的系数为1×10-4
卷积层C1通过32个5×5的卷积核同时对权重进行L2正则化,得到32个28×28×3的特征图;
步骤3-2:亚采样层S1根据图像的局部相关原理,对卷积层输出的特征图在相邻的小区域内进行聚合取样,在减少特征和参数的同时,保留图像的有用信息,使用Stochastic-pooling方法,对像素点按照数值大小赋予概率,再按照概率进行亚采样;
亚采样层S1在2×2的区域内对步骤3-1中的卷积层C1产生的特征图进行亚采样,步长为1,得到32个14×14×3的特征图;
步骤3-3:卷积层C2同步骤3-1中的卷积层C1提取特征图的方式一样,唯一区别为卷积层C2的卷积核为3×3,其卷积层特征图公式如式(1)所示,使用的激励函数如式(2)所示,使用的L2正则化方法如式(3)所示;
卷积层C2通过32个3×3的卷积核同时对权重进行L2正则化,得到1024个12×12×3的特征图;
步骤3-4:亚采样层S2与步骤3-2中的亚采样层S1方法相同,亚采样层S2在2×2的区域内对卷积层C2产生的特征图进行亚采样,步长为1,得到1024个6×6×3的特征图;
步骤3-5:对步骤3-4中的特征图采取flatten操作,产生一维特征向量输入全链接层,全链接层有三层分别是:
全链接层F1的大小为256;
全链接层F2的大小为128,然后采用dropout方法对某一层的神经元按照一定概率激活,dropout的概率参数为0.5,全链接层F2的激励函数使用Relu函数,具体表达式如式(2)所示;
全链接层F3的大小为64,然后采用dropout方法对某一层的神经元按照一定概率激活,dropout的概率参数为0.5,全链接层F3的激励函数使用Relu函数,具体表达式如式(2)所示;
步骤4:输出层为分类器,作用为输出属于各个类别的概率,并且所有类别的概率值之和为1,使用的分类器函数为soft-max函数,soft-max函数公式见式(4):
Figure FDA0002364162910000021
式(4)中,h(x(i))表示样本i属于第k类的概率,总类别数为K。
CN202010030628.1A 2020-01-13 2020-01-13 一种基于图像的小型动物识别方法 Pending CN111242214A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010030628.1A CN111242214A (zh) 2020-01-13 2020-01-13 一种基于图像的小型动物识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010030628.1A CN111242214A (zh) 2020-01-13 2020-01-13 一种基于图像的小型动物识别方法

Publications (1)

Publication Number Publication Date
CN111242214A true CN111242214A (zh) 2020-06-05

Family

ID=70876018

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010030628.1A Pending CN111242214A (zh) 2020-01-13 2020-01-13 一种基于图像的小型动物识别方法

Country Status (1)

Country Link
CN (1) CN111242214A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117932005A (zh) * 2024-03-21 2024-04-26 成都市技师学院(成都工贸职业技术学院、成都市高级技工学校、成都铁路工程学校) 一种基于人工智能的语音交互方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6178261B1 (en) * 1997-08-05 2001-01-23 The Regents Of The University Of Michigan Method and system for extracting features in a pattern recognition system
CN106056043A (zh) * 2016-05-19 2016-10-26 中国科学院自动化研究所 基于迁移学习的动物行为识别方法和装置
CN108171274A (zh) * 2018-01-17 2018-06-15 百度在线网络技术(北京)有限公司 用于识别动物的方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6178261B1 (en) * 1997-08-05 2001-01-23 The Regents Of The University Of Michigan Method and system for extracting features in a pattern recognition system
CN106056043A (zh) * 2016-05-19 2016-10-26 中国科学院自动化研究所 基于迁移学习的动物行为识别方法和装置
CN108171274A (zh) * 2018-01-17 2018-06-15 百度在线网络技术(北京)有限公司 用于识别动物的方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
TIBOR TRNOVSZKY 等: "Animal Recognition System Based on Convolutional Neural Network", 《DIGITAL IMAGE PROCESSING AND COMPUTER GRAPHICS》 *
李建伟 等: "基于CNN 的动物识别研究", 《软件导刊》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117932005A (zh) * 2024-03-21 2024-04-26 成都市技师学院(成都工贸职业技术学院、成都市高级技工学校、成都铁路工程学校) 一种基于人工智能的语音交互方法
CN117932005B (zh) * 2024-03-21 2024-06-04 成都市技师学院(成都工贸职业技术学院、成都市高级技工学校、成都铁路工程学校) 一种基于人工智能的语音交互方法

Similar Documents

Publication Publication Date Title
CN107292298B (zh) 基于卷积神经网络和分类器模型的牛脸识别方法
Bilen et al. Universal representations: The missing link between faces, text, planktons, and cat breeds
AU2019100354A4 (en) An animal image search system based on convolutional neural network
CN107451565B (zh) 一种半监督小样本深度学习图像模式分类识别方法
Zhou et al. Remote sensing scene classification based on rotation-invariant feature learning and joint decision making
CN109344891A (zh) 一种基于深度神经网络的高光谱遥感数据分类方法
CN110555060A (zh) 基于成对样本匹配的迁移学习方法
CN111898736A (zh) 基于属性感知的高效行人重识别方法
CN111401426B (zh) 基于伪标签学习的小样本高光谱图像分类方法
CN106650765B (zh) 基于卷积神经网络的高光谱数据转灰度图的高光谱数据分类方法
Yadav et al. AFD-Net: Apple Foliar Disease multi classification using deep learning on plant pathology dataset
CN106056159A (zh) 基于Fisher Vector的图像精细分类方法
Su et al. LodgeNet: Improved rice lodging recognition using semantic segmentation of UAV high-resolution remote sensing images
CN112101467A (zh) 一种基于深度学习的高光谱图像分类方法
CN107451545A (zh) 基于软标签下多通道判别非负矩阵分解的人脸识别方法
Olsvik et al. Biometric fish classification of temperate species using convolutional neural network with squeeze-and-excitation
Luan et al. Sunflower seed sorting based on convolutional neural network
CN111242214A (zh) 一种基于图像的小型动物识别方法
Tan et al. Cephalopod species identification using integrated analysis of machine learning and deep learning approaches
Fauzi et al. Butterfly image classification using convolutional neural network (cnn)
Singh et al. Performance Analysis of CNN Models with Data Augmentation in Rice Diseases
Chen-McCaig et al. Convolutional neural networks for texture recognition using transfer learning
Sharma et al. Detection of plant leaf disease directly in the JPEG compressed domain using transfer learning technique
CN114219049A (zh) 一种基于层级约束的细粒度笔石图像分类方法和装置
Jingyi et al. Classification of images by using TensorFlow

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200605

RJ01 Rejection of invention patent application after publication