CN113836804A - 基于卷积神经网络的动物识别模型建立方法及其应用*** - Google Patents

基于卷积神经网络的动物识别模型建立方法及其应用*** Download PDF

Info

Publication number
CN113836804A
CN113836804A CN202111080000.3A CN202111080000A CN113836804A CN 113836804 A CN113836804 A CN 113836804A CN 202111080000 A CN202111080000 A CN 202111080000A CN 113836804 A CN113836804 A CN 113836804A
Authority
CN
China
Prior art keywords
model
animal
identification
animal identification
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111080000.3A
Other languages
English (en)
Other versions
CN113836804B (zh
Inventor
向前
王晓丹
王紫娇
王硕
宋亚飞
王坚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202111080000.3A priority Critical patent/CN113836804B/zh
Publication of CN113836804A publication Critical patent/CN113836804A/zh
Application granted granted Critical
Publication of CN113836804B publication Critical patent/CN113836804B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/086Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Physiology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了基于卷积神经网络的动物识别模型建立方法及其应用***,所述卷积神经网络的动物识别模型建立方法先将分组卷积引入到基于标准卷积的卷积神经网络中,构建动物识别初始模型,并对动物识别初始模型进行训练,得到动物识别预训练模型;然后对动物识别预训练模型依次进行迁移学习、剪枝、稀疏和量化处理,得到最终的动物识别模型;利用本发明中的方法建立的动物识别模型识别正确率更高,模型计算量降低,将建立的动物识别模型应用到低功耗的嵌入式动物识别***中,模型在嵌入式设备中的识别速度和准确率都较高,模型的实时性较强,能够完成快速精准的动物识别任务,可识别321种动物,在一定程度上实现了动物种类的细粒度识别。

Description

基于卷积神经网络的动物识别模型建立方法及其应用***
技术领域
本发明涉及动物识别技术领域,尤其涉及基于卷积神经网络的动物识别模型建立方法及其应用***。
背景技术
现实世界动物种类繁多,如何有效地识别动物的种类是科学家亟待研究的课题。研究快速精准地识别动物的装置,可以帮助科学家在野外研究时快速地对物种的归属进行判别,细粒度的动物识别有助于动物保护基地进行实时精准的物种多样性监测和实施有效的保护。另外,近年来,不断有野生动物闯入人类生活区域影响人类正常生活的事件发生,如2021年4月发生的东北虎进村伤人事件、2021年5月的云南大象北迁事件等,如果有动物识别监测装置提前做出危险动物离开栖息地的预警,则人类可以提前做好防范措施,避免人与动物的正面冲突,实现人与大自然的和谐相处。
由于野外环境复杂,动物种类繁多,且行踪不定,同时网络环境较差,因此开发基于嵌入式的动物识别***有助于灵活方便地部署***。卷积神经网络(ConvolutionalNeural Network,CNN)作为当前主要的深度学习技术,在多项计算机视觉任务中都取得了较好的效果,但往往具有较高的计算复杂度从而限制了其在边缘设备上的部署,无法达到“快速精准”的效果。
现有情况下在开发快速精准的嵌入式智能动物识别***时存在如下问题:1、动物种类众多,背景复杂,完备的数据集不易获取,难以实现复杂背景下的细粒度识别;2、标准卷积模块计算量大,对嵌入式设备的存储和运算资源需求较高;3、传统卷积神经网络模型参数量大,难以部署到计算资源受限的嵌入式平台中,模型的实时性较差;4、数据量大,模型训练难以快速收敛。
发明内容
针对上述存在的问题,本发明旨在提供一种基于卷积神经网络的动物识别模型建立方法及其应用,利用该动物识别模型建立方法建立起来的动物识别模型能够快速精准的对动物种类进行识别,且从网络结构层面降低了计算量,提高了嵌入式***的计算效率。
为了实现上述目的,本发明所采用的技术方案如下:
基于卷积神经网络的动物识别模型建立方法,其特征在于,包括以下步骤,
S1:将分组卷积引入到基于标准卷积的卷积神经网络中,构建动物识别初始模型,并使用ImageNet数据集对动物识别初始模型进行训练,得到动物识别预训练模型;
S2:使用扩增数据集对步骤S1中得到的动物识别预训练模型中的可训练参数进行训练更新,实现动物识别预训练模型的迁移学习,得到动物识别迁移模型;
S3:建立以动物识别迁移模型中各个卷积层的通道数为变量,模型在测试集上的识别率为目标的优化模型,并利用全局最优引导人工蜂群算法,对动物识别迁移模型进行剪枝,降低模型的参数量,得到动物识别剪枝模型;
S4:结合多重正则化技术,对步骤S3中得到的动物识别剪枝模型进行稀疏训练,得到动物识别稀疏模型;
S5:对步骤S4中的动物识别稀疏模型进行量化,得到最终的动物识别模型。
进一步的,步骤S1中所述的动物识别初始模型包括输入层、隐含层和输出层;
所述隐含层包含10个卷积层,每个卷积层的输出都采用批量归一化进行处理,之后采用ReLU函数进行激活;每两个卷积层之间使用最大池化作为上采样层,最后一个卷积层后使用平均池化作为上采样;隐含层的末尾连接一个基于全连接层的Softmax分类器。
进一步的,步骤S2中所述的扩增数据集包括对原始动物图像进行缩放、裁剪、翻转、旋转、移位、添加高斯噪声和色彩抖动后形成的图像集。
进一步的,步骤S2的具体操作包括以下步骤,
S201:将扩增数据集分为训练集和测试集;
S202:优化器参数配置;设置训练周期、每批次输入模型的样本数以及初始学***均超参数β1,梯度二阶矩估计的指数移动加权平均超参数β2,学习率上下界调整步幅γ,常数ε;
S203:动物识别预训练模型初始化;对模型的参数θ进行初始化,将模型参数设置成近于0的随机值;
S204:使用自适应梯度下降算法对参数θ进行更新;
S205:参数每更新一次,计算当前模型在训练集和测试集上的损失函数值和准确率,以测试集准确率为性能度量,检验当前模型性能是否提升,如果提升,则将当前模型参数保存,记录测试集的最佳识别率,并将测试集最佳识别率对应的模型即为动物识别迁移模型。
进一步的,步骤S204的具体操作包括以下步骤,
S2041:初始化梯度的一阶矩估计m0=0和二阶矩估计v0=0;
S2042:对于第t次迭代,按照损失函数计算前向传播误差L(θt-1);
S2043:计算第t次迭代时损失函数的梯度
Figure BDA0003263633900000031
S2044:更新第t次迭代时的学习率
Figure BDA0003263633900000032
S2045:计算第t次迭代时,学习率的下界
Figure BDA0003263633900000033
S2046:计算第t次迭代时,学习率的上界
Figure BDA0003263633900000041
S2047:更新第t次迭代时梯度的一阶矩估计mt=βt·mt-1+(1-β1)·gt
S2048:更新第t次迭代时梯度的二阶矩估计
Figure BDA0003263633900000042
S2049:更新参数
Figure BDA0003263633900000043
进一步的,步骤S3中建立以动物识别迁移模型中各个卷积层的通道数为变量,模型在测试集上的识别率为目标的优化模型的具体操作包括以下步骤,
S301:令动物识别迁移模型
Figure BDA0003263633900000044
中各个卷积层的卷积核组成的集合为
Figure BDA0003263633900000045
其中,W(l)和b(l)分别是卷积核的权重和偏置参数,对应通道个数组成的集合为
Figure BDA0003263633900000046
为动物识别迁移模型的卷积层数量;
S302:将
Figure BDA0003263633900000047
的子网络
Figure BDA0003263633900000048
包含的卷积核和通道个数组成的集合分别表示为
Figure BDA0003263633900000049
Figure BDA00032636339000000410
Figure BDA00032636339000000411
S303:对于特定的训练集
Figure BDA00032636339000000412
和测试集
Figure BDA00032636339000000413
以确定最优的通道个数集合
Figure BDA00032636339000000414
为目标,使对应的子网络
Figure BDA00032636339000000415
Figure BDA00032636339000000416
上微调之后对
Figure BDA00032636339000000417
具有较高的识别正确率,从而将以动物识别迁移模型中各个卷积层的通道数为变量,模型在测试集上的识别率为目标的优化目标描述为以下规划问题:
Figure BDA00032636339000000418
Figure BDA00032636339000000419
Figure BDA00032636339000000420
式中,acc(·)表示子网络
Figure BDA0003263633900000051
在测试集
Figure BDA0003263633900000052
上的整体识别正确率,α∈(0.100%]为给定的百分比超参数,表示在剪枝的过程中子网络每个卷积层最多只保留模型
Figure BDA0003263633900000053
中对应卷积层百分比为α的通道个数;当
Figure BDA0003263633900000054
时,取
Figure BDA0003263633900000055
表示子网络的权重参数继承自原始网络。
进一步的,步骤S302中子网络
Figure BDA0003263633900000056
的卷积核组成的集合
Figure BDA0003263633900000057
的计算方法包括以下步骤,
S3021:令
Figure BDA0003263633900000058
子网络
Figure BDA0003263633900000059
各一维卷积层的通道数为
Figure BDA00032636339000000510
3022:获取原始网络中第l个一维卷积层的通道数nj=len(W(i));
S3023:随机产生一个一维数组A=[a1,a2,…,az]其中第i个元素ai为从区间[1,n1]内随机选取的一个正整数,同时a1≠a2≠…≠az
S3024:将数组A中的元素从小到大排列;
S3025:令j=ai,则
Figure BDA00032636339000000511
进一步的,步骤S3中利用全局最优引导人工蜂群算法,对动物识别迁移模型进行剪枝的具体操作包括以下步骤,
S304、初始化阶段:将剪枝模型各层的通道数视为人工蜂群的蜜源,对于第j个蜜源,在闭区间[1,αC(l)/ρ]之间随机选取一个正整数作为第l个卷积层的通道个数
Figure BDA00032636339000000512
其中ρ∈(1,+∞];各个蜜源先初始化为较小的范围[1,αC(l)/ρ],然后在搜索过程中将搜索空间扩展到[1,αC(l)],设置最大搜索周期数为
Figure BDA00032636339000000513
S305、雇佣蜂阶段:使用差分进化算法的搜索公式
Figure BDA0003263633900000061
进行搜索,式中,a≠b≠c≠j,Fl是一个与卷积层相关的缩放因子,各自独立地从期望为0.5,标准差为0.1的正太分布中随机取值,即Fl~N(0.5,0.1);根据步骤S303中建立的目标规划问题,计算蜜源的适应度值
Figure BDA0003263633900000062
S306、跟随蜂阶段:利用公式
Figure BDA0003263633900000063
通过轮盘赌选择法选择一个蜜源,使用公式
Figure BDA0003263633900000064
根据选择的蜜源产生新蜜源,再根据其各自的适应度值对新旧蜜源进行贪婪选择;式中,
Figure BDA0003263633900000065
用于避免
Figure BDA0003263633900000066
时,Pj=0;e≠f≠j,
Figure BDA0003263633900000067
是当前最优蜜源的取值,缩放因子服从正太分布,即F′j~N(0.0,2.0);
S307、侦察蜂阶段:若蜜源
Figure BDA0003263633900000068
经过Ψ次搜索之后仍未在邻域内找到比它更优的蜜源,则按照初始化阶段的方法随机生成一个蜜源代替
Figure BDA0003263633900000069
S308、重复步骤S305~S307直至完成
Figure BDA00032636339000000610
个周期的搜索,根据步骤S303中建立的目标规划问题,计算所有蜜源的适应度值,并将适应度最大的蜜源对应的子网络作为最终的动物识别剪枝模型。
进一步的,步骤S5的具体操作包括以下步骤,
S501:采用动态8位量化方法对动物识别稀疏模型的32位浮点型参数值进行量化;
S502:在网络训练时,使用指数滑动平均计算各参数取值的最大值Rmax和最小值Rmin,判断参数的取值是有符号还是无符号的浮点型;
S503:对于有符号的浮点型,将其量化到整型区间[-128,+127],对于无符号浮点型,则量化到整数区间[0,255];
S504:对于无符号浮点型参数值,其对应的整型数长度为Il=log2(|Rmax|);对于有符号浮点型参数值,其对应的整型数长度为Il=log2(max(|Rmin|,|Rmax|))+1;
S505:计算分子长度Fl=8-Il,则该浮点数的量化乘积因子为
Figure BDA0003263633900000071
S506:将浮点型参数值W与量化乘积因子Mq相乘,再将其值裁剪到合适的无符号或有符号的整型范围内,对于无符号浮点型,其量化值为Wq=clip(round(W*Mq),0,255),对于有符号浮点型,其量化值为Wq=cllip(round(W*Mq),-128,+127)。
进一步的,一种基于卷积神经网络的动物识别模型的应用***,其特征在于:所述应用***包括处理器、视频采集模块、识别处理模块、触控屏显示控制模块和网络通信模块;所述动物识别模型嵌入式设置在所述识别处理模块中,所述视频采集模块、识别处理模块、触控屏显示控制模块和网络通信模块均与所述处理器连接;
所述视频采集模块主要负责实时视频采集;
所述识别处理模块对所述视频采集模块提供的视频流进行动物种类的实时识别;
所述触控屏显示控制模块主要负责人机交互,其功能包括实现触摸控制程序打开和关闭,显示实时识别结果;
所述网络通信模块提供所述动物识别***与其他外接设备之间的通信。
本发明的有益效果是:与现有技术相比,本发明的改进之处在于,
1、本发明中基于卷积神经网络的动物识别模型建立方法能够大大提高模型识别正确率,且降低了模型的计算量;在提高识别正确率方面,通过数据增强方案和迁移学习方案,并结合AdaBound训练优化算法,实现了动物的高准确率和细粒度的识别;在降低计算量方面,首先,针对通道冗余问题,提出了基于改进人工蜂群算法的网络通道剪枝方案,以网络结构搜索的方式搜索网络最优的通道子集,降低了网络通道数;其次,针对参数冗余问题,设计了稀疏训练方案,降低了参数量;最后,设计了模型量化方案,将网络参数的32位浮点型值转为8位整型值,进一步降低了网络对存储和计算资源的需求。
2、本发明中基于卷积神经网络的动物识别模型建立方法建立的动物识别模型能够部署在低功耗的嵌入式设备中,且模型在嵌入式设备中的识别速度和准确率都较高,模型的实时性较强,能够完成快速精准的动物识别任务,可识别321种动物,在一定程度上实现了动物种类的细粒度识别。
附图说明
图1为本发明基于卷积神经网络的动物识别模型建立方法流程图。
图2为本发明中分组卷积示意图。
图3为本发明样本数据增强前后对比示意图。
图4为本发明迁移学习流程图。
图5为本发明基于全局最优引导人工蜂群算法的动物识别模型剪枝算法的整体流程。
图6为本发明稀疏训练流程图。
图7为本发明中应用***硬件设计框图。
图8为本发明实施例中***启动时Matrix-GUI桌面。
图9为本发明实施例中***启动时智能动物识别***应用图标。
图10为本发明实施例中***启动时智能动物识别***界面。
图11为本发明实施例中不同亮度条件下的动物图像识别测试结果。
图12为本发明实施例中不同品种动物图像识别测试结果。
图13为本发明实施例中不同角度下的动物图像识别测试结果。
图14为本发明实施例中不同噪声条件下的动物图像识别测试结果。
图15为本发明实施例中不同色彩抖动条件下的动物图像识别测试结果。
图16为本发明实施例中不同遮挡条件动物识别测试结果。
具体实施方式
为了使本领域的普通技术人员能更好的理解本发明的技术方案,下面结合附图和实施例对本发明的技术方案做进一步的描述。
如附图1所示,基于卷积神经网络的动物识别模型建立方法,包括以下步骤,
S1:将分组卷积引入到基于标准卷积的卷积神经网络中,构建动物识别初始模型,并使用ImageNet数据集对动物识别初始模型进行训练,得到动物识别预训练模型;
在CNN模型中,卷积层的计算量最大,并决定了推理运行的速度,因此降低卷积层的复杂度很重要。如附图2所示,标准卷积实质上是分组数G=1时的分组卷积,当G增大时,输入特征图与卷积核之间的连线显著减少,意味着它们之间的计算减少,因此分组卷积有助于减少卷积层的计算成本。
具体的,本申请中的动物识别初始模型包括输入层、隐含层和输出层;所述隐含层的结构设置如下表1所示,包含10个卷积(Conv)层,每个卷积层的输出都采用批量归一化(Batch Normalization,BN)进行处理,之后采用ReLU函数进行激活;每两个卷积层之间使用最大池化(MaxPool)作为上采样层,最后一个卷积层后使用平均池化(AvgPool)作为上采样;隐含层的末尾连接一个基于全连接层(FC)的Softmax分类器,动物识别初始模型输入图像为尺寸为224×224。此处需要说明的是,在构建动物识别初始模型时需要对动物识别初始模型进行预训练,采用现有的预训练方法,使用ImageNet数据集对动物识别初始模型进行预训练,得到动物识别预训练模型,该预训练操作采用现有的方法进行,本申请中不做赘述。
表1隐含层结构设置
Figure BDA0003263633900000101
进一步的,S2:使用扩增数据集对步骤S1中得到的动物识别预训练模型中的可训练参数进行训练更新,实现动物识别预训练模型的迁移学习,得到动物识别迁移模型;
具体的,所述扩增数据集包括对原始动物图像进行缩放、裁剪、翻转、镜像、旋转、移位、添加高斯噪声和色彩抖动后形成的图像集。由于收集到的带标签的动物图像数据极其有限,使用缩放、裁剪、翻转、旋转、移位、添加高斯噪声和色彩抖动等数据增强技术对训练数据进行扩充,提高训练样本的多样性。
缩放:图主要包括向外或向内缩放。向外缩放时为了保持原始图像的大小,从缩放后的图像中裁剪出和原始图像大小一样的图像。向内缩放将图像缩小到预设的大小。
裁剪:做裁剪操作主要是考虑原始图像的宽高扰动,在大多数图像分类网络中,样本在输入网络前必须要统一大小,所以通过调整图像的尺寸可以大量的扩展数据。本设计首先将随机裁剪固定尺寸大小的图片,然后再将图像通过插值算法调整到网络需要的尺寸大小。
翻转:图像的翻转是将原始的图像进行镜像操作,主要包括水平镜像翻转,垂直镜像翻转和原点镜像翻转。
旋转:角度旋转操作和图像镜像相对,它主要是沿着画面的中心进行任意角度的变换,该变换是通过将原图像和仿射变换矩阵相乘实现的。
移位:移位只涉及沿X或Y方向(或两者)移动图像,该方法可以有效增加样本的数量。
添加高斯噪声:神经网络倾向于学习可能无用的高频特征(即图像中大量出现的模式)时,通常会发生过度拟合。具有零均值的高斯噪声基本上在所有频率中具有数据点,从而有效地扭曲高频特征,增加网络的泛化能力。
色彩抖动:色彩抖动主要是在图像的颜色方面做增强,主要调整的是图像的亮度,饱和度和对比度。为了模拟不同环境背景、光照条件下的动物图像,本设计对数据进行不同程度的色彩抖动。
样本数据增强前后对比情况如附图3所示,在图3中的镜像处理方式包含在上述所述的翻转操作内,因此,本申请中未对镜像操作进行具体说明。
进一步的,迁移学习(Transfer Learning)是一种机器学习方法,是把一个领域(即源领域)的知识,迁移到另外一个领域(即目标领域),使得目标领域能够取得更好的学习效果。源领域由于具有大量数据和对应的标签,可以充分地对模型进行有监督学习,然后将该模型在源领域上学习到的知识或模式应用到不同但相关的目标领域中,改进目标领域的学习效果。为了提高模型的训练速度和识别效果,如附图4所示,将动物识别初始模型(此处的动物识别初始模型指的是经过预训练之后的预训练模型)作为初始模型,使用扩增数据集对初始模型中的可训练参数进行进行训练,避免模型从头开始训练,减少了模型的训练次数,同时在训练过程中引入改进的随机梯度下降算法AdaBound,加速模型的收敛。
网络的训练是模型参数值根据损失函数和输入数据动态调整的过程,由于计算机内存的限制,一般不将整个训练数据集同时进行训练,而是采用分批的方法将小批量数据逐次送入网络更新参数。随机梯度下降算法(Stochastic gradient descent,SGD)每次从训练集中分批次随机抽取n个训练样本送入网络,对于第t次迭代,参数θ更新的表达式为
θt+1=θtt·gt (1-1)
式中,αt为学习率,gt为损失函数的梯度,对于损失函数L(θt;x(i:i+n);y(i:i+n))有
Figure BDA0003263633900000121
在网络的训练中,SGD使用固定的学***稳。
具体的,使用扩增数据集对动物识别预训练模型中的可训练参数进行训练更新的目的是通过输入训练集和测试集数据,输出当测试集识别率达到最高时的模型,其具体操作包括以下步骤,
S201:将扩增数据集分为训练集和测试集;
S202:优化器参数配置;将训练周期epoch设置为200,每批次输入模型的样本数B为32,也即每个批次随机选取32个样本输入网络;同时设置参数α0=0.001αf=0.1,β1=0.9β2=0.999,γ=10-3ε=10-7,其中α0为初始学***均超参数,β2为梯度二阶矩估计的指数移动加权平均超参数,γ为学习率上下界调整步幅,ε为一常数,且为小数。
S203:动物识别预训练模型初始化;对模型的参数θ进行初始化,将模型参数设置成近于0的随机值;
S204:使用自适应梯度下降算法对参数θ进行更新;具体按照以下步骤进行更新:
S2041:初始化梯度的一阶矩估计m0=0和二阶矩估计v0=0;
S2042:对于第t次迭代,按照损失函数计算前向传播误差L(θt-1);
S2043:计算第t次迭代时损失函数的梯度
Figure BDA0003263633900000141
S2044:更新第t次迭代时的学习率
Figure BDA0003263633900000142
S2045:计算第t次迭代时,学习率的下界
Figure BDA0003263633900000143
S2046:计算第t次迭代时,学习率的上界
Figure BDA0003263633900000144
S2047:更新第t次迭代时梯度的一阶矩估计mt=βt·mt-1+(1-βt)·g;
S2048:更新第t次迭代时梯度的二阶矩估计
Figure BDA0003263633900000146
S2049:更新参数
Figure BDA0003263633900000145
S205:参数每更新一次,计算当前模型在训练集和测试集上的损失函数值和准确率,以测试集准确率为性能度量,检验当前模型性能是否提升,如果提升,则将当前模型参数保存,记录测试集的最佳识别率,并将测试集最佳识别率对应的模型即为动物识别迁移模型。
进一步的,S3:建立以动物识别迁移模型中各个卷积层的通道数为变量,模型在测试集上的识别率为目标的优化模型,并利用全局最优引导人工蜂群算法,对动物识别迁移模型进行剪枝,降低模型的参数量,得到动物识别剪枝模型;
具体的,以动物识别迁移模型中各个卷积层的通道数为变量,模型在测试集上的识别率为目标的优化模型的具体操作包括以下步骤,
S301:令动物识别迁移模型
Figure BDA0003263633900000151
中各个卷积层的卷积核组成的集合为
Figure BDA0003263633900000152
其中,W(l)和b(l)分别是卷积核的权重和偏置参数,对应通道个数组成的集合为
Figure BDA0003263633900000153
为动物识别迁移模型的卷积层数量;
S302:将
Figure BDA0003263633900000154
的子网络
Figure BDA0003263633900000155
包含的卷积核和通道个数组成的集合分别表示为
Figure BDA0003263633900000156
Figure BDA0003263633900000157
Figure BDA0003263633900000158
表示子网络的权重参数继承自原始网络
在已知子网络的各个一维卷积层通道数的情况下从预训练的原始网络
Figure BDA0003263633900000159
中随机选取一个子网络
Figure BDA00032636339000001510
其卷积核组成的集合
Figure BDA00032636339000001511
的计算方法包括以下步骤,
S3021:令
Figure BDA00032636339000001512
子网络
Figure BDA00032636339000001513
各一维卷积层的通道数为
Figure BDA00032636339000001514
S3022:获取原始网络中第l个一维卷积层的通道数nl=len(W(l));
S3023:随机产生一个一维数组A=[a1,a2,…,az]其中第i个元素ai为从区间[1,n1]内随机选取的一个正整数,同时a1≠a2≠…≠az
S3024:将数组A中的元素从小到大排列;
S3025:令j=ai,则
Figure BDA00032636339000001515
S303:对于特定的训练集
Figure BDA00032636339000001516
和测试集
Figure BDA00032636339000001517
以确定最优的通道个数集合
Figure BDA00032636339000001518
为目标,使对应的子网络
Figure BDA00032636339000001519
Figure BDA00032636339000001520
上微调之后对
Figure BDA00032636339000001521
具有较高的识别正确率,从而将以动物识别迁移模型中各个卷积层的通道数为变量,模型在测试集上的识别率为目标的优化目标描述为以下规划问题:
Figure BDA0003263633900000161
Figure BDA0003263633900000162
Figure BDA0003263633900000163
式中,acc(·)表示子网络
Figure BDA0003263633900000164
在测试集
Figure BDA0003263633900000165
上的整体识别正确率,α∈(0.100%]为给定的百分比超参数,表示在剪枝的过程中子网络每个卷积层最多只保留模型
Figure BDA0003263633900000166
中对应卷积层百分比为α的通道个数,因此起到了限定子网络通道个数的上界以达到剪枝效果和缩小搜索空间的作用。由于每个一维卷积层的通道数目不为0;因此,在公式(1-3)中,当
Figure BDA0003263633900000167
时,取
Figure BDA0003263633900000168
进一步的,利用全局最优引导人工蜂群算法,对动物识别迁移模型进行剪枝的整体流程如附图5所示,具体操作包括以下步骤,
S304、初始化阶段:将剪枝模型各层的通道数视为人工蜂群的蜜源,对于第j个蜜源,在闭区间[1,αC(l)/ρ]之间随机选取一个正整数作为第l个卷积层的通道个数
Figure BDA0003263633900000169
其中ρ∈(1,+∞];各个蜜源先初始化为较小的范围[1,αC(l)/ρ],根据式(1-3)可知,
Figure BDA00032636339000001610
因此,蜜源在搜索过程中搜索空间会扩展到[1,αC(l)],实现了优先选择通道数较小的网络再根据适应度值逐渐选择较大的网络目的,设置最大搜索周期数为
Figure BDA00032636339000001612
S305、雇佣蜂阶段:使用差分进化算法的搜索公式替换标准人工蜂群算法的搜索公式,以提高算法的收敛速度,差分进化算法的搜索公式为
Figure BDA00032636339000001611
式中,a≠b≠c≠j,Fl是一个与卷积层相关的缩放因子,各自独立地从期望为0.5,标准差为0.1的正太分布中随机取值,即Fl~N(0.5,0.1);根据步骤S303中式(1-3)建立的目标规划问题,计算蜜源的适应度值
Figure BDA0003263633900000171
S306、跟随蜂阶段:跟随蜂利用公式(1-6)通过轮盘赌选择法选择一个蜜源,使用公式(1-7)根据选择的蜜源产生新蜜源,再根据其各自的适应度值对新旧蜜源进行贪婪选择;
Figure BDA0003263633900000172
Figure BDA0003263633900000173
式(1-6)中,
Figure BDA0003263633900000174
用于避免
Figure BDA0003263633900000175
时,Pj=0;
式(1-7)中,e≠f≠j,
Figure BDA0003263633900000176
是当前最优蜜源的取值,缩放因子服从正太分布,即F′j~N(0.0,2.0);与公式(1-4)相比,公式(1-7)引入了当前最优蜜源到搜索公式中,使得算法在当前最优值附近寻找更优的蜜源。
S307、侦察蜂阶段:若蜜源
Figure BDA0003263633900000177
经过Ψ次搜索之后仍未在邻域内找到比它更优的蜜源,则按照初始化阶段的方法随机生成一个蜜源代替
Figure BDA0003263633900000178
S308、重复步骤S305~S307直至完成
Figure BDA0003263633900000179
个周期的搜索,根据步骤S303中建立的目标规划问题,计算所有蜜源的适应度值,并将适应度最大的蜜源对应的子网络作为最终的动物识别剪枝模型。
在雇佣蜂阶段和跟随蜂阶段都用到了公式(1-5)对给定蜜源
Figure BDA0003263633900000181
的适应度进行计算,但是从头开始训练
Figure BDA0003263633900000182
对应的子网络
Figure BDA0003263633900000183
再通过公式(1-5)求得
Figure BDA0003263633900000184
的识别正确率是非常耗时的。因此,本发明中按照
Figure BDA0003263633900000185
中各个卷积层的具体通道个数,首先从经过预训练的原始网络
Figure BDA0003263633900000186
中对应的卷积层随机挑选相应数目的卷积核作为
Figure BDA0003263633900000187
的卷积核,因此
Figure BDA0003263633900000188
中各个卷积层参数完全继承自
Figure BDA0003263633900000189
再对
Figure BDA00032636339000001810
训练少量的周期计算适应度。
在网络剪枝过程中的四个阶段中,每个子网络使用公式(1-5)计算网络的适应度时都需要训练Θ个周期,为了估计本发明中剪枝算法的复杂度,可计算剪枝算法总的周期数。因为每个蜜源对应一个子网络,在剪枝算法的每个搜索周期中,初始化阶段、雇佣蜂阶段和跟随蜂阶段分别产生Ω个子网络,因此每个阶段都要训练Ω×Θ个周期。侦察蜂阶段产生的子网络数量具有较大的随机性,很难精确的估算,将该阶段的训练周期总数记为
Figure BDA00032636339000001811
总之,本发明中剪枝算法所需的子网络训练周期总数为
Figure BDA00032636339000001812
即除去网络在预训练阶段和微调阶段的训练周期数,网络在剪枝过程中额外所需的训练周期数至少为
Figure BDA00032636339000001813
因此本发明的剪枝算法的引入相对增加了模型在训练过程中的计算量,导致网络在训练阶段非常耗时,但是对于实际应用而言,降低网络在测试过程中的模型复杂度和提高识别正确率比减少训练过程中的时间消耗更重要,尤其是将动物识别模型部署在低功耗的嵌入式设备上更加明显。本发明的剪枝算法引入了超参数α用于控制子网络各个卷积层的通道数上限,再根据彩票假设优先选择通道数目较小的子网络,与原始网络相比,网络的参数相应降低,进而减少了网络在测试阶段的计算复杂度。
进一步的,S4:结合多重正则化技术,对步骤S3中得到的动物识别剪枝模型进行稀疏训练,得到动物识别稀疏模型;
使用剪枝算法减少了动物识别模型的卷积层通道数量,从减少参数量的角度减少了模型复杂度,但另一方面,参数值过大也会增加网络的计算量。为了从参数值的角度降低计算量,本发明结合多重正则化技术对剪枝后的动物识别剪枝模型进行稀疏化训练,其过程如附图6所示。首先将剪枝模型的稠密参数向后进行L2和L1正则化,使参数的绝对值接近于0,阈值稀疏化将一定比例的最小参数直接置为零,这样可以使得参数的数量减少。由于直接将部分参数置为0会降低AnimalNets的识别正确率,因此需再使用训练数据集对稀疏参数进行微调,最终得到稀疏模型。
进一步的,S5:对步骤S4中的动物识别稀疏模型进行量化,得到最终的动物识别模型。
上述得到的动物识别稀疏模型的参数是32位浮点数,浮点数在进行计算时相比整型数有两大缺点:一是浮点数在运算时需要占用较大的存储空间和内存空间,如果将32位的浮点数转化为8位的整型,则可缩小75%的存储空间;二是浮点数在运算时会降低运算速度,增加设备能耗,读取32位浮点数所需的带宽可以同时读入4个8位整型,并且整型运算相比浮点型运算更快,自然可以降低设备的功耗。
本申请中对动物识别稀疏模型进行量化的具体操作包括以下步骤,
S501:采用动态8位量化方法对动物识别稀疏模型的32位浮点型参数值进行量化;
S502:在网络训练时,使用指数滑动平均计算各参数取值的最大值Rmax和最小值Rmin,判断参数的取值是有符号还是无符号的浮点型;
S503:对于有符号的浮点型,将其量化到整型区间[-128,+127],对于无符号浮点型,则量化到整数区间[0,255];
S504:对于无符号浮点型参数值,其对应的整型数长度为
Il=log2(|Rmax|) (1-8)
对于有符号浮点型参数值,其对应的整型数长度为
Il=log2(max(|Rmin,Rmax|))+1 (1-9)
S505:计算分子长度Fl=8-Il (1-10)
则该浮点数的量化乘积因子为
Figure BDA0003263633900000201
S506:将浮点型参数值W与量化乘积因子Mq相乘,再将其值裁剪到合适的无符号或有符号的整型范围内,对于无符号浮点型,其量化值为
Wq=clip(round(W*Mq),0,255) (1-12)
对于有符号浮点型,其量化值为
Wq=clip(round(W*Mq),-128,+127) (1-13)
进一步的,本申请中还提供一种基于卷积神经网络的动物识别模型的应用***,所述应用***包括处理器、视频采集模块、识别处理模块、触控屏显示控制模块和网络通信模块;所述动物识别模型嵌入式设置在所述识别处理模块中,所述视频采集模块、识别处理模块、触控屏显示控制模块和网络通信模块均与所述处理器连接;***整体硬件设计框图如附图7所示。
所述嵌入式动物识别***选取工业派作为硬件平台。工业派(IndustriPi)是一款基于美国德州仪器公司(TI)Sitara系列产品AM5708异构多核处理器设计的开源智能硬件开发平台,是一款基于AM5708的最小***。工业派是一款低功耗产品,具有丰富的外设接口。也即,本发明中的处理器采用TI Sitara AM5708 SoC异构多核处理器,其采用工业派作为载体,视频采集模块、识别处理模块、触控屏显示控制模块和网络通信模块通过工业派的外设接口与其处理器通讯连接。所述工业派的功能特点如下表2所示。
表2工业派功能特点
Figure BDA0003263633900000211
所述视频采集模块主要负责实时视频采集,采用镜头焦距为3mm,感光原件尺寸为2.7英寸的USB2.0相机模组CTLYLH2M V1.1,采集视频的尺寸为640×480像素,采集速度为20FPS。
所述识别处理模块对所述视频采集模块提供的视频流,并通过调用TIDL API对视频流中动物种类的实时识别,该模块主要使用C66x DSP,工作频率为750MHz。
所述触控屏显示控制模块主要负责人机交互,可实现触摸控制程序打开和关闭,显示实时识别结果等,该模块采用7英寸HDMI接口的LCD显示屏,支持1024×600像素。
所述网络通信模块提供所述动物识别***与其他外接设备之间的通信,主要通过自带网络接口实现,也可使用UART串口实现对开发板的控制。
实施例:
为了检验***在工业派上的进行动物识别的功能完整性,将本发明中的动物识别模型和相应的软件程序部署到工业派***中,按照如下步骤进行启动:
步骤1:给工业派连接电源,带板子启动后出现附图8所示的Matrix-GUI桌面,选择“Intelligent Storm Applications”;
步骤2:经过第一步选择之后,出现附图9所示的智能动物识别***应用图标,点击进入“Animal Recognition System V0.1”;
步骤3:在软件介绍页面点击“run”按钮,弹出智能动物识别***界面,如附图10所示。
按照上述步骤启动之后,可以开展不同亮度条件、不同品种动物、不同角度、不同噪声条件、不同色彩抖动条件、不同遮挡条件下的识别测试测试实验。
对不同亮度条件下的动物图像进行识别,结果如附图11所示,其中,(a)亮度条件为暗,(b)亮度条件为亮,可见***在图中所示的不同亮度条件下能正确识别动物。
对同一类但不同品种动物图像进行识别,检验***对动物的细粒度识别效果,以犬类为例,结果如附图12所示,其中,(a)为澳洲梗(Australian terrier),(b)为吉娃娃犬(Chihuahua),(c)为杜宾犬(doberman),(d)为金毛猎犬(golden retriever),(e)为挪威猎麋犬(Norwegian Elkhound),可见***能正确识别图中不同品种的动物。
对不同角度下的动物图像进行识别,结果如附图13所示,其中,(a)为正立,(b)为倒立,(c)为侧立,可见***在图中所示的不同角度下能正确识别动物。
对不同噪声条件下的动物图像进行识别,噪声选用高斯白噪声,结果如附图14所示,其中,(a)为高噪声,(b)为低噪声,可见***在图中所示的不同噪声条件下能正确识别动物。
对不同色彩抖动条件下的动物图像进行识别,结果如附图15所示,其中,(a)为调整饱和度条件下的结果,(b)为调整对比度条件下的结果,(c)为调整锐度条件下的结果,(d)为调整上述所有项条件下的结果,可见***在图中所示的不同色彩抖动条件下能正确识别动物。
对动物图像进行不同程度的遮挡,识别结果如附图16所示,其中,(a)、(b)、(c)为三种不同遮挡方式,可见***在图中所示的不同遮挡条件下能正确识别动物。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (10)

1.基于卷积神经网络的动物识别模型建立方法,其特征在于,包括以下步骤,
S1:将分组卷积引入到基于标准卷积的卷积神经网络中,构建动物识别初始模型,并使用ImageNet数据集对动物识别初始模型进行训练,得到动物识别预训练模型;
S2:使用扩增数据集对步骤S1中得到的动物识别预训练模型中的可训练参数进行训练更新,实现动物识别预训练模型的迁移学习,得到动物识别迁移模型;
S3:建立以动物识别迁移模型中各个卷积层的通道数为变量,模型在测试集上的识别率为目标的优化模型,并利用全局最优引导人工蜂群算法,对动物识别迁移模型进行剪枝,降低模型的参数量,得到动物识别剪枝模型;
S4:结合多重正则化技术,对步骤S3中得到的动物识别剪枝模型进行稀疏训练,得到动物识别稀疏模型;
S5:对步骤S4中的动物识别稀疏模型进行量化,得到最终的动物识别模型。
2.根据权利要求1所述的基于卷积神经网络的动物识别模型建立方法,其特征在于:步骤S1中所述的动物识别初始模型包括输入层、隐含层和输出层;
所述隐含层包含10个卷积层,每个卷积层的输出都采用批量归一化进行处理,之后采用ReLU函数进行激活;每两个卷积层之间使用最大池化作为上采样层,最后一个卷积层后使用平均池化作为上采样;隐含层的末尾连接一个基于全连接层的Softmax分类器。
3.根据权利要求2所述的基于卷积神经网络的动物识别模型建立方法,其特征在于:步骤S2中所述的扩增数据集包括对原始动物图像进行缩放、裁剪、翻转、旋转、移位、添加高斯噪声和色彩抖动后形成的图像集。
4.根据权利要求2所述的基于卷积神经网络的动物识别模型建立方法,其特征在于,步骤S2的具体操作包括以下步骤,
S201:将扩增数据集分为训练集和测试集;
S202:优化器参数配置;设置训练周期、每批次输入模型的样本数以及初始学***均超参数β1,梯度二阶矩估计的指数移动加权平均超参数β2,学习率上下界调整步幅γ,常数ε;
S203:动物识别预训练模型初始化;对模型的参数θ进行初始化,将模型参数设置成近于0的随机值;
S204:使用自适应梯度下降算法对参数θ进行更新;
S205:参数每更新一次,计算当前模型在训练集和测试集上的损失函数值和准确率,以测试集准确率为性能度量,检验当前模型性能是否提升,如果提升,则将当前模型参数保存,记录测试集的最佳识别率,并将测试集最佳识别率对应的模型即为动物识别迁移模型。
5.根据权利要求4所述的基于卷积神经网络的动物识别模型建立方法,其特征在于,步骤S204的具体操作包括以下步骤,
S2041:初始化梯度的一阶矩估计m0=0和二阶矩估计v0=0;
S2042:对于第t次迭代,按照损失函数计算前向传播误差L(θt-1);
S2043:计算第t次迭代时损失函数的梯度
Figure FDA0003263633890000031
S2044:更新第t次迭代时的学习率
Figure FDA0003263633890000032
S2045:计算第t次迭代时,学习率的下界
Figure FDA0003263633890000033
S2046:计算第t次迭代时,学习率的上界
Figure FDA0003263633890000034
S2047:更新第t次迭代时梯度的一阶矩估计mt=βt·mt-1+(1-βt)·gt
S2048:更新第t次迭代时梯度的二阶矩估计
Figure FDA0003263633890000035
S2049:更新参数
Figure FDA0003263633890000036
6.根据权利要求4所述的基于卷积神经网络的动物识别模型建立方法,其特征在于,步骤S3中建立以动物识别迁移模型中各个卷积层的通道数为变量,模型在测试集上的识别率为目标的优化模型的具体操作包括以下步骤,
S301:令动物识别迁移模型
Figure FDA0003263633890000037
中各个卷积层的卷积核组成的集合为
Figure FDA0003263633890000038
其中,W(l)和b(l)分别是卷积核的权重和偏置参数,对应通道个数组成的集合为
Figure FDA0003263633890000039
Figure FDA00032636338900000310
为动物识别迁移模型的卷积层数量;
S302:将
Figure FDA00032636338900000311
的子网络
Figure FDA00032636338900000312
包含的卷积核和通道个数组成的集合分别表示为
Figure FDA00032636338900000313
Figure FDA00032636338900000314
Figure FDA00032636338900000315
S303:对干特定的训练集
Figure FDA0003263633890000041
和测试集
Figure FDA0003263633890000042
以确定最优的通道个数集合
Figure FDA0003263633890000043
为目标,使对应的子网络
Figure FDA0003263633890000044
Figure FDA0003263633890000045
上微调之后对
Figure FDA0003263633890000046
具有较高的识别正确率,从而将以动物识别迁移模型中各个卷积层的通道数为变量,模型在测试集上的识别率为目标的优化目标描述为以下规划问题:
Figure FDA0003263633890000047
Figure FDA0003263633890000048
Figure FDA0003263633890000049
式中,acc(·)表示子网络
Figure FDA00032636338900000410
在测试集
Figure FDA00032636338900000411
上的整体识别正确率,α∈(0.100%]为给定的百分比超参数,表示在剪枝的过程中子网络每个卷积层最多只保留模型
Figure FDA00032636338900000412
中对应卷积层百分比为α的通道个数;当
Figure FDA00032636338900000413
时,取
Figure FDA00032636338900000414
Figure FDA00032636338900000415
表示子网络的权重参数继承自原始网络。
7.根据权利要求6所述的基于卷积神经网络的动物识别模型建立方法,其特征在于,步骤S302中子网络
Figure FDA00032636338900000416
的卷积核组成的集合
Figure FDA00032636338900000417
的计算方法包括以下步骤,
S3021:令
Figure FDA00032636338900000418
Figure FDA00032636338900000419
子网络
Figure FDA00032636338900000420
各一维卷积层的通道数为
Figure FDA00032636338900000421
S3022:获取原始网络中第l个一维卷积层的通道数n1=len(W(l));
S3023:随机产生一个一维数组A=[a1,a2,…,az],其中第i个元素ai为从区间[1,n1]内随机选取的一个正整数,同时a1≠a2≠…≠az
S3024:将数组A中的元素从小到大排列;
S3025:令j=ai,则
Figure FDA00032636338900000422
8.根据权利要求6所述的基于卷积神经网络的动物识别模型建立方法,其特征在于,步骤S3中利用全局最优引导人工蜂群算法,对动物识别迁移模型进行剪枝的具体操作包括以下步骤,
S304、初始化阶段:将剪枝模型各层的通道数视为人工蜂群的蜜源,对于第j个蜜源,在闭区间[1,αC(l)/ρ]之间随机选取一个正整数作为第l个卷积层的通道个数
Figure FDA0003263633890000051
其中ρ∈(1,+∞];各个蜜源先初始化为较小的范围[1,αC(l)/ρ],然后在搜索过程中将搜索空间扩展到[1,αC(l)],设置最大搜索周期数为
Figure FDA0003263633890000052
S305、雇佣蜂阶段:使用差分进化算法的搜索公式
Figure FDA0003263633890000053
进行搜索,式中,a≠b≠c≠j,Fl是一个与卷积层相关的缩放因子,各自独立地从期望为0.5,标准差为0.1的正太分布中随机取值,即Fl~N(0.5,0.1);根据步骤S303中建立的目标规划问题,计算蜜源的适应度值
Figure FDA0003263633890000054
S306、跟随蜂阶段:利用公式
Figure FDA0003263633890000055
通过轮盘赌选择法选择一个蜜源,使用公式
Figure FDA0003263633890000056
根据选择的蜜源产生新蜜源,再根据其各自的适应度值对新旧蜜源进行贪婪选择;式中,
Figure FDA0003263633890000057
β∈(0,1),用于避免
Figure FDA0003263633890000058
时,Pj=0;e≠f≠j,gbestj (l)是当前最优蜜源的取值,缩放因子服从正太分布,即F′j~N(0.0,2.0);
S307、侦察蜂阶段:若蜜源
Figure FDA0003263633890000059
经过Ψ次搜索之后仍未在邻域内找到比它更优的蜜源,则按照初始化阶段的方法随机生成一个蜜源代替
Figure FDA0003263633890000061
S308、重复步骤S305~S307直至完成
Figure FDA0003263633890000063
个周期的搜索,根据步骤S303中建立的目标规划问题,计算所有蜜源的适应度值,并将适应度最大的蜜源对应的子网络作为最终的动物识别剪枝模型。
9.根据权利要求6所述的基于卷积神经网络的动物识别模型建立方法,其特征在于,步骤S5的具体操作包括以下步骤,
S501:采用动态8位量化方法对动物识别稀疏模型的32位浮点型参数值进行量化;
S502:在网络训练时,使用指数滑动平均计算各参数取值的最大值Rmax和最小值Rmin,判断参数的取值是有符号还是无符号的浮点型;
S503:对于有符号的浮点型,将其量化到整型区间[-128,+127],对于无符号浮点型,则量化到整数区间[0,255];
S504:对于无符号浮点型参数值,其对应的整型数长度为Il=log2(|Rmax|);对于有符号浮点型参数值,其对应的整型数长度为Il=log2(max(|Rmin|,|Rmax|))+1;
S505:计算分子长度Fl=8-Il,则该浮点数的量化乘积因子为
Figure FDA0003263633890000062
S506:将浮点型参数值W与量化乘积因子Mq相乘,再将其值裁剪到合适的无符号或有符号的整型范围内,对于无符号浮点型,其量化值为Wq=clip(round(W*Mq),0,255),对于有符号浮点型,其量化值为Wq=clip(round(W*Mq),-128,+127)。
10.一种基于卷积神经网络的动物识别模型的应用***,其特征在于:所述应用***包括处理器、视频采集模块、识别处理模块、触控屏显示控制模块和网络通信模块;所述动物识别模型嵌入式设置在所述识别处理模块中,所述视频采集模块、识别处理模块、触控屏显示控制模块和网络通信模块均与所述处理器连接;
所述视频采集模块主要负责实时视频采集;
所述识别处理模块对所述视频采集模块提供的视频流进行动物种类的实时识别;
所述触控屏显示控制模块主要负责人机交互,其功能包括实现触摸控制程序打开和关闭,显示实时识别结果;
所述网络通信模块提供所述动物识别***与其他外接设备之间的通信。
CN202111080000.3A 2021-09-15 2021-09-15 基于卷积神经网络的动物识别模型建立方法及其应用*** Active CN113836804B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111080000.3A CN113836804B (zh) 2021-09-15 2021-09-15 基于卷积神经网络的动物识别模型建立方法及其应用***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111080000.3A CN113836804B (zh) 2021-09-15 2021-09-15 基于卷积神经网络的动物识别模型建立方法及其应用***

Publications (2)

Publication Number Publication Date
CN113836804A true CN113836804A (zh) 2021-12-24
CN113836804B CN113836804B (zh) 2024-06-18

Family

ID=78959421

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111080000.3A Active CN113836804B (zh) 2021-09-15 2021-09-15 基于卷积神经网络的动物识别模型建立方法及其应用***

Country Status (1)

Country Link
CN (1) CN113836804B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115049055A (zh) * 2022-06-29 2022-09-13 厦门大学 基于动态双可训练界限的超分神经网络的量化方法
CN115526266A (zh) * 2022-10-18 2022-12-27 支付宝(杭州)信息技术有限公司 模型训练方法和装置、业务预测方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110378435A (zh) * 2019-07-25 2019-10-25 安徽工业大学 一种基于卷积神经网络的苹果叶片病害识别的方法
WO2021129570A1 (zh) * 2019-12-25 2021-07-01 神思电子技术股份有限公司 一种基于网络激活与稀疏化的网络裁剪优化方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110378435A (zh) * 2019-07-25 2019-10-25 安徽工业大学 一种基于卷积神经网络的苹果叶片病害识别的方法
WO2021129570A1 (zh) * 2019-12-25 2021-07-01 神思电子技术股份有限公司 一种基于网络激活与稀疏化的网络裁剪优化方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
白洁;张金松;刘倩宇;: "基于卷积网络特征迁移的小样本物体图像识别", 计算机仿真, no. 05, 15 May 2020 (2020-05-15) *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115049055A (zh) * 2022-06-29 2022-09-13 厦门大学 基于动态双可训练界限的超分神经网络的量化方法
CN115049055B (zh) * 2022-06-29 2024-06-04 厦门大学 基于动态双可训练界限的超分神经网络的量化方法
CN115526266A (zh) * 2022-10-18 2022-12-27 支付宝(杭州)信息技术有限公司 模型训练方法和装置、业务预测方法和装置
CN115526266B (zh) * 2022-10-18 2023-08-29 支付宝(杭州)信息技术有限公司 模型训练方法和装置、业务预测方法和装置

Also Published As

Publication number Publication date
CN113836804B (zh) 2024-06-18

Similar Documents

Publication Publication Date Title
Strumberger et al. Designing convolutional neural network architecture by the firefly algorithm
CN112163465B (zh) 细粒度图像分类方法、***、计算机设备及存储介质
WO2022057262A1 (zh) 图像识别方法、装置及计算机可读存储介质
CN109816009A (zh) 基于图卷积的多标签图像分类方法、装置及设备
WO2022068623A1 (zh) 一种模型训练方法及相关设备
CN112613581A (zh) 一种图像识别方法、***、计算机设备和存储介质
CN112052948B (zh) 一种网络模型压缩方法、装置、存储介质和电子设备
CN113836804B (zh) 基于卷积神经网络的动物识别模型建立方法及其应用***
CN109961102B (zh) 图像处理方法、装置、电子设备及存储介质
US20200257966A1 (en) Quality monitoring and hidden quantization in artificial neural network computations
CN114332545A (zh) 一种基于低比特脉冲神经网络的图像数据分类方法和装置
CN109583367A (zh) 图像文本行检测方法及装置、存储介质和电子设备
CN114925320B (zh) 一种数据处理方法及相关装置
Peng et al. An adaptive Lévy flight firefly algorithm for multilevel image thresholding based on Rényi entropy
WO2020165629A1 (en) Quality monitoring and hidden quantization in artificial neural network computations
Mocerino et al. CoopNet: Cooperative convolutional neural network for low-power MCUs
Wang et al. MetaScleraSeg: an effective meta-learning framework for generalized sclera segmentation
Rugina et al. Meta-learning and self-supervised pretraining for real world image translation
Prasad et al. Analysis on content based image retrieval using image enhancement and deep learning convolutional neural networks
Ghosh et al. PB3C-CNN: An integrated PB3C and CNN based approach for plant leaf classification
CN117649631B (zh) 一种基于改进卷积神经网络的客户端图像处理方法及***
CN114140654B (zh) 图像动作识别方法、装置及电子设备
CN113869193B (zh) 行人再识别模型的训练方法、行人再识别方法及***
US11989653B2 (en) Pseudo-rounding in artificial neural networks
Rakhmatulin Increasing FPS for Single Board Computers and Embedded Computers in 2021 (Jetson Nano and YOVOv4-Tiny)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant