CN110222696A - 一种利用GPCNNs和ELM进行植物叶片疾病识别的方法 - Google Patents

一种利用GPCNNs和ELM进行植物叶片疾病识别的方法 Download PDF

Info

Publication number
CN110222696A
CN110222696A CN201910303028.5A CN201910303028A CN110222696A CN 110222696 A CN110222696 A CN 110222696A CN 201910303028 A CN201910303028 A CN 201910303028A CN 110222696 A CN110222696 A CN 110222696A
Authority
CN
China
Prior art keywords
image
layer
feature
output
elm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910303028.5A
Other languages
English (en)
Inventor
张传雷
任雪飞
李建荣
武大硕
刘璞
张善文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Dozhi Information Technology Co Ltd
Tianjin University of Science and Technology
Original Assignee
Tianjin Dozhi Information Technology Co Ltd
Tianjin University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Dozhi Information Technology Co Ltd, Tianjin University of Science and Technology filed Critical Tianjin Dozhi Information Technology Co Ltd
Priority to CN201910303028.5A priority Critical patent/CN110222696A/zh
Publication of CN110222696A publication Critical patent/CN110222696A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种利用GPCNNs和ELM进行植物叶片疾病识别的方法,包括三个阶段:利用GPCNN学习多尺度金字塔汇聚特征,融合提取的层次特征,然后进行疾病识别分类。本发明的特点是:(1)采用全局汇聚层代替全连通层,加快了网络收敛速度,提高了网络性能;(2)与传统的基于特征提取的疾病识别方法相比,本发明利用GPCNNs从病叶图像中自动学习出可靠的特征,代替人工提取病叶特征,可靠性提高,效率提高;(3)与传统的基于深度学习的作物病害识别方法相比,用ELM分类器代替利用卷积神经网络(CNNs)对疾病类型进行分类,提高了识别性能。

Description

一种利用GPCNNs和ELM进行植物叶片疾病识别的方法
技术领域
本发明涉及计算机技术领域,更具体的说是涉及一种利用GPCNNs和ELM 进行植物叶片疾病识别的方法。
背景技术
目前,传统的检测和诊断植物叶片病害的主要方法是通过专家和农民的 专业技术水平和多年的经验对果树进行肉眼观察,劳动强度大,耗时长,需 要专家和农民连续监测田间水果的生长,往往容易错过最佳的防治时机。随 着机器学习领域、模式识别、图像处理和图像分类的发展,许多植物病害的 识别方法和技术已被提出并应用于自动检测和苹果病害的识别,Sindhuja[2] 等建立了一种快速、有效、可靠地健康监测传感器。虽然这些方法能有效地 诊断植物病害,但它们对于普通人来说太专业化了[4]。Omrani[5]等人提出了 农作物病虫叶片图像分类的软计算方法;Bhavini[6]等人综述了几种利用图像 处理和机器学习的植物病害检测与分类方法,总结了作物病害检测与识别的 各个阶段;Shiv[7]等人提出了一种基于颜色、纹理和形状特征的苹果病害分类 方法;Zhang[8]等人提出了一种苹果叶部病害识别的方法,从每个斑点图像中 提取38个颜色、纹理和形状的分类特征,利用遗传算法(GA)选择最有价值 的特征,最后利用支持向量机进行病害识别;Ganatra[9]等人作物病害检测与 分类中使用的各种现有算法和技术,总结了各种特征提取算法、分割算法和 分类器以及优缺点。
但是,上述方法的识别性能在很大程度上取决于病叶图像的分割效果和 提取的手工艺特征。由于病叶图像的颜色、形状和纹理非常复杂和不规则, 很难从病叶图像中提取鲁棒性的分类特征用于病害识别。
因此,如何实现从病叶图像准确进行病害识别是本领域技术人员亟需解 决的问题。
发明内容
有鉴于此,本发明提供了一种利用GPCNNs和ELM进行植物叶片疾病识 别的方法,通过建立全局汇聚CNNs模型,对病叶图像进行多尺度特征提取, 并利用ELM对病叶图像进行分类。包括两个训练阶段,在第一训练阶段,进 行GPCNNs模型训练,包括两部分:基于网络权重集(W,b)的特征提取和采 用Softmax分类器的图像识别,(W,b)用于从最后三层卷积层或池层的特征 图像映射中提取多尺度特征映射;第二训练阶段,将第一阶段的多尺度特征 映射进行多尺度融合操作得到金字塔汇集特征向量,再将其串联为列向量, 再采用列向量来训练由网络权重集表征的ELM分类器,训练后的网络权值集 (V,e,b)用于生成分类标签(V,e,b)。最后通过(W,b,V,e,b)构建了一个端 到端的GPCNNs+ELM识别模型。输入叶片图像到GPCNNs+ELM识别模型就可 以得到叶片灾害类型的识别结果。
为了实现上述目的,本发明采用如下技术方案:
公开了一种利用GPCNNs和ELM进行植物叶片疾病识别的方法,采集原 始图像通过训练GPCNNs模型进行多尺度金字塔池特征提取,得到病害特征模 型,再采用ELM对测试图像的植物叶片病害类型进行识别,其具体步骤为: S1:对采集原始图像进行处理,对所述原始图像进行归一化和固定图像大小 处理;运用微失真增强算法提高所述原始图像的抗干扰能力,对所述原始图 像运用微失真增强算法后进行变换处理得到若干新图像,与所述原始图像共 同组成图像数据;
S2:输入所述图像数据训练一个GPCNNs模型来提取所述原始图像的多层特 征,得到特征图像、特征图像映射和原始图像标签;所述GPCNNs模型包括输 入层、若干层卷积层、若干层池层以及全局平均池层GAP和输出层;训练具 有L层的CNNs,则所述卷积层和所述池层均设置有L层;每一个所述卷积层 运算后都进行一个所述池层运算,且均输出特征图像和特征图像映射,前一 个所述卷积层的输出多尺度特征映射作为后一个所述池层和后一个所述卷积 层的输入;在所述输出层输出原始图像标签;
S3:选取步骤2中最后三层所述特征图像映射,通过多尺度融合操作提取金 字塔汇集特征,并将所述金字塔汇集特征串联为列向量,用所述列向量训练 由所述网络权重集表征的ELM分类器;
S4:采用所述ELM分类器对测试图像进行分类,完成植物叶片病害类型识别。 为了进一步优化上述技术特征,在所述S1中采用双线性插值算法对所述原始 图像进行归一化;所述微失真增强算法包括方向干扰、光干扰、高斯噪声和 PCA抖动;所述变换处理是通过调整锐度值、亮度值和对比度值,令所述原始 图像的所有像素围绕所述原始图像的中心旋转,并相对于垂直轴和水平轴进 行镜像变换,生成若干所述新图像。
优选的,S2的具体过程为:
S21:在所述输入层设定输入图像大小,并输入所述图像数据,按照所述输入 图像大小变换后进行卷积计算;设定每个所述卷积层的卷积核和权重值(W, b),其中W为权重,b为加性偏置;
S22:进行l层卷积计算l∈(1,2,...,L),卷积计算公式为
其中xl-1为l-1层卷积输出,xl为所述l层卷积输出,f(·)为非线性激活函 数,公式为Wl为所述l层的权重,bl为所述l层的加性偏置; S23:进行池层运算,计算公式为xl=f(down(xl-1)+bl);
其中,xl-1为l-1层的所述卷积输出;down(·)为下采样算子;bl为l层的加 性偏置;
S24:是否进行完L次所述卷积计算和所述池层计算,如果否则进入步骤22; S25:进行全局平均池层计算,计算公式为
其中,为最后一个所述池层中的具有m*n大小的第k个特征映射,m*n 为前一个所述池层的输出大小,是所述全局平均池层的输出。
S26:输出层计算公式为y(k,b)=fL(kLhL+bL);
其中,y(k,b)是整个CNNs的预测值,hL-1表示CNNs中的第L-1隐藏层的 输出特征图,它可以是卷积层或者汇聚层;kL为全局平均池层输出, bL为第L层偏置项;fL为Softmax分类器;k是输出结果个数,b是加性偏置。
优选的,S3的具体过程为:
S31:采用多尺度池提取多层次特征,首先,将输入所述图像数据分割成若干 块;
S32:将分割后的所述若干块所述图像数据采用层次金字塔结构在所述全局平 均池层进行聚类,聚类对象为S2中最后的三层所述卷积层或所述池层的输出 特征图像,进行所述聚类时保留局部空间块的空间位置信息,输出三个具有 多尺度特征的图像特征列向量,将所述图像特征列向量展开成列,并级联成 图像融合特征向量。
优选的,S4的具体过程为:
S41:在输入层输入S32中的所述图像融合特征向量;
S42:ELM模型的所述隐藏层中存在L个隐藏神经元,所述图像融合特征向量 在隐藏层进行计算,计算公式g(x;vi,bi)=g(xvi+ei)(i=1,2,...,L);
其中,g为激活函数,vi为第i隐含神经元与所有输入神经元之间的权重向量, bi为第i隐含神经元的偏置,ei为偏差,x为输入图像,激活函数采用Sigmoid 函数 S43:ELM模型的输出层有M个输出神经元,输出特征向量 h(x)=[g(x;v1,e1),g(x;v2,e2),L,g(x;vL,eL)];
输出神经元的输出计算公式为其中,bi,j为第i个隐含神经元的第j个输出神经元的输出权重;
S44:输入样本x对应的隐藏层的输出特征向量f(x)=[f1(x),f2(x),L,fM(x)]=h(x)b 其中,b为为上述步骤S43中的bi,j,所述输入样本x的标签为 label(x)=argi=1,2,L, Mmaxfj(x)
优选的,利用GPCNNs+ELM对原始图像和预测图像进行模型运算得到测 量目标标签和预测标签之间的偏差,然后利用平方损失函数对所述测量目标 标签和预测标签的偏差进行优化,计算公式如下:
其中,ci是第i个样本的标签值,即利用GPCNNs模型输入图像输出的第 i个图像的标签,yi(w,b)表示第i个单一激活单元的输出。
采用前馈和反向传播算法使平方损失函数最小,得到GPCNNs的参数W 和b。具体的,应用随机梯度下降算法(SGD)对参数进行优化,GPCNNs的 参数可以根据SGD的导数进行更新,一旦反向传播过程完成,W和b被确定。 然后,应用前馈步骤在另一轮中生成新的误差导数来更新参数。这些前馈和 反向传播过程被重复直到达到收敛,获得最优W和b,然后GPCNNs被很好 地训练。训练样本和测试样本的多层高层特征可以通过训练好的分层GPCNNs 框架提取。在完成GPCNNs的卷积核汇聚操作后,将最后一层的输出特征映射 变换为一维向量,然后利用Softmax分类器进行分类。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种利 用GPCNNs和ELM进行植物叶片疾病识别的方法,包括三个阶段:利用GPCNN 学习多尺度金字塔汇聚特征,融合提取的层次特征,然后进行疾病识别分类。 本发明的特点是:(1)采用全局汇聚层代替全连通层,加快了网络收敛速度, 提高了网络性能;(2)与传统的基于特征提取的疾病识别方法相比,本发明 利用GPCNNs从植物病叶图像中自动学习出可靠的特征,代替人工提取病叶特 征,可靠性提高,效率提高;(3)与传统的基于深度学习的作物病害识别方 法相比,用ELM分类器代替利用卷积神经网络(CNNs)对疾病类型进行分类, 提高了识别性能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实 施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面 描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不 付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1附图为本发明提供的GPCNNs+ELM框架结构示意图;
图2附图为本发明提供的GPCNNs框架结构示意图
图3附图为本发明提供的多尺度池化层的特征提取结构示意图;
图4附图为本发明提供的特征融合结构示意图;
图5附图为本发明提供的ELM框架结构示意图;
图6附图为本发明提供的基于GPCNNs+ELM的识别模型框架结构示意图;
图7附图为本发明提供的病变苹果图像和响应分割病变图像示意图;
图8附图为本发明提供的病害叶片图像和响应分割点图像及其增强图像 示意图;
图9附图为本发明提供的1000次迭代后不同层的输出特征图示意图;
图10附图为本发明提供的GPCNNs识别精度与迭代次数关系示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行 清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而 不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做 出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种利用GPCNNs和ELM进行植物叶片疾病识别的 方法,其特征在于,采集原始图像通过训练GPCNNs模型进行多尺度金字塔池 特征提取,得到病害特征模型,再采用ELM对测试图像的植物叶片病害类型 进行识别,其具体步骤为:
S1:对采集原始图像进行处理,对原始图像进行归一化和固定图像大小处理; 运用微失真增强算法提高原始图像的抗干扰能力,对所述原始图像运用微失 真增强算法后进行变换处理得到若干新图像,与原始图像共同组成图像数据;
S2:输入图像数据训练一个GPCNNs模型来提取原始图像的多层特征,得到特 征图像、特征图像映射和原始图像标签;GPCNNs模型包括输入层、若干层卷 积层、若干层池层以及全局平均池层GAP和输出层;训练具有L层的CNNs, 则卷积层和池层均设置有L层;每一个卷积层运算后都进行一个池层运算, 且均输出特征图像和特征图像映射,前一个卷积层的输出多尺度特征映射作 为后一个池层和后一个卷积层的输入;在输出层输出原始图像标签;
S3:选取步骤2中最后三层特征图像映射,通过多尺度融合操作提取金字塔 汇集特征,并将金字塔汇集特征串联为列向量,用列向量训练由网络权重集 表征的ELM分类器;
S4:采用ELM分类器对测试图像进行分类,完成植物叶片病害类型识别。
为了进一步优化上述技术特征,在S1中采用双线性插值算法对原始图像进行 归一化;微失真增强算法包括方向干扰、光干扰、高斯噪声和PCA抖动;变 换处理是通过调整锐度值、亮度值和对比度值,令原始图像的所有像素围绕 原始图像的中心旋转,并相对于垂直轴和水平轴进行镜像变换,生成若干新 图像。
为了进一步优化上述技术特征,S2的具体过程为:
S21:在输入层设定输入图像大小,并输入图像数据,按照输入图像大小变换 后进行卷积计算;设定每个卷积层的卷积核和权重值(W,b),其中W为权 重,b为加性偏置;
S22:进行l层卷积计算l∈(1,2,...,L),卷积计算公式为
其中xl-1为l-1层卷积输出,xl为l层卷积输出,f(·)为非线性激活函数, 公式为Wl为l层的权重,bl为l层的加性偏置;
S23:进行池层运算,计算公式为xl=f(down(xl-1)+bl);
其中,xl-1为l-1层的卷积输出;down(·)为下采样算子;bl为l层的加性偏 置;
S24:是否进行完L次卷积计算和池层计算,如果否则进入步骤22;
S25:进行全局平均池层计算,计算公式为
其中,为最后一个池层中的具有m*n大小的第k个特征映射,m*n为 前一个池层的输出大小,是全局平均池层的输出。
S26:输出层计算公式为y(k,b)=fL(kLhL+bL);
其中,y(k,b)是整个CNNs的预测值,hL-1表示CNNs中的第L-1隐藏层的 输出特征图,它可以是卷积层或者汇聚层;kL为全局平均池层输出, bL为第L层偏置项;fL为Softmax分类器;k是输出结果个数,b是加性偏置。
为了进一步优化上述技术方案,步骤3的具体过程为:
S31:采用多尺度池提取多层次特征,首先,将输入图像数据分割成若干块; S32:将分割后的若干块图像数据采用层次金字塔结构在全局平均池层进行聚 类,聚类对象为S2中最后的三层卷积层或池层的输出特征图像,进行聚类时 保留局部空间块的空间位置信息,输出三个具有多尺度特征的图像特征列向 量,将图像特征列向量展开成列,并级联成图像融合特征向量。
为了进一步优化上述技术方案,步骤4的具体过程为:
S41:在输入层输入S32中的图像融合特征向量;
S42:ELM模型的隐藏层中存在L个隐藏神经元,图像融合特征向量在隐藏层 进行计算,计算公式g(x;vi,bi)=g(xvi+ei)(i=1,2,...,L);
其中,g为激活函数,vi为第i隐含神经元与所有输入神经元之间的权重向量, bi为第i隐含神经元的偏置,ei为偏差,x为输入图像,激活函数采用Sigmoid 函数
S43:ELM模型的输出层有M个输出神经元,输出特征向量 h(x)=[g(x;v1,e1),g(x;v2,e2),L,g(x;vL,eL)];
输出神经元的输出计算公式为其中,bi,j为第i个隐含神经元的第j个输出神经元的输出权重;
S44:输入样本x对应的隐藏层的输出特征向量f(x)=[f1(x),f2(x),L,fM(x)]=h(x)b 其中,b为步骤S43中的bi,j,输出输入样本x的标签为 label(x)=argi=1,2,L,Mmaxfj(x)。
为了进一步优化上述技术方案,利用GPCNNs+ELM对原始图像和预测图 像进行模型运算得到测量目标标签和预测标签之间的偏差,然后利用平方损 失函数测量目标标签和预测标签的偏差进行优化,计算公式如下:
其中,ci是第i个样本的标签值,yi(w,b)表示第i个单一激活单元的输出; 采用前馈和反向传播算法使平方损失函数最小,得到GPCNNs的参数W和b。 具体的,应用随机梯度下降算法(SGD)对参数进行优化,GPCNNs的参数可 以根据SGD的导数进行更新,一旦反向传播过程完成,W和b被确定。然后, 应用前馈步骤即采用随机梯度下降算法中的前向传播算法计算W和b,在另 一轮中生成新的误差导数来更新参数。这些前馈和反向传播过程被重复直到 达到收敛,获得最优W和b,然后GPCNNs被很好地训练。训练样本和测试 样本的多层高层特征可以通过训练好的分层GPCNNs模型提取。在完成 GPCNNs的卷积核汇聚操作后,将最后一层的输出特征映射变换为一维向量, 即在输出层输出标签,然后利用Softmax分类器进行分类。
为了进一步优化上述技术方案,病害类别建模图像和预测图像均在 GPCNNs模型中进行计算,分别得到建模图像和预测图像的标签,然后在ELM 中进行两种标签的比对识别,根据已知的建模图像的病害类别确定预测图像 的病害类别,ELM进行病害类别确定的具体过程如下:
S51:输入:(xk,ck),k=1,2,...,L,ck是xk的标签,激活函数g,隐藏神经元的 个数L;
S511:随机设置输入权重wi和偏差bi的参数值,i=1,2,...,L;
S512:计算隐藏层的输出矩阵H;
S513:根据下述约束条件对隐藏层的输出权重bx进行评估,
st:Hb=T-a
其中a是较小的调整常数,用来增强CNNs的归一化,r是正则化因子, T是输入样本的标签值;
或者对隐藏层输出权重进行评估;
S52:输出训练样本的输出神经元特征向量Y
其中,yN,M=y(k,b)=fL(kLhL+bL),N为样本 分类的个数,M为输出层神经元个数。
实施例
通过实验验证本发明的可行性和准确性。
构建了苹果病叶图像数据库,包含4个常见病害的400幅病叶图像,即 图7-1斑叶、图7-2褐斑(布朗斑)、图7-3花叶病和图7-4锈病,每类100 幅叶图像。所有叶片图像采集自陕西阳陵农业高新技术产业示范区,然后用 佳能A640数码相机拍摄,分辨率为1200×1600。每种病害有100张JEPG格 式的叶片图像,症状明显,大小不同,方向不同,光照度不同,背景单一。 k-均值聚类算法用于分割病斑叶图像。图7显示了一些原始病态叶片图像和相 应的分割彩色病变图像。
CNNs模型往往需要一个大规模的图像集来训练其参数,避免过拟合问题, 并导致更好的泛化。然而,事实上,很难收集大量可用的病态叶片图像。一 种有效的方法是通过以下步骤对原始图像进行人工变换来增强数据集:
旋转/反射:以一定角度随机旋转每个原始图像,以改变图像内容的方向;
翻转:将每一个原始图像进行水平或垂直翻转;
尺度:按一定比例放大或缩小每个原始图像;
不变特征变化:在图像平面上以一定的方式变换每个原始图像;
裁剪:根据指定的比例因子对每个原始图像进行放大或缩小,或者参考 比例不变特征变换(SIFT)特征提取的思想,使用指定的比例因子对图像进行 滤波,构建比例空间;
对比度:在HSV图像颜色空间中,改变饱和度S和V亮度分量,保持色 调H不变,并指数计算每个像素的S和V分量(指数因子在0.25和4之间), 增加光照变化;
噪声干扰:随机加入一定噪声干扰的原始图像各像素RGB,常见的噪声 模式有椒盐噪声和高斯噪声;
PCA抖动:根据RGB的三个颜色通道计算均值和标准差,然后在整个训 练集上计算协方差矩阵,通过特征向量分解得到特征向量和特征值。
通过上述处理,将每个原始图像增强为50个新图像,然后创建包含20400 个图像的增强数据集。从经验中选择,图像的大小固定为64×64的大小,具 有256×256×3像素,即256像素宽,256像素高,3色通道。在不同的自然 条件下,数据集能够最大程度地覆盖病变叶片图像,从而大大地提高了识别 性能。作为图像的非均匀亮度,通过整个数据集,将每个彩色图像归一化为 具有64×64大小的零均值和单位方差。有利于提高训练稳定性,降低过拟合 风险,提高收敛速度。图8显示了病态叶片图像和相应的分割斑图像及其增 强图像实例,图8-1为斑点叶的原始病害叶片图像和相应的分段斑点图像,图 8-2为增强图像实例示意图,图8-3为增强图像的分段斑点图像。
为了评估所提出方法的性能,通过10倍交叉验证(10-FCV)方案实现了 一系列实验。数据集的所有图像被随机划分为10个部分,每部分中的其中一 部分被保留为测试数据,其余部分用作训练数据,训练数据用于训练所提出 的GPCNNs模型以及ELM,并且使用测试数据来测试所提出方法的性能,然后 将实验重复10次,每一部分仅作为实验数据使用一次,十个折叠的数据被平 均来产生单个估计。
如图2所示为本实施例GPCNNs框架,以苹果病害叶片的RGB图像作为 输出,其大小为256×256×3像素。我们将第一卷积层Conv1设为10×7×7 像素的核,提取出输入数据的特征,生成相应的的特征映射,这与AlexNet 中的第一卷积层核大小11×11不同,因为病变叶片和它的斑点通常比较小。 Conv2有150个内核,大小为5×5像素;Conv3有250个内核,大小为3×3 像素。每个卷积层后面是一个2×2最大池层,而最后一个卷积层后面是一个 全局平均池(GAP)层。GAP在GPCNNs的训练中只用为分类阶段,通过大量 迭代对大规模图像进行GPCNNs训练需要使用高性能GPUs。
通过从标准正态分布中采样,使用零均值高斯分布对GPCNNs各层中的滤 波器核进行初始化,并将特征映射的偏差设置为零。使用权重衰减、动量和 学习速率,并通过验证选择特定值,其中学习速率最初被设置为最大值,然 后在验证误差不减小时减小,直到网络收敛或学习速率达到预定义的较小值。 训练过程涉及两个主要参数,即耗损和精度,其中耗损对应于正向和反向传 播中的耗损函数的输出。训练GPCNNs的目的是最小化损失函数,利用每个卷 积层的激活ReLu函数来增强网络的非线性性能。在GAP层之后,获取特征映射,输入到Softmax中预测数据集的标签,然后通过与输入数据集的实际标签 进行比较,评价其精度。调整初始学习参数直到损失正常减小并且损失收敛 到大约1,然后训练过程结束,并且整个训练过程通常可以持续一到几天。在 整个训练数据集上用小批量SCD对GPCNNs进行优化,以学习最优的权重和 偏差集,学习率初始化为0.001,每50个周期降低50%,动量设置为0.9,权 重衰减参数设置为0.0005。图9是100000次迭代后不同层次的原始病害叶片 图像的输出特征图。
从图9中可以看出,图9-1为原始图像,图9-2为Conv1提取图像,图 9-3为ReLu1提取图像,图9-4为PooLing1提取图像,图9-5为Conv2提取图 像,图9-6为ReLu2提取图像,图9-7为PooLing2提取图像,图9-8为Conv3 提取图像,图9-9为ReLu3提取图像,图9-10为PooLing3提取图像,图9-11 为GAP层图像,图9-12为多幅图像Conv1提取图像,图9-13为多幅图像提 取的Conv1的核,图9-14为多幅图像Conv2提取图像,图9-15为多幅图像提 取的Conv2的核。不同层提取的特征图有很大差异,这与病叶图像的颜色、 边缘、角度和斑点轮廓有关。间隙特征是稀疏的,这对于分类器是有用的。 图10示出了识别精度与迭代次数。从图10可以看出,当迭代次数约为140000 时,GPCNNs开始收敛,经过150000次迭代,GPCNNs达到稳定的识别精度。 然后,在进行ELM的200000次迭代之后,选择经过训练的GPCNNS模型。
使用训练好的GPCNNs从Pooling2、Conv3和Pooling3提取多层特征,然 后利用空间金字塔汇聚算法提取多尺度特征,分别得到大小为2100×1、3500 ×1和3500×1的三个列向量,然后将它们串联。为具有9100的大小的集成 特征向量,其代表输入图像。训练样本的集成特征向量被用来训练ELM分类 器。从任何测试图像中,训练好的GPCNN提取pooling2、Conv3和Pooling3 中的特征映射,通过空间金字塔汇聚算法将其转换为三个多尺度列向量,然 后将它们连接成一个集成的特征向量。最后,将集成的特征向量输入到训练 的ELM分类器中以识别测试图像。
将10-FCV实验重复50次以克服随机影响,将50个结果平均作为最终识 别结果。表2显示了其它识别方法随增强的病叶图像数据集合对应的分割的 病变图像数据集的识别结果。
表2多种识别方法的识别结果统计
从表2中,我们得到以下结论:
尽管GPCNNs的培养耗时较长,但通过GPCNNs的培养和ELM技术可以 快速识别苹果叶片病害,因此所提出的方法是可行的。
该方法优于其他方法,在原始病叶图像数据集和分割病叶图像数据集上 的识别率均在90%以上。传统的特征提取方法ANNS和GAC对原始图像数据 集的识别率小于66%,对分割后的病变图像数据集的识别率大大提高到83% 以上。其主要原因在于,该方法能够自动从病叶图像中提取出多尺度的深层 特征,而ANNS和GAC依赖于病灶分割和特征提取算法,不能有效地处理复 杂的cr。OP病变叶片图像。该方法比传统方法更稳定。ANN和GAC都对病变 叶片图像是否预处理敏感。在分割后的病斑图像数据集上,它们的性能明显 优于原始病叶图像数据集。
所提出的方法优于DCNNs,其原因在于,所提出的方法利用了Pooling2、 Conv3和Pooling3三种多尺度金字塔池特征,而DCN仅采用单层特征。由于 单层特征不能充分显示多尺度特征,精度不理想,而多层特征充分利用特征 的多样性,可以显著提高分类精度。
虽然该算法的识别率略高于DNNs,但训练时间远小于DCNNs,其原因在 于,所提出的方法继承了CNN和ELM的优点。也就是说,用全局平均池(GAP) 代替全连通层来减少训练时间,用ELM分类器代替CNN中的Softmax分类器 来识别疾病类型,ELM可以克服光照、姿态、表现、闭塞、遮挡和其他类内 变化。
DELM+SSP比ANNS、GAC和DCNNS要好很多,因为它考虑了数据的判别 性和稀疏性信息,但它并不比所提的方法好,因为它也是一个浅的网络。
综上所述,与传统的作物病害识别方法、ANNS和基于作物病害识别方法 的CNNs相比,该方法更适合于实际应用,不仅可以达到更好的识别性能,而 且大大简化了预处理步骤。
本发明提出了一种结合GPCNNs和ELM的苹果病害识别方法,训练的 GPCNNs用于提取多尺度金字塔池特征,ELM用于苹果病害类型的识别。该方 法可以解决传统网络值利用端点特征对图像进行分类而导致特征不完整的问 题,而多尺度汇聚操作则可以将三层提取的特征向量组合起来形成多尺度和 多层叶片病变图像特征。GAP和ELM可以显著地降低CNNs的计算复杂度和 计算成本。实验结果表明,提出的方法能够有效地提高苹果病害识别的准确 率,大大缩短了训练和识别的时间,能够满足识别的实时性要求。今后的研 究工作将集中在改善网络结构和损失函数上,进一步提高该方法的识别性能。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都 是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。 对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述 的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用 本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易 见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下, 在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例, 而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (6)

1.一种利用GPCNNs和ELM进行植物叶片疾病识别的方法,其特征在于,采集原始图像通过训练GPCNNs模型进行多尺度金字塔池特征提取,得到病害特征模型,再采用ELM对测试图像的植物叶片病害类型进行识别,其具体步骤为:
步骤1:对采集的原始图像进行处理,对所述原始图像进行归一化和固定图像大小处理;运用微失真增强算法提高所述原始图像的抗干扰能力,对所述原始图像运用微失真增强算法后进行变换处理得到若干新图像,与所述原始图像共同组成图像数据;
步骤2:输入所述图像数据训练一个GPCNNs模型来提取所述原始图像的多层特征,得到特征图像、特征图像映射和原始图像标签;
步骤3:选取步骤2中最后三层所述特征图像映射,通过多尺度融合操作提取金字塔汇集特征,并将所述金字塔汇集特征串联为列向量,用所述列向量训练由所述网络权重集表征的ELM分类器;
步骤4:采用所述ELM分类器对测试图像进行分类,完成植物叶片病害类型识别。
2.根据权利要求1所述的一种利用GPCNNs和ELM进行植物叶片疾病识别的方法,其特征在于,在所述步骤1中采用双线性插值算法对所述原始图像进行归一化;所述微失真增强算法包括方向干扰、光干扰、高斯噪声和PCA抖动;所述变换处理是通过调整锐度值、亮度值和对比度值,令所述原始图像的所有像素围绕所述原始图像的中心旋转,并相对于垂直轴和水平轴进行镜像变换,生成若干所述新图像。
3.根据权利要求1所述的一种利用GPCNNs和ELM进行植物叶片疾病识别的方法,其特征在于,步骤2的具体过程为:
步骤21:在所述输入层设定输入图像大小,并输入所述图像数据,按照所述输入图像大小变换后进行卷积计算;设定每个所述卷积层的卷积核和权重值(W,b),其中W为权重,b为加性偏置;
步骤22:进行l层卷积计算l∈(1,2,...,L),卷积计算公式为其中xl-1为l-1层卷积输出,xl为所述l层卷积输出,f(·)为非线性激活函数,公式为Wl为所述l层的权重,bl为所述l层的加性偏置;
步骤23:进行池层运算,计算公式为xl=f(down(xl-1)+bl);
其中,xl-1是l-1层的所述卷积输出;down(·)为下采样算子;bl为l层的加性偏置;
步骤24:是否进行完L次所述卷积计算和所述池层计算,如果否则进入步骤22;
步骤25:进行全局平均池层计算,计算公式为
其中,为最后一个所述池层中的具有m*n大小的第k个特征映射,m*n为前一个所述池层的输出大小,是所述全局平均池层的输出。
步骤26:输出层计算公式为y(k,b)=fL(kLhL+bL),
其中,hL为CNNs中的第L隐藏层的输出特征映射图,它可以是卷积层或者汇聚层;kL为全局平均池层输出,bL为第L层偏置项;fL为Softmax分类器;k是输出结果个数,b是加性偏置。
4.根据权利要求1所述的一种利用GPCNNs和ELM进行植物叶片疾病识别的方法,其特征在于,步骤3的具体过程为:
步骤31:采用多尺度池提取多层次特征,首先,将输入所述图像数据分割成若干块;
步骤32:将分割后的所述若干块所述图像数据采用层次金字塔结构在所述全局平均池层进行聚类,聚类对象为步骤2中最后的三层所述卷积层或所述池层的输出图像,进行所述聚类时保留局部空间块的空间位置信息,输出三个具有多尺度特征的图像特征列向量,将所述图像特征列向量展开成列,并级联成图像融合特征向量。
5.根据权利要求1所述的一种利用GPCNNs和ELM进行植物叶片疾病识别的方法,其特征在于,步骤4的具体过程为:
步骤41:在输入层输入步骤32中的所述图像融合特征向量,(xk,ck),k=1,2,...,L,xk为输入图像,ck为xk经过GPCNNs模型计算输出的图像标签;
步骤42:ELM模型的所述隐藏层中存在L个隐藏神经元,随机设置输入权重wi和偏差bi的参数值,i=1,2,...,L,所述图像融合特征向量在隐藏层进行计算,计算公式g(x;vi,bi)=g(xvi+ei)(i=1,2,...,L);
其中,g为激活函数,vi为第i隐含神经元与所有输入神经元之间的权重向量wi,bi为第i隐含神经元的偏置,ei为偏差,x为输入图像,所述激活函数采用Sigmoid函数
步骤43:输出层有M个输出神经元,输出特征向量h(x)=[g(x;v1,e1),g(x;v2,e2),L,g(x;vL,eL)];输出神经元的输出公式计算为
其中,bi,j为第i个隐含神经元的第j个输出神经元的输出权重;
步骤44:ELM模型输入输入样本x,所述输入样本x对应的隐藏层的输出特征向量f(x)=[f1(x),f2(x),L,fM(x)]=h(x)b;
其中,b为步骤43中的bi,j,所述输入样本x的标签为label(x)=argi=1,2,L,Mmaxfj(x)
6.根据权利要求1所述的一种利用GAPCNNs和ELM进行苹果疾病识别的方法,其特征在于,利用GPCNNs+ELM对原始图像和预测图像进行模型运算得到测量目标标签和预测标签之间的偏差,然后利用平方损失函数对所述测量目标标签和预测标签的偏差进行优化,计算公式如下:
其中,ci是第i个样本的标签值,yi(w,b)表示第i个单一激活单元的输出。
CN201910303028.5A 2019-04-16 2019-04-16 一种利用GPCNNs和ELM进行植物叶片疾病识别的方法 Pending CN110222696A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910303028.5A CN110222696A (zh) 2019-04-16 2019-04-16 一种利用GPCNNs和ELM进行植物叶片疾病识别的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910303028.5A CN110222696A (zh) 2019-04-16 2019-04-16 一种利用GPCNNs和ELM进行植物叶片疾病识别的方法

Publications (1)

Publication Number Publication Date
CN110222696A true CN110222696A (zh) 2019-09-10

Family

ID=67822602

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910303028.5A Pending CN110222696A (zh) 2019-04-16 2019-04-16 一种利用GPCNNs和ELM进行植物叶片疾病识别的方法

Country Status (1)

Country Link
CN (1) CN110222696A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110659599A (zh) * 2019-09-19 2020-01-07 安徽七天教育科技有限公司 一种基于扫描试卷的离线笔迹鉴定***以及使用方法
CN110796026A (zh) * 2019-10-10 2020-02-14 湖北工业大学 一种基于全局特征拼接的行人重识别方法
CN110837926A (zh) * 2019-11-04 2020-02-25 四川省烟草公司广元市公司 一种基于大数据的烟草主要病虫害预测方法
CN111598001A (zh) * 2020-05-18 2020-08-28 哈尔滨理工大学 一种基于图像处理的苹果树病虫害的识别方法
CN111612797A (zh) * 2020-03-03 2020-09-01 江苏大学 一种水稻图像信息处理***
CN112434662A (zh) * 2020-12-09 2021-03-02 安徽大学 一种基于多尺度卷积神经网络的茶叶病斑自动识别算法
CN113194292A (zh) * 2021-04-30 2021-07-30 招商局金融科技有限公司 智能设备的协调管理方法、装置、设备及存储介质
CN116468962A (zh) * 2023-06-20 2023-07-21 浙江天演维真网络科技股份有限公司 害虫识别方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107392224A (zh) * 2017-06-12 2017-11-24 天津科技大学 一种基于三通道卷积神经网络的作物病害识别算法
CN108388917A (zh) * 2018-02-26 2018-08-10 东北大学 一种基于改进深度学习模型的高光谱图像分类方法
CN109086799A (zh) * 2018-07-04 2018-12-25 江苏大学 一种基于改进卷积神经网络模型AlexNet的作物叶片病害识别方法
CN109191455A (zh) * 2018-09-18 2019-01-11 西京学院 一种基于ssd卷积网络的大田作物病虫害检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107392224A (zh) * 2017-06-12 2017-11-24 天津科技大学 一种基于三通道卷积神经网络的作物病害识别算法
CN108388917A (zh) * 2018-02-26 2018-08-10 东北大学 一种基于改进深度学习模型的高光谱图像分类方法
CN109086799A (zh) * 2018-07-04 2018-12-25 江苏大学 一种基于改进卷积神经网络模型AlexNet的作物叶片病害识别方法
CN109191455A (zh) * 2018-09-18 2019-01-11 西京学院 一种基于ssd卷积网络的大田作物病虫害检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
孙伟 等: "基于CNN多层特征和ELM的交通标志识别", 《电子科技大学学报》 *
赵京霞 等: "CNN多层特征融合与ELM的乳腺疾病诊断方法", 《计算机工程与应用 网络首发》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110659599A (zh) * 2019-09-19 2020-01-07 安徽七天教育科技有限公司 一种基于扫描试卷的离线笔迹鉴定***以及使用方法
CN110796026A (zh) * 2019-10-10 2020-02-14 湖北工业大学 一种基于全局特征拼接的行人重识别方法
CN110837926A (zh) * 2019-11-04 2020-02-25 四川省烟草公司广元市公司 一种基于大数据的烟草主要病虫害预测方法
CN110837926B (zh) * 2019-11-04 2022-08-12 四川省烟草公司广元市公司 一种基于大数据的烟草主要病虫害预测方法
CN111612797B (zh) * 2020-03-03 2021-05-25 江苏大学 一种水稻图像信息处理***
CN111612797A (zh) * 2020-03-03 2020-09-01 江苏大学 一种水稻图像信息处理***
CN111598001A (zh) * 2020-05-18 2020-08-28 哈尔滨理工大学 一种基于图像处理的苹果树病虫害的识别方法
CN111598001B (zh) * 2020-05-18 2023-04-28 哈尔滨理工大学 一种基于图像处理的苹果树病虫害的识别方法
CN112434662A (zh) * 2020-12-09 2021-03-02 安徽大学 一种基于多尺度卷积神经网络的茶叶病斑自动识别算法
CN112434662B (zh) * 2020-12-09 2023-04-18 安徽大学 一种基于多尺度卷积神经网络的茶叶病斑自动识别算法
CN113194292A (zh) * 2021-04-30 2021-07-30 招商局金融科技有限公司 智能设备的协调管理方法、装置、设备及存储介质
CN116468962A (zh) * 2023-06-20 2023-07-21 浙江天演维真网络科技股份有限公司 害虫识别方法、装置、设备及介质
CN116468962B (zh) * 2023-06-20 2023-10-24 浙江天演维真网络科技股份有限公司 害虫识别方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN110222696A (zh) 一种利用GPCNNs和ELM进行植物叶片疾病识别的方法
Jia et al. Detection and segmentation of overlapped fruits based on optimized mask R-CNN application in apple harvesting robot
Chen et al. Attention embedded lightweight network for maize disease recognition
CN102013021B (zh) 基于颜色和区域生长的茶叶嫩芽分割和识别方法
CN108304873A (zh) 基于高分辨率光学卫星遥感影像的目标检测方法及其***
CN108764316A (zh) 基于深度卷积神经网络和多核学习的遥感图像场景分类方法
CN108230329A (zh) 基于多尺度卷积神经网络的语义分割方法
CN114341948A (zh) 用于植物物种识别的***和方法
CN106446942A (zh) 基于增量学习的农作物病害识别方法
CN102214306B (zh) 叶片病斑识别方法及装置
CN108734171A (zh) 一种深度协同稀疏编码网络的合成孔径雷达遥感图像海洋浮筏识别方法
CN108734719A (zh) 一种基于全卷积神经网络的鳞翅目昆虫图像前背景自动分割方法
CN113627472B (zh) 基于分层深度学习模型的智慧园林食叶害虫识别方法
CN109543602A (zh) 一种基于多视角图像特征分解的行人再识别方法
Bhagat et al. Eff-UNet++: A novel architecture for plant leaf segmentation and counting
CN109325495A (zh) 一种基于深度神经网络建模的作物图像分割***及方法
CN108447551A (zh) 一种基于深度学习的靶区自动勾画方法、设备和存储介质
Sanyal et al. Color texture analysis of rice leaves diagnosing deficiency in the balance of mineral levels towards improvement of crop productivity
CN109635653A (zh) 一种植物识别方法
Patil et al. Enhanced radial basis function neural network for tomato plant disease leaf image segmentation
CN108537121A (zh) 气象环境参数与图像信息融合的自适应遥感场景分类方法
Souza et al. A deep learning model for recognition of pest insects in maize plantations
Balakrishna et al. Tomato Leaf Disease Detection Using Deep Learning: A CNN Approach
CN110378880A (zh) 基于视觉的火化机燃烧时间计算方法
AU2021105554A4 (en) An efficient artificial fish swarm optimization based method for disease detection in oryza sativa

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination