CN110222696A

CN110222696A - 一种利用GPCNNs和ELM进行植物叶片疾病识别的方法

Info

Publication number: CN110222696A
Application number: CN201910303028.5A
Authority: CN
Inventors: 张传雷; 任雪飞; 李建荣; 武大硕; 刘璞; 张善文
Original assignee: Tianjin Dozhi Information Technology Co Ltd; Tianjin University of Science and Technology
Current assignee: Tianjin Dozhi Information Technology Co Ltd; Tianjin University of Science and Technology
Priority date: 2019-04-16
Filing date: 2019-04-16
Publication date: 2019-09-10

Abstract

本发明公开了一种利用GPCNNs和ELM进行植物叶片疾病识别的方法，包括三个阶段：利用GPCNN学习多尺度金字塔汇聚特征，融合提取的层次特征，然后进行疾病识别分类。本发明的特点是：(1)采用全局汇聚层代替全连通层，加快了网络收敛速度，提高了网络性能；(2)与传统的基于特征提取的疾病识别方法相比，本发明利用GPCNNs从病叶图像中自动学习出可靠的特征，代替人工提取病叶特征，可靠性提高，效率提高；(3)与传统的基于深度学习的作物病害识别方法相比，用ELM分类器代替利用卷积神经网络(CNNs)对疾病类型进行分类，提高了识别性能。

Description

一种利用GPCNNs和ELM进行植物叶片疾病识别的方法

技术领域

本发明涉及计算机技术领域，更具体的说是涉及一种利用GPCNNs和ELM 进行植物叶片疾病识别的方法。

背景技术

目前，传统的检测和诊断植物叶片病害的主要方法是通过专家和农民的专业技术水平和多年的经验对果树进行肉眼观察，劳动强度大，耗时长，需要专家和农民连续监测田间水果的生长，往往容易错过最佳的防治时机。随着机器学习领域、模式识别、图像处理和图像分类的发展，许多植物病害的识别方法和技术已被提出并应用于自动检测和苹果病害的识别，Sindhuja[2] 等建立了一种快速、有效、可靠地健康监测传感器。虽然这些方法能有效地诊断植物病害，但它们对于普通人来说太专业化了[4]。Omrani[5]等人提出了农作物病虫叶片图像分类的软计算方法；Bhavini[6]等人综述了几种利用图像处理和机器学习的植物病害检测与分类方法，总结了作物病害检测与识别的各个阶段；Shiv[7]等人提出了一种基于颜色、纹理和形状特征的苹果病害分类方法；Zhang[8]等人提出了一种苹果叶部病害识别的方法，从每个斑点图像中提取38个颜色、纹理和形状的分类特征，利用遗传算法(GA)选择最有价值的特征，最后利用支持向量机进行病害识别；Ganatra[9]等人作物病害检测与分类中使用的各种现有算法和技术，总结了各种特征提取算法、分割算法和分类器以及优缺点。

但是，上述方法的识别性能在很大程度上取决于病叶图像的分割效果和提取的手工艺特征。由于病叶图像的颜色、形状和纹理非常复杂和不规则，很难从病叶图像中提取鲁棒性的分类特征用于病害识别。

因此，如何实现从病叶图像准确进行病害识别是本领域技术人员亟需解决的问题。

发明内容

有鉴于此，本发明提供了一种利用GPCNNs和ELM进行植物叶片疾病识别的方法，通过建立全局汇聚CNNs模型，对病叶图像进行多尺度特征提取，并利用ELM对病叶图像进行分类。包括两个训练阶段，在第一训练阶段，进行GPCNNs模型训练，包括两部分：基于网络权重集(W,b)的特征提取和采用Softmax分类器的图像识别，(W,b)用于从最后三层卷积层或池层的特征图像映射中提取多尺度特征映射；第二训练阶段，将第一阶段的多尺度特征映射进行多尺度融合操作得到金字塔汇集特征向量，再将其串联为列向量，再采用列向量来训练由网络权重集表征的ELM分类器，训练后的网络权值集 (V,e,b)用于生成分类标签(V,e,b)。最后通过(W,b,V,e,b)构建了一个端到端的GPCNNs+ELM识别模型。输入叶片图像到GPCNNs+ELM识别模型就可以得到叶片灾害类型的识别结果。

为了实现上述目的，本发明采用如下技术方案：

公开了一种利用GPCNNs和ELM进行植物叶片疾病识别的方法，采集原始图像通过训练GPCNNs模型进行多尺度金字塔池特征提取，得到病害特征模型，再采用ELM对测试图像的植物叶片病害类型进行识别，其具体步骤为： S1：对采集原始图像进行处理，对所述原始图像进行归一化和固定图像大小处理；运用微失真增强算法提高所述原始图像的抗干扰能力，对所述原始图像运用微失真增强算法后进行变换处理得到若干新图像，与所述原始图像共同组成图像数据；

S2：输入所述图像数据训练一个GPCNNs模型来提取所述原始图像的多层特征，得到特征图像、特征图像映射和原始图像标签；所述GPCNNs模型包括输入层、若干层卷积层、若干层池层以及全局平均池层GAP和输出层；训练具有L层的CNNs，则所述卷积层和所述池层均设置有L层；每一个所述卷积层运算后都进行一个所述池层运算，且均输出特征图像和特征图像映射，前一个所述卷积层的输出多尺度特征映射作为后一个所述池层和后一个所述卷积层的输入；在所述输出层输出原始图像标签；

S3：选取步骤2中最后三层所述特征图像映射，通过多尺度融合操作提取金字塔汇集特征，并将所述金字塔汇集特征串联为列向量，用所述列向量训练由所述网络权重集表征的ELM分类器；

S4：采用所述ELM分类器对测试图像进行分类，完成植物叶片病害类型识别。为了进一步优化上述技术特征，在所述S1中采用双线性插值算法对所述原始图像进行归一化；所述微失真增强算法包括方向干扰、光干扰、高斯噪声和 PCA抖动；所述变换处理是通过调整锐度值、亮度值和对比度值，令所述原始图像的所有像素围绕所述原始图像的中心旋转，并相对于垂直轴和水平轴进行镜像变换，生成若干所述新图像。

优选的，S2的具体过程为：

S21：在所述输入层设定输入图像大小，并输入所述图像数据，按照所述输入图像大小变换后进行卷积计算；设定每个所述卷积层的卷积核和权重值(W， b)，其中W为权重，b为加性偏置；

S22：进行l层卷积计算l∈(1,2,...,L)，卷积计算公式为

其中x^l-1为l-1层卷积输出，x^l为所述l层卷积输出，f(·)为非线性激活函数，公式为W^l为所述l层的权重，b^l为所述l层的加性偏置； S23：进行池层运算，计算公式为x^l＝f(down(x^l-1)+b^l)；

其中，x^l-1为l-1层的所述卷积输出；down(·)为下采样算子；b^l为l层的加性偏置；

S24：是否进行完L次所述卷积计算和所述池层计算，如果否则进入步骤22； S25：进行全局平均池层计算，计算公式为

其中，为最后一个所述池层中的具有m*n大小的第k个特征映射，m*n 为前一个所述池层的输出大小，是所述全局平均池层的输出。

S26：输出层计算公式为y(k,b)＝f^L(k^Lh^L+b^L)；

其中，y(k,b)是整个CNNs的预测值，h^L-1表示CNNs中的第L-1隐藏层的输出特征图，它可以是卷积层或者汇聚层；k^L为全局平均池层输出， b^L为第L层偏置项；f^L为Softmax分类器；k是输出结果个数，b是加性偏置。

优选的，S3的具体过程为：

S31：采用多尺度池提取多层次特征，首先，将输入所述图像数据分割成若干块；

S32：将分割后的所述若干块所述图像数据采用层次金字塔结构在所述全局平均池层进行聚类，聚类对象为S2中最后的三层所述卷积层或所述池层的输出特征图像，进行所述聚类时保留局部空间块的空间位置信息，输出三个具有多尺度特征的图像特征列向量，将所述图像特征列向量展开成列，并级联成图像融合特征向量。

优选的，S4的具体过程为：

S41：在输入层输入S32中的所述图像融合特征向量；

S42：ELM模型的所述隐藏层中存在L个隐藏神经元，所述图像融合特征向量在隐藏层进行计算，计算公式g(x；v_i,b_i)＝g(xv_i+e_i)(i＝1,2，...，L)；

其中，g为激活函数，v_i为第i隐含神经元与所有输入神经元之间的权重向量， b_i为第i隐含神经元的偏置，e_i为偏差，x为输入图像，激活函数采用Sigmoid 函数 S43：ELM模型的输出层有M个输出神经元，输出特征向量 h(x)＝[g(x；v₁,e₁),g(x；v₂,e₂),L,g(x；v_L,e_L)]；

输出神经元的输出计算公式为其中，b_i,j为第i个隐含神经元的第j个输出神经元的输出权重；

S44：输入样本x对应的隐藏层的输出特征向量f(x)＝[f₁(x),f₂(x),L,f_M(x)]＝h(x)b 其中，b为为上述步骤S43中的b_i,j，所述输入样本x的标签为 label(x)＝arg_i＝1,2,L, _Mmaxf_j(x)

优选的，利用GPCNNs+ELM对原始图像和预测图像进行模型运算得到测量目标标签和预测标签之间的偏差，然后利用平方损失函数对所述测量目标标签和预测标签的偏差进行优化，计算公式如下：

其中，c_i是第i个样本的标签值，即利用GPCNNs模型输入图像输出的第 i个图像的标签，y_i(w,b)表示第i个单一激活单元的输出。

采用前馈和反向传播算法使平方损失函数最小，得到GPCNNs的参数W 和b。具体的，应用随机梯度下降算法(SGD)对参数进行优化，GPCNNs的参数可以根据SGD的导数进行更新，一旦反向传播过程完成，W和b被确定。然后，应用前馈步骤在另一轮中生成新的误差导数来更新参数。这些前馈和反向传播过程被重复直到达到收敛，获得最优W和b，然后GPCNNs被很好地训练。训练样本和测试样本的多层高层特征可以通过训练好的分层GPCNNs 框架提取。在完成GPCNNs的卷积核汇聚操作后，将最后一层的输出特征映射变换为一维向量，然后利用Softmax分类器进行分类。

经由上述的技术方案可知，与现有技术相比，本发明公开提供了一种利用GPCNNs和ELM进行植物叶片疾病识别的方法，包括三个阶段：利用GPCNN 学习多尺度金字塔汇聚特征，融合提取的层次特征，然后进行疾病识别分类。本发明的特点是：(1)采用全局汇聚层代替全连通层，加快了网络收敛速度，提高了网络性能；(2)与传统的基于特征提取的疾病识别方法相比，本发明利用GPCNNs从植物病叶图像中自动学习出可靠的特征，代替人工提取病叶特征，可靠性提高，效率提高；(3)与传统的基于深度学习的作物病害识别方法相比，用ELM分类器代替利用卷积神经网络(CNNs)对疾病类型进行分类，提高了识别性能。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1附图为本发明提供的GPCNNs+ELM框架结构示意图；

图2附图为本发明提供的GPCNNs框架结构示意图

图3附图为本发明提供的多尺度池化层的特征提取结构示意图；

图4附图为本发明提供的特征融合结构示意图；

图5附图为本发明提供的ELM框架结构示意图；

图6附图为本发明提供的基于GPCNNs+ELM的识别模型框架结构示意图；

图7附图为本发明提供的病变苹果图像和响应分割病变图像示意图；

图8附图为本发明提供的病害叶片图像和响应分割点图像及其增强图像示意图；

图9附图为本发明提供的1000次迭代后不同层的输出特征图示意图；

图10附图为本发明提供的GPCNNs识别精度与迭代次数关系示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例公开了一种利用GPCNNs和ELM进行植物叶片疾病识别的方法，其特征在于，采集原始图像通过训练GPCNNs模型进行多尺度金字塔池特征提取，得到病害特征模型，再采用ELM对测试图像的植物叶片病害类型进行识别，其具体步骤为：

S1：对采集原始图像进行处理，对原始图像进行归一化和固定图像大小处理；运用微失真增强算法提高原始图像的抗干扰能力，对所述原始图像运用微失真增强算法后进行变换处理得到若干新图像，与原始图像共同组成图像数据；

S2：输入图像数据训练一个GPCNNs模型来提取原始图像的多层特征，得到特征图像、特征图像映射和原始图像标签；GPCNNs模型包括输入层、若干层卷积层、若干层池层以及全局平均池层GAP和输出层；训练具有L层的CNNs，则卷积层和池层均设置有L层；每一个卷积层运算后都进行一个池层运算，且均输出特征图像和特征图像映射，前一个卷积层的输出多尺度特征映射作为后一个池层和后一个卷积层的输入；在输出层输出原始图像标签；

S3：选取步骤2中最后三层特征图像映射，通过多尺度融合操作提取金字塔汇集特征，并将金字塔汇集特征串联为列向量，用列向量训练由网络权重集表征的ELM分类器；

S4：采用ELM分类器对测试图像进行分类，完成植物叶片病害类型识别。

为了进一步优化上述技术特征，在S1中采用双线性插值算法对原始图像进行归一化；微失真增强算法包括方向干扰、光干扰、高斯噪声和PCA抖动；变换处理是通过调整锐度值、亮度值和对比度值，令原始图像的所有像素围绕原始图像的中心旋转，并相对于垂直轴和水平轴进行镜像变换，生成若干新图像。

为了进一步优化上述技术特征，S2的具体过程为：

S21：在输入层设定输入图像大小，并输入图像数据，按照输入图像大小变换后进行卷积计算；设定每个卷积层的卷积核和权重值(W，b)，其中W为权重，b为加性偏置；

S22：进行l层卷积计算l∈(1,2,...,L)，卷积计算公式为

其中x^l-1为l-1层卷积输出，x^l为l层卷积输出，f(·)为非线性激活函数，公式为W^l为l层的权重，b^l为l层的加性偏置；

S23：进行池层运算，计算公式为x^l＝f(down(x^l-1)+b^l)；

其中，x^l-1为l-1层的卷积输出；down(·)为下采样算子；b^l为l层的加性偏置；

S24：是否进行完L次卷积计算和池层计算，如果否则进入步骤22；

S25：进行全局平均池层计算，计算公式为

其中，为最后一个池层中的具有m*n大小的第k个特征映射，m*n为前一个池层的输出大小，是全局平均池层的输出。

S26：输出层计算公式为y(k,b)＝f^L(k^Lh^L+b^L)；

为了进一步优化上述技术方案，步骤3的具体过程为：

S31：采用多尺度池提取多层次特征，首先，将输入图像数据分割成若干块； S32：将分割后的若干块图像数据采用层次金字塔结构在全局平均池层进行聚类，聚类对象为S2中最后的三层卷积层或池层的输出特征图像，进行聚类时保留局部空间块的空间位置信息，输出三个具有多尺度特征的图像特征列向量，将图像特征列向量展开成列，并级联成图像融合特征向量。

为了进一步优化上述技术方案，步骤4的具体过程为：

S41：在输入层输入S32中的图像融合特征向量；

S42：ELM模型的隐藏层中存在L个隐藏神经元，图像融合特征向量在隐藏层进行计算，计算公式g(x；v_i,b_i)＝g(xv_i+e_i)(i＝1,2，...，L)；

其中，g为激活函数，v_i为第i隐含神经元与所有输入神经元之间的权重向量， b_i为第i隐含神经元的偏置，e_i为偏差，x为输入图像，激活函数采用Sigmoid 函数

S43：ELM模型的输出层有M个输出神经元，输出特征向量 h(x)＝[g(x；v₁,e₁),g(x；v₂,e₂),L,g(x；v_L,e_L)]；

S44：输入样本x对应的隐藏层的输出特征向量f(x)＝[f₁(x),f₂(x),L,f_M(x)]＝h(x)b 其中，b为步骤S43中的b_i,j，输出输入样本x的标签为 label(x)＝arg_i＝1,2,L,Mmaxf_j(x)。

为了进一步优化上述技术方案，利用GPCNNs+ELM对原始图像和预测图像进行模型运算得到测量目标标签和预测标签之间的偏差，然后利用平方损失函数测量目标标签和预测标签的偏差进行优化，计算公式如下：

其中，c_i是第i个样本的标签值，y_i(w,b)表示第i个单一激活单元的输出；采用前馈和反向传播算法使平方损失函数最小，得到GPCNNs的参数W和b。具体的，应用随机梯度下降算法(SGD)对参数进行优化，GPCNNs的参数可以根据SGD的导数进行更新，一旦反向传播过程完成，W和b被确定。然后，应用前馈步骤即采用随机梯度下降算法中的前向传播算法计算W和b，在另一轮中生成新的误差导数来更新参数。这些前馈和反向传播过程被重复直到达到收敛，获得最优W和b，然后GPCNNs被很好地训练。训练样本和测试样本的多层高层特征可以通过训练好的分层GPCNNs模型提取。在完成 GPCNNs的卷积核汇聚操作后，将最后一层的输出特征映射变换为一维向量，即在输出层输出标签，然后利用Softmax分类器进行分类。

为了进一步优化上述技术方案，病害类别建模图像和预测图像均在 GPCNNs模型中进行计算，分别得到建模图像和预测图像的标签，然后在ELM 中进行两种标签的比对识别，根据已知的建模图像的病害类别确定预测图像的病害类别，ELM进行病害类别确定的具体过程如下：

S51：输入：(x_k,c_k),k＝1,2,...,L,c_k是x_k的标签，激活函数g，隐藏神经元的个数L；

S511：随机设置输入权重w_i和偏差b_i的参数值，i＝1,2，...，L；

S512：计算隐藏层的输出矩阵H；

S513：根据下述约束条件对隐藏层的输出权重b_x进行评估，

st:Hb＝T-a

其中a是较小的调整常数，用来增强CNNs的归一化，r是正则化因子， T是输入样本的标签值；

或者对隐藏层输出权重进行评估；

S52：输出训练样本的输出神经元特征向量Y

其中，y_N,M＝y(k,b)＝f^L(k^Lh^L+b^L)，N为样本分类的个数，M为输出层神经元个数。

实施例

通过实验验证本发明的可行性和准确性。

构建了苹果病叶图像数据库，包含4个常见病害的400幅病叶图像，即图7-1斑叶、图7-2褐斑(布朗斑)、图7-3花叶病和图7-4锈病，每类100 幅叶图像。所有叶片图像采集自陕西阳陵农业高新技术产业示范区，然后用佳能A640数码相机拍摄，分辨率为1200×1600。每种病害有100张JEPG格式的叶片图像，症状明显，大小不同，方向不同，光照度不同，背景单一。 k-均值聚类算法用于分割病斑叶图像。图7显示了一些原始病态叶片图像和相应的分割彩色病变图像。

CNNs模型往往需要一个大规模的图像集来训练其参数，避免过拟合问题，并导致更好的泛化。然而，事实上，很难收集大量可用的病态叶片图像。一种有效的方法是通过以下步骤对原始图像进行人工变换来增强数据集：

旋转/反射：以一定角度随机旋转每个原始图像，以改变图像内容的方向；

翻转：将每一个原始图像进行水平或垂直翻转；

尺度：按一定比例放大或缩小每个原始图像；

不变特征变化：在图像平面上以一定的方式变换每个原始图像；

裁剪：根据指定的比例因子对每个原始图像进行放大或缩小，或者参考比例不变特征变换(SIFT)特征提取的思想，使用指定的比例因子对图像进行滤波，构建比例空间；

对比度：在HSV图像颜色空间中，改变饱和度S和V亮度分量，保持色调H不变，并指数计算每个像素的S和V分量(指数因子在0.25和4之间)，增加光照变化；

噪声干扰：随机加入一定噪声干扰的原始图像各像素RGB，常见的噪声模式有椒盐噪声和高斯噪声；

PCA抖动：根据RGB的三个颜色通道计算均值和标准差，然后在整个训练集上计算协方差矩阵，通过特征向量分解得到特征向量和特征值。

通过上述处理，将每个原始图像增强为50个新图像，然后创建包含20400 个图像的增强数据集。从经验中选择，图像的大小固定为64×64的大小，具有256×256×3像素，即256像素宽，256像素高，3色通道。在不同的自然条件下，数据集能够最大程度地覆盖病变叶片图像，从而大大地提高了识别性能。作为图像的非均匀亮度，通过整个数据集，将每个彩色图像归一化为具有64×64大小的零均值和单位方差。有利于提高训练稳定性，降低过拟合风险，提高收敛速度。图8显示了病态叶片图像和相应的分割斑图像及其增强图像实例，图8-1为斑点叶的原始病害叶片图像和相应的分段斑点图像，图 8-2为增强图像实例示意图，图8-3为增强图像的分段斑点图像。

为了评估所提出方法的性能，通过10倍交叉验证(10-FCV)方案实现了一系列实验。数据集的所有图像被随机划分为10个部分，每部分中的其中一部分被保留为测试数据，其余部分用作训练数据，训练数据用于训练所提出的GPCNNs模型以及ELM，并且使用测试数据来测试所提出方法的性能，然后将实验重复10次，每一部分仅作为实验数据使用一次，十个折叠的数据被平均来产生单个估计。

如图2所示为本实施例GPCNNs框架，以苹果病害叶片的RGB图像作为输出，其大小为256×256×3像素。我们将第一卷积层Conv1设为10×7×7 像素的核，提取出输入数据的特征，生成相应的的特征映射，这与AlexNet 中的第一卷积层核大小11×11不同，因为病变叶片和它的斑点通常比较小。 Conv2有150个内核，大小为5×5像素；Conv3有250个内核，大小为3×3 像素。每个卷积层后面是一个2×2最大池层，而最后一个卷积层后面是一个全局平均池(GAP)层。GAP在GPCNNs的训练中只用为分类阶段，通过大量迭代对大规模图像进行GPCNNs训练需要使用高性能GPUs。

通过从标准正态分布中采样，使用零均值高斯分布对GPCNNs各层中的滤波器核进行初始化，并将特征映射的偏差设置为零。使用权重衰减、动量和学习速率，并通过验证选择特定值，其中学习速率最初被设置为最大值，然后在验证误差不减小时减小，直到网络收敛或学习速率达到预定义的较小值。训练过程涉及两个主要参数，即耗损和精度，其中耗损对应于正向和反向传播中的耗损函数的输出。训练GPCNNs的目的是最小化损失函数，利用每个卷积层的激活ReLu函数来增强网络的非线性性能。在GAP层之后，获取特征映射，输入到Softmax中预测数据集的标签，然后通过与输入数据集的实际标签进行比较，评价其精度。调整初始学习参数直到损失正常减小并且损失收敛到大约1，然后训练过程结束，并且整个训练过程通常可以持续一到几天。在整个训练数据集上用小批量SCD对GPCNNs进行优化，以学习最优的权重和偏差集，学习率初始化为0.001，每50个周期降低50％，动量设置为0.9，权重衰减参数设置为0.0005。图9是100000次迭代后不同层次的原始病害叶片图像的输出特征图。

从图9中可以看出，图9-1为原始图像，图9-2为Conv1提取图像，图 9-3为ReLu1提取图像，图9-4为PooLing1提取图像，图9-5为Conv2提取图像，图9-6为ReLu2提取图像，图9-7为PooLing2提取图像，图9-8为Conv3 提取图像，图9-9为ReLu3提取图像，图9-10为PooLing3提取图像，图9-11 为GAP层图像，图9-12为多幅图像Conv1提取图像，图9-13为多幅图像提取的Conv1的核，图9-14为多幅图像Conv2提取图像，图9-15为多幅图像提取的Conv2的核。不同层提取的特征图有很大差异，这与病叶图像的颜色、边缘、角度和斑点轮廓有关。间隙特征是稀疏的，这对于分类器是有用的。图10示出了识别精度与迭代次数。从图10可以看出，当迭代次数约为140000 时，GPCNNs开始收敛，经过150000次迭代，GPCNNs达到稳定的识别精度。然后，在进行ELM的200000次迭代之后，选择经过训练的GPCNNS模型。

使用训练好的GPCNNs从Pooling2、Conv3和Pooling3提取多层特征，然后利用空间金字塔汇聚算法提取多尺度特征，分别得到大小为2100×1、3500 ×1和3500×1的三个列向量，然后将它们串联。为具有9100的大小的集成特征向量，其代表输入图像。训练样本的集成特征向量被用来训练ELM分类器。从任何测试图像中，训练好的GPCNN提取pooling2、Conv3和Pooling3 中的特征映射，通过空间金字塔汇聚算法将其转换为三个多尺度列向量，然后将它们连接成一个集成的特征向量。最后，将集成的特征向量输入到训练的ELM分类器中以识别测试图像。

将10-FCV实验重复50次以克服随机影响，将50个结果平均作为最终识别结果。表2显示了其它识别方法随增强的病叶图像数据集合对应的分割的病变图像数据集的识别结果。

表2多种识别方法的识别结果统计

从表2中，我们得到以下结论：

尽管GPCNNs的培养耗时较长，但通过GPCNNs的培养和ELM技术可以快速识别苹果叶片病害，因此所提出的方法是可行的。

该方法优于其他方法，在原始病叶图像数据集和分割病叶图像数据集上的识别率均在90％以上。传统的特征提取方法ANNS和GAC对原始图像数据集的识别率小于66％，对分割后的病变图像数据集的识别率大大提高到83％以上。其主要原因在于，该方法能够自动从病叶图像中提取出多尺度的深层特征，而ANNS和GAC依赖于病灶分割和特征提取算法，不能有效地处理复杂的cr。OP病变叶片图像。该方法比传统方法更稳定。ANN和GAC都对病变叶片图像是否预处理敏感。在分割后的病斑图像数据集上，它们的性能明显优于原始病叶图像数据集。

所提出的方法优于DCNNs，其原因在于，所提出的方法利用了Pooling2、 Conv3和Pooling3三种多尺度金字塔池特征，而DCN仅采用单层特征。由于单层特征不能充分显示多尺度特征，精度不理想，而多层特征充分利用特征的多样性，可以显著提高分类精度。

虽然该算法的识别率略高于DNNs，但训练时间远小于DCNNs，其原因在于，所提出的方法继承了CNN和ELM的优点。也就是说，用全局平均池(GAP) 代替全连通层来减少训练时间，用ELM分类器代替CNN中的Softmax分类器来识别疾病类型，ELM可以克服光照、姿态、表现、闭塞、遮挡和其他类内变化。

DELM+SSP比ANNS、GAC和DCNNS要好很多，因为它考虑了数据的判别性和稀疏性信息，但它并不比所提的方法好，因为它也是一个浅的网络。

综上所述，与传统的作物病害识别方法、ANNS和基于作物病害识别方法的CNNs相比，该方法更适合于实际应用，不仅可以达到更好的识别性能，而且大大简化了预处理步骤。

本发明提出了一种结合GPCNNs和ELM的苹果病害识别方法，训练的 GPCNNs用于提取多尺度金字塔池特征，ELM用于苹果病害类型的识别。该方法可以解决传统网络值利用端点特征对图像进行分类而导致特征不完整的问题，而多尺度汇聚操作则可以将三层提取的特征向量组合起来形成多尺度和多层叶片病变图像特征。GAP和ELM可以显著地降低CNNs的计算复杂度和计算成本。实验结果表明，提出的方法能够有效地提高苹果病害识别的准确率，大大缩短了训练和识别的时间，能够满足识别的实时性要求。今后的研究工作将集中在改善网络结构和损失函数上，进一步提高该方法的识别性能。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种利用GPCNNs和ELM进行植物叶片疾病识别的方法，其特征在于，采集原始图像通过训练GPCNNs模型进行多尺度金字塔池特征提取，得到病害特征模型，再采用ELM对测试图像的植物叶片病害类型进行识别，其具体步骤为：

步骤1：对采集的原始图像进行处理，对所述原始图像进行归一化和固定图像大小处理；运用微失真增强算法提高所述原始图像的抗干扰能力，对所述原始图像运用微失真增强算法后进行变换处理得到若干新图像，与所述原始图像共同组成图像数据；

步骤2：输入所述图像数据训练一个GPCNNs模型来提取所述原始图像的多层特征，得到特征图像、特征图像映射和原始图像标签；

步骤3：选取步骤2中最后三层所述特征图像映射，通过多尺度融合操作提取金字塔汇集特征，并将所述金字塔汇集特征串联为列向量，用所述列向量训练由所述网络权重集表征的ELM分类器；

步骤4：采用所述ELM分类器对测试图像进行分类，完成植物叶片病害类型识别。

2.根据权利要求1所述的一种利用GPCNNs和ELM进行植物叶片疾病识别的方法，其特征在于，在所述步骤1中采用双线性插值算法对所述原始图像进行归一化；所述微失真增强算法包括方向干扰、光干扰、高斯噪声和PCA抖动；所述变换处理是通过调整锐度值、亮度值和对比度值，令所述原始图像的所有像素围绕所述原始图像的中心旋转，并相对于垂直轴和水平轴进行镜像变换，生成若干所述新图像。

3.根据权利要求1所述的一种利用GPCNNs和ELM进行植物叶片疾病识别的方法，其特征在于，步骤2的具体过程为：

步骤21：在所述输入层设定输入图像大小，并输入所述图像数据，按照所述输入图像大小变换后进行卷积计算；设定每个所述卷积层的卷积核和权重值(W，b)，其中W为权重，b为加性偏置；

步骤22：进行l层卷积计算l∈(1,2,...,L)，卷积计算公式为其中x^l-1为l-1层卷积输出，x^l为所述l层卷积输出，f(·)为非线性激活函数，公式为W^l为所述l层的权重，b^l为所述l层的加性偏置；

步骤23：进行池层运算，计算公式为x^l＝f(down(x^l-1)+b^l)；

其中，x^l-1是l-1层的所述卷积输出；down(·)为下采样算子；b^l为l层的加性偏置；

步骤24：是否进行完L次所述卷积计算和所述池层计算，如果否则进入步骤22；

步骤25：进行全局平均池层计算，计算公式为

其中，为最后一个所述池层中的具有m*n大小的第k个特征映射，m*n为前一个所述池层的输出大小，是所述全局平均池层的输出。

步骤26：输出层计算公式为y(k,b)＝f^L(k^Lh^L+b^L)，

其中，h^L为CNNs中的第L隐藏层的输出特征映射图，它可以是卷积层或者汇聚层；k^L为全局平均池层输出，b^L为第L层偏置项；f^L为Softmax分类器；k是输出结果个数，b是加性偏置。

4.根据权利要求1所述的一种利用GPCNNs和ELM进行植物叶片疾病识别的方法，其特征在于，步骤3的具体过程为：

步骤31：采用多尺度池提取多层次特征，首先，将输入所述图像数据分割成若干块；

步骤32：将分割后的所述若干块所述图像数据采用层次金字塔结构在所述全局平均池层进行聚类，聚类对象为步骤2中最后的三层所述卷积层或所述池层的输出图像，进行所述聚类时保留局部空间块的空间位置信息，输出三个具有多尺度特征的图像特征列向量，将所述图像特征列向量展开成列，并级联成图像融合特征向量。

5.根据权利要求1所述的一种利用GPCNNs和ELM进行植物叶片疾病识别的方法，其特征在于，步骤4的具体过程为：

步骤41：在输入层输入步骤32中的所述图像融合特征向量，(x_k,c_k),k＝1,2,...,L,x_k为输入图像，c_k为x_k经过GPCNNs模型计算输出的图像标签；

步骤42：ELM模型的所述隐藏层中存在L个隐藏神经元，随机设置输入权重w_i和偏差b_i的参数值，i＝1,2，...，L，所述图像融合特征向量在隐藏层进行计算，计算公式g(x；v_i,b_i)＝g(xv_i+e_i)(i＝1,2，...，L)；

其中，g为激活函数，v_i为第i隐含神经元与所有输入神经元之间的权重向量w_i，b_i为第i隐含神经元的偏置，e_i为偏差，x为输入图像，所述激活函数采用Sigmoid函数

步骤43：输出层有M个输出神经元，输出特征向量h(x)＝[g(x；v₁,e₁),g(x；v₂,e₂),L,g(x；v_L,e_L)]；输出神经元的输出公式计算为

其中，b_i,j为第i个隐含神经元的第j个输出神经元的输出权重；

步骤44：ELM模型输入输入样本x，所述输入样本x对应的隐藏层的输出特征向量f(x)＝[f₁(x),f₂(x),L,f_M(x)]＝h(x)b；

其中，b为步骤43中的b_i,j，所述输入样本x的标签为label(x)＝arg_i＝1,2,L,Mmaxf_j(x)

6.根据权利要求1所述的一种利用GAPCNNs和ELM进行苹果疾病识别的方法，其特征在于，利用GPCNNs+ELM对原始图像和预测图像进行模型运算得到测量目标标签和预测标签之间的偏差，然后利用平方损失函数对所述测量目标标签和预测标签的偏差进行优化，计算公式如下：

其中，c_i是第i个样本的标签值，y_i(w,b)表示第i个单一激活单元的输出。