CN112308159A

CN112308159A - 基于预测增量宽度学习的图像识别分类方法

Info

Publication number: CN112308159A
Application number: CN202011225539.9A
Authority: CN
Inventors: 陈祖国; 张胥卓; 刘洋龙; 吴亮红; 卢明; 唐至强; 陈超洋
Original assignee: Hunan University of Science and Technology
Current assignee: Hunan University of Science and Technology
Priority date: 2020-11-05
Filing date: 2020-11-05
Publication date: 2021-02-02
Anticipated expiration: 2040-11-05
Also published as: CN112308159B

Abstract

本发明公开了一种基于预测增量宽度学习的图像识别分类方法，包括以下步骤：步骤一：建立宽度学习模型，输入各类节点初始数量，设置识别准确度；步骤二：通过拟合函数计算需要的增强节点数量；步骤三：增加增强节点数量，进行增量宽度学习；步骤四：判断测试识别准确度是否大于设置识别准确度，若否，则返回步骤三；若是，则输出训练结果与识别准确度。本发明将宽度学习的部分实验数据通过最小二乘法拟合，通过部分实验数据拟合得出增强节点数量与识别精度之间的关系，通过设置精度可得出满足精度的合适的增强节点数量，避免了人为设置模型参数的繁琐步骤和设置不合适的模型参数导致的训练时间的增加，具有识别精度高、算法简单的优点。

Description

基于预测增量宽度学习的图像识别分类方法

技术领域

本发明涉及图像识别领域，特别涉及一种基于预测增量宽度学习的图像识别分类方法。

背景技术

随着互联网的不断发展，图片逐渐成为传播信息的主要载体，因此对图像的处理至关重要，图像识别技术作为图像处理中的一个重要部分近年来不断发展。机器学习是现在图像识别技术的主要方法，其通过外界的大量数据进行学习更新参数从而进行识别判断。作为目前机器学习的主流，深度学习在图像处理中取得了良好的处理结果，然而深度学习普遍存在着一个共同的问题，就是需要计算的参数多，训练时间长。

文献“Broad Learning System:An Effective and Efficient IncrementalLearning System Without the Need for Deep Architecture”提出了一种宽度学习***。宽度学习***是基于随机向量函数链接神经网络(RVFLNN)和单层前馈神经网络(SLFN)的一种单层增量式神经网络。其相对于深度学习网络层数更少，通过引入增强节点则可在不增加网络纵向深度的前提下增加神经网络模型的非线性拟合能力。这个模型相比于传统的深层网络模型，它在保证一定精度的同时，具有快速、简洁，同时支持增量式的在线模型更新等比较好的性质，其有效地解决了深度学习需要耗费大量时间的问题，同时具有较高的精度。为了提高宽度学习***识别的准确度需要修改模型中的参数，模型的改变是要通过手动设置各类节点的数量，而通过增加大量增强节点来增加模型的拟合能力又会使增加整个训练时间。

发明内容

为了解决上述技术问题，本发明提供一种算法简单、分类精度高的基于预测增量宽度学习的图像识别分类方法。

本发明解决上述问题的技术方案是：一种基于预测增量宽度学习的图像识别分类方法，其特征在于，包括以下步骤：

步骤一：建立宽度学习模型，输入各类节点初始数量，设置识别准确度；

步骤二：通过拟合函数计算需要的增强节点数量；

步骤三：增加增强节点数量，进行增量宽度学习；

步骤四：判断测试识别准确度是否大于设置识别准确度，若否，则返回步骤三；若是，则输出训练结果与识别准确度。

上述基于预测增量宽度学习的图像识别分类方法，所述步骤一中，宽度学习模型的输入层是由两部分组成，分别是映射节点与增强节点，映射节点记为Z，增强节点记为H，原始输入记为X；映射节点是通过原始输入X经过线性变换与激活函数输出得到，而增强节点是通过映射节点线性变换与激活函数输出得到，其变换公式如式(1)(2)所示

其中W₁,β₁,W₂,β₂为自动编码产生的基础上加上稀疏性限制产生而来的数据， W₁、W₂为随机权重矩阵，β₁、β₂为随机偏差矩阵，φ为映射节点的激活函数，ξ为增强节点的激活函数，

新的输入层即为A＝[Z|H]，则宽度学***衡，随着λ的增大，模型的方差减小，偏差增大，求得W如(3)所示:

上述基于预测增量宽度学***方和最小化来求取设定函数的待定系数，误差平方和S如式(4)所示：

其中x_i表示第i个测量数据，y_i表示第i个测量数据的对应结果，i＝1,2,3…N；对于线性方程，误差平方和S最小，则必有

通过式(5)得到一个线性方程组，再求解线性方程组算出待定系数a,b,c...；

对于宽度学习，其增强节点的数量与识别准确度之间为非线性关系；若拟合函数为非线性方程，则将非线性方程进行变换转化为线性方程，再应用最小二乘法求得待定系数，最终得到增强节点数量与识别准确度的近似函数，利用近似函数求得设置识别准确度所对应的增强节点数量。

上述基于预测增量宽度学习的图像识别分类方法，所述步骤三中，增量宽度学习是将增加的增强节点合并到原来的输入层中，增强层即为原输入层加上通过增量宽度学习的增强节点，由于输入节点数无法改变，则增强层的增强节点越多，其非线性近似能力就越强；输入层即变为[A|ζ(Z_eW₃+β₃)]，其中W₃为随机权重矩阵，β₃为随机偏差矩阵，Z_e为增加的增强节点，W₃,β₃也同为随机生成并通过稀疏自编码得到。

本发明的有益效果在于：本发明将宽度学习的部分实验数据通过最小二乘法拟合，通过部分实验数据拟合得出增强节点数量与识别精度之间的关系，通过设置精度可得出满足精度的合适的增强节点数量，避免了人为设置模型参数的繁琐步骤和设置不合适的模型参数导致的训练时间的增加，具有识别精度高、算法简单的优点。

附图说明

图1为本发明的流程图。

具体实施方式

下面结合附图和实施例对本发明做进一步的说明。

如图1所示，一种基于预测增量宽度学习的图像识别分类方法，包括以下步骤：

步骤一：建立宽度学习模型，输入各类节点初始数量，设置识别准确度。

宽度学习模型的输入层是由两部分组成，分别是映射节点与增强节点，映射节点记为Z，增强节点记为H，原始输入记为X；映射节点是通过原始输入X 经过线性变换与激活函数输出得到，而增强节点是通过映射节点线性变换与激活函数输出得到，其变换公式如式(1)(2)所示

步骤二：通过拟合函数计算需要的增强节点数量。

假设给定拟合函数为f(x；a,b,c...)，已知N个测量数据(x₁,x₂,x₃...x_N)及其对应结果(y₁,y₂,y₃...y_N)，最小二乘法是通过将误差平方和最小化来求取设定函数的待定系数，误差平方和S如式(4)所示：

对于宽度学习，其增强节点的数量与识别准确度之间为非线性关系；若拟合函数为非线性方程，再应用最小二乘法求得待定系数，最终得到增强节点数量与识别准确度的近似函数，利用近似函数求得设置识别准确度所对应的增强节点数量。

步骤三：增加增强节点数量，进行增量宽度学习。

对于一些情况，当初始的模型拟合能力不够时，可以采用增量宽度学习来提高拟合能力，增量宽度学习是将增加的增强节点合并到原来的输入层中，增强层的增强节点越多，其非线性近似能力就越强；输入层即变为[A|ζ(Z_eW₃+β₃)]，其中W₃为随机权重矩阵，β₃为随机偏差矩阵，Z_e为增加的增强节点，W₃,β₃也同为随机生成并通过稀疏自编码得到。

实施例

本发明通过使用matlab软件对MNIST，Fashion-MNIST，EMNIST中的Digits 与Letters一共4个数据集进行测试。测试结果如下表1-表4所示：

表1 MNIST

表2 Fashion MNIST

表3 EMNIST Letters

表4EMNIST Digits

对以上4个表格中的数据分析可知，本发明对MNIST与EMNIST Digits有着较强的拟合能力，且实测准确度与设置准确度相差不大，并且有着较快的处理速度。对FashionMNIST与EMNIST Letters的拟合能力一般，且依旧有着较快的处理速度。总体而言，本发明对于以上4个数据集的拟合效果较优，实测准确基本符合设置准确度，且用时较短。

Claims

1.一种基于预测增量宽度学习的图像识别分类方法，其特征在于，包括以下步骤：

步骤二：通过拟合函数计算需要的增强节点数量；

步骤三：增加增强节点数量，进行增量宽度学习；

2.根据权利要求1所述的基于预测增量宽度学习的图像识别分类方法，其特征在于，所述步骤一中，宽度学习模型的输入层是由两部分组成，分别是映射节点与增强节点，映射节点记为Z，增强节点记为H，原始输入记为X；映射节点是通过原始输入X经过线性变换与激活函数输出得到，而增强节点是通过映射节点线性变换与激活函数输出得到，其变换公式如式(1)(2)所示

其中W₁,β₁,W₂,β₂为自动编码产生的基础上加上稀疏性限制产生而来的数据，W₁、W₂为随机权重矩阵，β₁、β₂为随机偏差矩阵，φ为映射节点的激活函数，ξ为增强节点的激活函数，

3.根据权利要求2所述的基于预测增量宽度学***方和最小化来求取设定函数的待定系数，误差平方和S如式(4)所示：

其中x_i表示第i个测量数据，y_i表示第i个测量数据的对应结果，i＝1,2,3…N；

对于线性方程，误差平方和S最小，则必有

4.根据权利要求2所述的基于预测增量宽度学习的图像识别分类方法，其特征在于，所述步骤三中，增量宽度学习是将增加的增强节点合并到原来的输入层中，增强层即为原输入层加上通过增量宽度学习的增强节点，由于输入节点数无法改变，则增强层的增强节点越多，其非线性近似能力就越强；输入层即变为[A|ζ(Z_eW₃+β₃)]，其中W₃为随机权重矩阵，β₃为随机偏差矩阵，Z_e为增加的增强节点，W₃,β₃也同为随机生成并通过稀疏自编码得到。