CN108647723B

CN108647723B - 一种基于深度学习网络的图像分类方法

Info

Publication number: CN108647723B
Application number: CN201810448134.8A
Authority: CN
Inventors: 王改华; 吕朦; 袁国亮; 刘文洲; 李涛
Original assignee: Hubei University of Technology
Current assignee: Hubei University of Technology
Priority date: 2018-05-11
Filing date: 2018-05-11
Publication date: 2020-10-13
Anticipated expiration: 2038-05-11
Also published as: CN108647723A

Abstract

本发明公开了一种基于深度学习网络的图像分类方法，首先建立与ResNext网络相同的提取特征部分，这部分通过堆叠卷积快来实现。根据参数设置，将每个参数相同的卷积块分为一节，并对每节部分进行同样大小卷积块的删减；然后在建立好网络的三节部分中提取每一部分网络得到的特征图，处理后获得最后的特征列向量；接着将最后的特征列向量与softmax分类器连接，完整整个网络；整个网络用已知数据库进行调节，保存调节好后的权值；最后将网络运用到新数据库时，用保存好的权值迁移学习，然后进行微调。本发明提出了一种新的卷积神经网络算法结构，并降低了参数储存量，缩短了网络训练时间，同时提高了识别效率。

Description

一种基于深度学习网络的图像分类方法

技术领域

本发明属于图形处理与模式识别技术领域，涉及一种图像分类方法，具体涉及一种在ResNext网络基础上进行多空间多尺度特征提取融合，并结合迁移学习训练网络的深度学习的图像分类方法。

背景技术

ResNext是原作者之一何凯明对网络ResNet的改进，一共有152层的深度残差网络ResNet在2015年的ImageNet和COCO 2015竞赛中的图像分类、目标检测和语义分割各个分项都取得最好成绩。

多尺度提取特征能有效改善图像检索、图像分类和目标检测的正确率。卷积神经网络中的多尺度提取特征可从卷积层，全连接层不同空间中提取特征。

迁移学习是指一种学习对另一种学习的影响。在深度学习中，就是把已经训练好的的模型参数迁移到新的模型来帮助新的模型训练。

发明内容

本发明的目的是提出一种在ResNext网络基础上进行多空间多尺度特征提取融合，并结合迁移学习训练网络的图像分类方法，减少了训练参数量，缩短训练时间，提高图像的模式识别的能力。

本发明所采用的技术方案是：一种基于深度学习网络的图像分类方法，其特征在于，包括以下步骤：

步骤1：首先建立与ResNext网络相同的提取特征部分，这部分通过堆叠卷积快来实现；根据参数设置，将每个参数相同的卷积块分为一节，并对每节部分进行同样大小卷积块的删减；

步骤2：在建立好网络的三节部分中提取每一部分网络得到的特征图，处理后获得最后的特征列向量；

步骤3：将最后的特征列向量与softmax分类器进行全连接，使整个网络完整；

步骤4：将已知数据库输入到整个网络中，运用梯度下降法进行调节，当训练精度和验证精度到达一定程度后(正确率在80％以上)，保存调节好后的权值；

步骤5：将网络运用到新数据库时，用保存好的权值进行迁移学习，即将保持好的权值对网络进行权值初始化，然后运用梯度下降法调节网络，即微调步骤。

本发明的有益效果是：提出了一种新的卷积神经网络算法结构，并降低了参数储存量，缩短了网络训练时间，同时提高了识别效率。

附图说明

图1为本发明实施例的流程图；

图2为本发明实施例网络结构图；

图3为本发明实施例的原始block示意图；

图4为本发明实施例的修改后的block示意图。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明，下面结合附图及实施例对本发明作进一步的详细描述，应当理解，此处所描述的实施示例仅用于说明和解释本发明，并不用于限定本发明。

请见图1，本发明提供的一种基于深度学习网络的图像分类方法，包括以下步骤：

步骤1：首先建立与ResNext网络相同的提取特征部分，这部分通过堆叠卷积快来实现。根据参数设置，将每个参数相同的卷积块分为一节，并对每节部分进行同样大小卷积块的删减；

请见图2，为本实施例的网络结构图；具体网络结构请见表1

表1

表1中，输出列的数据表示的经过网络经过各阶段操作后得到的输出，如果操作无参数，表明此网络无此操作，输出为上一阶段的输出；

表1中，卷积操作中的n*n，m，表示为卷积核大小为n*n，卷积核个数为 m；C表示通道数，表示有C个n*n，m卷积操作。我们的方法中，一类采用1*3 和3*1两层卷积层，另一类采用两个重复的1*3和3*1两层卷积层，同时调整步长，使输出特征图大小相同。每类的通道个数均为对比网络的一半，组合后相同；每阶段操作最右的大括号表示卷积块的堆叠的个数；

表1中，池化操作中的n*n，表示为池化大小为n*n。

步骤2：在建立好网络的每节部分中提取每一部分网络得到的特征图，处理后获得最后的特征列向量；

步骤2的具体实现包括以下子步骤：

步骤2.1：将每一部分获得的特征图进行均匀池化，一共有N节部分时，第一部分池化后特征图大小为2^(N-1)*2^(N-1)，第二部分池化后特征图大小为2^(N-2) *2^(N-2)，以此类推，最后一部分池化后特征图大小为2^(N-N)*2^(N-N)；

本实施例的N取3。

步骤2.2：将每一部分的每一张特征图转化为列向量排列，然后整个部分顺序连接为列向量，最后将每个列向量顺利连接为最后的特征列向量。

步骤3：将最后的特征列向量与softmax分类器进行全连接，使整个网络完整。

本发明在ResNext网络基础上进行了改进，减少了block的个数，在不改变Cardinality个数的基础上减小了网络的深度，减少了参数调整量的同时，提高了网络精度。

首先，减少block的个数，将block的个数由2改为3.

请见图3，本发明针对单个block，根据ResNext模型，选取了原始block结构进行了改进，改进后的block结构请见图4；

Cardinality个数不变，但是将Cardinality分成均等两类，一类采用1*3和3*1 两层卷积层替代原始3*3卷积核，另一类采用两个重复的1*3和3*1两层卷积层来替代5*5卷积核，同时调整步长，使输出特征图大小相同。其他结构保持不变。

然后，在整体结构中选取每个重复block的最后输出进行不同尺度的均匀池化，最后一层的block输出均匀池化为1*1大小的特征图，即与原网络的全局均匀池化相同，倒数第二个重复block的输出则均匀池化为2^(2_1)*2^(2_1)大小的特征图，以此类推，以空间金字塔结构来获取深层网络中不同深度下特征图，最后将这些特征图进行顺序连接，送入softmax分类器中，完整网络。

应当理解的是，本说明书未详细阐述的部分均属于现有技术。

应当理解的是，上述针对较佳实施例的描述较为详细，并不能因此而认为是对本发明专利保护范围的限制，本领域的普通技术人员在本发明的启示下，在不脱离本发明权利要求所保护的范围情况下，还可以做出替换或变形，均落入本发明的保护范围之内，本发明的请求保护范围应以所附权利要求为准。

Claims

1.一种基于深度学习网络的图像分类方法，其特征在于，包括以下步骤：

步骤1：首先建立与ResNext网络相同的提取特征部分，根据参数设置，将每个参数相同的卷积块分为一节，并对每节部分进行同样大小卷积块的删减；

步骤2的具体实现包括以下子步骤：

步骤2.1：将每一部分获得的特征图进行均匀池化，一共有N节部分时，第一部分池化后特征图大小为2^(N-1)*2^(N-1)，第二部分池化后特征图大小为2^(N-2)*2^(N-2)，以此类推，最后一部分池化后特征图大小为2^(N-N)*2^(N-N)；

步骤2.2：将每一部分的每一张特征图转化为列向量排列，然后整个部分顺序连接为列向量，最后将每个列向量顺利连接为最后的特征列向量；

步骤4：将已知数据库输入到整个网络中，运用梯度下降法进行调节，当训练精度和验证精度到预设程度后，保存调节好后的权值；

步骤5：将网络运用到新数据库时，用保存好的权值进行迁移学习；

其中，将保持好的权值对网络进行权值初始化，然后运用梯度下降法调节网络。