CN108647723B - 一种基于深度学习网络的图像分类方法 - Google Patents
一种基于深度学习网络的图像分类方法 Download PDFInfo
- Publication number
- CN108647723B CN108647723B CN201810448134.8A CN201810448134A CN108647723B CN 108647723 B CN108647723 B CN 108647723B CN 201810448134 A CN201810448134 A CN 201810448134A CN 108647723 B CN108647723 B CN 108647723B
- Authority
- CN
- China
- Prior art keywords
- network
- column vector
- size
- pooling
- feature map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 10
- 238000013135 deep learning Methods 0.000 title claims abstract description 8
- 238000012549 training Methods 0.000 claims abstract description 10
- 238000010586 diagram Methods 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims abstract description 5
- 238000011176 pooling Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 6
- 238000011478 gradient descent method Methods 0.000 claims description 6
- 238000013508 migration Methods 0.000 claims description 3
- 230000005012 migration Effects 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 238000013527 convolutional neural network Methods 0.000 abstract description 3
- 238000013526 transfer learning Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于深度学习网络的图像分类方法,首先建立与ResNext网络相同的提取特征部分,这部分通过堆叠卷积快来实现。根据参数设置,将每个参数相同的卷积块分为一节,并对每节部分进行同样大小卷积块的删减;然后在建立好网络的三节部分中提取每一部分网络得到的特征图,处理后获得最后的特征列向量;接着将最后的特征列向量与softmax分类器连接,完整整个网络;整个网络用已知数据库进行调节,保存调节好后的权值;最后将网络运用到新数据库时,用保存好的权值迁移学习,然后进行微调。本发明提出了一种新的卷积神经网络算法结构,并降低了参数储存量,缩短了网络训练时间,同时提高了识别效率。
Description
技术领域
本发明属于图形处理与模式识别技术领域,涉及一种图像分类方法,具体涉及一种在ResNext网络基础上进行多空间多尺度特征提取融合,并结合迁移学习训练网络的深度学习的图像分类方法。
背景技术
ResNext是原作者之一何凯明对网络ResNet的改进,一共有152层的深度残差网络ResNet在2015年的ImageNet和COCO 2015竞赛中的图像分类、目标检测和语义分割各个分项都取得最好成绩。
多尺度提取特征能有效改善图像检索、图像分类和目标检测的正确率。卷积神经网络中的多尺度提取特征可从卷积层,全连接层不同空间中提取特征。
迁移学习是指一种学习对另一种学习的影响。在深度学习中,就是把已经训练好的的模型参数迁移到新的模型来帮助新的模型训练。
发明内容
本发明的目的是提出一种在ResNext网络基础上进行多空间多尺度特征提取融合,并结合迁移学习训练网络的图像分类方法,减少了训练参数量,缩短训练时间,提高图像的模式识别的能力。
本发明所采用的技术方案是:一种基于深度学习网络的图像分类方法,其特征在于,包括以下步骤:
步骤1:首先建立与ResNext网络相同的提取特征部分,这部分通过堆叠卷积快来实现;根据参数设置,将每个参数相同的卷积块分为一节,并对每节部分进行同样大小卷积块的删减;
步骤2:在建立好网络的三节部分中提取每一部分网络得到的特征图,处理后获得最后的特征列向量;
步骤3:将最后的特征列向量与softmax分类器进行全连接,使整个网络完整;
步骤4:将已知数据库输入到整个网络中,运用梯度下降法进行调节,当训练精度和验证精度到达一定程度后(正确率在80%以上),保存调节好后的权值;
步骤5:将网络运用到新数据库时,用保存好的权值进行迁移学习,即将保持好的权值对网络进行权值初始化,然后运用梯度下降法调节网络,即微调步骤。
本发明的有益效果是:提出了一种新的卷积神经网络算法结构,并降低了参数储存量,缩短了网络训练时间,同时提高了识别效率。
附图说明
图1为本发明实施例的流程图;
图2为本发明实施例网络结构图;
图3为本发明实施例的原始block示意图;
图4为本发明实施例的修改后的block示意图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
请见图1,本发明提供的一种基于深度学习网络的图像分类方法,包括以下步骤:
步骤1:首先建立与ResNext网络相同的提取特征部分,这部分通过堆叠卷积快来实现。根据参数设置,将每个参数相同的卷积块分为一节,并对每节部分进行同样大小卷积块的删减;
请见图2,为本实施例的网络结构图;具体网络结构请见表1
表1
表1中,输出列的数据表示的经过网络经过各阶段操作后得到的输出,如果操作无参数,表明此网络无此操作,输出为上一阶段的输出;
表1中,卷积操作中的n*n,m,表示为卷积核大小为n*n,卷积核个数为 m;C表示通道数,表示有C个n*n,m卷积操作。我们的方法中,一类采用1*3 和3*1两层卷积层,另一类采用两个重复的1*3和3*1两层卷积层,同时调整步长,使输出特征图大小相同。每类的通道个数均为对比网络的一半,组合后相同;每阶段操作最右的大括号表示卷积块的堆叠的个数;
表1中,池化操作中的n*n,表示为池化大小为n*n。
步骤2:在建立好网络的每节部分中提取每一部分网络得到的特征图,处理后获得最后的特征列向量;
步骤2的具体实现包括以下子步骤:
步骤2.1:将每一部分获得的特征图进行均匀池化,一共有N节部分时,第一部分池化后特征图大小为2(N-1)*2(N-1),第二部分池化后特征图大小为2(N-2) *2(N-2),以此类推,最后一部分池化后特征图大小为2(N-N)*2(N-N);
本实施例的N取3。
步骤2.2:将每一部分的每一张特征图转化为列向量排列,然后整个部分顺序连接为列向量,最后将每个列向量顺利连接为最后的特征列向量。
步骤3:将最后的特征列向量与softmax分类器进行全连接,使整个网络完整。
步骤4:将已知数据库输入到整个网络中,运用梯度下降法进行调节,当训练精度和验证精度到达一定程度后(正确率在80%以上),保存调节好后的权值;
步骤5:将网络运用到新数据库时,用保存好的权值进行迁移学习,即将保持好的权值对网络进行权值初始化,然后运用梯度下降法调节网络,即微调步骤。
本发明在ResNext网络基础上进行了改进,减少了block的个数,在不改变Cardinality个数的基础上减小了网络的深度,减少了参数调整量的同时,提高了网络精度。
首先,减少block的个数,将block的个数由2改为3.
请见图3,本发明针对单个block,根据ResNext模型,选取了原始block结构进行了改进,改进后的block结构请见图4;
Cardinality个数不变,但是将Cardinality分成均等两类,一类采用1*3和3*1 两层卷积层替代原始3*3卷积核,另一类采用两个重复的1*3和3*1两层卷积层来替代5*5卷积核,同时调整步长,使输出特征图大小相同。其他结构保持不变。
然后,在整体结构中选取每个重复block的最后输出进行不同尺度的均匀池化,最后一层的block输出均匀池化为1*1大小的特征图,即与原网络的全局均匀池化相同,倒数第二个重复block的输出则均匀池化为2^(2_1)*2^(2_1)大小的特征图,以此类推,以空间金字塔结构来获取深层网络中不同深度下特征图,最后将这些特征图进行顺序连接,送入softmax分类器中,完整网络。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。
Claims (1)
1.一种基于深度学习网络的图像分类方法,其特征在于,包括以下步骤:
步骤1:首先建立与ResNext网络相同的提取特征部分,根据参数设置,将每个参数相同的卷积块分为一节,并对每节部分进行同样大小卷积块的删减;
步骤2:在建立好网络的每节部分中提取每一部分网络得到的特征图,处理后获得最后的特征列向量;
步骤2的具体实现包括以下子步骤:
步骤2.1:将每一部分获得的特征图进行均匀池化,一共有N节部分时,第一部分池化后特征图大小为2(N-1)*2(N-1),第二部分池化后特征图大小为2(N-2)*2(N-2),以此类推,最后一部分池化后特征图大小为2(N-N)*2(N-N);
步骤2.2:将每一部分的每一张特征图转化为列向量排列,然后整个部分顺序连接为列向量,最后将每个列向量顺利连接为最后的特征列向量;
步骤3:将最后的特征列向量与softmax分类器进行全连接,使整个网络完整;
步骤4:将已知数据库输入到整个网络中,运用梯度下降法进行调节,当训练精度和验证精度到预设程度后,保存调节好后的权值;
步骤5:将网络运用到新数据库时,用保存好的权值进行迁移学习;
其中,将保持好的权值对网络进行权值初始化,然后运用梯度下降法调节网络。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810448134.8A CN108647723B (zh) | 2018-05-11 | 2018-05-11 | 一种基于深度学习网络的图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810448134.8A CN108647723B (zh) | 2018-05-11 | 2018-05-11 | 一种基于深度学习网络的图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108647723A CN108647723A (zh) | 2018-10-12 |
CN108647723B true CN108647723B (zh) | 2020-10-13 |
Family
ID=63754530
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810448134.8A Expired - Fee Related CN108647723B (zh) | 2018-05-11 | 2018-05-11 | 一种基于深度学习网络的图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108647723B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109509187B (zh) * | 2018-11-05 | 2022-12-13 | 中山大学 | 一种针对大分辨率布匹图像中的小瑕疵的高效检验算法 |
CN109918752B (zh) * | 2019-02-26 | 2022-12-16 | 华南理工大学 | 基于迁移卷积神经网络的机械故障诊断方法、设备及介质 |
CN110414536B (zh) * | 2019-07-17 | 2022-03-25 | 北京得意音通技术有限责任公司 | 录音重放检测方法、存储介质和电子设备 |
CN110503185B (zh) * | 2019-07-18 | 2023-04-07 | 电子科技大学 | 一种改进的深度调制识别网络模型 |
CN111898479B (zh) * | 2020-07-14 | 2023-09-26 | 中国矿业大学 | 一种基于全卷积单步目标检测算法的口罩佩戴识别方法和装置 |
CN112561880B (zh) * | 2020-12-16 | 2022-07-08 | 华东师范大学 | 一种将先验知识融入深度学习引导磁共振图像分类的方法 |
CN113343002A (zh) * | 2021-06-07 | 2021-09-03 | 湖南大学 | 一种基于深度cnn特征的图像检索和分类方法 |
CN113807362B (zh) * | 2021-09-03 | 2024-02-27 | 西安电子科技大学 | 基于层间语义信息融合深度卷积网络的图像分类方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105069472A (zh) * | 2015-08-03 | 2015-11-18 | 电子科技大学 | 一种基于卷积神经网络自适应的车辆检测方法 |
CN105224942A (zh) * | 2015-07-09 | 2016-01-06 | 华南农业大学 | 一种rgb-d图像分类方法及*** |
CN107316066A (zh) * | 2017-07-28 | 2017-11-03 | 北京工商大学 | 基于多通路卷积神经网络的图像分类方法及*** |
CN107506740A (zh) * | 2017-09-04 | 2017-12-22 | 北京航空航天大学 | 一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9501724B1 (en) * | 2015-06-09 | 2016-11-22 | Adobe Systems Incorporated | Font recognition and font similarity learning using a deep neural network |
CN106127173B (zh) * | 2016-06-30 | 2019-05-07 | 北京小白世纪网络科技有限公司 | 一种基于深度学习的人体属性识别方法 |
US20180124437A1 (en) * | 2016-10-31 | 2018-05-03 | Twenty Billion Neurons GmbH | System and method for video data collection |
CN107341506A (zh) * | 2017-06-12 | 2017-11-10 | 华南理工大学 | 一种基于多方面深度学习表达的图像情感分类方法 |
CN107239802B (zh) * | 2017-06-28 | 2021-06-01 | 广东工业大学 | 一种图像分类方法及装置 |
CN107480599B (zh) * | 2017-07-19 | 2021-01-22 | 董伟 | 一种基于深度学习算法的共享单车还车管理方法 |
CN107958272B (zh) * | 2017-12-12 | 2020-11-24 | 北京旷视科技有限公司 | 图片数据集更新方法、装置、***及计算机存储介质 |
-
2018
- 2018-05-11 CN CN201810448134.8A patent/CN108647723B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105224942A (zh) * | 2015-07-09 | 2016-01-06 | 华南农业大学 | 一种rgb-d图像分类方法及*** |
CN105069472A (zh) * | 2015-08-03 | 2015-11-18 | 电子科技大学 | 一种基于卷积神经网络自适应的车辆检测方法 |
CN107316066A (zh) * | 2017-07-28 | 2017-11-03 | 北京工商大学 | 基于多通路卷积神经网络的图像分类方法及*** |
CN107506740A (zh) * | 2017-09-04 | 2017-12-22 | 北京航空航天大学 | 一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法 |
Non-Patent Citations (2)
Title |
---|
SINGING STYLE INVESTIGATION BY RESIDUAL SIAMESE CONVOLUTIONAL NEURAL NETWORKS;Cheng-i Wang.et;《ICASSP 2018》;20180420;第116-120页 * |
采用无监督学习算法与卷积的图像分类模型;王改华等;《华侨大学学报(自然科学版)》;20180131;第39卷(第1期);第146-151页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108647723A (zh) | 2018-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108647723B (zh) | 一种基于深度学习网络的图像分类方法 | |
CN107705242B (zh) | 一种结合深度学习与深度感知的图像风格化迁移方法 | |
CN112257794B (zh) | 一种基于yolo的轻量级的目标检测方法 | |
US20240202871A1 (en) | Three-dimensional point cloud upsampling method, system and device, and medium | |
CN106991440B (zh) | 一种基于空间金字塔的卷积神经网络的图像分类方法 | |
CN108875076B (zh) | 一种基于Attention机制和卷积神经网络的快速商标图像检索方法 | |
CN108614997B (zh) | 一种基于改进AlexNet的遥感图像识别方法 | |
CN106845529A (zh) | 基于多视野卷积神经网络的影像特征识别方法 | |
CN111242180B (zh) | 一种基于轻量化卷积神经网络的图像识别方法及*** | |
CN111882040A (zh) | 基于通道数量搜索的卷积神经网络压缩方法 | |
CN103942571B (zh) | 一种基于遗传规划算法的图形图像分类方法 | |
CN111046917B (zh) | 基于深度神经网络的对象性增强目标检测方法 | |
CN109543029B (zh) | 基于卷积神经网络的文本分类方法、装置、介质和设备 | |
CN110334645B (zh) | 一种基于深度学习的月球撞击坑识别方法 | |
CN111723915A (zh) | 深度卷积神经网络的剪枝方法、计算机设备及应用方法 | |
CN113515656B (zh) | 一种基于增量学习的多视角目标识别与检索方法、及装置 | |
CN111709516A (zh) | 神经网络模型的压缩方法及压缩装置、存储介质、设备 | |
Yue et al. | Face recognition based on histogram equalization and convolution neural network | |
US20220245510A1 (en) | Multi-dimensional model shape transfer | |
CN111860679B (zh) | 一种基于YOLO v3改进算法的车辆检测方法 | |
KR102305575B1 (ko) | 이미지 간 유사도를 이용한 유사 영역 강조 방법 및 시스템 | |
CN112257727A (zh) | 一种基于深度学习自适应可变形卷积的特征图像提取方法 | |
CN112150497A (zh) | 基于二值神经网络的局部激活方法与*** | |
CN113807366B (zh) | 一种基于深度学习的点云关键点提取方法 | |
CN113313140B (zh) | 基于深度注意力的三维模型分类和检索方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20201013 |
|
CF01 | Termination of patent right due to non-payment of annual fee |