CN112001431A - 一种基于梳状卷积的高效图像分类方法 - Google Patents

一种基于梳状卷积的高效图像分类方法 Download PDF

Info

Publication number
CN112001431A
CN112001431A CN202010803534.3A CN202010803534A CN112001431A CN 112001431 A CN112001431 A CN 112001431A CN 202010803534 A CN202010803534 A CN 202010803534A CN 112001431 A CN112001431 A CN 112001431A
Authority
CN
China
Prior art keywords
convolution
comb
layer
mapping
layers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010803534.3A
Other languages
English (en)
Other versions
CN112001431B (zh
Inventor
周圆
李丹丹
霍树伟
曹涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN202010803534.3A priority Critical patent/CN112001431B/zh
Publication of CN112001431A publication Critical patent/CN112001431A/zh
Application granted granted Critical
Publication of CN112001431B publication Critical patent/CN112001431B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于梳状卷积的高效图像分类方法,包括下列步骤:准备数据集及数据预处理;训练基于梳状卷积的深度卷积神经网络,包括下面几个方面:(1)梳状卷积层层内操作:将计算代价低的线性映射并行的、交错的***到标准卷积映射中,使输出特征图上一部分的特征点由标准卷积映射得到,另一部分的特征点由线性映射得到;(2)梳状卷积层层间交错映射操作;(3)基于梳状卷积的高效网络模型整体网络结构;(4)训练;测试模型的分类效果。

Description

一种基于梳状卷积的高效图像分类方法
技术领域
本发明涉及图像处理、计算机视觉领域,更具体地,涉及到一种基于梳状卷积的高效图像分类方法。
背景技术
图像分类属于计算机视觉领域中各类相关研究工作的基本问题,是计算机视觉任务的基础构成。图像分类是指把输入的图像划分到多个预定义的类中,也就是将输入的图像标记上对应的标签。近年来,深度学习通过分层式结构的多层信息处理来进行图像分类,相对于通过浅层学习或得图像底层特征的传统图像分类方法,深度学习利用设定好的网络结构,完全从训练数据中学习图像的层级结构性特征,能够提取更加接近图像高级语义的抽象特征,因此在图像分类上的表现远远超过传统方法。
基于深度卷积神经网络的图像分类模型具有较强的分层学习数据特征的能力。目前,基于深度卷积神经网络模型的图像分类算法已经成为该领域的主要研究算法。但是,随着卷积神经网络模型的性能不断逼近计算机视觉任务的精度极限,所消耗的计算资源也急剧增加。例如,AlexNet[1]需要1.4×1010FLOPs来处理单张224×224大小的图像,而ResNet-152[2]需要2.26×1011FLOPs。因此,为了满足工业界在计算开销、实时性等方面的要求,设计高效的图像分类方法成为了当前亟待解决的问题。
近年来研究人员对卷积运算加速的研究主要集中在减少特征图通道间的连接冗余方面。通过构建特征图在通道维度之间的结构化稀疏关系,之前的工作如ResNeXt[3]、Xception[4]、Shufflenet[5]、MobileNets[6]、Deep roots[7]、CondenseNet[8]和IGCNets[9],使得模型效率获得一致提高。然而,以上工作都忽略了相邻层特征图在空间维度上也存在大量连接冗余,限制了模型效率的进一步提高。
参考文献:
[1]Krizhevsky A,Sutskever I,Hinton G.ImageNet Classification withDeep Convolutional Neural Networks[C]//NIPS.Curran Associates Inc.2012.
[2]He K,Zhang X,Ren S,et al.Deep Residual Learning for ImageRecognition[J].2015.
[3]Xie S,Girshick R,Dollár,Piotr,et al.Aggregated ResidualTransformations for Deep Neural Networks[J].2016.
[4]Chollet F.Xception:Deep Learning with Depthwise SeparableConvolutions[J].2016.
[5]Zhang X,Zhou X,Lin M,et al.ShuffleNet:An Extremely EfficientConvolutional Neural Network for Mobile Devices[J].2017.
[6]Howard A G,Zhu M,Chen B,et al.MobileNets:Efficient ConvolutionalNeural Networks for Mobile Vision Applications[J].2017.
[7]Ioannou Y,Robertson D,Cipolla R,et al.Deep Roots:Improving CNNEfficiency with Hierarchical Filter Groups[J].2016.
[8]Huang G,Liu S,Laurens V D M,et al.CondenseNet:An EfficientDenseNet using Learned Group Convolutions[J].2017.
[9]Zhang T,Qi G J,Xiao B,et al.Interleaved Group Convolutions forDeep Neural Networks[J].2017.
发明内容
为了解决上述问题,本发明提供了一种基于梳状卷积的高效图像分类方法,通过将线性映射并行的、交错的***到标准卷积映射中,可以显著减少网络模型在进行图像分类时产生的计算开销,使得网络模型可以更加高效的对图像进行分类,并获得相当的分类效果。同时,本发明所提出的方法能够进行端到端训练,简单高效。与现有技术相比,本发明方法能够解决层内计算冗余的问题,与减少层间计算冗余的图像分类方法相兼容,具有较好的扩展性。技术方案如下:
一种基于梳状卷积的高效图像分类方法,包括下列步骤:
第一步,准备数据集及数据预处理;
第二步,训练基于梳状卷积的深度卷积神经网络,包括下面几个方面:
(1)梳状卷积层层内操作:将计算代价低的线性映射并行的、交错的***到标准卷积映射中,使输出特征图上一部分的特征点由标准卷积映射得到,另一部分的特征点由线性映射得到,包括:
将第l-1层特征图xl-1同时经过标准卷积映射
Figure BDA0002628273130000021
和线性映射μ(·),得到第l层特征图xl,第l层第j个通道的特征图表示为
Figure BDA0002628273130000022
其与第l-1层特征图xl-1的映射关系定义如下:
Figure BDA0002628273130000023
其中,
Figure BDA0002628273130000024
表示对应于第l层第j个通道的特征图
Figure BDA0002628273130000025
的卷积核,
Figure BDA0002628273130000026
表示特征图xl-1与卷积核
Figure BDA0002628273130000027
进行标准卷积映射操作,1表示与第l层第j个通道的特征图分辨率相同的全1矩阵;
Figure BDA0002628273130000028
表示对应于第l层第j个通道的特征图
Figure BDA0002628273130000029
的二值棋盘掩码矩阵,定义如下:
Figure BDA00026282731300000210
其中,(p,q)表示第l层第j个通道的特征图
Figure BDA00026282731300000211
上的各点坐标,符号
Figure BDA00026282731300000212
表示非负整数集;同时,μ(xl-1)表示线性映射操作,定义如下:
Figure BDA0002628273130000031
其中,Cl-1表示第l-1层特征图的通道总数;
当卷积操作
Figure BDA0002628273130000032
表示为标准深度可分离卷积映射操作,并且线性映射表示为μ(xl-1)=xl-1时,梳状卷积层转换为与深度可分离卷积融合的梳状卷积层;
对二值棋盘掩码矩阵取反,重复公式(1)的计算过程,得到第l层第j+1个通道的特征图
Figure BDA0002628273130000033
与第l-1层特征图xl-1的映射关系;以此类推,将二值棋盘掩码矩阵不断取反,最终得到第l层特征图xl与第l-1层特征图xl-1的整体映射关系;
(2)梳状卷积层层间交错映射操作:对的梳状卷积操作进行堆叠,同时不断将上一层的二值掩码张量取反,即
Maskl+1=1-Maskl (4)
其中,Maskl和Maskl+1分别为第l层和第l+1层的掩码张量,1为与Maskl大小维度相同的全1张量;重复上述(1)中层内梳状卷积操作过程;
(3)基于梳状卷积的高效网络模型整体网络结构:基于Xception网络,共包含28个卷积层,即2层梳状卷积层和26层与深度可分离卷积融合的梳状卷积层,输入图像经2层梳状卷积层提取特征后,输入若干个相互堆叠的模块中;其中,每个模块含有2个级联的与深度可分离卷积融合的梳状卷积层和1个2×2最大池化层,共堆叠12个模块,每个模块中均采用ResNet中的残差连接操作;最后经2层与深度可分离卷积融合的梳状卷积层后,进行全局平均池化,随后经过全连接层输出分类结果;使用的卷积核全部为3×3大小,卷积核滑动步长为1,采用ReLU激活函数;
(4)将经数据预处理后的图像输入到搭建好的基于梳状卷积的高效网络模型中,设置神经网络模型参数,经过前向传导、反向传导后即更新一次网络的参数权重,经过迭代之后即可得到训练好的高效图像分类网络。
第三步,测试模型的分类效果。
附图说明
图1算法原理图
图2基于TensorFlow的实现流程图
图3整体网络结构图
图4算法执行结果
具体实施方式
为使本发明的技术方案更加清楚,下面结合附图对本发明做进一步阐述。本发明按以下步骤具体实现:
第一步,准备数据集及数据预处理。
所提出的方法使用了CIFAR-100分类数据集来训练图像分类模型。CIFAR-100数据集由60000个32×32彩色图像组成,根据图像内容被分为100个小类别,包括:airplane、automobile、bird、cat、deer、dog、frog、horse、ship、truck,10个大类下的10个小类,类别之间的交集为空。每个类有600个图像每个类,每类各有500个训练图像和100个测试图像。实验实施过程中采用标准的数据增强方案,即对图像进行每边4个像素的零填充,随机裁剪生成32×32大小的图像,以0.5的概率进行水平翻转。在训练过程中,随机抽取5%的训练图像作为验证集。
第二步,训练基于梳状卷积的深度卷积神经网络。
所提出的梳状卷积原理参见图1,主要分为两大部分,其原理具体细节如下:
1、梳状卷积层层内操作:
梳状卷积层层内操作将计算代价低的线性映射并行的、交错的***到标准卷积映射中,使输出特征图上一半的特征点由标准卷积映射得到,另一半的特征点由线性映射得到,从而极大的降低了卷积操作的运算开销。具体设计如下:
(1)将第l-1层特征图xl-1同时经过标准卷积映射
Figure BDA0002628273130000041
和线性映射μ(·),得到第l层特征图xl。其中,第l层第j个通道的特征图表示为
Figure BDA0002628273130000042
其与第l-1层特征图xl-1的映射关系定义如下:
Figure BDA0002628273130000043
其中,
Figure BDA0002628273130000044
表示对应于第l层第j个通道的特征图
Figure BDA0002628273130000045
的卷积核,
Figure BDA0002628273130000046
表示特征图xl-1与卷积核
Figure BDA0002628273130000047
进行标准卷积映射操作,1表示与第l层第j个通道的特征图分辨率相同的全1矩阵。
Figure BDA0002628273130000048
表示对应于第l层第j个通道的特征图
Figure BDA0002628273130000049
的二值棋盘掩码矩阵,定义如下:
Figure BDA00026282731300000410
其中,(p,q)表示第l层第j个通道的特征图
Figure BDA00026282731300000411
上的各点坐标,符号
Figure BDA00026282731300000412
表示非负整数集。同时,μ(xl-1)表示线性映射操作,定义如下:
Figure BDA00026282731300000413
其中,Cl-1表示第l-1层特征图的通道总数。
特别地,当卷积操作
Figure BDA00026282731300000414
表示为标准深度可分离卷积映射操作,并且线性映射表示为μ(xl-1)=xl-1时,梳状卷积层转换为与深度可分离卷积融合的梳状卷积层。
(2)对二值棋盘掩码矩阵取反,重复公式(1)的计算过程,得到第l层第j+1个通道的特征图
Figure BDA00026282731300000415
与第l-1层特征图xl-1的映射关系。以此类推,将二值棋盘掩码矩阵不断取反,最终得到第l层特征图xl与第l-1层特征图xl-1的整体映射关系。
2、梳状卷积层层间交错映射操作:
对上述过程得到的梳状卷积操作进行堆叠,同时不断将上一层的二值掩码张量取反,即
Maskl+1=1-Maskl (4)
其中,Maskl和Maskl+1分别为第l层和第l+1层的掩码张量,1为与Maskl大小维度相同的全1张量。重复上述1中层内梳状卷积操作过程,最终得到基于梳状卷积的高效网络模型。等效的基于TensorFlow框架的高效梳状卷积实现流程参见图2。
实验的整体网络结构参见图3。整体网络结构受到Xception网络的启发,共包含28个卷积层,即2层梳状卷积层和26层与深度可分离卷积融合的梳状卷积层。输入图像经2层梳状卷积层提取特征后,输入若干个相互堆叠的模块中。其中,每个模块含有2个级联的与深度可分离卷积融合的梳状卷积层和1个2×2最大池化层,共堆叠12个模块,每个模块中均采用了ResNet中的残差连接操作。最后经2层与深度可分离卷积融合的梳状卷积层后,进行全局平均池化,随后经过全连接层输出分类结果。使用的卷积核全部为3×3大小,卷积核滑动步长为1,采用ReLU激活函数。
具体操作时将经数据预处理后的图像输入到搭建好的神经网络模型中,设置神经网络模型初始学习率为0.1,采用参数为0.9的Momentum优化方法,权重衰减率为10-4,并在训练进程达到50%和75%后将学习率下调10倍,参数初始化采用He初始化方法,训练批次大小为100。经过前向传导、反向传导后即更新一次网络的参数权重,经过300轮迭代之后,即可得到训练好的高效图像分类网络。
第三步,测试模型的分类效果。
测试时,将测试集图像输入网络模型,测试结果请参考图4。本发明将使用高效梳状卷积前后的模型分类结果进行了对比。从实验效果上看,本发明方法能十分有效地降低模型的运算复杂度,并获得相当的分类效果。同时,本发明所提出的方法能够进行端到端训练,简单高效。此外,本发明方法能够解决层内计算冗余的问题,与减少层间计算冗余的图像分类方法相兼容,具有较好的扩展性。

Claims (3)

1.一种基于梳状卷积的高效图像分类方法,包括下列步骤:
第一步,准备数据集及数据预处理;
第二步,训练基于梳状卷积的深度卷积神经网络。包括下面几个方面:
(1)梳状卷积层层内操作:将计算代价低的线性映射并行的、交错的***到标准卷积映射中,使输出特征图上一部分的特征点由标准卷积映射得到,另一部分的特征点由线性映射得到,包括:
将第l-1层特征图xl-1同时经过标准卷积映射
Figure FDA0002628273120000011
和线性映射μ(·),得到第l层特征图xl,第l层第j个通道的特征图表示为
Figure FDA0002628273120000012
其与第l-1层特征图xl-1的映射关系定义如下:
Figure FDA0002628273120000013
其中,
Figure FDA0002628273120000014
表示对应于第l层第j个通道的特征图
Figure FDA0002628273120000015
的卷积核,
Figure FDA0002628273120000016
表示特征图xl-1与卷积核
Figure FDA0002628273120000017
进行标准卷积映射操作,1表示与第l层第j个通道的特征图分辨率相同的全1矩阵;
Figure FDA0002628273120000018
表示对应于第l层第j个通道的特征图
Figure FDA0002628273120000019
的二值棋盘掩码矩阵,定义如下:
Figure FDA00026282731200000110
其中,(p,q)表示第l层第j个通道的特征图
Figure FDA00026282731200000111
上的各点坐标,符号
Figure FDA00026282731200000112
表示非负整数集;同时,μ(xl-1)表示线性映射操作,定义如下:
Figure FDA00026282731200000113
其中,Cl-1表示第l-1层特征图的通道总数;
当卷积操作
Figure FDA00026282731200000114
表示为标准深度可分离卷积映射操作,并且线性映射表示为μ(xl-1)=xl -1时,梳状卷积层转换为与深度可分离卷积融合的梳状卷积层;
对二值棋盘掩码矩阵取反,重复公式(1)的计算过程,得到第l层第j+1个通道的特征图
Figure FDA00026282731200000115
与第l-1层特征图xl-1的映射关系;以此类推,将二值棋盘掩码矩阵不断取反,最终得到第l层特征图xl与第l-1层特征图xl-1的整体映射关系;
(2)梳状卷积层层间交错映射操作:对的梳状卷积操作进行堆叠,同时不断将上一层的二值掩码张量取反,即
Maskl+1=1-Maskl (4)
其中,Maskl和Maskl+1分别为第l层和第l+1层的掩码张量,1为与Maskl大小维度相同的全1张量;重复上述(1)中层内梳状卷积操作过程;
(3)建立基于梳状卷积的高效网络模型;
(4)训练高效图像分类网络;
第三步,测试模型的分类效果。
2.根据权利要求1所述的方法,其特征在于,建立基于梳状卷积的高效网络模型:基于Xception网络,共包含28个卷积层,即2层梳状卷积层和26层与深度可分离卷积融合的梳状卷积层,输入图像经2层梳状卷积层提取特征后,输入若干个相互堆叠的模块中;其中,每个模块含有2个级联的与深度可分离卷积融合的梳状卷积层和1个2×2最大池化层,共堆叠12个模块,每个模块中均采用ResNet中的残差连接操作;最后经2层与深度可分离卷积融合的梳状卷积层后,进行全局平均池化,随后经过全连接层输出分类结果;使用的卷积核全部为3×3大小,卷积核滑动步长为1,采用ReLU激活函数。
3.根据权利要求1所述的方法,其特征在于,训练高效图像分类网络方法为:将经数据预处理后的图像输入到搭建好的基于梳状卷积的高效网络模型中,设置神经网络模型参数,经过前向传导、反向传导后即更新一次网络的参数权重,经过迭代之后即可得到训练好的高效图像分类网络。
CN202010803534.3A 2020-08-11 2020-08-11 一种基于梳状卷积的高效图像分类方法 Active CN112001431B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010803534.3A CN112001431B (zh) 2020-08-11 2020-08-11 一种基于梳状卷积的高效图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010803534.3A CN112001431B (zh) 2020-08-11 2020-08-11 一种基于梳状卷积的高效图像分类方法

Publications (2)

Publication Number Publication Date
CN112001431A true CN112001431A (zh) 2020-11-27
CN112001431B CN112001431B (zh) 2022-06-28

Family

ID=73464070

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010803534.3A Active CN112001431B (zh) 2020-08-11 2020-08-11 一种基于梳状卷积的高效图像分类方法

Country Status (1)

Country Link
CN (1) CN112001431B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115170917A (zh) * 2022-06-20 2022-10-11 美的集团(上海)有限公司 图像处理方法、电子设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103489454A (zh) * 2013-09-22 2014-01-01 浙江大学 基于波形形态特征聚类的语音端点检测方法
CN110211064A (zh) * 2019-05-21 2019-09-06 华南理工大学 一种基于边缘引导的混合退化文本图像恢复方法
CN110427990A (zh) * 2019-07-22 2019-11-08 浙江理工大学 一种基于卷积神经网络的艺术图像分类方法
CN110781912A (zh) * 2019-09-10 2020-02-11 东南大学 一种基于通道扩张倒置卷积神经网络的图像分类方法
CN110799991A (zh) * 2017-06-28 2020-02-14 奇跃公司 用于使用卷积图像变换执行同时定位和映射的方法和***
CN110995382A (zh) * 2019-11-29 2020-04-10 中国科学院微电子研究所 基于元学习的避扰通信模型及其训练方法
CN111340907A (zh) * 2020-03-03 2020-06-26 曲阜师范大学 一种自适应属性和实例掩码嵌入图的文本到图像生成方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103489454A (zh) * 2013-09-22 2014-01-01 浙江大学 基于波形形态特征聚类的语音端点检测方法
CN110799991A (zh) * 2017-06-28 2020-02-14 奇跃公司 用于使用卷积图像变换执行同时定位和映射的方法和***
CN110211064A (zh) * 2019-05-21 2019-09-06 华南理工大学 一种基于边缘引导的混合退化文本图像恢复方法
CN110427990A (zh) * 2019-07-22 2019-11-08 浙江理工大学 一种基于卷积神经网络的艺术图像分类方法
CN110781912A (zh) * 2019-09-10 2020-02-11 东南大学 一种基于通道扩张倒置卷积神经网络的图像分类方法
CN110995382A (zh) * 2019-11-29 2020-04-10 中国科学院微电子研究所 基于元学习的避扰通信模型及其训练方法
CN111340907A (zh) * 2020-03-03 2020-06-26 曲阜师范大学 一种自适应属性和实例掩码嵌入图的文本到图像生成方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
安坤: "基于神经网络的梳状谱信号峰均比优化技术", 《中国电子科学研究院学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115170917A (zh) * 2022-06-20 2022-10-11 美的集团(上海)有限公司 图像处理方法、电子设备及存储介质
CN115170917B (zh) * 2022-06-20 2023-11-07 美的集团(上海)有限公司 图像处理方法、电子设备及存储介质

Also Published As

Publication number Publication date
CN112001431B (zh) 2022-06-28

Similar Documents

Publication Publication Date Title
Zhang et al. Latentgnn: Learning efficient non-local relations for visual recognition
CN111275107A (zh) 一种基于迁移学习的多标签场景图像分类方法及装置
CN109063719B (zh) 一种联合结构相似性和类信息的图像分类方法
Khasoggi et al. Efficient mobilenet architecture as image recognition on mobile and embedded devices
CN113344188A (zh) 基于通道注意力模块的轻量级神经网络模型
CN111259904B (zh) 一种基于深度学习和聚类的语义图像分割方法及***
CN111488917A (zh) 一种基于增量学习的垃圾图像细粒度分类方法
CN111461175B (zh) 自注意与协同注意机制的标签推荐模型构建方法及装置
CN113378938B (zh) 一种基于边Transformer图神经网络的小样本图像分类方法及***
CN113435520A (zh) 神经网络的训练方法、装置、设备及计算机可读存储介质
Yue et al. Face recognition based on histogram equalization and convolution neural network
CN114882278A (zh) 一种基于注意力机制和迁移学习的轮胎花纹分类方法和装置
Ale et al. Lightweight deep learning model for facial expression recognition
CN112001431B (zh) 一种基于梳状卷积的高效图像分类方法
Ge et al. Super-resolution reconstruction of biometric features recognition based on manifold learning and deep residual network
CN110728352A (zh) 一种基于深度卷积神经网络的大规模图像分类方法
Abdulsattar et al. Facial expression recognition using transfer learning and fine-tuning strategies: A comparative study
CN113239949A (zh) 一种基于1d分组卷积神经网络的数据重构方法
CN116109868A (zh) 基于轻量化神经网络的图像分类模型构建和小样本图像分类方法
Sang et al. Image recognition based on multiscale pooling deep convolution neural networks
Nie et al. Multi-scale CNNs for 3D model retrieval
Xia et al. Efficient synthesis of compact deep neural networks
CN112801153B (zh) 一种嵌入lbp特征的图的半监督图像分类方法及***
CN117036368A (zh) 图像数据处理方法、装置、计算机设备和存储介质
CN114220171A (zh) 一种基于层次有序残差网络结构的多尺度动作识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant