CN111860672A - 一种基于分块卷积神经网络的细粒度图像分类方法 - Google Patents

一种基于分块卷积神经网络的细粒度图像分类方法 Download PDF

Info

Publication number
CN111860672A
CN111860672A CN202010738474.1A CN202010738474A CN111860672A CN 111860672 A CN111860672 A CN 111860672A CN 202010738474 A CN202010738474 A CN 202010738474A CN 111860672 A CN111860672 A CN 111860672A
Authority
CN
China
Prior art keywords
block
convolution
fine
feature map
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010738474.1A
Other languages
English (en)
Other versions
CN111860672B (zh
Inventor
马占宇
谢吉洋
杜若一
司中威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN202010738474.1A priority Critical patent/CN111860672B/zh
Publication of CN111860672A publication Critical patent/CN111860672A/zh
Application granted granted Critical
Publication of CN111860672B publication Critical patent/CN111860672B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

一种基于分块卷积神经网络的细粒度图像分类方法,涉及细粒度图像识别技术领域,解决现有方法将原始图像平均分块后输入到卷积神经网络中用于细粒度图像分类,存在感受野限制较弱的问题,本发明不引入额外的参数与运算,在预测过程中保留通用卷积神经网络的高效性,不需要过大的感受野的特性将输入特征图进行分块,每块分别进行卷积操作后,再重新拼接,具有较强的限制性。本发明将卷积的感受野按需要进行限制,使网络更加关注局部区域的特征,更适合应用于细粒度图像分类任务。本发明所述的细粒度图像分类方法,在不引入更多参数的前提下,限制卷积层的感受野范围,使卷积神经网络能够寻找较小的有判别力的局部区域。

Description

一种基于分块卷积神经网络的细粒度图像分类方法
技术领域
本发明涉及细粒度图像识别技术领域,具体涉及一种基于分块卷积神经网络的细粒度图像分类方法。
背景技术
在细粒度图像识别技术领域中,现有基于人工智能和深度学习的方法大多直接将图像输入到卷积神经网络(Convolutional Neural Network,CNN)中,通过多层卷积和池化层操作,在前一层的输出特征图(Feature Map)上提取特征图,逐层提取并获得感受野(Receptive Field,RF),即特征图上每个特征点映射到输入图片上的范围)更大的特征图,最终得到感受野为整幅图像尺寸大小的特征图(理论感受野可能大于整幅图像尺寸大小)并用于细粒度图像分类。但是,多数现有方法主要通过在图像上寻找有判别力的局部区域,用于识别图像中物体的种类,例如鸟类中不同颜色的翅膀和不同形状的喙,机动车中不同形状的车灯和轮胎。在这种情况下,更小的感受野能够使模型更好地提取图像上的局部特征,进而寻找较小的有判别力的局部区域。然而,现有的卷积神经网络框架主要通过引入复杂度较高、参数量较大的操作,但是仍然很难限制卷积层的感受野大小。
细粒度视觉分类(Fine-Grained Visual Classification,FGVC)是传统图像分类任务的子任务,指的是对某特定类别物体进行更加细化的分类,例如:区分不同品种的鸟或狗、不同型号的汽车或飞机等。细粒度分类比传统分类任务更具有挑战性,因为目标物体与同类别物体的差异可能会大于目标物体与不同类别物体的差异,比如两只同类的鸟可能因为姿势不同,导致区别很大;而两只不同类的鸟,可能因为体态接近,只在鸟喙、鸟尾等局部区域有结构和纹理的差异。
随着深度学习的发展,CNN已经成为图像分类任务的主流解决方案。CNN主要由以下几部分组成:(1)卷积层,用于特征提取;(2)池化层,用于特征选择和信息过滤;(3)全连接层,对提取到的特征进行非线性组合以得到最终输出。在CNN中,RF的概念指的是指定层的输出特征图上一个特征点映射到输入图片上的范围,而卷积层和池化层都有增大感受野的效果,网络相邻层间的感受野关系计算方式为:
Figure BDA0002605832620000021
其中r(l)指第l层卷积层或池化层的感受野,k(l)指第l层卷积层或池化层的核大小,s(l′)指第l′层卷积层或池化层的步长。
现有的细粒度分类方法主要分为两种:(1)基于局部定位的方法,需要先利用卷积神经网络提取特征,并找到多个有判别力的区域,再对这些区域从原图上进行裁剪,分别执行特征提取与分类操作,导致预测时间较长;此外,这类方法大多要提前设定用于分类的区域个数,大大限制了模型的灵活性。(2)基于端到端特征编码的方法,这类方法大多会在全连接层之前生成一个高维向量,来提高模型表达能力以适应细粒度分类任务。而过高的维度带来的额外运算量则大大限制了模型效率。
对于传统的卷积神经网络来说,其普遍感受野很大,对一般的图像分类任务来说,这可以让模型依据更大范围的信息进行判断;但是对于细粒度任务来说,过大的感受野增加了类内差异对网络的影响,使其很难关注局部的细节。
现有文献《基于拼图与渐进式多粒度学***均分块并打乱分块后直接输入到卷积神经网络中用于细粒度图像分类,不同之处在于(1)该方法只在原始图像上进行分块;(2)该方法通过打乱分块的方法限制感受野,限制较弱。
发明内容
本发明为解决现有方法将原始图像平均分块后输入到卷积神经网络中用于细粒度图像分类,存在感受野限制较弱的问题,提供一种基于分块卷积神经网络的细粒度图像分类方法。
一种基于分块卷积神经网络的细粒度图像分类方法,设定分块卷积神经网络共有L个分块卷积层,l为当前分块卷积层的层数,1≤l≤L,初始化为l=1;该方法由以下步骤实现:
步骤一、对于第l个分块卷积层f(·;Ω(l)),获取其输入特征图为x(l);所述
Figure BDA0002605832620000022
为卷积核参数,R表示实数,c(l)为输入特征图通道数,c(l+1)为输出特征图通道数,·表示函数的输入,
Figure BDA0002605832620000031
Figure BDA0002605832620000032
为每个卷积核的宽和高;
Figure BDA0002605832620000033
表示维度为
Figure BDA0002605832620000034
的实矩阵;
所述输入特征图
Figure BDA0002605832620000035
为第l-1个分块卷积层的输出特征图,x(1)为模型输入,W(l)和H(l)为输入特征图的宽和高;
步骤二、当l=1时,设置m1=n1=1;当l>1时,通过下式计算输入特征图上的每行分块数ml和每列分块数nl
Figure BDA0002605832620000036
Figure BDA0002605832620000037
式中,
Figure BDA0002605832620000038
Figure BDA0002605832620000039
分别为输入特征图x(l)的理论感受野的宽和高,且
Figure BDA00026058326200000310
Figure BDA00026058326200000311
为所述理论感受野在宽和高维度上的收缩因子,
Figure BDA00026058326200000312
Figure BDA00026058326200000313
分别为第l′层分块卷积层的卷积核在特征图的宽和高维度上的步长,
Figure BDA00026058326200000314
为向上取整操作;
步骤三、根据步骤二中获得的输入特征图上每行每列分块数ml和nl,随机采样获得特征图分块的宽
Figure BDA00026058326200000315
和高
Figure BDA00026058326200000316
并且
Figure BDA00026058326200000317
i=1,…,ml
Figure BDA00026058326200000318
j=1,…,nl均为正整数,
Figure BDA00026058326200000319
步骤四、根据步骤三获得的特征图分块的宽
Figure BDA00026058326200000320
和高
Figure BDA00026058326200000321
将输入的特征图x(l)分成ml×nl块,获得分块特征图集合
Figure BDA00026058326200000322
Figure BDA00026058326200000323
步骤五、采用步骤一中的卷积核参数Ω(l)分别对步骤四获得的所有
Figure BDA00026058326200000324
进行卷积,获得对应卷积输出特征图
Figure BDA00026058326200000325
步骤六、将步骤五获得的卷积输出特征图
Figure BDA00026058326200000326
按原位置进行拼接,获得分块卷积神经网络中的第l个卷积层的输出特征图
Figure BDA00026058326200000327
步骤七、对于L个分块卷积层,均按照步骤一至六进行操作,直至获得最后第L个分块卷积层的输出特征图x(L+1),将x(L+1)输入到全连接层中,获得细粒度图像分类的输出概率p∈Rn,n是类别数,实现细粒度图像的分类。
本发明的有益效果:本发明所述的细粒度图像分类方法,可以将卷积的感受野按需要进行限制,使网络更加关注局部区域的特征,更适合应用于细粒度图像分类任务。同时,本发明并没有引入额外的参数与运算,在预测过程中可以保留通用卷积神经网络的高效性。
本发明所述的细粒度图像分类中不需要过大的感受野的特性将输入特征图进行分块,每块分别进行卷积操作后,再重新拼接,具有较强的限制性。
本发明所述的细粒度图像分类方法,在不引入更多参数的前提下,限制卷积层的感受野范围,使卷积神经网络能够寻找较小的有判别力的局部区域。
附图说明
图1为本发明所述的一种基于分块卷积神经网络的细粒度图像分类方法的流程图。
图2为本发明所述的一种基于分块卷积神经网络的细粒度图像分类方法的示意图,以ml=nl=4为例。
图3为本发明所述的一种基于分块卷积神经网络的细粒度图像分类方法具体实施方式二的示意图,以ml=nl=4为例。
具体实施方式
具体实施方式一、结合图1和图2说明本实施方式,一种基于分块卷积神经网络的细粒度图像分类方法,设定分块卷积神经网络共有L个分块卷积层,l为当前分块卷积层的层数,1≤l≤L,初始化为l=1;该方法由以下步骤实现:
步骤一、对于第l个分块卷积层f(·;Ω(l)),获取其输入特征图为x(l);“·”表示函数的输入,在输入不确定时可以用“·”表示。所述
Figure BDA0002605832620000041
为卷积核参数,R为实数,
Figure BDA0002605832620000042
表示维度为
Figure BDA0002605832620000043
的实矩阵,用于表示Ω(l)的大小;c(l)为输入特征图通道数,c(l+1)为输出特征图通道数,
Figure BDA0002605832620000044
Figure BDA0002605832620000045
为每个卷积核的宽和高;
所述输入特征图
Figure BDA0002605832620000046
为第l-1个分块卷积层的输出特征图,x(1)为模型输入,W(l)和H(l)为输入特征图的宽和高;
步骤二、当l=1时,设置m1=n1=1;当l>1时,通过下式计算输入特征图上的每行分块数ml和每列分块数nl
Figure BDA0002605832620000051
Figure BDA0002605832620000052
式中,
Figure BDA0002605832620000053
Figure BDA0002605832620000054
分别为输入特征图x(l)的理论感受野的宽和高,且
Figure BDA0002605832620000055
Figure BDA0002605832620000056
为所述理论感受野在宽和高维度上的收缩因子,
Figure BDA0002605832620000057
Figure BDA0002605832620000058
分别为第l′层分块卷积层的卷积核在特征图的宽和高维度上的步长,
Figure BDA0002605832620000059
为向上取整操作;所述理论感受野的宽和高维度上的收缩因子的范围分别为:
Figure BDA00026058326200000510
步骤三、根据步骤二中获得的输入特征图上每行每列分块数ml和nl,随机采样获得特征图分块的宽
Figure BDA00026058326200000511
和高
Figure BDA00026058326200000512
并且
Figure BDA00026058326200000513
i=1,…,ml
Figure BDA00026058326200000514
j=1,…,nl均为正整数,
Figure BDA00026058326200000515
步骤四、根据步骤三获得的特征图分块的宽
Figure BDA00026058326200000516
和高
Figure BDA00026058326200000517
将输入的特征图x(l)分成ml×nl块,获得分块特征图集合
Figure BDA00026058326200000518
Figure BDA00026058326200000519
步骤五、采用步骤一中的卷积核参数Ω(l)分别对步骤四获得的所有
Figure BDA00026058326200000520
进行卷积,获得对应卷积输出特征图
Figure BDA00026058326200000521
步骤六、将步骤五获得的卷积输出特征图
Figure BDA00026058326200000522
i=1,…,ml,j=1,…,nl按原位置进行拼接,获得分块卷积神经网络中的第l个卷积层的输出特征图
Figure BDA00026058326200000523
步骤七、对于L个分块卷积层,均按照步骤一至六进行操作,直至获得最后第L个分块卷积层的输出特征图x(L+1),将x(L+1)输入到全连接层中,获得细粒度图像分类的输出概率p∈Rn,n是类别数,实现细粒度图像的分类。
步骤八、在模型训练过程中,使用交叉熵LCE(t,p)和真实类别t对细粒度图像分类的输出概率p进行优化:
LCE(t,p)=-ln pt
具体实施方式二、结合图3说明本实施方式,本实施方式为具体实施方式一所述的一种基于分块卷积神经网络的细粒度图像分类方法的实施例:本实施例能够在完成分块卷积操作的同时,简化操作,提高分块卷积效率。设定分块卷积神经网络共有L个分块卷积层,l为当前分块卷积层的层数,1≤l≤L,初始化为l=1;
步骤1、对于分块卷积神经网络中的第l个分块卷积层f(·;Ω(l)),“·”表示函数的输入。
Figure BDA0002605832620000061
是其卷积核参数,R为实数,
Figure BDA0002605832620000062
表示维度为
Figure BDA0002605832620000063
的实矩阵,用于表示Ω(l)的大小;c(l)是输入特征图通道数,
Figure BDA0002605832620000064
Figure BDA0002605832620000065
是每个卷积核的宽和高,获取其输入特征图
Figure BDA0002605832620000066
为第l-1个分块卷积层的输出特征图,W(l)和H(l)是输入特征图的宽和高;
步骤2、根据提前设定好的特征图上每行每列分块数ml和nl,随机采样得到特征图分块的宽
Figure BDA0002605832620000067
和高
Figure BDA0002605832620000068
并且
Figure BDA0002605832620000069
i=1,…,ml
Figure BDA00026058326200000610
j=1,…,nl均为正整数,
Figure BDA00026058326200000611
步骤3、在输入的特征图x(l)上按列每隔
Figure BDA00026058326200000612
***
Figure BDA00026058326200000613
列全零列向量,按行每隔
Figure BDA00026058326200000614
***
Figure BDA00026058326200000615
行全零行向量,
Figure BDA00026058326200000616
Figure BDA00026058326200000617
是卷积核在特征图的宽和高维度上的步长,
Figure BDA00026058326200000618
为向下取整操作,获得处理后的特征图
Figure BDA00026058326200000619
步骤4、采用卷积核参数Ω(l)
Figure BDA0002605832620000071
进行卷积,获得卷积输出特征图
Figure BDA0002605832620000072
步骤5、按照步骤3中***全零列向量和行向量的位置,将卷积输出特征图
Figure BDA0002605832620000073
中***的向量去除,去除的列标号为
Figure BDA0002605832620000074
Figure BDA0002605832620000075
去除的行标号为
Figure BDA0002605832620000076
获得分块卷积神经网络中的第l个卷积层的输出特征图
Figure BDA0002605832620000077
步骤6、对于所有分块卷积层,均按照步骤1至5进行操作,直至获得最后一个分块卷积层(第L层)的输出特征图x(L+1),将x(L+1)输入到全连接层中得到细粒度图像分类的输出概率p;
本实施方式中使用交叉熵(Cross Entropy,CE)LCE(t,p)和真实类别t对细粒度图像分类的输出概率p进行优化。

Claims (4)

1.一种基于分块卷积神经网络的细粒度图像分类方法,设定分块卷积神经网络共有L个分块卷积层,l为当前分块卷积层的层数,1≤l≤L,初始化为l=1;其特征是:
该方法由以下步骤实现:
步骤一、对于第l个分块卷积层f(·;Ω(l)),获取其输入特征图为x(l);所述
Figure FDA0002605832610000011
为卷积核参数,R表示实数,c(l)为输入特征图通道数,c(l+1)为输出特征图通道数,·表示函数的输入,
Figure FDA0002605832610000012
Figure FDA0002605832610000013
为每个卷积核的宽和高;
Figure FDA0002605832610000014
表示维度为
Figure FDA0002605832610000015
的实矩阵;
所述输入特征图
Figure FDA0002605832610000016
为第l-1个分块卷积层的输出特征图,x(1)为模型输入,W(l)和H(l)为输入特征图的宽和高;
步骤二、当l=1时,设置m1=n1=1;当l>1时,通过下式计算输入特征图上的每行分块数ml和每列分块数nl
Figure FDA0002605832610000017
Figure FDA0002605832610000018
式中,
Figure FDA0002605832610000019
Figure FDA00026058326100000110
分别为输入特征图x(l)的理论感受野的宽和高,且
Figure FDA00026058326100000111
Figure FDA00026058326100000112
Figure FDA00026058326100000113
为所述理论感受野在宽和高维度上的收缩因子,
Figure FDA00026058326100000114
Figure FDA00026058326100000115
分别为第l′层分块卷积层的卷积核在特征图的宽和高维度上的步长,
Figure FDA00026058326100000116
为向上取整操作;
步骤三、根据步骤二中获得的输入特征图上每行每列分块数ml和nl,随机采样获得特征图分块的宽
Figure FDA00026058326100000117
和高
Figure FDA00026058326100000118
并且
Figure FDA00026058326100000119
Figure FDA00026058326100000120
均为正整数,
Figure FDA00026058326100000121
步骤四、根据步骤三获得的特征图分块的宽
Figure FDA0002605832610000021
和高
Figure FDA0002605832610000022
将输入的特征图x(l)分成ml×nl块,获得分块特征图集合
Figure FDA0002605832610000023
Figure FDA0002605832610000024
步骤五、采用步骤一中的卷积核参数Ω(l)分别对步骤四获得的所有
Figure FDA0002605832610000025
进行卷积,获得对应卷积输出特征图
Figure FDA0002605832610000026
步骤六、将步骤五获得的卷积输出特征图
Figure FDA0002605832610000027
按原位置进行拼接,获得分块卷积神经网络中的第l个卷积层的输出特征图
Figure FDA0002605832610000028
步骤七、对于L个分块卷积层,均按照步骤一至六进行操作,直至获得最后第L个分块卷积层的输出特征图x(L+1),将x(L+1)输入到全连接层中,获得细粒度图像分类的输出概率p∈Rn,n是类别数,实现细粒度图像的分类。
2.根据权利要求1所述的一种基于分块卷积神经网络的细粒度图像分类方法,其特征在于:还包括步骤八,采用交叉熵LCE(t,p)和真实类别t对细粒度图像分类的输出概率p进行优化:
LCE(t,p)=-lnpt
3.根据权利要求1所述的一种基于分块卷积神经网络的细粒度图像分类方法,其特征在于:步骤二中,所述理论感受野的宽和高维度上的收缩因子的范围分别为:
Figure FDA0002605832610000029
4.根据权利要求1所述的一种基于分块卷积神经网络的细粒度图像分类方法,其特征在于:采用下述步骤替换步骤二至步骤六,具体为:
步骤A、设定所述输出特征图上的每行每列分块数ml和nl,随机采样得到特征图分块的宽
Figure FDA00026058326100000210
和高
Figure FDA00026058326100000211
并且
Figure FDA00026058326100000212
Figure FDA00026058326100000213
均为正整数,
Figure FDA00026058326100000214
步骤B、在输入的特征图x(l)上按列每隔
Figure FDA00026058326100000215
***
Figure FDA00026058326100000216
列全零列向量,按行每隔
Figure FDA00026058326100000217
***
Figure FDA00026058326100000218
行全零行向量,
Figure FDA00026058326100000219
Figure FDA00026058326100000220
Figure FDA00026058326100000221
分别为卷积核在特征图宽和高维度上的步长,
Figure FDA0002605832610000031
为向下取整操作,获得处理后的特征图
Figure FDA0002605832610000032
步骤C、采用步骤一获得的卷积核参数Ω(l)
Figure FDA0002605832610000033
直接进行卷积,获得卷积输出特征图
Figure FDA0002605832610000034
步骤D:按照步骤C中***全零列向量和行向量的位置,将卷积输出特征图
Figure FDA0002605832610000035
中***的向量去除,去除的列标号为
Figure FDA0002605832610000036
Figure FDA0002605832610000037
去除的行标号为
Figure FDA0002605832610000038
获得分块卷积神经网络中的第l个卷积层的输出特征图
Figure FDA0002605832610000039
CN202010738474.1A 2020-07-28 2020-07-28 一种基于分块卷积神经网络的细粒度图像分类方法 Active CN111860672B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010738474.1A CN111860672B (zh) 2020-07-28 2020-07-28 一种基于分块卷积神经网络的细粒度图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010738474.1A CN111860672B (zh) 2020-07-28 2020-07-28 一种基于分块卷积神经网络的细粒度图像分类方法

Publications (2)

Publication Number Publication Date
CN111860672A true CN111860672A (zh) 2020-10-30
CN111860672B CN111860672B (zh) 2021-03-16

Family

ID=72948450

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010738474.1A Active CN111860672B (zh) 2020-07-28 2020-07-28 一种基于分块卷积神经网络的细粒度图像分类方法

Country Status (1)

Country Link
CN (1) CN111860672B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113052008A (zh) * 2021-03-01 2021-06-29 深圳市捷顺科技实业股份有限公司 一种车辆重识别方法及装置

Citations (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104331447A (zh) * 2014-10-29 2015-02-04 邱桃荣 布料色卡图像检索方法
US20160342863A1 (en) * 2013-08-14 2016-11-24 Ricoh Co., Ltd. Hybrid Detection Recognition System
CN106462549A (zh) * 2014-04-09 2017-02-22 尹度普有限公司 使用从显微变化中进行的机器学习来鉴定实体对象
US20170061257A1 (en) * 2013-12-16 2017-03-02 Adobe Systems Incorporated Generation of visual pattern classes for visual pattern regonition
CN106650786A (zh) * 2016-11-14 2017-05-10 沈阳工业大学 基于多列卷积神经网络模糊评判的图像识别方法
CN106951872A (zh) * 2017-03-24 2017-07-14 江苏大学 一种基于无监督深度模型与层次属性的行人再识别方法
CN107680106A (zh) * 2017-10-13 2018-02-09 南京航空航天大学 一种基于Faster R‑CNN的显著性目标检测方法
CN108537283A (zh) * 2018-04-13 2018-09-14 厦门美图之家科技有限公司 一种图像分类方法及卷积神经网络生成方法
CN109191457A (zh) * 2018-09-21 2019-01-11 中国人民解放军总医院 一种病理图像质量有效性识别方法
CN109190622A (zh) * 2018-09-11 2019-01-11 深圳辉煌耀强科技有限公司 基于强特征和神经网络的上皮细胞分类***和方法
CN109255375A (zh) * 2018-08-29 2019-01-22 长春博立电子科技有限公司 基于深度学习的全景图像对象检测方法
CN109344856A (zh) * 2018-08-10 2019-02-15 华南理工大学 一种基于多层判别式特征学习的脱机签名鉴别方法
CN109711448A (zh) * 2018-12-19 2019-05-03 华东理工大学 基于判别关键域和深度学习的植物图像细粒度分类方法
CN109857889A (zh) * 2018-12-19 2019-06-07 苏州科达科技股份有限公司 一种图像检索方法、装置、设备及可读存储介质
CN109978077A (zh) * 2019-04-08 2019-07-05 南京旷云科技有限公司 视觉识别方法、装置和***及存储介质
CN110084285A (zh) * 2019-04-08 2019-08-02 安徽艾睿思智能科技有限公司 基于深度学习的鱼类细粒度分类方法
CN110110692A (zh) * 2019-05-17 2019-08-09 南京大学 一种基于轻量级全卷积神经网络的实时图像语义分割方法
US10503978B2 (en) * 2017-07-14 2019-12-10 Nec Corporation Spatio-temporal interaction network for learning object interactions
US20200026942A1 (en) * 2018-05-18 2020-01-23 Fudan University Network, System and Method for Image Processing
CN110914829A (zh) * 2017-04-07 2020-03-24 英特尔公司 使用改进的卷积神经网络用于图像处理的方法和***
CN110958187A (zh) * 2019-12-17 2020-04-03 电子科技大学 一种面向分布式机器学习参数同步差异化数据传输方法
CN111047038A (zh) * 2019-11-08 2020-04-21 南昌大学 一种利用分块循环矩阵的神经网络压缩方法
CN111178432A (zh) * 2019-12-30 2020-05-19 武汉科技大学 多分支神经网络模型的弱监督细粒度图像分类方法
CN111414954A (zh) * 2020-03-17 2020-07-14 重庆邮电大学 一种岩石图像检索方法及其***

Patent Citations (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160342863A1 (en) * 2013-08-14 2016-11-24 Ricoh Co., Ltd. Hybrid Detection Recognition System
US20170061257A1 (en) * 2013-12-16 2017-03-02 Adobe Systems Incorporated Generation of visual pattern classes for visual pattern regonition
CN106462549A (zh) * 2014-04-09 2017-02-22 尹度普有限公司 使用从显微变化中进行的机器学习来鉴定实体对象
CN104331447A (zh) * 2014-10-29 2015-02-04 邱桃荣 布料色卡图像检索方法
CN106650786A (zh) * 2016-11-14 2017-05-10 沈阳工业大学 基于多列卷积神经网络模糊评判的图像识别方法
CN106951872A (zh) * 2017-03-24 2017-07-14 江苏大学 一种基于无监督深度模型与层次属性的行人再识别方法
CN110914829A (zh) * 2017-04-07 2020-03-24 英特尔公司 使用改进的卷积神经网络用于图像处理的方法和***
US10503978B2 (en) * 2017-07-14 2019-12-10 Nec Corporation Spatio-temporal interaction network for learning object interactions
CN107680106A (zh) * 2017-10-13 2018-02-09 南京航空航天大学 一种基于Faster R‑CNN的显著性目标检测方法
CN108537283A (zh) * 2018-04-13 2018-09-14 厦门美图之家科技有限公司 一种图像分类方法及卷积神经网络生成方法
US20200026942A1 (en) * 2018-05-18 2020-01-23 Fudan University Network, System and Method for Image Processing
CN109344856A (zh) * 2018-08-10 2019-02-15 华南理工大学 一种基于多层判别式特征学习的脱机签名鉴别方法
CN109255375A (zh) * 2018-08-29 2019-01-22 长春博立电子科技有限公司 基于深度学习的全景图像对象检测方法
CN109190622A (zh) * 2018-09-11 2019-01-11 深圳辉煌耀强科技有限公司 基于强特征和神经网络的上皮细胞分类***和方法
CN109191457A (zh) * 2018-09-21 2019-01-11 中国人民解放军总医院 一种病理图像质量有效性识别方法
CN109711448A (zh) * 2018-12-19 2019-05-03 华东理工大学 基于判别关键域和深度学习的植物图像细粒度分类方法
CN109857889A (zh) * 2018-12-19 2019-06-07 苏州科达科技股份有限公司 一种图像检索方法、装置、设备及可读存储介质
CN109978077A (zh) * 2019-04-08 2019-07-05 南京旷云科技有限公司 视觉识别方法、装置和***及存储介质
CN110084285A (zh) * 2019-04-08 2019-08-02 安徽艾睿思智能科技有限公司 基于深度学习的鱼类细粒度分类方法
CN110110692A (zh) * 2019-05-17 2019-08-09 南京大学 一种基于轻量级全卷积神经网络的实时图像语义分割方法
CN111047038A (zh) * 2019-11-08 2020-04-21 南昌大学 一种利用分块循环矩阵的神经网络压缩方法
CN110958187A (zh) * 2019-12-17 2020-04-03 电子科技大学 一种面向分布式机器学习参数同步差异化数据传输方法
CN111178432A (zh) * 2019-12-30 2020-05-19 武汉科技大学 多分支神经网络模型的弱监督细粒度图像分类方法
CN111414954A (zh) * 2020-03-17 2020-07-14 重庆邮电大学 一种岩石图像检索方法及其***

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
KRIZHEVSKY A等: "ImageNet classification with deep convolutional neural networks", 《PROCEEDINGS OF THE 25TH INTERNATIONAL CONFERENCE ON NEURAL INFORMATION PROCESSING SYSTEMS》 *
MA,ZHANYU等: "Beta mixture models and the application to image classification", 《2009 16TH IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING》 *
YAO B P等: "A codebook-free and annotation-free approach for fine-grained image categorization", 《PROCEEDINGS OF THE 2012 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 *
罗建豪等: "基于深度卷积特征的细粒度图像分类研究综述", 《自动化学报》 *
郭玉荣等: "端到端双通道特征重标定DenseNet图像分类", 《中国图象图形学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113052008A (zh) * 2021-03-01 2021-06-29 深圳市捷顺科技实业股份有限公司 一种车辆重识别方法及装置

Also Published As

Publication number Publication date
CN111860672B (zh) 2021-03-16

Similar Documents

Publication Publication Date Title
CN110443842B (zh) 基于视角融合的深度图预测方法
CN110414394B (zh) 一种面部遮挡人脸图像重建方法以及用于人脸遮挡检测的模型
CN109492666B (zh) 图像识别模型训练方法、装置及存储介质
CN108288035A (zh) 基于深度学习的多通道图像特征融合的人体动作识别方法
CN109741341B (zh) 一种基于超像素和长短时记忆网络的图像分割方法
CN107680106A (zh) 一种基于Faster R‑CNN的显著性目标检测方法
CN113705641B (zh) 基于富上下文网络的高光谱图像分类方法
CN112288011A (zh) 一种基于自注意力深度神经网络的图像匹配方法
CN115082966B (zh) 行人重识别模型训练方法、行人重识别方法、装置和设备
CN111784699B (zh) 一种对三维点云数据进行目标分割方法、装置及终端设备
CN111723915A (zh) 深度卷积神经网络的剪枝方法、计算机设备及应用方法
CN112862871A (zh) 图像融合方法及装置
CN110619059A (zh) 一种基于迁移学习的建筑物标定方法
CN114821058A (zh) 一种图像语义分割方法、装置、电子设备及存储介质
CN112101364A (zh) 基于参数重要性增量学习的语义分割方法
CN111860672B (zh) 一种基于分块卷积神经网络的细粒度图像分类方法
CN114565628B (zh) 一种基于边界感知注意的图像分割方法及***
CN110084820B (zh) 基于改进fcm算法的紫色土图像自适应分割提取方法
CN111310820A (zh) 基于交叉验证深度cnn特征集成的地基气象云图分类方法
Sun et al. Iterative, deep synthetic aperture sonar image segmentation
CN111275616A (zh) 低空航拍图像拼接方法和装置
CN117237623B (zh) 一种无人机遥感图像语义分割方法及***
CN113361589A (zh) 基于迁移学习与知识蒸馏的珍稀濒危植物叶片识别方法
CN108805811B (zh) 一种基于非凸二次规划的自然图像智能拼图方法及***
CN115359281A (zh) 基于深度子空间聚类顺序集成的图像聚类方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant