CN111259904B - 一种基于深度学习和聚类的语义图像分割方法及*** - Google Patents

一种基于深度学习和聚类的语义图像分割方法及*** Download PDF

Info

Publication number
CN111259904B
CN111259904B CN202010047315.7A CN202010047315A CN111259904B CN 111259904 B CN111259904 B CN 111259904B CN 202010047315 A CN202010047315 A CN 202010047315A CN 111259904 B CN111259904 B CN 111259904B
Authority
CN
China
Prior art keywords
convolution
clustering
layer
neural network
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010047315.7A
Other languages
English (en)
Other versions
CN111259904A (zh
Inventor
郭丽
刘知贵
张小乾
白克强
薛旭倩
刘道广
李理
张活力
吴均
付聪
喻琼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest University of Science and Technology
Original Assignee
Southwest University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest University of Science and Technology filed Critical Southwest University of Science and Technology
Priority to CN202010047315.7A priority Critical patent/CN111259904B/zh
Publication of CN111259904A publication Critical patent/CN111259904A/zh
Application granted granted Critical
Publication of CN111259904B publication Critical patent/CN111259904B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度学习和聚类的语义图像分割方法和***,包括以下步骤:S1:通过卷积神经网络,对原图像进行卷积和池化,得到原图像的线性特征矩阵;S2:将所述线性特征矩阵,进行子空间聚类,得到聚类后的特征数据;S3:将所述聚类后的特征数据,通过反卷积和上采样,处理至与原图像相同的像素,得到分割后的图像。本发明将深度神经网络中的卷积神经网络(CNN)与子空间聚类相结合,又用稀疏子空间替代CNN中全连接层的方式,解决了现有技术中语义图像分割计算复杂,数据量大而信息贫乏的问题。在神经网络中引入子空间聚类方法,减少了CNN工作时需要的大量标记数据,实现对CNN神经网络的无监督学习。

Description

一种基于深度学习和聚类的语义图像分割方法及***
技术领域
本发明涉及机器视觉领域,具体涉及一种基于深度学习和聚类的语义图像分割方法和***。
背景技术
语义图像分割的目的是分类出每一块区域的语义,即这块区域是什么物体,也就是从图像中把所有物体都指出它们各自的类别,并分割出来。目前通常采用分割的方式有采用深度学习神经网络工具实现图像分割和子空聚类方式。但他们各自存在优缺点。
深度学习神经网络方式通过让计算机自动学习方式提取特征数据,将特征学习融入到建立模型过程中,减少了人为设计特征造成的不完备,已达到了分类性能较优的特点,但是往往为了达到很好的精度,需要大数据支撑,尤其全连接层的网络参数量非常大,甚至比多个卷积层的参数量还要大得多,导致***计算的时间复杂度急剧提升。
子空间聚类是实现高维数据聚类的而有效途径,预先进行降维,常利用子空间聚类方法构建出有利于分割的图来解决复杂图像分割问题,复杂图像区域特征数据维度较高且存在大量无关属性,难以形成簇,即数据丰富而信息贫乏问题。但是,子空间聚类方法要求数据之间线性表示,可现实图像数据通常不能在输入空间中互相线性地表示,此时子空间分割就变得困难,目前一般采用基于内核的方法,但内核方法类似于基于模板的方法,其性能在很大程度上取决于内核函数的选择,内核函数选择又具有经验性,且非线性变换不明确,不能确定预定义内核是否会产生适合子空间聚类的隐式特征空间,给处理大规模数据集时带来困难。
发明内容
本发明所要解决的技术问题是现有语义图像分割技术中,***数据量大且计算复杂和特征数据难以形成簇,不便于提取特征数据的问题,目的在于提供一种基于深度学习和聚类的语义图像分割方法和***,解决如何避免复杂计算和更好提取特征数据的问题。
本发明通过下述技术方案实现:
一种基于深度学习和聚类的语义图像分割方法,其特征在于,包括以下步骤:
S1:通过卷积神经网络,对原图像进行卷积和池化,得到原图像的线性特征矩阵;
S2:将所述线性特征矩阵,进行子空间聚类,得到聚类后的特征数据;
S3:将所述聚类后的特征数据,通过反卷积和上采样,处理至与原图像相同的像素,得到分割后的图像。
首先采用深度学习方法通过卷积神经网络,对原图像特征数据进行多层卷积和池化,也就是一个分层非线性变换的过程,得到原图像的线性特征矩阵,并通过最高池化层传输到子空间聚类层,由于通过卷积和池化后的图像特征具有线性,使得子空间分割就变得容易。通过对子空间进行重构稀疏后,得到一个亲和度矩阵,再用谱聚类的方式进行聚类。本发明用子空间聚类层替代卷积神经网络的全连接层,减少了全连接层分类模式带来的计算时间长和计算难度大。再通过稀疏子空间聚类方法实现了对特征数据的聚类,最后为了提高分割精度,本发明采用由深度神经网络中的反卷积和上采样的方式,将分割后的图像恢复至原像素后输出。
进一步的,所述卷积神经网络包括由低到高的多层网络,每层网络均包括卷积和池化,所述步骤S1包括以下子步骤:
所述卷积神经网络的低层网络,使用M卷积核进行卷积运算,通过池化提取到简单共性特征数据,在所述卷积神经网络的高层网络,使用N卷积核进行卷积运算,通过池化提取到复杂共性特征数据,所述M卷积核的数量少于所述N卷积核的数量;
所述卷积神经网络的每一层网络卷积和池化的对象,为上一层网络所得的共性特征数据,所述卷积神经网络的最低层网络卷积和池化的对象,为原图像;
所述卷积神经网络的最高层网络卷积和池化得到的共性特征数据形成线性矩阵,所述线性矩阵为原图像的线性特征矩阵。
本发明是基于深度学习和聚类的语义图像分割,通过学习一个明确的映射,使子空间更加可分。即首先采用深度学习方法通过卷积神经网络实现对特征数据分层非线性变换提取,即依次从低层网络通过较少卷积核卷积运算提取简单共性的特征,到高层网络选用较多卷积核实现对复杂特征的提取,然后将最高层池化层提取的特征通过稀疏子空间聚类方法实现特征数据聚类,最后经由深度神经网络构成的解码层将分割后的图像恢复原像素后输出。
进一步的,所述子空间聚类为稀疏子空间聚类,所述步骤S2包括以下子步骤:将所述线性特征矩阵通过子空间进行稀疏化处理,得到稀疏系数矩阵,根据所述稀疏系数矩阵,计算图像各接点之间的相似度,得到亲和度矩阵,对所述亲和度矩阵进行谱聚类,得到聚类后的特征数据。优选的,通过稀疏系数将所述线性特征矩阵分割成不同的子空间。优选的,所述谱聚类采用K均值聚类算法。
进一步的,步骤S3所述反卷积的卷积层数与步骤S1所述卷积的卷积层数相同。当图像特征数据映射被修复为,与原输入图像分辨率相同的时候,即可停止卷积操作,得到分割后的图像。
另外,一种基于深度学习和聚类的语义图像分割***,包括:
输入单元:用于输入原图像;
编码单元:用于通过卷积神经网络,对原图像进行卷积和池化,得到原图像的线性特征矩阵;
聚类单元:用于将所述线性特征矩阵,进行子空间聚类,得到聚类后的特征数据;
解码单元:用于将所述聚类后的特征数据,通过反卷积和上采样,处理至与原图像相同的像素,得到分割后的图像;
输出单元:用于输出所述分割后的图像。
本发明与现有技术相比,具有如下的优点和有益效果:
卷积神经网络具有提取图像数据特征,而且是监督学习,同时在神经网络中引入子空间聚类方法可通过谱聚类的输出,监督卷积编码层各层特征学习模块,减少卷积神经网络工作时需要的大量标记数据,实现对卷积神经网络的无监督学习,避免了卷积神经网络全连接层对大量数据的运算。通过卷积神经网络学习一组显式非线性映射函数,以将输入映射到另一个空间,并使用新空间中的样本表示来计算亲和度矩阵,从而实现子空间聚类方法。通过神经网络训练后降低特征数据噪声,提高子空间聚类模型对噪声的鲁棒性。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1为本发明示意图。
图2为实施例2的设计框图。
图3为全连接层神经网络。
图4为子空间聚类层替代全连接层设计原理图。
图5为实施例4的特征分类结果。
图6全连接层分类示意图。
图7为实施例5卷积神经网络解码层设计框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例1
本实施例是一种基于深度学习和聚类的语义图像分割方法,设计原理如图1所示。即首先采用深度学习方法通过卷积神经网络(CNN)的编码层,实现对原图像的特征数据进行分层非线性变换,并通过最高池化层传输到子空间聚类层,通过稀疏子空间聚类方法实现特征数据聚类,最后为了提高分割精度,本发明采用由深度神经网络构成的解码层将分割后的图像恢复原像素后输出。
实施例2
本实施例是在实施例1的基础上,详细阐述深度神经网络编码层的原理。此编码层的深度神经网络可选BP神经网络、RNN神经网络、CNN等神经网络架构。本发明中利用卷积神经网络(CNN)从图像信息中提取数据特征的强大功能,在深度神经网络编码器层采用卷积神经网络(CNN)架构,卷积层1-池化层1-卷积层2-池化层2-卷积层3-池化层3-卷积层4-池化层4…卷积层n-池化层n等层构成,通过多卷积核等实现对输入图片进行数据特征提取和信息过滤,直到得到信息价值更高更干净的数据即可停止卷积操作。此设计方法相对于通常用原始数据直接作为输入,具有数据分层多线性变化、降低子空间表示误差,提高子空间聚类模型对噪声的鲁棒性。卷积神经网络编码层设计框图如图2所示。
实施例3
本实施例是在实施例1的基础上,详细阐述子空间聚类层设计方法,用稀疏子空间聚类方法替代CNN深度神经网络的全连接层。全连接层的网络参数量非常大,甚至比多个卷积层的参数量还要大得多,以图3为例,若最大池化成输出20个12*12的图像,经过全连接第一层100个神经元作用后,整张图就有100*20*12*12=288000个参数,这无疑增加了计算时间和难度。本发明避免了全连接产生分类模式,采用了在深度神经网络结构中引入稀疏子空间聚类方法,对前端顶层卷积层输出的特征矩阵利用稀疏子空间聚类方法实现对特征数据的分类,使子空间更加可分,如本设计中将整张图片的图像特征分成k个子空间
Figure BDA0002369892620000041
此外,稀疏子空间聚类方法明确了前端神经网络的训练目标:学习重建输入数据误差最小。全连接层中各节点之间的权值为相应节点之间的相似度,所有权值组成X=XC中的C是系数矩阵,其进一步构建数据点之间的亲和度矩阵,利用谱聚类方法实现数据聚类。子空间聚类层替代全连接层设计原理图如图4所示。子空间表示系数计算方法:
子空间表示模型:min||C||1s.t.X=XC,Cii=0。
使用交替双向乘子法令f(c)=X-XC,
Figure BDA0002369892620000042
计算步骤:1、
Figure BDA0002369892620000043
2、λk+1=λkkh(Ck+1)
结果:通过子空间表示系数计算,得到系数矩阵C
相似度矩阵计算方法:W=(|C|+|CT|)/2
本发明使用子空间聚类层代替全连接层设计方法的好处是减少CNN工作时需要的大量标记数据,实现对神经网络的无监督学习。
实施例4
本实施例是在实施例3的基础上,以对6组特征数据矩阵实现对2类数据划分为例,说明子空间聚类层替代全连接层的过程。利用稀疏矩阵计算公式:min||C||1 s.t.X=XC,Cii=0;其中X表示最高池化层输出的6个特征数据矩阵,C表示系数矩阵且为稀疏矩阵,如式(1)所示:
Figure BDA0002369892620000051
通过采用交替双向乘子法对式(1)中的系数矩阵
Figure BDA0002369892620000052
的构建,得出系数矩阵其0向量很多,如式(2)中的矩阵C/。
Figure BDA0002369892620000053
该矩阵中含0的系数比较多,即可以用很少的数据量表示特征中的数,以式(1)中的X11用6组数据中相应的其他数据表示如式(3)所示:
Figure BDA0002369892620000061
X11=X12*0+X13*1/2+X14*1/2+X15*0+X16*0
X12=X11*0+X13*0+X14*0+X15*1/4+X16*3/4
………………………
………………………
………………………
X16=X11*0+X12*1/2+X13*0+X14*0+X15*1/2
即通过很少数据量计算就可将
Figure BDA0002369892620000062
Figure BDA0002369892620000063
Figure BDA0002369892620000064
这5组特征向量分类成图5所示
在对其特征值进行聚类前并不需要知道有A和B类,仅需知道类别数量即可完成分类,他并不需要像神经网络学习一样分类之前需要确切知道每类的类别。
实施例5
本实施例是以实施例4的计算条件下,采用全连接方式对6组特征数据矩阵实现对A、B两类数据分类过程:
第一步:需要给定A、B标签
第二步:建立全连接层,并构建隐含层,6组特征值中的所有向量共30个向量与隐含层中的每一层每一个神经元都要用权值连接并反复调整连接权权值。如图6所示。
实施例6
本实施例是在实施例1的基础上,详细阐述深度神经网络解码层的原理。输入图像经过深度神经网络编码器层的卷积和池化操作后输出的数据已经被压缩为较低像素的图像,如果直接用最高层图像特征进行分割,分割的目标图像边缘细节会比较模糊,因为CNN越高层的特征较复杂,语义信息更丰富,但CNN底层特征通常包含很多共性特征,包含更多的边缘、位置等信息。因此,为了提高图像分割精度在输出层输出清晰的分割图像,此时设计深度神经网络解码层,通过上采样和反卷积操作将特征图处理成原始图像大小。解码层具体由上采样层1-卷积层n+1-上采样层2-卷积层n+2-上采样层3-卷积层n+3…等层构成。为了防止过拟合现象,解码器中卷积层的层数可与编码层中卷积层层数相同,当特征映射被修复为与原输入图像分辨率相同的时候即可停止卷积操作,最后在输出层输出分割后的图像。深度神经网络解码层设计框图如图7所示。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于深度学习和聚类的语义图像分割方法,其特征在于,包括以下步骤:
S1:通过卷积神经网络,对原图像进行卷积和池化,得到原图像的线性特征矩阵;
S2:将所述线性特征矩阵,进行子空间聚类,用子空间聚类层替代卷积神经网络的全连接层,得到聚类后的特征数据;
S3:将所述聚类后的特征数据,通过反卷积和上采样,处理至与原图像相同的像素,得到分割后的图像;
其中,所述卷积神经网络包括由低到高的多层网络,每层网络均包括卷积和池化,所述步骤S1包括以下子步骤:
所述卷积神经网络的低层网络,使用M卷积核进行卷积运算,通过池化提取到简单共性特征数据,在所述卷积神经网络的高层网络,使用N卷积核进行卷积运算,通过池化提取到复杂共性特征数据,所述M卷积核的数量少于所述N卷积核的数量;
所述卷积神经网络的每一层网络卷积和池化的对象,为上一层网络所得的共性特征数据,所述卷积神经网络的最低层网络卷积和池化的对象,为原图像;
所述卷积神经网络的最高层网络卷积和池化得到的共性特征数据形成线性矩阵,所述线性矩阵为原图像的线性特征矩阵。
2.根据权利要求1所述的基于深度学习和聚类的语义图像分割方法,其特征在于,所述子空间聚类为稀疏子空间聚类,所述步骤S2包括以下子步骤:将所述线性特征矩阵通过子空间进行稀疏化处理,得到稀疏系数矩阵,根据所述稀疏系数矩阵,计算图像各接点之间的相似度,得到亲和度矩阵,对所述亲和度矩阵进行谱聚类,得到聚类后的特征数据。
3.根据权利要求1所述的基于深度学习和聚类的语义图像分割方法,其特征在于,通过稀疏系数将所述线性特征矩阵分割成不同的子空间。
4.根据权利要求2所述的基于深度学习和聚类的语义图像分割方法,其特征在于,所述谱聚类采用K均值聚类算法。
5.根据权利要求1所述的基于深度学习和聚类的语义图像分割方法,其特征在于,步骤S3所述反卷积的卷积层数与步骤S1所述卷积的卷积层数相同。
6.一种基于深度学习和聚类的语义图像分割***,其特征在于,包括:
输入单元:用于输入原图像;
编码单元:用于通过卷积神经网络,对原图像进行卷积和池化,得到原图像的线性特征矩阵;
聚类单元:用于将所述线性特征矩阵,进行子空间聚类,用子空间聚类层替代卷积神经网络的全连接层,得到聚类后的特征数据;
解码单元:用于将所述聚类后的特征数据,通过反卷积和上采样,处理至与原图像相同的像素,得到分割后的图像;
输出单元:用于输出所述分割后的图像;
其中,所述编码单元包括由低到高的多层网络,每层网络均包括卷积和池化,包括:
所述编码单元的低层网络,使用M卷积核进行卷积运算,通过池化提取到简单共性特征数据,所述编码单元的高层网络,使用N卷积核进行卷积运算,通过池化提取到复杂共性特征数据,所述M卷积核的数量少于所述N卷积核的数量;
所述编码单元的每一层网络卷积和池化的对象,为上一层网络所得的共性特征数据,所述编码单元的最低层网络卷积和池化的对象,为原图像;
所述编码单元的最高层网络卷积和池化得到的共性特征数据形成线性矩阵,所述线性矩阵为原图像的线性特征矩阵。
7.根据权利要求6所述的基于深度学习和聚类的语义图像分割***,其特征在于,所述聚类单元为稀疏子空间聚类单元,用于:将所述特征矩阵通过子空间进行稀疏化处理,得到亲和度矩阵,对所述亲和度矩阵进行谱聚类,得到聚类后的特征数据。
8.根据权利要求6所述的基于深度学习和聚类的语义图像分割***,其特征在于,所述解码单元进行反卷积的卷积层数与所述编码单元进行卷积的卷积层数相同。
CN202010047315.7A 2020-01-16 2020-01-16 一种基于深度学习和聚类的语义图像分割方法及*** Active CN111259904B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010047315.7A CN111259904B (zh) 2020-01-16 2020-01-16 一种基于深度学习和聚类的语义图像分割方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010047315.7A CN111259904B (zh) 2020-01-16 2020-01-16 一种基于深度学习和聚类的语义图像分割方法及***

Publications (2)

Publication Number Publication Date
CN111259904A CN111259904A (zh) 2020-06-09
CN111259904B true CN111259904B (zh) 2022-12-27

Family

ID=70954191

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010047315.7A Active CN111259904B (zh) 2020-01-16 2020-01-16 一种基于深度学习和聚类的语义图像分割方法及***

Country Status (1)

Country Link
CN (1) CN111259904B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112164067A (zh) * 2020-10-12 2021-01-01 西南科技大学 一种基于多模态子空间聚类的医学图像分割方法及装置
CN112784929B (zh) * 2021-03-14 2023-03-28 西北工业大学 一种基于双元组扩充的小样本图像分类方法及装置
CN113450351B (zh) * 2021-08-06 2024-01-30 推想医疗科技股份有限公司 分割模型训练方法、图像分割方法、装置、设备及介质
CN113821661B (zh) * 2021-08-30 2024-04-02 上海明略人工智能(集团)有限公司 图像检索方法、***、存储介质及电子设备
CN113793340B (zh) * 2021-08-31 2023-10-13 南京邮电大学 一种图像分割神经网络及远程生物成像方法及***
CN116260983A (zh) * 2021-12-03 2023-06-13 华为技术有限公司 图像编解码方法和装置
CN115331039A (zh) * 2022-08-15 2022-11-11 广州广电运通金融电子股份有限公司 图像自动标注方法、装置、设备及介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10565713B2 (en) * 2016-11-15 2020-02-18 Samsung Electronics Co., Ltd. Image processing apparatus and method
US20190205758A1 (en) * 2016-12-30 2019-07-04 Konica Minolta Laboratory U.S.A., Inc. Gland segmentation with deeply-supervised multi-level deconvolution networks
CN107169415B (zh) * 2017-04-13 2019-10-11 西安电子科技大学 基于卷积神经网络特征编码的人体动作识别方法
CN108734719A (zh) * 2017-04-14 2018-11-02 浙江工商大学 一种基于全卷积神经网络的鳞翅目昆虫图像前背景自动分割方法
CN107341517B (zh) * 2017-07-07 2020-08-11 哈尔滨工业大学 基于深度学习层级间特征融合的多尺度小物体检测方法
CN108010049A (zh) * 2017-11-09 2018-05-08 华南理工大学 使用全卷积神经网络分割定格动画中人手部区域的方法
CN108665463A (zh) * 2018-03-30 2018-10-16 哈尔滨理工大学 一种基于对抗式生成网络的宫颈细胞图像分割方法
CN108717568B (zh) * 2018-05-16 2019-10-22 陕西师范大学 一种基于三维卷积神经网络的图像特征提取与训练方法
CN109145920A (zh) * 2018-08-21 2019-01-04 电子科技大学 一种基于深度神经网络的图像语义分割方法
CN109784424B (zh) * 2019-03-26 2021-02-09 腾讯科技(深圳)有限公司 一种图像分类模型训练的方法、图像处理的方法及装置
CN110399840B (zh) * 2019-05-22 2024-04-02 西南科技大学 一种快速的草坪语义分割及边界检测方法
CN110599461B (zh) * 2019-08-21 2023-04-07 东南大学 一种基于子空间特征学习的丘脑功能分区方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Sparse Subspace Clustering: Algorithm, Theory, and Applications;Ehsan Elhamifar等;《IEEE Transactions on Pattern Analysis & Machine Intelligence》;20130920;第35卷(第11期);正文第2767-2768页 *
基于改进全卷积神经网络的玉米叶片病斑分割;王振等;《计算机工程与应用》;20190529;第55卷(第22期);正文第129-130页、图2-3 *
基于稀疏化双线性卷积神经网络的细粒度图像分类;马力等;《模式识别与人工智能》;20190415(第04期);正文第337页、图1 *

Also Published As

Publication number Publication date
CN111259904A (zh) 2020-06-09

Similar Documents

Publication Publication Date Title
CN111259904B (zh) 一种基于深度学习和聚类的语义图像分割方法及***
CN107798381B (zh) 一种基于卷积神经网络的图像识别方法
CN110136062B (zh) 一种联合语义分割的超分辨率重建方法
CN109711426B (zh) 一种基于gan和迁移学习的病理图片分类装置及方法
CN110826596A (zh) 一种基于多尺度可变形卷积的语义分割方法
CN110544297A (zh) 一种单幅图像的三维模型重建方法
CN113240683B (zh) 基于注意力机制的轻量化语义分割模型构建方法
CN109389667B (zh) 一种基于深度学习的高效全局光照明绘制方法
CN110363068A (zh) 一种基于多尺度循环生成式对抗网络的高分辨行人图像生成方法
CN113222124A (zh) 用于图像语义分割的SAUNet++网络与图像语义分割方法
CN112329801A (zh) 一种卷积神经网络非局部信息构建方法
CN115294563A (zh) 一种基于Transformer的增强了局部语义学习能力的3D点云分析方法及装置
Ahmad et al. 3D capsule networks for object classification from 3D model data
CN116863194A (zh) 一种足溃疡图像分类方法、***、设备及介质
CN117274662A (zh) 一种改进ResNeXt神经网络的轻量级多模态医学图像分类方法
CN116168197A (zh) 一种基于Transformer分割网络和正则化训练的图像分割方法
CN115936992A (zh) 一种轻量级Transformer的垃圾图像超分辨方法及***
CN113793267B (zh) 基于跨维度注意力机制的自监督单遥感图像超分辨率方法
CN111860668B (zh) 一种针对原始3d点云处理的深度卷积网络的点云识别方法
CN117115563A (zh) 基于区域语义感知的遥感土地覆盖分类方法及***
CN116188435B (zh) 一种基于模糊逻辑的医学图像深度分割方法
CN113269235B (zh) 一种基于无监督学习的装配体变化检测方法及设备
CN112990336B (zh) 基于竞争注意力融合的深度三维点云分类网络构建方法
CN115272696A (zh) 一种基于自适应卷积和局部几何信息的点云语义分割方法
Pandey et al. A conspectus of deep learning techniques for single-image super-resolution

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant