CN110675405B - 基于注意力机制的one-shot图像分割方法 - Google Patents

基于注意力机制的one-shot图像分割方法 Download PDF

Info

Publication number
CN110675405B
CN110675405B CN201910867163.2A CN201910867163A CN110675405B CN 110675405 B CN110675405 B CN 110675405B CN 201910867163 A CN201910867163 A CN 201910867163A CN 110675405 B CN110675405 B CN 110675405B
Authority
CN
China
Prior art keywords
feature extraction
attention
branch
extraction block
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910867163.2A
Other languages
English (en)
Other versions
CN110675405A (zh
Inventor
孟凡满
鲍俊玲
黄开旭
李宏亮
吴庆波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201910867163.2A priority Critical patent/CN110675405B/zh
Publication of CN110675405A publication Critical patent/CN110675405A/zh
Application granted granted Critical
Publication of CN110675405B publication Critical patent/CN110675405B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于注意力机制的one‑shot图像分割方法。在单个特征和简单的双分支融合不足以使查询分支从支持分支中提取有用信息的情况下。本发明为了支持分支关注于两个分支共性的区域,以便准确地引导查询分支分割图像,将多级上下文特征和注意模块引入到one‑shot图像分割中找到更准确有效的指导方法。本发明能更好地利用现有的知识迅速对新类图像进行分割,利用多级指导和注意力机制来强化学习两个分支的共性,进而准确地指导未知图像的分割。

Description

基于注意力机制的one-shot图像分割方法
技术领域
本发明涉及图像分割技术,特别涉及one-shot图像分割技术。
技术背景
图像分割是图像分析和理解的关键步骤,旨在对图像中每个像素进行分类。此外,图像分割技术在辅助驾驶、医学影像分析、目标识别、图像理解等领域有着广泛的应用。因此,研究图像分割方法对计算机视觉的发展具有深刻的意义。
近年来,图像分割、目标检测和图像分类的快速发展离不开深度神经网络,但其性能的显著提升严重依赖于耗时耗力的人工标注。然而,通过利用大量手工标注来训练分割模型很难适应实际应用的需求。此外,将已经训练好的分割模型直接分割未知类别的图像是很困难的。于是,few-shot分割方法被提出来,该方法旨在通过利用未知类别极少量标注图像的有效指导,分割该类别的其他图像。
Few-shot图像分割方法自2017年提出至今,所提出的方法基本上都是两分支的网络结构,其中一个分支(支持分支)采用标注的图像(支持图像),另一个分支(查询分支)分割未知图像(查询图像)。支持分支试图学习一种指导方式来指导查询分支分割两分支图像相同的目标类。现有的指导方法大概可以分成两种,一种是利用支持分支的特征,将支持分支的特征和查询分支的特征合并或相加,作为查询分支的特征;另一种是利用支持分支学习一组网络参数用于查询分支。Few-shot图像分割通常有one-shot和five-shot两种。one-shot是指支持分支利用一张带标注的图像指导查询分支,five-shot是指支持分支利用五张带标注的图像指导查询分支。
因此,对于few-shot图像分割,最重要的是找到一种准确有效的指导方法。然而,从极少量的标注图像中寻求一种准确的指导很难,已经存在的few-shot分割方法存在一些缺点:1)简单的合并和相加运算不足以有效地指导未知图像以获得准确的分割结果。2)上述大多数方法只考虑单个输出(通常是已知图像网络最后一层的特征或某一层的参数)进行引导,该指导没有更多地关注上下文特征。
发明内容
本发明所要解决的技术问题是,提供一种新的one-shot分割方法,在继续沿用两分支的网络结构的基础上,利用多级指导和注意力机制,充分利用支持图像所提供的信息且重点关注两分支共性的区域。
本发明为解决上述技术问题所采用的技术方案是,针对目前利用最后一层特征来监督指导没有充分利用标注图像所提供的信息,本发明利用多级特征进行指导;为了使得指导更多的关注于两分支共性的区域,将注意力机制引入。基于注意力机制的one-shot图像分割方法,包括以下步骤:
1)构建基于注意力机制的两分支one-shot图像分割网络:
支持分支由N层特征提取块串联而成;
查询分支包括N层特征提取块以及M个注意力模块,M小于N;第1层特征提取块输出至第2层特征提取块,第2层至第N层特征提取块中不需要进行注意力指导的特征提取块直接输出至下一层特征提取块,需要进行注意力指导的特征提取块的输出至对应的注意力模块;第1至第M-1个注意力模块的两个输入分别来自于查询分支中对应需要进行注意力指导的特征提取块的输出以及支持分支中同层特征提取块的输出;第1至第M-1个注意力模块分别输出至对应需要进行注意力指导的特征提取块的下一层特征提取块;支持分支最后一层特征提取块与查询分支最后一层特征提取块均输出至第M个注意力模块;
第M个注意力模块输出至反卷积模块;
2)构建训练集;
3)使用训练集数据训练所述基于注意力机制的两分支one-shot图像分割网络;
4)将测试集图像输入训练完成的基于注意力机制的两分支one-shot图像分割网络。
在单个特征和简单的双分支融合不足以使查询分支从支持分支中提取有用信息的情况下。对于one-shot图像分割,需要支持分支关注于两个分支共性的区域,以便准确地引导查询分支分割图像。所以,考虑将多级上下文特征和注意模块引入到one-shot图像分割中找到更准确有效的指导方法。
进一步的,为了更好的运用注意力机制,我们提出了两种不同的注意力模块,分别针对高低层次的特征。因为,我们发现网络中低层次的特征主要是纹理颜色等特征,它们对空间位置比较敏感,而网络中高层次的特征主要包含更多的语义性,它们对特征的通道比较敏感,比如某个通道可能和猫鼻子有关,另一个通道可能和猫耳朵有关。因此,针对不同层次特征设计不同的注意力模块应该更能捕捉需要关注的区域。
具体的,基于空间位置的注意力模块进行注意力指导的方法为:将支持分支中需要进行注意力指导的特征提取块输出的特征f1经过1×1的卷积后,再经过sigmoid函数正则化得到特征谱gate,sigmoid函数使得特征谱gate与查询分支的同层特征提取块输出的特征f2的大小相同,再将特征谱gate与特征f2相乘,将相乘结构输出至下一层特征提取块。
基于通道的注意力模块进行注意力指导的方法为:将支持分支中需要进行注意力指导的特征提取块输出的特征f1进行全局平均池化,再经过两个全连接层,其中第一全连接层后加激活函数relu,第二个全连接层的输出经过sigmoid函数正则化得到一个1*1×c的向量,将该向量与查询分支的同层特征提取块输出的特征f2相乘,将相乘结构输出至下一层特征提取块;c为查询分支特征通道数。
本发明的有益效果是,能更好地利用现有的知识迅速对新类图像进行分割。利用多级指导和注意力机制来强化学习两个分支的共性,进而准确地指导未知图像的分割。
附图说明
图1是实施例one-shot分割网络框架示意图;
图2是实施例所用数据集中选取几张图像的分割结果展示;
图3是基于空间位置的注意力模块示意图;
图4是基于通道的注意力模块示意图。
具体实施方式
1)构建one-shot图像分割网络,如图1所示:
构建两分支one-shot图像分割网络,提取深度特征的网络采用resnet-50,之后采用反卷积将提取到的深度特征生成和输入图像同样大小的分割结果。
支持分支由5层特征提取块串联而成,即5个block,Res-1、Res-2、Res-3、Res-4、Res-5。
查询分支包括5层特征提取块以及4个注意力模块;第1层特征提取块Res-1输出至第2层特征提取块Res-2,需要进行注意力指导的特征提取块包括Res-2、Res-3、Res-4、Res-5;4个注意力模块中有2个是基于空间位置的注意力模块G,2个是基于通道的注意力模块SE;第1个注意力模块G两个输入分别来自于查询分支中特征提取块Res-2的输出以及支持分支中特征提取块Res-2的输出,第1个注意力模块G输出至查询分支中特征提取块Res-3;第2个注意力模块G两个输入分别来自于查询分支中特征提取块Res-3的输出以及支持分支中特征提取块Res-3的输出,第2个注意力模块G输出至查询分支中特征提取块Res-4;第3个注意力模块SE两个输入分别来自于查询分支中特征提取块Res-4的输出以及支持分支中特征提取块Res-4的输出,第3个注意力模块SE输出至查询分支中特征提取块Res-5;第4个注意力模块SE两个输入分别来自于查询分支中特征提取块Res-5的输出以及支持分支中特征提取块Res-5的输出,第4个注意力模块SE输出至反卷积模块Dcnov。
需要注意的是,支持分支输入为支持图像及其像素级标签。因此,我们将支持分支resnet-50第一个block得到的特征与像素级标签相乘得到支持分支的前景特征。得到两分支各自的深度特征之后,采用反卷积将提取到的深度特征生成和输入图像同样大小的分割结果。resnet-50的初始参数为在ImgNet1000类图像上预训练参数。
冻结resnet-50前三个block的网络参数。这样做不仅能够降低网络的参数,而且能够充分利用预训练模型提取更准确的深度特征,且实验验证冻结三个block参数效果最好。
2)设计注意力模块
本发明设计了两种注意力模块,一种是基于空间位置的注意力模块,另一种是基于通道的注意力模块。
2-1)设计基于空间位置的注意力模块,如图3所示:
该模块的输入是两个网络分支低层次的特征也就是resnet-50网络第二个block(Res-2)和第三个block(Res-3)输出的特征,输出是经过注意力谱指导的查询分支特征。
注意力指导:将支持分支特征f1经过1×1的卷积后,后经过sigmoid函数正则化得到一张gate谱,大小和查询分支的特征f2相同,将gate谱(图3中sigmoid层后的正方形)与查询分支的特征f2相乘,即对f2上每个位置的特征进行了加权,使得值得关注的地方得到凸显。
2-2)设计基于通道的注意力模块,如图4所示:
该模块的输入是两个网络分支高层次的特征也就是resnet-50网络第四个block(Res-4)和第五个block(Res-5)输出的特征,输出是经过注意力指导的查询分支特征。
注意力指导:将支持分支特征f1先经过全局平均池化,后经过两个全连接层,其中第一个全连接后加激活函数relu,最后经过sigmoid函数正则化得到一个1×1×c(c为查询分支特征通道数)的向量,将该向量与查询分支的特征f2相乘,即对查询分支特征f2上每个特征通道进行了加权,使得值得关注的通道得到加强。
3)设计分割网络的损失函数
利用交叉熵损失函数衡量查询分支分割结果与其像素级标签之间的差异,作为网络的约束。
Figure BDA0002201601700000041
其中,x表示查询分支图像的像素点,
Figure BDA0002201601700000042
表示查询分支图像的像素级标签,y表示查询分支图像的分割结果。
下面以one-shot分割网络为例来描述训练与测试过程:
步骤1.准备网络输入数据
1.1本实施例采用PASCAL VOC 2012数据集,该数据集包含20个类别,具体训练和测试阶段所用的类别如下表所示。
Figure BDA0002201601700000043
Figure BDA0002201601700000051
1.2训练阶段两分支的输入图像成对(两张图像属于同一个类别)随机选取,但该对图像选取后不再利用,直到所有图像选取完为止。测试阶段设置了一个随机种子,根据随机种子,每个数据子集(Fold1-Fold3)选取固定的1000对图像(支持图像和查询图像)进行测试。
1.3在输入网络之前,我们将所有的图像大小归一化为320*320,支持分支输入为支持图像及其对应的像素集标签,查询分支输入仅为查询图像。
这样做的原因是训练15个类别当做学习现有的事物,测试的5个类别检验所学的模型是否能在现有的知识的基础上迅速处理新的事物。
此外为了保证仅利用极少量的标注图像就能将所学模型泛化到新的类别上,训练阶段要模仿测试阶段。例如,one-shot图像分割是指利用新类的一张图像指导该类别其他图像的分割。因此对于one-shot图像分割,不管是训练阶段还是测试阶段支持分支输入图像为一张有标注的图像。对于训练阶段查询分支输入的图像有标注,该标注用于约束分割结果,而测试阶段的查询分支输入图像无任何标注,该分支用于分割图像得到分割结果。
步骤2.训练分割网络,得到分割结果
2.1将四个数据子集中的训练集分别训练one-shot分割网络,得到四个子集的分割模型。
2.2将四个数据子集中的测试集图像用所得到的四个模型分别测试对应子集的测试级图像,得到所有测试图像的分割结果。
图2是分割结果的事例:第一行为支持分支的输入图像,第二行为查询分支的输入图像,第三行为查询分支图像人工标注的像素级标签,第四行为我们网络对查询分支的分割结果。可以看出与第三行的像素级标签相比,我们分割得到的结果准确。

Claims (8)

1.基于注意力机制的one-shot图像分割方法,其特征在于,包括以下步骤:
1)构建基于注意力机制的两分支one-shot图像分割网络:
支持分支由N层特征提取块串联而成;
查询分支包括N层特征提取块以及M个注意力模块,M小于N;第1层特征提取块输出至第2层特征提取块,第2层至第N层特征提取块中不需要进行注意力指导的特征提取块直接输出至下一层特征提取块,需要进行注意力指导的特征提取块输出至对应的注意力模块;第1至第M-1个注意力模块的两个输入分别来自于查询分支中对应需要进行注意力指导的特征提取块的输出以及支持分支中同层特征提取块的输出;第1至第M-1个注意力模块分别输出至对应需要进行注意力指导的特征提取块的下一层特征提取块;支持分支最后一层特征提取块与查询分支最后一层特征提取块均输出至第M个注意力模块;
第M个注意力模块输出至反卷积模块;
2)构建训练集;
3)使用训练集数据训练所述基于注意力机制的两分支one-shot图像分割网络;
4)将测试集图像输入训练完成的基于注意力机制的两分支one-shot图像分割网络。
2.如权利要求1所述方法,其特征在于,M个注意力模块中,对应低层次需要进行注意力指导的特征提取块的注意力模块具体为基于空间位置的注意力模块;对应高层次需要进行注意力指导的特征提取块的注意力模块具体为基于通道的注意力模块。
3.如权利要求2所述方法,其特征在于,所述低层次需要进行注意力指导的特征提取块为查询分支中前S层的特征提取块,S小于N。
4.如权利要求2所述方法,其特征在于,基于空间位置的注意力模块进行注意力指导的方法为:将支持分支中需要进行注意力指导的特征提取块输出的特征f1经过1×1的卷积后,再经过sigmoid函数正则化得到特征谱gate,sigmoid函数使得特征谱gate与查询分支的同层特征提取块输出的特征f2的大小相同,再将特征谱gate与特征f2相乘,将相乘结构输出至下一层特征提取块。
5.如权利要求2所述方法,其特征在于,基于通道的注意力模块进行注意力指导的方法为:将支持分支中需要进行注意力指导的特征提取块输出的特征f1进行全局平均池化,再经过两个全连接层,其中第一全连接层后加激活函数relu,第二个全连接层的输出经过sigmoid函数正则化得到一个1× 1×c的向量,将该向量与查询分支的同层特征提取块输出的特征f2相乘,将相乘结构输出至下一层特征提取块;c为查询分支特征通道数。
6.如权利要求1所述方法,其特征在于,支持分支由N层特征提取块与查询分支包括N层特征提取块均采用resnet-50,N=5。
7.如权利要求6所述方法,其特征在于,resnet-50结构的支持分支与查询分支中前3层特征提取块的参数保持初始值不变。
8.如权利要求6所述方法,其特征在于,基于注意力机制的两分支one-shot图像分割网的损失函数为交叉熵损失函数。
CN201910867163.2A 2019-09-12 2019-09-12 基于注意力机制的one-shot图像分割方法 Active CN110675405B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910867163.2A CN110675405B (zh) 2019-09-12 2019-09-12 基于注意力机制的one-shot图像分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910867163.2A CN110675405B (zh) 2019-09-12 2019-09-12 基于注意力机制的one-shot图像分割方法

Publications (2)

Publication Number Publication Date
CN110675405A CN110675405A (zh) 2020-01-10
CN110675405B true CN110675405B (zh) 2022-06-03

Family

ID=69078174

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910867163.2A Active CN110675405B (zh) 2019-09-12 2019-09-12 基于注意力机制的one-shot图像分割方法

Country Status (1)

Country Link
CN (1) CN110675405B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111091166B (zh) * 2020-03-25 2020-07-28 腾讯科技(深圳)有限公司 图像处理模型训练方法、图像处理方法、设备及存储介质
CN111832620A (zh) * 2020-06-11 2020-10-27 桂林电子科技大学 一种基于双注意力多层特征融合的图片情感分类方法
CN112364870B (zh) * 2020-10-22 2021-10-15 中国科学院大学 一种基于特征和谐激活的小样本语义分割方法
CN112863550B (zh) * 2021-03-01 2022-08-16 德鲁动力科技(成都)有限公司 基于注意力残差学习的哭声检测方法及***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018128741A1 (en) * 2017-01-06 2018-07-12 Board Of Regents, The University Of Texas System Segmenting generic foreground objects in images and videos
CN110020682A (zh) * 2019-03-29 2019-07-16 北京工商大学 一种基于小样本学习的注意力机制关系对比网络模型方法
CN110059586A (zh) * 2019-03-29 2019-07-26 电子科技大学 一种基于空洞残差注意力结构的虹膜定位分割***
CN110197182A (zh) * 2019-06-11 2019-09-03 中国电子科技集团公司第五十四研究所 基于上下文信息和注意力机制的遥感影像语义分割方法
CN110210485A (zh) * 2019-05-13 2019-09-06 常熟理工学院 基于注意力机制指导特征融合的图像语义分割方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9042648B2 (en) * 2012-02-23 2015-05-26 Microsoft Technology Licensing, Llc Salient object segmentation

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018128741A1 (en) * 2017-01-06 2018-07-12 Board Of Regents, The University Of Texas System Segmenting generic foreground objects in images and videos
CN110020682A (zh) * 2019-03-29 2019-07-16 北京工商大学 一种基于小样本学习的注意力机制关系对比网络模型方法
CN110059586A (zh) * 2019-03-29 2019-07-26 电子科技大学 一种基于空洞残差注意力结构的虹膜定位分割***
CN110210485A (zh) * 2019-05-13 2019-09-06 常熟理工学院 基于注意力机制指导特征融合的图像语义分割方法
CN110197182A (zh) * 2019-06-11 2019-09-03 中国电子科技集团公司第五十四研究所 基于上下文信息和注意力机制的遥感影像语义分割方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Binyuan Hui 等.Self-Attention Relation Network for Few-Shot Learning.《2019 IEEE International Conference on Multimedia & Expo Workshops (ICMEW)》.2019,第198-203页. *
Bo Zhao 等.Diversified Visual Attention Networks for Fine-Grained Object Classification.《IEEE Transactions on Multimedia》.2017,第19卷(第6期),第1245-1256页. *
T. Hu 等.Attention-Based Multi-Context Guiding for Few-Shot Semantic Segmentation.《Proceedings of the AAAI Conference on Artificial Intelligence》.2019,第33卷(第1期),第8441-8448页. *
吴清亮.基于多示例的图像检索技术研究.《中国优秀硕士学位论文全文数据库 信息科技辑》.2014,I138-1024. *
孟凡满.图像的协同分割理论与方法研究.《中国博士学位论文全文数据库 基础科学辑》.2016,I138-104. *
郑顾平.基于注意力机制的多尺度融合航拍影像语义分割.《图学学报》.2018,第39卷(第6期),第1069-1077页. *

Also Published As

Publication number Publication date
CN110675405A (zh) 2020-01-10

Similar Documents

Publication Publication Date Title
CN110675405B (zh) 基于注意力机制的one-shot图像分割方法
CN110334705B (zh) 一种结合全局和局部信息的场景文本图像的语种识别方法
CN110569738B (zh) 基于密集连接网络的自然场景文本检测方法、设备和介质
CN106257496B (zh) 海量网络文本与非文本图像分类方法
CN113076816B (zh) 基于红外与可见光图像的太阳能光伏组件热斑识别方法
CN114038037B (zh) 基于可分离残差注意力网络的表情标签修正和识别方法
CN112529005B (zh) 基于语义特征一致性监督金字塔网络的目标检测方法
CN113128620A (zh) 一种基于层次关系的半监督领域自适应图片分类方法
CN115049534A (zh) 基于知识蒸馏的鱼眼图像实时语义分割方法
CN114399686A (zh) 一种基于弱监督学习的遥感图像地物识别与分类方法和装置
CN112766378A (zh) 一种专注细粒度识别的跨域小样本图像分类模型方法
CN115512096A (zh) 基于CNN与Transformer的低分辨率图像分类方法及***
CN115953621A (zh) 一种基于不可靠伪标签学习的半监督高光谱图像分类方法
CN116630700A (zh) 基于引入通道-空间注意力机制的遥感图像分类方法
CN115424288A (zh) 一种基于多维度关系建模的视觉Transformer自监督学习方法及***
CN113077438B (zh) 针对多细胞核彩色图像的细胞核区域提取方法及成像方法
CN110598741A (zh) 一种像素级标签自动生成模型构建、自动生成方法及装置
Lorentz et al. Explaining defect detection with saliency maps
CN111612803B (zh) 一种基于图像清晰度的车辆图像语义分割方法
Zhao et al. Recognition and Classification of Concrete Cracks under Strong Interference Based on Convolutional Neural Network.
Rong et al. Weakly supervised text attention network for generating text proposals in scene images
Pham et al. Vietnamese scene text detection and recognition using deep learning: An empirical study
Qu et al. Method of feature pyramid and attention enhancement network for pavement crack detection
Wu et al. Corrosion detection method of transmission line components in mining area based on multiscale enhanced fusion
CN113920124A (zh) 基于分割和误差引导的脑神经元迭代分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant