CN113554657A - 基于注意力机制及卷积神经网络的超像素分割方法及*** - Google Patents

基于注意力机制及卷积神经网络的超像素分割方法及*** Download PDF

Info

Publication number
CN113554657A
CN113554657A CN202110943140.2A CN202110943140A CN113554657A CN 113554657 A CN113554657 A CN 113554657A CN 202110943140 A CN202110943140 A CN 202110943140A CN 113554657 A CN113554657 A CN 113554657A
Authority
CN
China
Prior art keywords
superpixel
pixel
segmentation
super
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110943140.2A
Other languages
English (en)
Inventor
王晶晶
栾振业
于子舒
任金雯
张立人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Aowande Information Technology Co ltd
Original Assignee
Shandong Aowande Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Aowande Information Technology Co ltd filed Critical Shandong Aowande Information Technology Co ltd
Priority to CN202110943140.2A priority Critical patent/CN113554657A/zh
Publication of CN113554657A publication Critical patent/CN113554657A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本公开提供了一种基于注意力机制及卷积神经网络的超像素分割方法及***,所述方案首先将注意力模块嵌入到卷积神经网络中。其次,由此产生的挤压和激发网络进行端到端训练。然后,用灵活的损失函数学习特定任务的超级像素。最后,通过训练好的网络可以进行图像的超像素分割,大大降低维度,并消除一些异常的像素。通过基于注意力机制及卷积神经网络超像素分割的算法能够得到更好的分割结果,为图像超像素分割领域提供了一种具有明显优势的方法。

Description

基于注意力机制及卷积神经网络的超像素分割方法及***
技术领域
本公开属于图像处理技术领域,尤其涉及一种基于注意力机制及卷积神经网络的超像素分割方法及***。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
超像素分割是计算机图像处理中一个重要的预处理步骤。在计算机视觉中,超像素是将一些具有相似特征的像素聚集起来,形成一个更具代表性的大元素。这个新元素将成为其他图像处理算法的基本单位。它不仅可以大大减少尺寸,而且可以消除一些异常的像素。大量的实验分析表明,基于深度学习的超像素分割方法不仅在传统的分割基准上优于现有的超级像素算法,而且还可以为其他任务学习超级像素。此外,深度学习网络可以很容易地集成到下游的深度网络中,从而提高性能。目前,由于其代表性和计算效率,超像素已被广泛用于计算机视觉算法,如物体检测、语义分割、显著性估计、光流估计、深度估计、跟踪等。
发明人发现,现有的超级像素分割方法存在以下缺点:
(1)大多数基于梯度的超级像素都是从像素的初始聚类开始,通过梯度变化迭代更新聚类,直到满足某些标准形成超级像素。
(2)SLIC(Simple Linear Iterative Clustering)是一种基于K-means聚类的超级像素分割算法,其虽然能够控制超像素块的数量和紧密程度。但是该方法只考虑了像素点与种子点之间的颜色和坐标关系,而没有考虑像素点与边界之间的关系,所以对图像边界的拟合程度不是很好。
(3)DB-SCAN(Density-based Spatial Clustering of Applications withNoise)是一种基于密度聚类的超像素分割算法。由于DB-SCAN聚类算法可以找到任意形状的聚类,因此对形状复杂、不规则的物体有很好的分割潜力,但它没有考虑像素点和种子点之间的空间关系,导致超级像素的形状不规则。
发明内容
本公开为了解决上述问题,提供了一种基于注意力机制及卷积神经网络的超像素分割方法及***,所述方案获得的图像超像素分割结果不仅可以大大降低图像维度,并且能够有效消除部分异常像素,为后续应用奠定了基础,提高了计算效率。
根据本公开实施例的第一个方面,提供了一种基于注意力机制及卷积神经网络的超像素分割方法,包括:
获取待进行超像素分割的图像;
将所述图像输入预先训练的超像素分割模型中,获得预测的超像素关联图,基于所述超像素关联图,确定图像超像素分割结果;
其中,所述超像素分割模型采用编码器-解码器设计,所述编码器包括若干卷积层,所述图像通过编码器中不同层级的卷积层产生不同尺度的特征图;所述解码器包括若干反卷积层,所述编码器中不同层级卷积层产生的特征图通过跳跃连接传递到解码器中对应层级的反卷积层;同时,所述解码器中每个反卷积层的输入前均设置有注意力模块。
进一步的,所述注意力模块采用SE-Net注意力模块,其包括挤压操作和激励操作,所述挤压操作通过在空间维度上聚集特征图产生一个通道描述符;所述激励操作采用门控机制,将所述通道描述符产生的全局分布的嵌入作为输入,获得每个通道调制权重的集合。
进一步的,所述基于所述超像素关联图,确定图像超像素分割结果,具体为:通过所述超像素分割模型获得预测的超像素关联图,其中,所述超像素关联图基于软关联图代替实际的像素硬分配,确定每个像素分配到不同网格单元的概率;通过将每个像素分配到具有最高概率的网格单元获得超像素分割结果。
进一步的,所述超像素分割模型训练过程中采用的损失函数包括两部分,第一部分用于将具有相似属性的像素进行组合;第二部分用于强制约束超级像素在空间上保持紧凑。
根据本公开实施例的第二个方面,提供了一种基于注意力机制及卷积神经网络的超像素分割***,包括:
数据获取单元,其用于获取待进行超像素分割的图像;
超像素分割单元,其用于将所述图像输入预先训练的超像素分割模型中,获得预测的超像素关联图,基于所述超像素关联图,确定图像超像素分割结果;
其中,所述超像素分割模型采用编码器-解码器设计,所述编码器包括若干卷积层,所述图像通过编码器中不同层级的卷积层产生不同尺度的特征图;所述解码器包括若干反卷积层,所述编码器中不同层级卷积层产生的特征图通过跳跃连接传递到解码器中对应层级的反卷积层;同时,所述解码器中每个反卷积层的输入前均设置有注意力模块。
根据本公开实施例的第三个方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上运行的计算机程序,所述处理器执行所述程序时实现所述的一种基于注意力机制及卷积神经网络的超像素分割方法。
根据本公开实施例的第四个方面,提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述的一种基于注意力机制及卷积神经网络的超像素分割方法。
与现有技术相比,本公开的有益效果是:
(1)本公开所述方案提供了一种基于注意力机制及卷积神经网络的超像素分割方法,所述方案通过将SE-Net注意力模块引入卷积神经网络中,构建超像素分割模型,所述方案利用SE-Net产生的挤压和激发网络进行端到端训练,并且利用灵活的损失函数学习特定任务的超级像素;最后,通过训练好的网络可以进行图像的超像素分割,大大降低维度,并消除一些异常的像素。
(2)相对于传统的FCN卷积相比,本公开所述方案在卷积神经网络中加入了注意力模块,可以更好地模拟通道之间的依赖关系,自适应地调整每个通道的特征响应值。在网络中加入注意力模块只会增加少量的计算开销,但可以大大改善网络性能。
(3)本公开所述方案通过找到图像像素和规则网格单元之间的关联分数,并使用挤压和激励网络直接预测这些分数,通过将每个像素分配到具有最高概率的规则网格单元来获得超像素来获得最终的超像素分割结果,能够有效提高超像素分割的效率和准确度。
本公开附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。
图1为本公开实施例一中所述的基于注意力机制及卷积神经网络的超像素分割方法整体网络结构示意图;
图2为本公开实施例一中所述的超像素挤压和激发网络结构示意图;
图3为本公开实施例一中所述的是挤压和激发模块结构示意图;
图4为本公开实施例一中所述的在BSDS500s数据集上的超像素分割结果示意图;
图5为本公开实施例一中所述的在NYUv2数据集上的超像素分割结果示意图。
具体实施方式
下面结合附图与实施例对本公开做进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
实施例一:
本实施例的目的是提供一种基于注意力机制及卷积神经网络的超像素分割方法。
一种基于注意力机制及卷积神经网络的超像素分割方法,包括:
获取待进行超像素分割的图像;
将所述图像输入预先训练的超像素分割模型中,获得预测的超像素关联图,基于所述超像素关联图,确定图像超像素分割结果;
其中,所述超像素分割模型采用编码器-解码器设计,所述编码器包括若干卷积层,所述图像通过编码器中不同层级的卷积层产生不同尺度的特征图;所述解码器包括若干反卷积层,所述编码器中不同层级卷积层产生的特征图通过跳跃连接传递到解码器中对应层级的反卷积层;同时,所述解码器中每个反卷积层的输入前均设置有注意力模块。
进一步的,所述注意力模块采用SE-Net(Squeeze-and-Excitation Networks)注意力模块,其包括挤压操作和激励操作,所述挤压操作通过在空间维度上聚集特征图产生一个通道描述符;所述激励操作采用门控机制,将所述通道描述符产生的全局分布的嵌入作为输入,获得每个通道调制权重的集合。
进一步的,所述基于所述超像素关联图,确定图像超像素分割结果,具体为:通过所述超像素分割模型获得预测的超像素关联图,其中,所述超像素关联图基于软关联图代替实际的像素硬分配,确定每个像素分配到不同网格单元的概率;通过将每个像素分配到具有最高概率的网格单元获得超像素分割结果。
进一步的,所述超像素分割模型训练过程中采用的损失函数包括两部分,第一部分用于将具有相似属性的像素进行组合;第二部分用于强制约束超级像素在空间上保持紧凑。
进一步的,所述预先确定的损失函数,具体表示如下:
Figure BDA0003215647090000061
其中,p为图像中的某一像素点,p'为重建后图像中的某一像素点,f(p)为像素点的特征,f'(p)为重建图像该像素点的特征,dist()表示重建后的特征与原特征的差距以及重建后的位置与原位置的差距,m为平衡这两个项的权重,s为超像素的取样间隔。
具体的,为了便于理解,以下结合附图对本公开所述方案进行详细说明:
如图1所示,本公开所述方案采用编码器-解码器设计,通过带有跳跃连接和注意力模块的超像素分割模型来预测超级像素关联图Q。所述编码器将彩色图像作为输入,通过卷积网络产生高级特征图。然后,解码器通过去卷积层逐渐对特征图进行上采样。在每次解卷积之前加入注意力模块,以更多地关注每个超级像素的特征权重,从而提高分割的准确性并进行最终的预测。
对于任何给定的将输入映射到特征图的转换,例如卷积操作,本公开所述方案在每次卷积操作前设置一个相应的注意力模块来进行特征再校准。在本实施例中采用SE-Net注意力模块,所述SE-Net注意力模块包括挤压操作和激励操作,所述卷积操作的输入特征首先通过挤压操作,在空间维度上聚集特征图产生一个通道描述符,所述描述符的功能是产生通道特征响应的全局分布的嵌入,使网络的全局感受野的信息能够被其所有层使用。挤压操作之后是激励操作,其形式是一个简单的门控机制,将挤压操作产生的嵌入作为输入,产生一个每个通道调制权重的集合。这些权重被应用于特征图以产生注意力模块的输出,可以直接输入网络的后续层。然后,我们可以把输出写成U=[u1,u2,...,uC],其中:
Figure BDA0003215647090000062
其中,*代表卷积,
Figure BDA0003215647090000063
X=[X1,X2,...,XC'],uc∈RH×W
Figure BDA0003215647090000064
为一个二维空间核,代表vc的单一通道,作用于X的相应通道;X为输入图像,vc为第c个卷积核参数,Vc 1为第c个卷积核的第一个通道参数,Vc 2第c个卷积核的第二个通道参数,R为图像特征图,Vc C’为第c个卷积核第C’个通道的参数,c为卷积核数,C’为通过卷积变换后的特征通道数,u1为卷积核1操作的输出,u2为卷积核2操作的输出,uc为卷积核c操作的输出,H为像素的高,W为像素的宽。
进一步的,本公开所述方案通过软关联图Q∈RH×W×|NP|(即超像素关联图,所述超像素关联图表示每个像素属于每个超像素的概率)代替像素的硬分配G。例如:
Figure BDA0003215647090000071
其中,s为超像素中心,Np为像素周围的超像素集合,qs(p)表示一个像素p被分配到每个s∈Np的概率。最后,通过将每个像素分配到具有最高概率的网格单元来获得超像素:s*=arg maxsqs(p)。与基于全卷积神经网络的方法不同,本公开在原始网络结构中加入了注意力机制,可以有效提高分割的精度。
进一步的,本公开所述方案在损失函数方面具有很好的灵活性。一般来说,通过f(p)表示我们希望超像素保留的像素属性,本实施例中,f(p)包括3维的CIELab颜色向量以及N维的语义标签单次编码向量,其中,N表示类的数量。我们进一步用图像坐标p=[x,y]T表示一个像素的位置。鉴于预测的超像素关联图Q,我们可以计算任何超级像素的中心,其中,us为属性向量,ls为位置向量,具体表示如下:
Figure BDA0003215647090000072
Figure BDA0003215647090000073
其中,Np是p的周围超级像素的集合,qs(p)是网络预测的p与超级像素相关的概率。在公式(2)和公式(3)中,每个总和都是对所有可能被分配到s的像素进行的。然后,任何像素p的重建属性和位置都由以下公式给出:
Figure BDA0003215647090000081
最后,我们的损失函数的一般表述有两个项。第一个项鼓励训练有素的模型将具有相似属性的像素组合起来,第二个项强制要求超级像素在空间上要紧凑。
Figure BDA0003215647090000082
基于确定的损失函数对所述超像素分割模型进行训练,利用训练好的模型实现图像的超像素分割。
进一步的,为了验证本公开对于图像超像素分割的优势,本实施例中将本公开所述方案在BSDS500s数据集和NYUv2数据集上进行了大量的超像素分割实验。先对数据集中的训练集进行模型的训练,然后对验证集进行验证,对测试集进行测试。实验结果分别如图4、图5所示。由图4、图5可知,本公开所建立的基于注意力机制的卷积神经网络超像素分割方法对于图像的超像素分割可以达到很好的效果,图像的超像素分割,不仅可以大大降低图像维度,并且能够消除一些异常的像素。这表明本公开建立的基于注意力机制的卷积神经网络超像素分割方法是有效的,为其在后续的物体检测、语义分割、显著性估计、光流估计、深度估计、跟踪等领域提高了计算效率,具有一定的实用性。
实施例二:
本实施例的目的是提供一种基于注意力机制及卷积神经网络的超像素分割***。
一种基于注意力机制及卷积神经网络的超像素分割***,包括:
数据获取单元,其用于获取待进行超像素分割的图像;
超像素分割单元,其用于将所述图像输入预先训练的超像素分割模型中,获得预测的超像素关联图,基于所述超像素关联图,确定图像超像素分割结果;
其中,所述超像素分割模型采用编码器-解码器设计,所述编码器包括若干卷积层,所述图像通过编码器中不同层级的卷积层产生不同尺度的特征图;所述解码器包括若干反卷积层,所述编码器中不同层级卷积层产生的特征图通过跳跃连接传递到解码器中对应层级的反卷积层;同时,所述解码器中每个反卷积层的输入前均设置有注意力模块。
进一步的,所述注意力模块采用SE-Net注意力模块,其包括挤压操作和激励操作,所述挤压操作通过在空间维度上聚集特征图产生一个通道描述符;所述激励操作采用门控机制,将所述通道描述符产生的全局分布的嵌入作为输入,获得每个通道调制权重的集合。
进一步的,所述基于所述超像素关联图,确定图像超像素分割结果,具体为:通过所述超像素分割模型获得预测的超像素关联图,其中,所述超像素关联图基于软关联图代替实际的像素硬分配,确定每个像素分配到不同网格单元的概率;通过将每个像素分配到具有最高概率的网格单元获得超像素分割结果。在更多实施例中,还提供:
一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成实施例一中所述的方法。为了简洁,在此不再赘述。
应理解,本实施例中,处理器可以是中央处理单元CPU,处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路AS I C,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例一中所述的方法。
实施例一中的方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
本领域普通技术人员可以意识到,结合本实施例描述的各示例的单元即算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。
上述实施例提供的一种基于注意力机制及卷积神经网络的超像素分割方法及***可以实现,具有广阔的应用前景。
以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (10)

1.一种基于注意力机制及卷积神经网络的超像素分割方法,其特征在于,包括:
获取待进行超像素分割的图像;
将所述图像输入预先训练的超像素分割模型中,获得预测的超像素关联图,基于所述超像素关联图,确定图像超像素分割结果;
其中,所述超像素分割模型采用编码器-解码器设计,所述编码器包括若干卷积层,所述图像通过编码器中不同层级的卷积层产生不同尺度的特征图;所述解码器包括若干反卷积层,所述编码器中不同层级卷积层产生的特征图通过跳跃连接传递到解码器中对应层级的反卷积层;同时,所述解码器中每个反卷积层的输入前均设置有注意力模块。
2.如权利要求1所述的一种基于注意力机制及卷积神经网络的超像素分割方法,其特征在于,所述注意力模块采用SE-Net注意力模块,其包括挤压操作和激励操作,所述挤压操作通过在空间维度上聚集特征图产生一个通道描述符;所述激励操作采用门控机制,将所述通道描述符产生的全局分布的嵌入作为输入,获得每个通道调制权重的集合。
3.如权利要求1所述的一种基于注意力机制及卷积神经网络的超像素分割方法,其特征在于,所述基于所述超像素关联图,确定图像超像素分割结果,具体为:通过所述超像素分割模型获得预测的超像素关联图,其中,所述超像素关联图基于软关联图代替实际的像素硬分配,确定每个像素分配到不同网格单元的概率;通过将每个像素分配到具有最高概率的网格单元获得超像素分割结果。
4.如权利要求1所述的一种基于注意力机制及卷积神经网络的超像素分割方法,其特征在于,所述超像素分割模型训练过程中采用的损失函数包括两部分,第一部分用于将具有相似属性的像素进行组合;第二部分用于强制约束超级像素在空间上保持紧凑。
5.如权利要求4所述的一种基于注意力机制及卷积神经网络的超像素分割方法,其特征在于,所述预先确定的损失函数,具体表示如下:
Figure FDA0003215647080000021
其中,p为图像中的某一像素点,p'为重建后图像中的某一像素点,f(p)为像素点的特征,f'(p)为重建图像该像素点的特征,dist()表示重建后的特征与原特征的差距以及重建后的位置与原位置的差距,m为平衡这两个项的权重,s为超像素的取样间隔。
6.一种基于注意力机制及卷积神经网络的超像素分割***,其特征在于,包括:
数据获取单元,其用于获取待进行超像素分割的图像;
超像素分割单元,其用于将所述图像输入预先训练的超像素分割模型中,获得预测的超像素关联图,基于所述超像素关联图,确定图像超像素分割结果;
其中,所述超像素分割模型采用编码器-解码器设计,所述编码器包括若干卷积层,所述图像通过编码器中不同层级的卷积层产生不同尺度的特征图;所述解码器包括若干反卷积层,所述编码器中不同层级卷积层产生的特征图通过跳跃连接传递到解码器中对应层级的反卷积层;同时,所述解码器中每个反卷积层的输入前均设置有注意力模块。
7.如权利要求6所述的一种基于注意力机制及卷积神经网络的超像素分割***,其特征在于,包括:
所述注意力模块采用SE-Net注意力模块,其包括挤压操作和激励操作,所述挤压操作通过在空间维度上聚集特征图产生一个通道描述符;所述激励操作采用门控机制,将所述通道描述符产生的全局分布的嵌入作为输入,获得每个通道调制权重的集合。
8.如权利要求6所述的一种基于注意力机制及卷积神经网络的超像素分割***,其特征在于,所述基于所述超像素关联图,确定图像超像素分割结果,具体为:通过所述超像素分割模型获得预测的超像素关联图,其中,所述超像素关联图基于软关联图代替实际的像素硬分配,确定每个像素分配到不同网格单元的概率;通过将每个像素分配到具有最高概率的网格单元获得超像素分割结果。
9.一种电子设备,包括存储器、处理器及存储在存储器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-5任一项所述的一种基于注意力机制及卷积神经网络的超像素分割方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5任一项所述的一种基于注意力机制及卷积神经网络的超像素分割方法。
CN202110943140.2A 2021-08-17 2021-08-17 基于注意力机制及卷积神经网络的超像素分割方法及*** Pending CN113554657A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110943140.2A CN113554657A (zh) 2021-08-17 2021-08-17 基于注意力机制及卷积神经网络的超像素分割方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110943140.2A CN113554657A (zh) 2021-08-17 2021-08-17 基于注意力机制及卷积神经网络的超像素分割方法及***

Publications (1)

Publication Number Publication Date
CN113554657A true CN113554657A (zh) 2021-10-26

Family

ID=78133926

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110943140.2A Pending CN113554657A (zh) 2021-08-17 2021-08-17 基于注意力机制及卷积神经网络的超像素分割方法及***

Country Status (1)

Country Link
CN (1) CN113554657A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114037715A (zh) * 2021-11-09 2022-02-11 北京字节跳动网络技术有限公司 图像分割方法、装置、设备及存储介质
CN115886839A (zh) * 2022-12-19 2023-04-04 广州华见智能科技有限公司 一种基于脑电波分析的诊断***
CN117349545A (zh) * 2023-12-04 2024-01-05 中国电子科技集团公司第五十四研究所 一种基于环境约束栅格的目标时空分布预测方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114037715A (zh) * 2021-11-09 2022-02-11 北京字节跳动网络技术有限公司 图像分割方法、装置、设备及存储介质
CN115886839A (zh) * 2022-12-19 2023-04-04 广州华见智能科技有限公司 一种基于脑电波分析的诊断***
CN117349545A (zh) * 2023-12-04 2024-01-05 中国电子科技集团公司第五十四研究所 一种基于环境约束栅格的目标时空分布预测方法

Similar Documents

Publication Publication Date Title
WO2020177651A1 (zh) 图像分割方法和图像处理装置
Dupont et al. Generative models as distributions of functions
CN113554657A (zh) 基于注意力机制及卷积神经网络的超像素分割方法及***
CN112529146B (zh) 神经网络模型训练的方法和装置
Kong et al. Pixel-wise attentional gating for scene parsing
Kong et al. Pixel-wise attentional gating for parsimonious pixel labeling
CN111046939A (zh) 基于注意力的cnn类别激活图生成方法
CN112232355B (zh) 图像分割网络处理、图像分割方法、装置和计算机设备
JP2023523029A (ja) 画像認識モデル生成方法、装置、コンピュータ機器及び記憶媒体
CN114332578A (zh) 图像异常检测模型训练方法、图像异常检测方法和装置
CN111860398A (zh) 遥感图像目标检测方法、***及终端设备
WO2023116632A1 (zh) 基于时空记忆信息的视频实例分割方法和分割装置
WO2020062299A1 (zh) 一种神经网络处理器、数据处理方法及相关设备
US10733498B1 (en) Parametric mathematical function approximation in integrated circuits
CN113179421B (zh) 视频封面选择方法、装置、计算机设备和存储介质
CN109523546A (zh) 一种肺结节分析的方法及装置
US20210350230A1 (en) Data dividing method and processor for convolution operation
Saltori et al. Gipso: Geometrically informed propagation for online adaptation in 3d lidar segmentation
CN114581581A (zh) 基于自适应划分区域的神经体辐射场渲染加速方法及装置
CN114022359A (zh) 图像超分辨率模型训练方法、装置、存储介质及设备
CN114067389A (zh) 一种面部表情的分类方法和电子设备
CN115457492A (zh) 目标检测方法、装置、计算机设备及存储介质
CN117217280A (zh) 神经网络模型优化方法、装置及计算设备
Wang et al. Superpixel segmentation with squeeze-and-excitation networks
CN109711315A (zh) 一种肺结节分析的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination