CN115564789A - 一种跨级融合的工件缺陷区域分割方法、装置及存储介质 - Google Patents
一种跨级融合的工件缺陷区域分割方法、装置及存储介质 Download PDFInfo
- Publication number
- CN115564789A CN115564789A CN202211523273.5A CN202211523273A CN115564789A CN 115564789 A CN115564789 A CN 115564789A CN 202211523273 A CN202211523273 A CN 202211523273A CN 115564789 A CN115564789 A CN 115564789A
- Authority
- CN
- China
- Prior art keywords
- feature
- fusion
- features
- module
- scale
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000004927 fusion Effects 0.000 title claims abstract description 118
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000007547 defect Effects 0.000 title claims abstract description 33
- 230000011218 segmentation Effects 0.000 claims abstract description 30
- 230000007246 mechanism Effects 0.000 claims description 26
- 238000011176 pooling Methods 0.000 claims description 25
- 238000005065 mining Methods 0.000 claims description 24
- 238000010586 diagram Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 5
- 238000003709 image segmentation Methods 0.000 claims description 3
- 230000002950 deficient Effects 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 6
- 230000006870 function Effects 0.000 description 21
- 239000002184 metal Substances 0.000 description 9
- 230000004913 activation Effects 0.000 description 6
- 238000001994 activation Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30108—Industrial image inspection
- G06T2207/30164—Workpiece; Machine component
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种跨级融合的工件缺陷区域分割方法、装置及存储介质,应用于工件表面缺陷区域分割技术领域,包括:通过将多层不同级别的特征图与注意力诱导的跨级融合模块相结合,并且在注意力诱导的跨级融合模块中引入了多尺度通道注意机智,获取有价值的注意力线索,再通过双分支全局上下文模块捕获有价值的上下文信息以提高工件表面区域缺陷区域分割的准确性,从而实现对复杂工件表面的缺陷检测分割的问题,相比于现有技术,在分割的准确性上有明显提升。
Description
技术领域
本发明涉及工件表面缺陷区域分割技术领域,具体涉及一种跨级融合的工件缺陷区域分割方法、装置及存储介质。
背景技术
近年来,基于深度学习算法的高精度工件表面缺陷区域分割取得快速发展。现有代表性方法采用U-Net等编码器-解码器架构、或者DeeplabV3等方法,通过融合图像的底层空间细节和高层判别语义等多层级特征实现多尺度特征的有效融合,或者通过不同感受野范围的膨胀卷积金字塔,聚合不同距离范围的上下文信息,实现对缺陷区域的预测;
现有工件表面缺陷检测方法将网络提取的多尺度、多层级特征进行特征融合,从而能有效的结合图像的全局信息和局部细节。然而上述代表性方法在从相对简单的场景中检测单个缺陷方面显示出了良好的性能,但是在许多复杂工件的多缺陷检测的情况表现不够理想。
发明内容
有鉴于此,本发明的目的在于提供一种跨级融合的工件缺陷区域分割方法、装置及存储介质,以解决现有技术中,工件表面缺陷检测分割方法的准确性不足,尤其是针对复杂工件表面的缺陷检测的问题。
根据本发明实施例的第一方面,提供一种跨级融合的工件缺陷区域分割方法,包括:
将待分割的图像输入到分割网络中,经过多层卷积以及池化操作后,得到多张不同级别的特征图;
对特征图进行编号,将最后一层卷积以及池化操作得到的特征图记为最深层特征图,最深层特征图记为特征FN,将特征FN以及特征FN-1输入到注意力诱导的跨级融合模块中,注意力诱导的跨级融合模块结合多尺度通道注意机制对特征FN以及特征FN-1进行特征融合得到特征F;
将特征F输入到双分支全局上下文模块中用以挖掘特征F的全局上下文信息,获得融合特征F1;
将融合特征F1与特征FN-2输入到注意力诱导的跨级融合模块中,重复上述步骤,直到完成所有层级的特征图的融合,得到最终融合特征Fx,根据最终融合特征Fx输出缺陷分割结果。
优选地,
所述注意力诱导的跨级融合模块结合多尺度通道注意机制对特征FN以及特征FN-1进行特征融合得到特征F包括:
将特征FN执行上采样操作后与特征FN-1进行融合,得到特征Fa;
通过多尺度通道注意机制对特征Fa进行多尺度的上下文信息进行挖掘,得到特征Fb;
将特征Fb分别与特征FN以及特征FN-1进行乘法操作,获得特征Fc以及特征Fd;
对特征Fc以及特征Fd进行融合操作,将融合后的特征再进行卷积操作,得到特征F。
优选地,
所述通过多尺度通道注意机制对特征Fa进行多尺度的上下文信息进行挖掘,得到特征Fb包括:
对特征Fa采用全局平均池化操作获得全局上下文信息,从而获取大尺度目标的全局分布特征;
对特征Fa保留原始特征获得局部上下文信息,从而获取小尺度目标的特征;
将大尺度目标的全局分布特征以及小尺度目标的特征进行融合,将融合后的特征作为Sigmoid函数的输入,输出即为特征Fb。
优选地,
所述对特征Fa采用全局平均池化操作获得全局上下文信息,从而获取大尺度目标的全局分布特征包括:
对特征Fa进行全局平均池化操作,得到特征Faa;
对特征Faa进行逐点卷积操作,将进行逐点卷积操作后的特征Faa作为ReLU函数的输入,对ReLU函数的输出再进行逐点卷积操作,得到大尺度目标的全局分布特征。
优选地,
所述对特征Fa保留原始特征获得局部上下文信息,从而获取小尺度目标的特征包括:
对特征Fa进行逐点卷积操作,将进行逐点卷积操作后的特征Fa作为ReLU函数的输入,对ReLU函数的输出再进行逐点卷积操作,得到小尺度目标的特征。
优选地,
所述将特征F输入到双分支全局上下文模块中用以挖掘特征F的全局上下文信息,获得融合特征F1包括:
将特征F分别经过卷积操作以及平均池化操作得到特征Fp以及特征Fn;
通过多尺度通道注意机制分别对特征Fp以及特征Fn进行多尺度信息挖掘,得到特征Fpm以及特征Fnm;
将特征Fpm与特征Fp相乘得到特征Fppm,将特征Fnm与特征Fn相乘得到特征Fnnm;
对特征Fnnm执行上采样操作后与特征Fppm通过加法操作进行融合,对融合后的特征进行卷积操作,得到特征Fnpm;
将特征Fnpm与特征F通过加法操作进行融合,然后再对融合后的特征进行卷积操作,得到融合特征F1。
根据本发明实施例的第二方面,提供一种跨级融合的工件缺陷区域分割装置,包括:
特征图获取模块:用于将待分割的图像输入到分割网络中,经过多层卷积以及池化操作后,得到多层不同级别的特征图;
特征挖掘融合模块:用于对特征图进行编号,将最深层特征图记为特征FN,将特征FN以及特征FN-1输入到注意力诱导的跨级融合模块中,注意力诱导的跨级融合模块结合多尺度通道注意机制对特征FN以及特征FN-1进行特征融合得到特征F;
融合特征获取模块:用于将特征F输入到双分支全局上下文模块中用以挖掘特征F的全局上下文信息,获得融合特征F1;
输出模块:用于将融合特征F1与特征FN-2输入到注意力诱导的跨级融合模块中,重复上述步骤,直到完成所有层级的特征图的融合,得到最终融合特征Fx,根据最终融合特征Fx输出预测结果。
根据本发明实施例的第三方面,提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被主控器执行时,实现所述的上述方法中的各个步骤。
本发明的实施例提供的技术方案可以包括以下有益效果:
本申请通过将多层不同级别的特征图与注意力诱导的跨级融合模块相结合,并且在注意力诱导的跨级融合模块中引入了多尺度通道注意机智,获取有价值的注意力线索,再通过双分支全局上下文模块捕获有价值的上下文信息以提高工件表面区域缺陷区域分割的准确性,从而实现对复杂工件表面的缺陷检测分割的问题,相比于现有技术,在分割的准确性上有明显提升。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种跨级融合的工件缺陷区域分割方法的流程示意图;
图2是根据另一示例性实施例示出的注意力诱导的跨级融合模块的工作原理的流程示意图;
图3是根据另一示例性实施例示出的多尺度通道注意机制的工作原理示意图;
图4是根据另一示例性实施例示出的双分支全局上下文模块的工作原理的流程示意图;
图5是根据另一示例性实施例示出的一种跨级融合的工件缺陷区域分割装置的***示意图;
附图中:1-特征图获取模块,2-特征挖掘融合模块,3-融合特征获取模块,4-输出模块。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
实施例一
图1是根据一示例性实施例示出的一种跨级融合的工件缺陷区域分割方法的流程示意图,如图1所示,该方法包括:
S1,将待分割的图像输入到分割网络中,经过多层卷积以及池化操作后,得到多张不同级别的特征图;
S2,对特征图进行编号,将最后一层卷积以及池化操作得到的特征图记为最深层特征图,最深层特征图记为特征FN,将特征FN以及特征FN-1输入到注意力诱导的跨级融合模块中,注意力诱导的跨级融合模块结合多尺度通道注意机制对特征FN以及特征FN-1进行特征融合得到特征F;
S3,将特征F输入到双分支全局上下文模块中用以挖掘特征F的全局上下文信息,获得融合特征F1;
S4,将融合特征F1与特征FN-2输入到注意力诱导的跨级融合模块中,重复上述步骤,直到完成所有层级的特征图的融合,得到最终融合特征Fx,根据最终融合特征Fx输出缺陷分割结果;
可以理解的是,本申请通过Res2Net-50作为骨干,来提取输入图像多层级的多尺度特征,将最深沉特征图表示为FN,上一层表示为FN-1,将特征FN以及特征FN-1输入到注意力诱导的跨级融合模块中,注意力诱导的跨级融合模块结合多尺度通道注意机制对特征FN以及特征FN-1进行特征融合得到特征F,将特征F输入到双分支全局上下文模块中用以挖掘特征F的全局上下文信息,获得融合特征F1,将融合特征F1与特征FN-2输入到注意力诱导的跨级融合模块中,重复上述步骤,可以得到融合特征F2,再将融合特征F2与特征FN-3输入到注意力诱导的跨级融合模块中,直到完成所有层级的特征图的融合,得到最终融合特征Fx,根据最终融合特征Fx输出预测结果;本申请通过将多层不同级别的特征图与注意力诱导的跨级融合模块相结合,并且在注意力诱导的跨级融合模块中引入了多尺度通道注意机智,获取有价值的注意力线索,再通过双分支全局上下文模块捕获有价值的上下文信息以提高工件表面区域缺陷区域分割的准确性,从而实现对复杂工件表面的缺陷检测分割的问题,相比于现有技术,在分割的准确性上有明显提升。
优选地,
所述注意力诱导的跨级融合模块结合多尺度通道注意机制对特征FN以及特征FN-1进行特征融合得到特征F包括:
S201,将特征FN执行上采样操作后与特征FN-1进行融合,得到特征Fa;
S202,通过多尺度通道注意机制对特征Fa进行多尺度的上下文信息进行挖掘,得到特征Fb;
S203,将特征Fb分别与特征FN以及特征FN-1进行乘法操作,获得特征Fc以及特征Fd;
S204,对特征Fc以及特征Fd进行融合操作,将融合后的特征再进行卷积操作,得到特征F;
可以理解的是,注意力诱导的跨级融合模块(ACFM)的工作流程如附图2所示,将特征FN执行上采样操作后与特征FN-1进行融合,得到特征Fa,通过多尺度通道注意机制对特征Fa进行多尺度的上下文信息进行挖掘,得到特征Fb,将特征Fb分别与特征FN以及特征FN-1进行不同的乘法操作,再进行特征融合,最后卷积得到融合的跨级次特征F。
优选地,
所述通过多尺度通道注意机制对特征Fa进行多尺度的上下文信息进行挖掘,得到特征Fb包括:
S2001,对特征Fa采用全局平均池化操作获得全局上下文信息,从而获取大尺度目标的全局分布特征;
S2002,对特征Fa保留原始特征获得局部上下文信息,从而获取小尺度目标的特征;
S2003,将大尺度目标的全局分布特征以及小尺度目标的特征进行融合,将融合后的特征作为Sigmoid函数的输入,输出即为特征Fb;
可以理解的是,多尺度通道注意机制的工作流程如附图3所示,多尺度通道注意机制将特征Fa分两边进行处理,一边采用全局平均池化(GAP)来利用全局上下文,获取大尺度目标的全局分布,另一边保留了原始特征来获得局部上下文,获取易被忽略的小尺度目标的特征,将大尺度目标的全局分布特征以及小尺度目标的特征进行融合,将融合后的特征作为Sigmoid函数的输入,输出即为特征Fb,Sigmoid函数是一个常见的S型函数,也称为S型生长曲线,在信息科学中,由于其单增以及反函数单增等性质,Sigmoid函数常被用作神经网络的激活函数,将变量映射到0,1之间。
优选地,
所述对特征Fa采用全局平均池化操作获得全局上下文信息,从而获取大尺度目标的全局分布特征包括:
对特征Fa进行全局平均池化操作,得到特征Faa;
对特征Faa进行逐点卷积操作,将进行逐点卷积操作后的特征Faa作为ReLU函数的输入,对ReLU函数的输出再进行逐点卷积操作,得到大尺度目标的全局分布特征;
可以理解的是,对特征Fa进行全局平均池化操作获得全局上下文信息,随后采用逐点卷积对特征维度进行恢复和压缩,从而聚合了多尺度的上下文信息,而ReLU函数作为分段线性函数,如果输入为正,将直接输出输入,否则将输出零,它已成为许多类型的神经网络的默认激活功能,因为使用该模型的模型更易于训练,并且通常可以获得更好的性能,神经网络由节点层组成,并学习输入到输出的映射,对于给定的节点,将输入乘以节点中的权重,再求和,此值称为节点的总激活量,然后,通过激活函数对求和的激活进行转换,并定义节点的特定输出或“激活”。
优选地,
所述对特征Fa保留原始特征获得局部上下文信息,从而获取小尺度目标的特征包括:
对特征Fa进行逐点卷积操作,将进行逐点卷积操作后的特征Fa作为ReLU函数的输入,对ReLU函数的输出再进行逐点卷积操作,得到小尺度目标的特征;
可以理解的是,同理,通过保留原始特征来获得局部上下文,获取易被忽略的小尺度目标的特征,随后采用点卷积对特征维度进行恢复和压缩,从而聚合了多尺度的上下文信息。
优选地,
所述将特征F输入到双分支全局上下文模块中用以挖掘特征F的全局上下文信息,获得融合特征F1包括:
S301,将特征F分别经过卷积操作以及平均池化操作得到特征Fp以及特征Fn;
S302,通过多尺度通道注意机制分别对特征Fp以及特征Fn进行多尺度信息挖掘,得到特征Fpm以及特征Fnm;
S303,将特征Fpm与特征Fp相乘得到特征Fppm,将特征Fnm与特征Fn相乘得到特征Fnnm;
S304,对特征Fnnm执行上采样操作后与特征Fppm通过加法操作进行融合,对融合后的特征进行卷积操作,得到特征Fnpm;
S305,将特征Fnpm与特征F通过加法操作进行融合,然后再对融合后的特征进行卷积操作,得到融合特征F1;
可以理解的是,双分支全局上下文模块的工作流程如附图4所示,双分支全局上下文模块(DGCM)能充分挖掘全局上下文信息,将特征F分别经过卷积操作以及平均池化操作得到特征Fp以及特征Fn,通过多尺度通道注意机制分别对特征Fp以及特征Fn进行多尺度信息挖掘,此处的多尺度通道注意机制对特征Fp以及特征Fn的处理与上述描述的一致,此处不再做过多的赘述,得到特征Fpm以及特征Fnm,将特征Fpm与特征Fp相乘得到特征Fppm,将特征Fnm与特征Fn相乘得到特征Fnnm,对特征Fnnm执行上采样操作后与特征Fppm通过加法操作进行融合,对融合后的特征进行卷积操作,得到特征Fnpm,将特征Fnpm与特征F通过加法操作进行融合,然后再对融合后的特征进行卷积操作,得到融合特征F1。
实施例二
图5是根据另一示例性实施例示出的一种跨级融合的工件缺陷区域分割装置的***示意图,包括:
特征图获取模块1:用于将待分割的图像输入到分割网络中,经过多层卷积以及池化操作后,得到多层不同级别的特征图;
特征挖掘融合模块2:用于对特征图进行编号,将最深层特征图记为特征FN,将特征FN以及特征FN-1输入到注意力诱导的跨级融合模块中,注意力诱导的跨级融合模块结合多尺度通道注意机制对特征FN以及特征FN-1进行特征融合得到特征F;
融合特征获取模块3:用于将特征F输入到双分支全局上下文模块中用以挖掘特征F的全局上下文信息,获得融合特征F1;
输出模块4:用于将融合特征F1与特征FN-2输入到注意力诱导的跨级融合模块中,重复上述步骤,直到完成所有层级的特征图的融合,得到最终融合特征Fx,根据最终融合特征Fx输出预测结果;
可以理解的是,通过特征图获取模块1将待分割的图像输入到分割网络中,经过多层卷积以及池化操作后,得到多层不同级别的特征图;通过特征挖掘融合模块2对特征图进行编号,将最深层特征图记为特征FN,将特征FN以及特征FN-1输入到注意力诱导的跨级融合模块中,注意力诱导的跨级融合模块结合多尺度通道注意机制对特征FN以及特征FN-1进行特征融合得到特征F;通过融合特征获取模块3将特征F输入到双分支全局上下文模块中用以挖掘特征F的全局上下文信息,获得融合特征F1;通过输出模块4将融合特征F1与特征FN-2输入到注意力诱导的跨级融合模块中,重复上述步骤,直到完成所有层级的特征图的融合,得到最终融合特征Fx,根据最终融合特征Fx输出预测结果;本方案通过将多层不同级别的特征图与注意力诱导的跨级融合模块相结合,并且在注意力诱导的跨级融合模块中引入了多尺度通道注意机智,获取有价值的注意力线索,再通过双分支全局上下文模块捕获有价值的上下文信息以提高工件表面区域缺陷区域分割的准确性,从而实现对复杂工件表面的缺陷检测分割的问题,相比于现有技术,在分割的准确性上有明显提升。
实施例三:
本实施例提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被主控器执行时,实现上述方法中的各个步骤;
可以理解的是,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (8)
1.一种跨级融合的工件缺陷区域分割方法,其特征在于,包括:
将待分割的图像输入到分割网络中,经过多层卷积以及池化操作后,得到多张不同级别的特征图;
对特征图进行编号,将最后一层卷积以及池化操作得到的特征图记为最深层特征图,最深层特征图记为特征FN,将特征FN以及特征FN-1输入到注意力诱导的跨级融合模块中,注意力诱导的跨级融合模块结合多尺度通道注意机制对特征FN以及特征FN-1进行特征融合得到特征F;
将特征F输入到双分支全局上下文模块中用以挖掘特征F的全局上下文信息,获得融合特征F1;
将融合特征F1与特征FN-2输入到注意力诱导的跨级融合模块中,重复上述步骤,直到完成所有层级的特征图的融合,得到最终融合特征Fx,根据最终融合特征Fx输出缺陷分割结果。
2.根据权利要求1所述的方法,其特征在于,
所述注意力诱导的跨级融合模块结合多尺度通道注意机制对特征FN以及特征FN-1进行特征融合得到特征F包括:
将特征FN执行上采样操作后与特征FN-1进行融合,得到特征Fa;
通过多尺度通道注意机制对特征Fa进行多尺度的上下文信息进行挖掘,得到特征Fb;
将特征Fb分别与特征FN以及特征FN-1进行乘法操作,获得特征Fc以及特征Fd;
对特征Fc以及特征Fd进行融合操作,将融合后的特征再进行卷积操作,得到特征F。
3.根据权利要求2所述的方法,其特征在于,
所述通过多尺度通道注意机制对特征Fa进行多尺度的上下文信息进行挖掘,得到特征Fb包括:
对特征Fa采用全局平均池化操作获得全局上下文信息,从而获取大尺度目标的全局分布特征;
对特征Fa保留原始特征获得局部上下文信息,从而获取小尺度目标的特征;
将大尺度目标的全局分布特征以及小尺度目标的特征进行融合,将融合后的特征作为Sigmoid函数的输入,输出即为特征Fb。
4.根据权利要求3所述的方法,其特征在于,
所述对特征Fa采用全局平均池化操作获得全局上下文信息,从而获取大尺度目标的全局分布特征包括:
对特征Fa进行全局平均池化操作,得到特征Faa;
对特征Faa进行逐点卷积操作,将进行逐点卷积操作后的特征Faa作为ReLU函数的输入,对ReLU函数的输出再进行逐点卷积操作,得到大尺度目标的全局分布特征。
5.根据权利要求3所述的方法,其特征在于,
所述对特征Fa保留原始特征获得局部上下文信息,从而获取小尺度目标的特征包括:
对特征Fa进行逐点卷积操作,将进行逐点卷积操作后的特征Fa作为ReLU函数的输入,对ReLU函数的输出再进行逐点卷积操作,得到小尺度目标的特征。
6.根据权利要求1所述的方法,其特征在于,
所述将特征F输入到双分支全局上下文模块中用以挖掘特征F的全局上下文信息,获得融合特征F1包括:
将特征F分别经过卷积操作以及平均池化操作得到特征Fp以及特征Fn;
通过多尺度通道注意机制分别对特征Fp以及特征Fn进行多尺度信息挖掘,得到特征Fpm以及特征Fnm;
将特征Fpm与特征Fp相乘得到特征Fppm,将特征Fnm与特征Fn相乘得到特征Fnnm;
对特征Fnnm执行上采样操作后与特征Fppm通过加法操作进行融合,对融合后的特征进行卷积操作,得到特征Fnpm;
将特征Fnpm与特征F通过加法操作进行融合,然后再对融合后的特征进行卷积操作,得到融合特征F1。
7.一种跨级融合的工件缺陷区域分割装置,其特征在于,所述装置包括:
特征图获取模块:用于将待分割的图像输入到分割网络中,经过多层卷积以及池化操作后,得到多层不同级别的特征图;
特征挖掘融合模块:用于对特征图进行编号,将最深层特征图记为特征FN,将特征FN以及特征FN-1输入到注意力诱导的跨级融合模块中,注意力诱导的跨级融合模块结合多尺度通道注意机制对特征FN以及特征FN-1进行特征融合得到特征F;
融合特征获取模块:用于将特征F输入到双分支全局上下文模块中用以挖掘特征F的全局上下文信息,获得融合特征F1;
输出模块:用于将融合特征F1与特征FN-2输入到注意力诱导的跨级融合模块中,重复上述步骤,直到完成所有层级的特征图的融合,得到最终融合特征Fx,根据最终融合特征Fx输出预测结果。
8.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被主控器执行时,实现如权利要求1-6任一项所述的一种跨级融合的工件缺陷区域分割方法中的各个步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211523273.5A CN115564789A (zh) | 2022-12-01 | 2022-12-01 | 一种跨级融合的工件缺陷区域分割方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211523273.5A CN115564789A (zh) | 2022-12-01 | 2022-12-01 | 一种跨级融合的工件缺陷区域分割方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115564789A true CN115564789A (zh) | 2023-01-03 |
Family
ID=84770143
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211523273.5A Pending CN115564789A (zh) | 2022-12-01 | 2022-12-01 | 一种跨级融合的工件缺陷区域分割方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115564789A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110866907A (zh) * | 2019-11-12 | 2020-03-06 | 中原工学院 | 基于注意力机制的全卷积网络织物疵点检测方法 |
CN113378725A (zh) * | 2021-06-15 | 2021-09-10 | 山东大学 | 一种基于多尺度-通道注意力网络的刀具故障诊断方法、设备及存储介质 |
WO2021208726A1 (zh) * | 2020-11-23 | 2021-10-21 | 平安科技(深圳)有限公司 | 基于注意力机制的目标检测方法、装置及计算机设备 |
CN113822885A (zh) * | 2021-11-23 | 2021-12-21 | 常州微亿智造科技有限公司 | 融合多注意力机制的工件缺陷检测方法和装置 |
CN114048822A (zh) * | 2021-11-19 | 2022-02-15 | 辽宁工程技术大学 | 一种图像的注意力机制特征融合分割方法 |
CN114187272A (zh) * | 2021-12-13 | 2022-03-15 | 珠海华星智造科技有限公司 | 一种基于深度学习的工业零件表面缺陷检测方法 |
CN114445430A (zh) * | 2022-04-08 | 2022-05-06 | 暨南大学 | 轻量级多尺度特征融合的实时图像语义分割方法及*** |
CN115294038A (zh) * | 2022-07-25 | 2022-11-04 | 河北工业大学 | 一种基于联合优化与混合注意力特征融合的缺陷检测方法 |
CN115375692A (zh) * | 2022-10-27 | 2022-11-22 | 北京矩视智能科技有限公司 | 基于边界引导的工件表面缺陷分割方法、装置及设备 |
-
2022
- 2022-12-01 CN CN202211523273.5A patent/CN115564789A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110866907A (zh) * | 2019-11-12 | 2020-03-06 | 中原工学院 | 基于注意力机制的全卷积网络织物疵点检测方法 |
WO2021208726A1 (zh) * | 2020-11-23 | 2021-10-21 | 平安科技(深圳)有限公司 | 基于注意力机制的目标检测方法、装置及计算机设备 |
CN113378725A (zh) * | 2021-06-15 | 2021-09-10 | 山东大学 | 一种基于多尺度-通道注意力网络的刀具故障诊断方法、设备及存储介质 |
CN114048822A (zh) * | 2021-11-19 | 2022-02-15 | 辽宁工程技术大学 | 一种图像的注意力机制特征融合分割方法 |
CN113822885A (zh) * | 2021-11-23 | 2021-12-21 | 常州微亿智造科技有限公司 | 融合多注意力机制的工件缺陷检测方法和装置 |
CN114187272A (zh) * | 2021-12-13 | 2022-03-15 | 珠海华星智造科技有限公司 | 一种基于深度学习的工业零件表面缺陷检测方法 |
CN114445430A (zh) * | 2022-04-08 | 2022-05-06 | 暨南大学 | 轻量级多尺度特征融合的实时图像语义分割方法及*** |
CN115294038A (zh) * | 2022-07-25 | 2022-11-04 | 河北工业大学 | 一种基于联合优化与混合注意力特征融合的缺陷检测方法 |
CN115375692A (zh) * | 2022-10-27 | 2022-11-22 | 北京矩视智能科技有限公司 | 基于边界引导的工件表面缺陷分割方法、装置及设备 |
Non-Patent Citations (1)
Title |
---|
YUJIA SUN: "Context-aware Cross-level Fusion Network for Camouflaged Object Detection" * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109978807B (zh) | 一种基于生成式对抗网络的阴影去除方法 | |
Fan et al. | Graph attention layer evolves semantic segmentation for road pothole detection: A benchmark and algorithms | |
CN109871895B (zh) | 电路板的缺陷检测方法和装置 | |
Tan et al. | Automatic detection of sewer defects based on improved you only look once algorithm | |
CN112884064A (zh) | 一种基于神经网络的目标检测与识别方法 | |
CN111445478B (zh) | 一种用于cta图像的颅内动脉瘤区域自动检测***和检测方法 | |
CN107154040A (zh) | 一种隧道衬砌表面图像裂缝检测方法 | |
US12020437B2 (en) | Computer-implemented method of analyzing an image to segment article of interest therein | |
CN110490205B (zh) | 基于全残差空洞卷积神经网络的道路场景语义分割方法 | |
Opara et al. | Defect detection on asphalt pavement by deep learning | |
CN113111875A (zh) | 一种基于深度学习的无缝钢轨焊缝缺陷识别装置及方法 | |
CN111860411A (zh) | 一种基于注意力残差学习的道路场景语义分割方法 | |
CN115035172A (zh) | 基于置信度分级及级间融合增强的深度估计方法及*** | |
CN110942097A (zh) | 基于单像素探测器的免成像分类方法和*** | |
Liu et al. | Two‐Stream Boundary‐Aware Neural Network for Concrete Crack Segmentation and Quantification | |
CN112926595B (zh) | 深度学习神经网络模型的训练装置、目标检测***及方法 | |
CN115564789A (zh) | 一种跨级融合的工件缺陷区域分割方法、装置及存储介质 | |
Sharma et al. | SCNet: a generalized attention-based model for crack fault segmentation | |
CN116109639B (zh) | 基于多任务学习网络的缺陷检测方法及装置 | |
CN110717910B (zh) | 基于卷积神经网络的ct图像目标检测方法及ct扫描仪 | |
Hu et al. | Hybrid Pixel‐Level Crack Segmentation for Ballastless Track Slab Using Digital Twin Model and Weakly Supervised Style Transfer | |
CN116486231A (zh) | 一种基于改进YOLOv5的混凝土裂缝检测方法 | |
CN114842032A (zh) | 一种图像处理方法及装置 | |
CN113379683A (zh) | 物体检测方法、装置、设备及介质 | |
CN111028245A (zh) | 一种多模态复合的高清高速视频背景建模方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20230103 |
|
RJ01 | Rejection of invention patent application after publication |