发明内容
有鉴于此,本发明的目的在于提供一种基于GIALDN网络的内部缺陷定位装置及内部缺陷定位方法,可以抑制消除噪声信号干扰、将信号内的数据进行交互,能有效地从所采集的信号数据中提取具有辨识性的特征,最终实现内部缺陷的高精度定位。
为达到上述目的,本发明提供如下技术方案:
本发明首先提出了一种基于GIALDN网络的内部缺陷定位装置,包括:
重塑模块:用于对采集到的振动信号数据进行重塑,以得到输入信号特征;
去池化预处理模块:利用去池化的预处理卷积层从输入信号特征中提取得到富含原始信息的振动信号数据,得到预处理信号特征;
轻量化信号去噪模块:用于对预处理信号特征进行软阈值去噪处理,以剥离噪声信号,得到去噪信号特征;
全局交互注意力模块:将去噪信号特征内的每一个数据点都互相连接起来,并且在每个通道间也建立起联系,以提取信号内的远距离联系与跨通道数据间的潜在关系,提升特征的辨别力;
多层卷积模块:用于对依次经轻量化信号去噪模块和全局交互注意力模块处理后的信号特征进行深度特征提取,得到深度信号特征;
结果输出模块:利用softmax函数,从深度信号特征中得到缺陷定位结果。
进一步,所述轻量化信号去噪模块进行软阈值去噪处理的方法如下:
其中,yi表示第i通道的去噪信号特征;xi表示第i通道的预处理信号特征;τi表示第i通道软阈值。
进一步,所述轻量化信号去噪模块包括全局混合池化层和一维卷积层;
所述全局混合池化层用于对预处理信号特征同时进行全局最大池化和全局平均池化处理,得到混合信号特征;
所述一维卷积层用于提取混合信号特征的通道特征,并利用sigmoid激活函数将学习到的系数缩放到[0,1]的范围,得到每个通道的软阈值系数σ;则:
τi=σi×|x|
其中,τi表示第i通道对应的软阈值;σi表示第i通道对应的软阈值系数;|x|表示绝对值化后的预处理信号特征。
进一步,所述全局交互注意力模块对去噪信号特征处理的方法如下:
(1)采用interpolate函数对去噪信号特征X进行插值,将特征图的维度由h数对降低成(h/2)×(w/2),得到特征图Xi;
(2)通过一个带有批标准化BN层、Relu激活函数的卷积层,把特征图Xi的通道数由c变成(h/2)×(w/2),得到特征图Xc;
(3)对特征Xc进行全局交互,生成注意力图Aa;
(4)注意力图Aa与特征图Xi进行逐点相乘,得到全局交互注意力特征图Ac;
(5)采用interpolate函数对对全局交互注意力特征图Ac进行插值操作,将全局交互注意力特征图Ac还原为与去噪信号特征X相同形状的特征图Ai;
(6)使用残差块,得到最后的输出特征图为:
Y=X+Ai。
进一步,所述步骤(3)中,对特征Xc进行全局交互以生成注意力图Aa的方法为:
(31)将特征Xc中每一个数据点在所有通道中生成大小为1×1、通道数为(h/2)×(w/2)的数据点特征图,而后将该数据特征图重塑为大小与(h/2)×(w/2)、通道数为1的单通道特征图;
(32)将所有数据点的单通道特征图进行聚合,得到中间特征图;
(33)利用softmax函数,从中间特征图中生成注意力图Aa。
本发明还提出了一种基于GIALDN网络的内部缺陷定位方法,包括如下步骤:
步骤一:采集数据:驱动被检测对象振动,利用多个传感器将被检测对象不同区域的振动信号转换为电信号,并利用A/D转换器将电信号转换为数字信号,得到振动信号数据;
步骤二:重塑:重塑振动信号数据,得到输入信号特征;
步骤三:去池化预处理:利用去池化的预处理卷积层从输入信号特征中提取得到富含原始信息的振动信号数据,得到预处理信号特征;
步骤四:轻量化信号去噪处理:对预处理信号特征进行软阈值去噪处理,以剥离噪声信号,得到去噪信号特征;
步骤五:全局交互注意力处理:将去噪信号特征内的每一个数据点都互相连接起来,并且在每个通道间也建立起联系,以提取信号内的远距离联系与跨通道数据间的潜在关系,提升特征的辨别力;
步骤六:多层卷积处理:对依次经过轻量化信号去噪处理和全局交互注意力处理处理后的信号特征进行深度特征提取,得到深度信号特征;
步骤七:输出结果:利用softmax函数,从深度信号特征中得到缺陷定位结果。
进一步,所述步骤四中,轻量化信号去噪处理的方法如下:
41)利用全局混合池化层对预处理信号特征同时进行全局最大池化和全局平均池化处理,得到混合信号特征;
42)利用一维卷积层提取混合信号特征的通道特征,并采用sigmoid激活函数将学习到的系数缩放到[0,1]的范围,得到每个通道的软阈值系数σ;则:
τi=σi×|xi|
其中,τi表示第i通道对应的软阈值;σi表示第i通道对应的软阈值系数;|xi|表示绝对值化后的第i通道的预处理信号特征;
43)对预处理信号特征进行软阈值去噪处理:
其中,yi表示第i通道的去噪信号特征;xi表示第i通道的预处理信号特征;τi表示第i通道软阈值。
进一步,所述步骤五中,全局交互注意力处理的方法如下:
(1)采用interpolate函数对去噪信号特征X进行插值,将特征图的维度由h数对降低成(h/2)×(w/2),得到特征图Xi;
(2)通过一个带有批标准化BN层、Relu激活函数的卷积层,把特征图Xi的通道数由c变成(h/2)×(w/2),得到特征图Xc;
(3)对特征Xc进行全局交互,生成注意力图Aa;
(4)注意力图Aa与特征图Xi进行逐点相乘,得到全局交互注意力特征图Ac;
(5)采用interpolate函数对对全局交互注意力特征图Ac进行插值操作,将全局交互注意力特征图Ac还原为与去噪信号特征X相同形状的特征图Ai;
(6)使用残差块,得到最后的输出特征图为:
Y=X+Ai。
进一步,所述步骤(3)中,对特征Xc进行全局交互以生成注意力图Aa的方法为:
(31)将特征Xc中每一个数据点在所有通道中生成大小为1×1、通道数为(h/2)×(w/2)的数据点特征图,而后将该数据特征图重塑为大小与(h/2)×(w/2)、通道数为1的单通道特征图;
(32)将所有数据点的单通道特征图进行聚合,得到中间特征图;
(33)利用softmax函数,从中间特征图中生成注意力图Aa。
进一步,所述被检测对象为CFRP层合板,所述传感器为数量相等的两组,两组传感器分别均匀分布在CFRP层合板的内外两层;所述步骤一中,采集数据的方法如下:
信号发生器产生的正弦数字信号,在经过D/A转换器把数字信号变换成电信号后,通过功率放大器控制振幅,最后传递给激振器以控制产生物理振动;
激振器的振动经由激振杆与CFRP层合板作用,使CFRP层合板发生振动;
利用两组传感器将被检测对象不同区域的振动信号转换为电信号,并利用A/D转换器将电信号转换为数字信号,得到振动信号数据。
本发明的有益效果在于:
本发明基于GIALDN网络的内部缺陷定位装置的有益效果有:
1)运用信号处理技术中的阈值去噪法,设计了轻量化信号去噪模块,以抑制、消除噪声相关特征,提高信号数据质量;
2)通过全局交互注意力模块,将信号内的每一个数据点都互相连接起来,并且在每个通道间也建立起联系,以提取信号内的远距离联系与跨通道数据间的潜在关系,提升特征的辨别力;
3)以去池化的卷积层与多层卷积为主干,结合轻量化信号去噪模块和全局交互注意力模块构建GIALDN,实现激振响应信号的特征提取和内部缺陷的定位;通过搭建实验台采集了激振响应信号数据集,对GIALDN的性能进行了测试,结果显示它的定位精度高于现有常用模型。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好的理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
如图1所示,数据采集***包括激振器、被检测对象、传感器、A/D转换器、功率放大器、信号采集卡和电脑上的信号采集软件等。本实施例的被检测对象为复合材料板,也即CFRP层合板。首先,激振信号是由信号发生器产生的正弦数字信号,在经过D/A转换器把数字信号变换成电信号后,通过功率放大器控制振幅,最后传递给激振器以控制产生物理振动。激振器的振动经由激振杆与复合材料板作用,使复材板发生振动。同时,带有CFRP层合板特征的振动响应信号由传感器获取转化为电信号,经A/D转换器采样、量化后变成数字信号,在信号采集***进行观察与保存记录。在实验中,共使用了8个传感器,分内外两层均匀分布在复合材料板四个区域,以同时采集8通道的信号数据。根据信号时域采样定理f_s≥3-5f_max,设置合适的采样频率,避免产生频率混叠误差的同时,保证所采集的信号能真实反映原始数据的变化情况。
如图2所示,为本发明GIALDN网络的内部缺陷定位装置的结构原理图。本实施例基于GIALDN网络的内部缺陷定位装置,包括:
重塑模块:用于对采集到的振动信号数据进行重塑,以得到输入信号特征。即:将从传感器采集的8路激振响应信号数据进行重塑,得到整个模型的输入信号特征。
去池化预处理模块:利用去池化的预处理卷积层从输入信号特征中提取得到富含原始信息的振动信号数据,得到预处理信号特征。需要注意的是,在卷积层中舍弃了传统的池化操作。虽然池化操作可以对特征进行压缩、降维、简化网络复杂度、减小计算量,但是由于池化操作固定的下采样规则,不可避免地会丢失大量有价值的信息,以及忽略整体与局部之间的关联性。因为需要准确的缺陷位置相关信息和信号数据间微小的差别来进行定位,因此这对利用多通道振动信号进行缺陷定位的任务是非常不利的。所以,为了保留信号数据准确详细的特征,只是使用了卷积、批标准化、Relu激活、丢弃操作组成的去池化卷积层。
轻量化信号去噪模块(Lightly Denoised Module,LMD):用于对预处理信号特征进行软阈值去噪处理,以剥离噪声信号,得到去噪信号特征。
全局交互注意力模块(Global Interaction Module,GIAM):将去噪信号特征内的每一个数据点都互相连接起来,并且在每个通道间也建立起联系,以提取信号内的远距离联系与跨通道数据间的潜在关系,提升特征的辨别力;
多层卷积模块:用于对依次经轻量化信号去噪模块和全局交互注意力模块处理后的信号特征进行深度特征提取,得到深度信号特征;本实施例的多层卷积模块采用具有残差块的11层卷积神经网络。
结果输出模块:利用softmax函数,从深度信号特征中得到缺陷定位结果。
由于复合材料内部结构的复杂性和随机性,从复合材料板采集得到的激振响应信号也包含着大量噪声。这些噪声会模糊信号特征、降低信号质量,使神经网络无法从振动信号中提取到与故障、缺陷定位相关的有用特征,输出层也会因学习到的特征缺乏足够的辨识度而无法做出准确的判断,对缺陷定位任务产生重要的不利影响。因此,在利用振动信号进行缺陷定位的工作中,设计了一个信号去噪处理模块来抑制消除噪声、提高数据信噪比是很有必要的。
本实施例的信号去噪模块采用阈值去噪法来消除与噪声相关的特征。该模块首先使用全局混合池化操作以实现特征聚合与降维;其次采用1DCNN来实现局部跨通道的交互,捕获通道间的联系,生成软阈值系数;最后,对输入信号进行软阈值去噪操作,具体如图3所示:
即本实施例的轻量化信号去噪模块包括全局混合池化层和一维卷积层。
全局混合池化层用于对预处理信号特征同时进行全局最大池化和全局平均池化处理,得到混合信号特征。
与SEnet和DRSN不同,在压缩输入的空间维度以获取每个通道全局特征的阶段,没有单独的采用全局平均池化(GAP),而是把全局最大池化(GMP)和全局平均池化(GAP)共同考虑,对信号的全局特征进行聚合,以更好地为每个通道赋予合理的软阈值。
GAP是最常用的聚合全局特征的操作,虽然全局平均值是一个非常重要的特征,但是也应该看到,它也仅仅只是全局特征中的一个而已,对于数据的整体特征不能完整表示。GMP提取了全局的显著特征,这是输入数据的另外一个重要特征表示,它对于为每个通道设置合理的软阈值很重要。将GAP和GMP同时考虑也被证实了可以大大的提高网络的表示能力。
和SEnet模块采用squeeze、excite操作的全连接结构不同,本实施例采用了1DCNN来提取通道特征。相对于SEnet,使用1DCNN的优势有:(1)SEnet中的降维操作虽然一定程度降低了模型复杂度和计算量,但是破坏了通道和其权重的直接对应关系,这对每个通道的软阈值生成很重要;(2)由于1DCNN拥有参数共享的特征,相比SEnet极大地降低了参数量和模型复杂度;(3)1DCNN实现了有效的局部跨通道交互,而不是不必要的全局通道交互,这对于学习通道软阈值是很重要的。使用了1DCNN的网络比使用SE结构的全连接网络参数量更少、准确率更高。
一维卷积层用于提取混合信号特征的通道特征,并利用sigmoid激活函数将学习到的系数缩放到[0,1]的范围,得到每个通道的软阈值系数σ;则:
τi=σi×|x|
其中,τi表示第i通道对应的软阈值;σi表示第i通道对应的软阈值系数;|x|表示绝对值化后的预处理信号特征。
轻量化信号去噪模块进行软阈值去噪处理的方法如下:
其中,yi表示第i通道的去噪信号特征;xi表示第i通道的预处理信号特征;τi表示第i通道软阈值。
根据公式可知,软阈值去噪的方法是将[―τ,τ]范围内的输入特征通过设置为0给过滤掉,而在这之外,负值特征加上软阈值,正值特征减去软阈值,使输入特征的噪声被最大程度抑制的同时,将有效信号尽可能完整的保留下来。同时,由于软阈值系数是经过全局混合池化和1DCNN层学习得到的,每个通道都有对应的系数,从而使模块的去噪能力得到不断提高。
对于全局交互注意力模块,采取了一种跨通道的、全局的交互注意力机制,可以灵活地聚合输入信号特征的远程前后关系和通道间的联系;通过为特征图中每个位置的数据产生堆叠成一个注意力图,将每个位置与其他位置联系起来,充分获取信号特征的短处与远处的各种有效信息,以增强模型表示能力。
本实施例采集的复合材料板具有如下的一些特征:
a、采集的数据是由分布在复合材料板上的8个传感器所采集的8通道的振动信号,在每一个缺陷位置,都能通过传感器采集到关于这个缺陷的8通道数据,每个通道数据都具有关于缺陷的独特特征。并且,由于位于同一块板上,这8个信号数据之间具有紧密的联系;
b、振动信号数据作为时序信号的一种,它具有时序数据的前后联系强、长时间依赖的特点,在一般的时序预测或者故障诊断任务中,都是通过捕获这种信号内部的前后联系或者长时间的依赖性来实现。而在缺陷定位任务中,振动信号的这种特点也能帮助进行定位;
由于本实施例的多通道振动信号所具有的这些特点,本实施例提出了全局交互的概念,以有效地捕获8通道数据之间的联系和信号内每个点与其他点之间的依赖性等隐含特征,通过聚合这些特征联系,可以有效地提升信号的表示能力,使模型学习到更多的特征表示、提高缺陷定位精度。
在缺陷定位任务中,需要对复合材料板上出现的缺陷进行精准的定位。而在这个定位任务中,每个缺陷位置的定位都会受到特征图上其他位置对自己的影响,每个通道内的数据之间也存在相互联系,这是非常重要的;所以,可以利用这种影响来帮助实现定位。具体操作就是:特征图上的每个位置都获取其他位置对自己的影响,即其他位置的特征在多大程度上可以辅助预测;与此同时,自己的特征在这种交互下也会对其他位置的预测提供帮助。在这样的一个模式下,每个位置的预测都能得到其他位置的帮助,同样地,自己也会对其他位置的定位提供帮助,这样就形成了一个双向的信息交互。这种双向的信息交互可以充分利用信号数据间的隐藏信息,捕获每个信号的内部联系,使得各个位置联系紧密,神经网络也因此可以学习到更加全面的表示特征,提高缺陷定位精度。
具体的,本实施例的全局交互注意力模块对去噪信号特征处理的方法如下:
(1)采用interpolate函数对去噪信号特征X进行插值,将特征图的维度由h数对降低成(h/2)×(w/2),得到特征图Xi;以减小在全局交互阶段的计算量,避免因特征通道数过大带来的额外计算开销。
(2)通过一个带有批标准化BN层、Relu激活函数的卷积层,把特征图Xi的通道数由c变成(h/2)×(w/2),得到特征图Xc;
(3)对特征Xc进行全局交互,生成注意力图Aa;
(4)注意力图Aa与特征图Xi进行逐点相乘,得到全局交互注意力特征图Ac;
(5)采用interpolate函数对对全局交互注意力特征图Ac进行插值操作,将全局交互注意力特征图Ac还原为与去噪信号特征X相同形状的特征图Ai;
(6)为了防止特征图经过全局交互后特征响应值降低,本实施例使用残差块,得到最后的输出特征图为:
Y=X+Ai。
在全局交互阶段,本实施例的“全局”交互即在空间和通道两个方面同时进行交互,在考虑信号内所有点之间的联系的同时,也考虑到通道之间的互相影响与帮助,充分利用了采集的多通道振动信号数据的信息。具体的全局交互过程如图5示。对特征Xc进行全局交互以生成注意力图Aa的方法为:
(31)将特征Xc中每一个数据点在所有通道中生成大小为1×1、通道数为(h/2)×(w/2)的数据点特征图,而后将该数据特征图重塑为大小与(h/2)×(w/2)、通道数为1的单通道特征图;
(32)将所有数据点的单通道特征图进行聚合,得到中间特征图;
(33)利用softmax函数,从中间特征图中生成注意力图Aa。
同理,本实施例提出的基于GIALDN网络的内部缺陷定位方法的具体实施方式如下:
本实施例基于GIALDN网络的内部缺陷定位方法,包括如下步骤:
步骤一:采集数据:驱动被检测对象振动,利用多个传感器将被检测对象不同区域的振动信号转换为电信号,并利用A/D转换器将电信号转换为数字信号,得到振动信号数据;本实施例的被检测对象为CFRP层合板,传感器为数量相等的两组,每组传感器包括4个,两组传感器分别均匀分布在CFRP层合板的内外两层的四个区域内;具体的,本实施例采集数据的方法如下:
信号发生器产生的正弦数字信号,在经过D/A转换器把数字信号变换成电信号后,通过功率放大器控制振幅,最后传递给激振器以控制产生物理振动;
激振器的振动经由激振杆与CFRP层合板作用,使CFRP层合板发生振动;
利用两组传感器将被检测对象不同区域的振动信号转换为电信号,并利用A/D转换器将电信号转换为数字信号,得到振动信号数据。
步骤二:重塑:重塑振动信号数据,得到输入信号特征;
步骤三:去池化预处理:利用去池化的预处理卷积层从输入信号特征中提取得到富含原始信息的振动信号数据,得到预处理信号特征;
步骤四:轻量化信号去噪处理:对预处理信号特征进行软阈值去噪处理,以剥离噪声信号,得到去噪信号特征;轻量化信号去噪处理的方法如下:
41)利用全局混合池化层对预处理信号特征同时进行全局最大池化和全局平均池化处理,得到混合信号特征;
42)利用一维卷积层提取混合信号特征的通道特征,并采用sigmoid激活函数将学习到的系数缩放到[0,1]的范围,得到每个通道的软阈值系数σ;则:
τi=σi×|xi|
其中,τi表示第i通道对应的软阈值;σi表示第i通道对应的软阈值系数;|xi|表示绝对值化后的第i通道的预处理信号特征;
43)对预处理信号特征进行软阈值去噪处理:
其中,yi表示第i通道的去噪信号特征;xi表示第i通道的预处理信号特征;τi表示第i通道软阈值。
步骤五:全局交互注意力处理:将去噪信号特征内的每一个数据点都互相连接起来,并且在每个通道间也建立起联系,以提取信号内的远距离联系与跨通道数据间的潜在关系,提升特征的辨别力;全局交互注意力处理的方法如下:
(1)采用interpolate函数对去噪信号特征X进行插值,将特征图的维度由h数对降低成(h/2)×(w/2),得到特征图Xi;
(2)通过一个带有批标准化BN层、Relu激活函数的卷积层,把特征图Xi的通道数由c变成(h/2)×(w/2),得到特征图Xc;
(3)对特征Xc进行全局交互,生成注意力图Aa;对特征Xc进行全局交互以生成注意力图Aa的方法为:
(31)将特征Xc中每一个数据点在所有通道中生成大小为1×1、通道数为(h/2)×(w/2)的数据点特征图,而后将该数据特征图重塑为大小与(h/2)×(w/2)、通道数为1的单通道特征图;
(32)将所有数据点的单通道特征图进行聚合,得到中间特征图;
(33)利用softmax函数,从中间特征图中生成注意力图Aa;
(4)注意力图Aa与特征图Xi进行逐点相乘,得到全局交互注意力特征图Ac;
(5)采用interpolate函数对对全局交互注意力特征图Ac进行插值操作,将全局交互注意力特征图Ac还原为与去噪信号特征X相同形状的特征图Ai;
(6)使用残差块,得到最后的输出特征图为:
Y=X+Ai。
步骤六:多层卷积处理:对依次经过轻量化信号去噪处理和全局交互注意力处理处理后的信号特征进行深度特征提取,得到深度信号特征;
步骤七:输出结果:利用softmax函数,从深度信号特征中得到缺陷定位结果。
下面基于实例对本实施例基于GIALDN网络的内部缺陷定位方法及内部缺陷定位方法的具体实施方式进行说明。
为了验证本实施例所提出模型及方法的有效性,搭建了CFRP层合板激振响应测试实验平台并采集了数据集,并利用此数据集将GIALDN模型与其他常用的经典网络模型进行了对比。
一、实验数据集
本会理设计的振动试验平台主要由激振器、A/D转换器、功率放大器、传感器、振动实验台架、数据采集卡与所配套数据采集软件组成,具体实验设备如图6所示,具体设备型号如表1所示。A/D转换器具备模拟信号与数字信号的A/D、D/A双向转换功能,实现信号类型变换;功率放大器能够对激振器的激振进行直接控制,比如振幅等;激振器具可以接收来自功率放大器的模拟电信号,产生振动;传感器能够捕获CFRP层合板的振动信号,并将其转换成模拟信号,传输给A/D转换器;振动实验台架用以对CFRP层合板、激振器进行固定,避免相对运动造成信号失真;数据采集卡和配套软件可以根据设置需要,产生相应频率、振幅的数字信号,例如正弦信号、方波信号等,并且可以对所采集的信号进行实时观察与保存记录。
表1实验设备
实验时,在信号采集软件上设置激振频率为120Hz,采样频率设为1000Hz,使所采集信号能真实反应复材板的振动信息;将振幅设置为1V,并通过功率放大器使振幅稳定,保证传感器在振动过程中能牢牢稳固在复材板上。在缺陷位置设置时,针对240×240mm的复合材料板区域,以10mm的间隔设置缺陷位置,共收集了552个缺陷位置的振动信号。模型训练中,每一个信号取0.4秒的数据,即每个样本通道有400个数据值,对其缺陷位置进行定位。这种使用短信号的缺陷定位是很具有挑战性的,也可以更好地验证所提出模型的性能。为了避免训练过程中出现过拟合,对所采集的552个振动信号的每个信号,都从中取若干段连续信号,以增大数据集。最后,复合材料板缺陷振动信号数据集共包含11040个样本,按照0.2的比例划分出训练集和测试集。
同时还观察到,在整个的过程中,由于传感器和其他设备的固有误差、周围环境噪声等的影响,噪声信号持续性的存在,这对模型的去噪能力提出了挑战。
二、模型超参数设置
验证实验直接用GIALDN模型对从复合材料振动数据集进行分析,最后根据定位至缺陷位置所在区域的准确率进行模型性能评判。另外,有关所提出网络模型的超参数设置介绍如下。
表2GIALDN的超参数设置
与所设计GIALDN网络结构相关的超参数,如卷积层输入通道数、卷积核个数、大小、滑动步长等总结在表2中。其中,De-pooling Conv2d中的参数依次表示卷积层的输入输出通道数、卷积核大小、滑动步长、填充,激活函数和Dropout比例;LDM参数表示输入、输出通道数;GIAM的参数表示输入通道数、交互分支数、compact与否等。Multi-LayersConv2d作为采用ResNet架构的卷积层,其参数表示每个ResBlock的卷积层数。不同层或模块的输出数据形状如表第一列所示,分别表示通道数×长×宽。在Multi-Conv2d的最后输出层使用GAP操作,使得输出维度下降,再经过Softmax得到对每一个位置判断的可能性大小,数值最大的即为需要定位的缺陷位置。
在整个网络的训练优化方面,因为Adam优化器结合了Adagrad和RMSProp的优点,对每一个参数都是用相同的学习率,随着学习的进行可以独立地适应,并且它还利用了梯度的历史信息对模型进行优化,所以选择了Adam优化器,并且设置学习率为0.001,以保证模型训练速度。根据设备性能和批量越大越好的原则,本实施例设置的batchsize大小为128。并且在训练过程中,每一代训练完成后,都使用验证集对模型进行验证,以提前发现训练过程中出现的问题,避免时间浪费。
所提出的深度模型在python3.8版本的基础上,使用pytorch深度学习框架进行编写,所有验证实验均在Nvidia GTX GPU 3080的Linux服务器上进行。
三、性能实验
本实施例共设置了两组实验测试:第一组实验用于比较本实施例所提出方法和模型进一步改进的有效性;第二组实验是针对本实施例模型的卷积结构所设置的与其他经典CNN网络的性能对比。
3.1、模型的组成成分性能实验
本实施例对GIALDN各个模块的有效性进行了实验验证,具体的结果如表3所示。在模型中,LDM和GIAM作为模型的两大主要模块,对模型的性能影响很大,其次,去池化的策略对于性能提高也是有效的,插值、conv1d的作用主要表现在降低模型参数量上面。
表3模型组成部分性能试验
可以看到,去池化策略虽然会增加模型参数量、增加模型复杂度,但是它同时也使得模型准确率上升。其实,相对与整个模型的参数量来说,由于去池化策略而导致增加的计算量是可以忽略的,对整个模型计算效率、训练时间的影响甚微。所以,去池化策略整体来看是有价值的、也是很有必要的。
在LDM中,经过全局池化后获得的表征每个通道特征的数值是生成软阈值的基础,直接影响模型的去噪效果。从表中可以看到,单独运用全局平均池化或者全局最大池化的模型精度明显比混合池化低,这说明单独使用这两种池化方式所获得的通道信息是不完全的,不能代表一个通道内的大多数数据,只有同时使用它们才可以实现完整表示整个通道的特征。在之后的通道间特征提取过程,相比于全连接层FC将每一个通道都连接起来、获取全部通道间关系的形式,本实施例采用Conv1d操作提取通道间的局部信息的方式,可以获取到有效的通道间关系,也说明FC提取的通道信息过于冗余、低效,同时,参数量也得到明显减少、计算效率显著提高。需要注意的是,在去掉LDM后,模型精度降低了1.02%,这充分说明对于这一类高噪声振动数据来说,进行去噪操作是很有必要、且很有效的。
在对GIAM的修改实验中,插值降维的方法对于降低计算量和模型复杂度的效果是很突出的,它主要表现在两个方面:一是特征图的大小,二是通道数目的可实现性(使通道数在合理范围内)。与采用GIAM模块的网络模型相比,去掉GIAM模块后,模型精度下降了0.66%,很显然,GIAM模块对的通道内数据交互联系和通道间关系的提取是很有效的,它使得有用的数据、更有效的通道得到网络模型的更多关注,并且增加了模型所提取有效特征量,这对于模型性能提高是很重要的。
总的来说,所提出的GIALDN模型在复合材料板振动信号数据集上表现出了很好的性能,这意味着数据特征得到了很好的学习。
3.2、与其他常用模型的对比
因为所提出的网络模型全部采用卷积神经网络进行搭建,所以为了验证GIALDN网络的优越性能,本实施例选择了基于CNN的FaultNet、ResNet18、SEresnet18、VGGnet11、DenseNet121等五个常用的经典网络进行对比,通过比较每个模型的定位精度、模型复杂度、训练速度、损失值,对模型性能进行综合的评价。为了使全部6个网络模型都达到稳定精确度的状态,本实施例训练了1000代,虽然在300代时本实施例的网络就已经达到了非常高的精度。
在相同的训练策略下,五个网络在复合材料板振动信号数据集上的测试集定位精度如图7所示;同时,模型性能、参数量、训练时间统计在表4中。可以看到,ResNet18、SEresnet18和DenseNet121实现了不错的效果,准确率都超过了95%,说明了通过叠加卷积网络层数是有效的,本实施例的模型也集成了这个优点。并且,由于本实施例提出的一系列创新性的改进,如去噪、全局交互等,使得GIALDN的准确率同前述三种网络拉开了差距,精度可达98.5%以上,并且在网络复杂度和训练速度方面得到改观,这充分说明所提出的阈值法能够消除信号数据中与噪声相关的特征,全局交互的方法可以使去噪后的信号数据建立内部联系、挖掘出更多有用的特征,进而使得输出层高级特征的辨别力更强。然后,在图中也可以看到,FauNet和VGGnet的准确率都维持在80%的水平,说明它们不能有效的提取出信号特征以用于缺陷定位,究其原因,FauNet是网络层数过低,VGGnet则是采用传统的、复杂的网络架构,这充分说明了网络层数在一定程度上能提高特征提取效率和有效性,但是过于复杂的网络又会适得其反,和本实施例的思路不谋而合,即在保证模型特征提取能力的同时、运用其他方法加强有效特征提取,最终实现网络模型轻量化和精度高的目标。这也体现在训练速度方面,本实施例的GIALDN与其他深度网络相比也具备明显优势,整个1000代迭代过程的训练时间不足10小时,而其他深度网络均在20小时以上,这使得它的实用性相对更强。
表4模型性能对比
为了更好地比较模型的训练效率和泛化性能,将resnet18,SEresnet18,densenet121,GIALDN的测试集交叉熵损失值展示在图8上。可以看到虽然前三者在前面都实现了较高的定位精度,但是在损失值的下降方面,resnet和SEresnet都要低于densenet,这说明残差连接的网络结构可以促进深度网络的参数优化,使得其在数据特征提取方面具有很大的优势。更重要的是,本实施例所提出的GIALDN相比于经典resnet,不论是损失下降速度还是最终平稳时的损失值方面,都优于resnet和SEresnet。毫无疑问,在训练过程中,去噪和全局交互模块发挥了作用,前者消除噪声相关特征、提高信息辨别力,后者深入挖掘多通道信号中隐藏的有用信息、增加用于定位的特征量,使最终的高级特征具有辨别力,从而使整个模型的训练效率提升。
在图9中是所提出GIALDN的训练和测试过程的损失值曲线。可以看出,训练损失曲线与测试损失曲线高度重合,在最后150代平稳阶段的平均损失都分别为0.120和0.117。这说明模型的泛化性非常强,并没有出现训练集效果好而测试集效果相差甚远的过拟合现象,一方面是因为所提出的网络属于轻量化网络,参数量很少,避免了网络只能对训练过的历史数据实现精确定位、而对新出现的缺陷位置不能进行有效的定位;另一方面也体现了所提出网络模块LDM和GIAM的有效性,使得网络具备强大的信息提取能力。当然,本实施例也通过设置dropout层使一部分神经元保持灵活状态的方式,在一定程度上提高了模型泛化性。总之,GIALDN实现了更好的训练效果。
以上所述实施例仅是为充分说明本发明而所举的较佳的实施例,本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换,均在本发明的保护范围之内。本发明的保护范围以权利要求书为准。