CN113049084B - 一种基于注意力机制的Resnet的分布式光纤传感信号识别方法 - Google Patents

一种基于注意力机制的Resnet的分布式光纤传感信号识别方法 Download PDF

Info

Publication number
CN113049084B
CN113049084B CN202110283686.XA CN202110283686A CN113049084B CN 113049084 B CN113049084 B CN 113049084B CN 202110283686 A CN202110283686 A CN 202110283686A CN 113049084 B CN113049084 B CN 113049084B
Authority
CN
China
Prior art keywords
resnet
cbam
time
signal
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110283686.XA
Other languages
English (en)
Other versions
CN113049084A (zh
Inventor
吴慧娟
刘欣雨
王宇丰
刘一梦
涂云淋
孙玉文
干登轲
刘亮
饶云江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202110283686.XA priority Critical patent/CN113049084B/zh
Publication of CN113049084A publication Critical patent/CN113049084A/zh
Application granted granted Critical
Publication of CN113049084B publication Critical patent/CN113049084B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01HMEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
    • G01H9/00Measuring mechanical vibrations or ultrasonic, sonic or infrasonic waves by using radiation-sensitive means, e.g. optical means
    • G01H9/004Measuring mechanical vibrations or ultrasonic, sonic or infrasonic waves by using radiation-sensitive means, e.g. optical means using fibre optic sensors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种基于注意力机制的Resnet的分布式光纤传感信号识别方法,属于光纤传感技术领域;包括数据准备:构建不同类型的典型事件信号数据集;信号预处理:对典型事件信号数据集中的时间信号做信号预处理,构建时频特征数据集;基于典型事件时频特征数据集,构建基于注意力机制的残差网络,对模型进行离线训练,得到最优模型;识别分类:利用最优模型对待测事件的时频数据集进行识别;同时将本发明的方法与2D‑CNN、Resnet、2D‑CNN+CBAM网络模型的识别性能进行对比,该方法具有最佳的识别性能。本发明将注意力机制与深度学习网络相结合,使网络自动聚焦于信号的关键信息部分,形成主要信号特征表达,使得识别网络具有更快的收敛速度。

Description

一种基于注意力机制的Resnet的分布式光纤传感信号识别 方法
技术领域
本发明涉及分布式光纤传感应用领域,涉及一种基于注意力机制的Resnet的分布式光纤传感信号识别方法。
背景技术
基于相敏光时域反射原理(Φ-OTDR)的分布式光纤声波/振动传感(DAS)技术,利用现有铺设的通信光缆高灵敏感知和精确定位周围环境中各种破坏性危险源(机械施工、人为挖掘等)振动产生的信号,并进行实时预警的一种技术,具有无源、恶劣环境生存能力强、大范围(长距离)连续监测和规模组网等突出能力,其综合性能优于普通OTDR、电学传感器阵列及其他线路破损检测手段,在通信光缆网安全监测上具有广阔应用前景。
最初研究人员基于机器学习的Φ-OTDR或DAS信号处理方法,对光缆安全事件进行预警。然而,由于通信光缆实际部署环境大,环境干扰噪声的多样性、复杂性等使得埋地光缆安全预警的准确性仍面临巨大挑战。机器学习需要人为提取事件信号特征,特征工程费时费力,而且不同应用背景算法泛化性差。因此,近期很多研究人员尝试应用深度学习方法提取特征,得到一些较好的结果。但DAS信号处理常用的卷积神经网络(CNN)存在很多问题:在缺乏海量训练数据时,容易出现过拟合的问题;采用梯度下降算法,容易使训练结果收敛于局部最小值而非全局最小值;随着网络深度的加深,容易出现梯度弥散和性能退化的问题;而且对于带有干扰噪声的振动信号,已有的DAS深度学习算法并没有对振动信号的重要特征信息特别关注,即无法实现网络模型能够更快地自动聚焦于振动事件信号的关键有用部分,从而导致***的智能识别性能不佳。基于CNN的残差网络(Resnet),通过增加重要基本单元——残差块,不仅能够加速深度神经网络的训练,而且可以大幅提升深度网络的准确率。残差块通过跳跃连接的方式实现了中间特征的跨层连接,同时残差网络中引入了恒等映射,这些措施很大程度上避免了由于深度加深带来的梯度***或梯度消失以及网络退化的问题;由于CNN每进行一次卷积操作(包括对应的激活操作)都会浪费掉一些信息:如卷积核参数的随机性、激活函数的抑制作用等;这时,残差块中的跳跃连接相当于把以前处理过的信息直接再拿到现在进行一并处理,在一定程度上起到了有用信息减损的效果。此外,相较于CNN,Resnet存在更加明显的层级,提取的特征层层递进,使得特征更具有层次性,保证了输出特征的表达能力,加快网络的收敛速度。
发明内容
本发明的目的在于:提供了一种基于注意力机制的Resnet的分布式光纤传感信号识别方法,将注意力机制与深度学习网络相结合,使网络自动聚焦于信号的关键信息部分,形成主要信号特征表达,使得DAS识别网络具有更快的收敛速度、更低的训练损失和更高的识别准确率。
本发明采用的技术方案如下:
一种基于注意力机制的Resnet的分布式光纤传感信号识别方法,包括以下步骤:
步骤1:数据准备,构建不同类型的事件信号数据集;
步骤2:信号预处理,对事件信号数据集中的时间信号做信号预处理,构建时频特征数据集;
步骤3:构建基于注意力机制的残差网络:基于典型事件时频数据集,构建Resnet+CBAM网络模型,对模型进行离线训练,得到最终的事件识别模型;
步骤4:识别分类,利用最优模型对待测事件的时频数据集进行识别。
进一步地,所述步骤1具体包括以下步骤:
步骤1.1:利用基于相敏光时域反射仪的分布式光纤振动、声波传感***硬件,采集多场景复杂背景环境下管道沿线的分布式光纤传感信号;
步骤1.2:该***每个时刻返回沿空间分布的原始信号轨迹,在时间轴上连续累积T条原始信号轨迹,构建得到一个时间T维,空间S维的时空响应信号矩阵;
步骤1.3:在累积得到的时空响应信号矩阵中,抽取事件影响的任意一个空间点的一维时间序列,依次按列沿时间轴进行事件信号分割,来构建不同类型事件信号数据集。
进一步地,所述分布式光纤振动、声波传感***硬件包括探测光缆、光信号解调设备和信号处理主机。
进一步地,所述步骤2具体包括以下步骤:
步骤2.1:时间信号通过短时傅里叶变换得到时频图;
步骤2.2:对时频图进行预处理,包括裁剪、灰度转换并将二维图像转换为二维数据矩阵,构建事件信号样本的二维时频特征数据集。
进一步地,所述步骤3具体包括以下步骤:
步骤3.1:基于典型事件时频数据集,构建Resnet+CBAM网络模型,并设置Resnet+CBAM网络模型的参数;
步骤3.2:训练步骤3.1所得到的Resnet+CBAM网络模型;
步骤3.3:对训练后的Resnet+CBAM网络模型进行网络调优,若迭代结束,保存结果最好的模型作为最终的事件识别模型;否则,跳转至步骤3.2。
进一步地,所述步骤3.1中,构建的Resnet+CBAM网络模型,具体为:输入层-卷积层C1-ReLU层-池化层P1-残差块+CBAM1-卷积层C2-ReLU层-池化层P2-残差块+CBAM2-全连接层FC1-全连接层FC2-输出层。
进一步地,所述步骤3.2具体包括以下步骤:
步骤3.2.1:初始化所述Resnet+CBAM网络模型的参数,包括矩阵权重和偏置;
步骤3.2.2:将所述训练集中的时频特征样本信号输入到所述Resnet+CBAM的网络模型进行前向传播,得到所述时频信号样本的预测标签。
进一步地,所述步骤3.2.2中,注意力机制的具体实现为:在给出一个中间特征映射F后,CBAM模块沿着通道和空间两个维度依次推导出注意力映射,设通道注意力映射为MC,空间注意力映射为MS,最终的特征细化输出F″计算过程如下:
Figure BDA0002978596460000031
Figure BDA0002978596460000032
MC(F)=σ(MLP(AvgPool(F))+MLP(MaxPool(F)))
MS(F)=σ(f7×7([AvgPool(F);MaxPool(F)]))
其中:σ表示Sigmoid函数,f7×7表示一个卷积运算,滤波器尺寸为7×7。
进一步地,所述步骤3.3具体包括以下步骤:
步骤3.3.1:利用交叉信息熵损失函数计算所述预测标签与真实标签的损失值,计算公式:
Figure BDA0002978596460000033
其中:x,n,a,y分别表示样本、样本总数、样本预测标签、样本真实标签;
步骤3.3.2:利用所述损失值反向计算所述Resnet+CBAM网络模型的参数梯度,利用所述参数梯度更新Resnet+CBAM网络模型;采用Adam算法进行优化;
步骤3.3.3:用模型参数θ更新Resnet+CBAM网络模型后,利用训练损失值判断更新后的Resnet+CBAM网络模型是否收敛,若收敛,保存结果最好的模型作为最终的事件识别模型;否则,跳转至步骤3.2。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1.本发明的预处理简单,仅对事件信号进行短时傅里叶变换(STFT)得到时频图,相较于其他深度学习及识别方法中的复杂信号预处理过程,如:小波包去噪(WPD)、经验模态分解(EMD)、奇异值分解(SVD)等,降低了整个算法的计算复杂度和处理时延,便于实现在线实时处理。
2.本发明首次将Resnet网络应用于分布式光纤声波/振动传感***的信号识别领域,相较于DAS识别领域常用的CNN网络,Resnet通过残差块单元,不仅能够加速网络的训练过程,而且可以大幅提升网络的识别准确率。基于Resnet的DAS识别网络,具有模型参数少、收敛速度快、抗过拟合能力强、在线处理实时性好的优势。
3.本发明将注意力机制应用到DAS信号识别网络。注意力机制使识别模型能够自动聚焦于事件信号的关键信息部分,通过通道和空间这两个通道表达了信号中有意义的主要特征,实现了更高的DAS事件识别率。
4.本发明的Resnet+CBAM识别网络模型,不仅具有收敛速度快、抗过拟合能力强、在线处理实时性好的优势,而且能够更快地自动聚焦于振动事件信号的关键信息部分,提高了***对声源或振动源信号的特征深度学习与识别能力。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图,其中:
图1为本发明的信号识别算法流程图;
图2为本发明中分布式光纤振动、声波传感***结构及工作原理;
图3为本发明中经时间累积得到的分布式光纤振动、声波传感时空响应信号;
图4为本发明的Resnet+CBAM网络结构
图5为本发明的2D-CNN+CBAM网络结构;
图6为本发明中2D-CNN、Resnet、2D-CNN+CBAM、Resnet+CBAM四种网络模型的迭代损失曲线对比图;
图7为本发明中2D-CNN、Resnet、2D-CNN+CBAM、Resnet+CBAM四种网络模型的十折交叉验证对比图;
图8为本发明中2D-CNN、Resnet、2D-CNN+CBAM、Resnet+CBAM四种网络模型的抗过拟合能力对比图;
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,即所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
下面结合实施例对本发明的特征和性能作进一步的详细描述。
实施例1
以长距离管道安全监测应用为例,基于注意力机制(CBAM)的残差网络(Resnet)的分布式光纤振动、声波传感信号特征提取与分类方法,整个信号处理流程如图1所示,主要分为四个步骤:
步骤1:数据准备。利用基于相敏光时域反射仪的分布式光纤声波/振动传感***(DAS)硬件,采集多场景复杂背景环境下管道沿线的声音或振动信号(即分布式光纤传感信号),对各空间点采集的管道事件信号按时间段进行分割,构建不同类型的事件信号数据集。
步骤2:信号预处理。对事件信号数据集中的时间信号做短时傅里叶变换(STFT)得到时频图,对时频图像进行预处理,包括裁剪、灰度转换并将二维图像转换为二维数据矩阵,构建事件信号样本的二维时频特征数据集,并按7:3的比例将数据集随机划分为训练集和测试集。
步骤3:构建基于注意力机制(CBAM)的残差网络(Resnet),对不同类型典型事件信号的时频特征进行深度学习。首先构建具有两层残差块(Residual block)结构的残差网络(Residual Network),简称Resnet;然后在每个残差块的卷积输出后加入卷积注意力模块(Convolutional Block Attention Module),简称CBAM,整个网络模型简称Resnet+CBAM。同时,构建具有三层卷积结构的二维卷积神经网络,简称2D-CNN;然后在2D-CNN的每个卷积输出后加入同样的CBAM模块,作为对比,整个网络模型简称2D-CNN+CBAM。将步骤2得到的训练集中的信号作为输入,对构建的上述网络分别进行离线训练,通过训练迭代调整使网络性能达到最优。
步骤4:识别分类。将步骤2得到的测试集输入到训练好的Resnet+CBAM网络模型和2D-CNN+CBAM网络模型中,对待测事件进行识别分类,实现在线监测光缆沿线信号。并对两个网络模型得到的结果进行比较,包括损失曲线(Train loss)、识别准确率(TestAccuracy)等。同时,为了验证注意力机制的可行性,分别去掉了Resnet+CBAM网络模型和2D-CNN+CBAM网络模型中的卷积注意力模块(CBAM),其他网络结构保持不变,重复上述实验,并将2D-CNN网络模型、Resnet网络模型、2D-CNN+CBAM网络模型和Resnet+CBAM网络模型的识别结果进行对比,验证了注意力机制的可行性。
实施例2
本实施例是在实施例1的基础上,对本发明做出进一步地优化说明。
实施例1中信号采集采用的***硬件,是基于相位解调的相敏光时域反射(Φ-OTDR)技术的分布式光纤声音、振动传感***,***结构及其工作原理如图2所示。***硬件由三个部分组成,探测光缆、光信号解调设备、信号处理主机。探测光缆通常采用普通单模通信光纤,一般沿地下管道、输电线缆、城镇道路埋地铺设,也可直接利用沿管道或道路铺设的通信光缆空余纤芯。光信号解调设备是该***的核心,其内部组成器件主要包括光学器件和电学器件两类。由超窄线宽激光器产生一路连续相干光信号,经声光或电光调制器调制成光脉冲信号,光脉冲信号由掺铒光纤放大器(EDFA)集中放大,放大后的光脉冲信号依次经隔离器、环形器的1端口、2端口注入探测光缆;光脉冲信号沿光缆传输过程产生瑞利散射,其后向瑞利散射光信号沿光缆返回,由环形器的2端口、3端口接收,经光学滤波器滤除噪声信号后经第一耦合器耦合后,再将其注入到一个非平衡马赫曾德尔或迈克尔逊干涉仪等,具体由解调方法确定,经由3*3的第二耦合器输出三路相位差为120度的外界扰动引入的相位变化信息,即可获得声波及振动在光纤上的作用信号,解调出的光信号由光电探测器转换成电信号,再由波形发生卡控制的同步触发模数转换器进行信号同步采集,最后数字电信号通过网络等接口实时传输给信号处理主机。信号处理主机为普通电脑主机(PC)或FPGA/DSP嵌入式主板,用于光纤探测信号的分析、处理,通过特定信号处理算法得到引起声波、振动等的事件信息,并由光时域反射原理确定其位置,以及对感测事件进行智能分析、处理和识别分类。
该***每个时刻返回沿空间分布的原始信号轨迹,在时间轴上连续累积T条原始信号轨迹,构建得到一个时间T维,空间S维的时空信号矩阵:
{XX=xts(t=1,2,…,T;s=1,2,…,S)} (1)
其中T为时间采样长度,S为空间采样长度,单位均为采样点。经时间累积得到的分布式光纤声音、振动传感***的时空响应信号,如图3所示,横坐标为空间轴,表示管道沿线的数据采集空间点,两空间点的距离为ΔS;纵坐标为时间轴,两采样点采样间隔ΔT=1/fs,fs为时间轴上脉冲触发频率,即时间采样频率。
实施例3
本实施例是在实施例2的基础上,对本发明做出进一步地优化说明。
将实施例2中数据集的每个数据样本做信号预处理,构建信号的时频特征集。本发明中以管道安全监测为例,将各数据集中时间信号通过短时傅里叶变换(STFT)转换成时频图。为了确定非平稳信号在某个时间窗口内的频域分量,需要把时间窗进行局部化,从而确定在该段时间窗内的频率分量。设信号为f(t),需要的窗函数为h(t):
Gf(w,t)=∫f(τ)h(τ-t)ejwτdτ (2)
其中h(τ-t)表示了对窗函数进行局部时移t,利用t来定位到了局部时间窗的位置,在实际计算中,τ为离散的时间点,确定的短时信号为:
S(τ)=f(τ)h(τ-t) (3)
再对S(τ)做快速傅里叶变换(FFT),计算出其频率分量,从而降低了计算量。这里采用75阶的矩形窗,其优点是主瓣较集中。在生成时频图后,还需要将其进行预处理,包括灰度转换和裁剪,最终生成尺寸为500*100的二维时频数据矩阵,完成四类典型事件信号的时频特征数据集的构建。所述典型事件数据库中的振动事件信号包括:背景噪声、交通干扰、人工施工和机械破路。将所述典型事件数据库中的数据按7:3的比例分为训练集和测试集,如表1所示:
表1典型事件数据库
Figure BDA0002978596460000071
实施例4
本实施例是在实施例3的基础上,对本发明做出进一步地优化说明。
基于实施例3得到的时频特征数据集,构建并训练基于CBAM的Resnet网络(Resnet+CBAM),具体包括:设计Resnet+CBAM结构并设置网络结构参数、训练网络、网络更新和输出特征四个环节。具体方法如下:
1.设计Resnet+CBAM结构并设置网络结构参数
本发明采用输入层-卷积层C1-ReLU层-池化层P1-残差块+CBAM1-卷积层C2-ReLU层-池化层P2-残差块+CBAM2-全连接层FC1-全连接层FC2-输出层的网络结构,如图4所示,CBAM为注意力机制模块,添加在在每个残差块结构的卷积输出后。其中卷积层-ReLU层-池化层-残差块+CBAM构成一层卷积结构,即该网络结构包含两层卷积结构,具体网络结构参数设置如表2所示:
表2 Resnet+CBAM网络的结构参数
Figure BDA0002978596460000081
2.训练网络
Resnet+CBAM经过参数初始化后,将训练集中的数据输入其中,所述Resnet+CBAM深度学习网络模型的损失函数相同,经过网络前向传播得到预测类别概率分布,并通过交叉信息熵损失函数计算所述全连接层输出的类别概率与真实概率的损失值,利用所述损失值反向传播计算每个学习参数的梯度,通过指定的学习率,按照梯度下降法更新模型参数θ,所述模型参数θ包括矩阵权重W和偏置b。以模型第一次迭代学习过程为例进行说明:
初始化所述Resnet+CBAM网络模型的参数,所述参数包括矩阵权重W和偏置b。初始化的网络参数是模型训练的起点,好的初始化参数使得模型更易学习,快速收敛。本发明采用Xavier初始化方法进行参数初始化,为了保证前向传播和反向传播时每一层的方差一致,参数随机初始化的分布范围是一个通过该层的输入参数个数nin,输出参数个数nin得到的分布范围内的均匀分布,分布范围公式为:
Figure BDA0002978596460000091
将所述训练集中的时频特征样本信号输入到所述Resnet+CBAM网络模型进行前向传播,得到所述时频信号样本的预测标签;该过程主要包括2层卷积结构和2层全连接层:
卷积结构:以卷积结构1(卷积层C1-ReLU层-池化层P1-残差块+CBAM1)为例。计算过程如下:
卷积层C1:设卷积层的卷积核大小为m,步长为S,边界填充为p,输入的序列长度为L,输入特征通道数为Kin,输出特征通道数为Kout,输入的训练数据为
Figure BDA0002978596460000092
第j个卷积核初始化后权值矩阵
Figure BDA0002978596460000093
Figure BDA0002978596460000094
Figure BDA0002978596460000095
ReLU层:ReLU激活函数计算过程如下:
conv_out=max{0,convu} (7)
池化层P1:设池化层步长为s,计算过程如下:
Figure BDA0002978596460000096
残差块:残差块中存在跳跃连接,即:残差块里有2个具有相同输出通道数的3×3卷积层,每个卷积层后接一个ReLU激活函数,在得到第二次卷积结果时,需要加上该残差块的输入,再将结果通过ReLU激活函数进行激活,实现跳跃连接。因此,原先对H(x)映射做的微分,将转化为对F(x)+x的微分,这样的转化对问题进行分解重新表示或者进行预处理会降低问题优化的复杂度,而且可以避免梯度消散等问题,计算过程如下:
y=F(x,{Wi}+x) (9)
其中,y表示残差结构输出,x表示该结构的输入,{Wi}代表所做的卷积或者特征提取运算,F(x)表示对线性提取的特征做非线性的叠加激活,即ReLU激活函数。
CBAM1:在给出一个中间特征映射F后,CBAM模块沿着通道和空间两个维度依次推导出注意力映射,设通道注意力映射为MC,空间注意力映射为MS。然后将注意力映射乘到输入特征映射上进行自适应的特征细化,强调了卷积过程中沿着通道和空间这两个主要维度的有意义的特征,最终的特征细化输出计算过程如下:
Figure BDA0002978596460000101
Figure BDA0002978596460000102
MC(F)=σ(MLP(AvgPool(F))+MLP(MaxPool(F))) (12)
MS(F)=σ(f7×7([AvgPool(F);MaxPool(F)])) (13)
其中:σ表示Sigmoid函数,f7×7表示一个卷积运算,滤波器尺寸为7×7。
全连接层:以全连接层FC1为例,设输入为xi,权重矩阵Wi,偏置yi,最终分类输出yi计算过程如下:
yi=Wi×xi+bi (14)
3.网络更新
根据得到的分类输出计算损失函数,以此对构建的Resnet+CBAM网络模型进行更新和调优,具体步骤如下:
利用交叉信息熵损失函数计算所述预测标签与真实标签的损失值:根据交叉信息熵损失函数计算预测事件标签与真实标签之间的距离,得到损失值,计算公式如下:
Figure BDA0002978596460000103
其中:x,n,a,y分别表示样本、样本总数、样本预测标签、样本真实标签。
利用所述损失值反向计算所述Resnet+CBAM网络模型的参数梯度,利用所述参数梯度更新所述Resnet+CBAM深度学习模型;本发明采用Adam算法进行优化,计算步骤如下:
Figure BDA0002978596460000104
mt=u*mt-1+(1-u)*gt (17)
Figure BDA0002978596460000105
其中:gt为计算的目标梯度,mt、nt分别是梯度的一阶、二阶矩估计,u,v∈[0,1),分别为梯度一阶、二阶矩的指数衰减率。
设第t次迭代,
Figure BDA0002978596460000106
则网络参数更新公式为:
Figure BDA0002978596460000107
其中:α为学习率,ε为非常小的数,防止除以零。
用模型参数θ更新Resnet+CBAM网络模型后,利用训练损失值判断所述Resnet+CBAM网络模型是否收敛,若收敛,则训练过程结束,否则跳转至步骤(2),直至达到设定的最大迭代次数。经过多次迭代,待损失函数值小于一定阈值或迭代超过一定阈值,认为模型收敛,则停止以上迭代过程。迭代收敛后,使用训练数据集中的验证集进行模型验证,保存结果最好的模型作为最终的事件识别模型。
实施例5
本实施例是在实施例4的基础上,对本发明做出进一步地优化说明。
将实施例4得到的Resnet+CBAM最优模型作为事件识别模型,对四类典型待测事件进行识别,实现在线监测光缆沿线信号,并与相同情况下(相同输入条件下)训练好的三类常用网络模型2D-CNN、Resnet、2D-CNN+CBAM进行比较,比较的内容包括损失曲线(Trainloss)、识别准确率(Test Accuracy)、在线识别时间(Testing time per sample)和十折交叉验证等。这里,卷积神经网络是本领域主要采用的深度学习网络。2D-CNN+CBAM的网络结构如图5所示,具有三层卷积结构,具体网络结构参数设置如表3所示:
表3 2D-CNN+CBAM网络的结构参数
Figure BDA0002978596460000111
将图5中的CBAM模块(虚线部分)去掉即为2D-CNN的网络结构图,同样的,将图4中的CBAM模块去掉即为Resnet的网络结构图。
将2D-CNN、Resnet、2D-CNN+CBAM和Resnet+CBAM的识别结果进行对比,在不同的Epoch数(Epoch number)、缩减比(Reduction number)下的平均训练损失值(Train Loss)、平均训练准确率(Train Accuracy)、平均测试准确率(Test Accuracy)和在线识别时间(Testing time per sample)如表4所示,四个模型在相同条件下迭代过程中的损失曲线如图6所示,四个模型的十折交叉验证结果图如图7所示,四个模型在在相同条件下迭代过程中的抗过拟合能力如图8所示。
表4四种网络模型的事件识别的综合性能对比
Figure BDA0002978596460000121
对于没有增加注意力机制的情况:首先,从表4中的平均训练损失值和图6的损失曲线可以看出,Resnet网络模型在收敛效果上优于2D-CNN网络模型,从表4中的平均测试准确率和图7的十折交叉验证结果可以看出,Resnet网络模型在识别准确率上略优于2D-CNN。其次,从图8的训练集准确率(training acc)和测试集准确率(testing acc)可以看出,对于同样的数据集,2D-CNN设置Epoch=8,再增大Epoch将出现明显的过拟合现象;Resnet可以设置到Epoch=10,没有出现过拟合;这是因为Resnet网络通过残差块实现跳跃连接,而且输出的特征加上了原始的输入样本,使得梯度在1附近,避免了2D-CNN中容易出现的梯度***、过拟合等问题。再次,从表4中的单样本在线识别时间可以看出,Resnet的识别时间为0.001512s,明显快于2D-CNN的0.002494s;究其原因,从二者的网络结构上可以看出,本实施例中的Resnet使用了两层卷积结构,2D-CNN使用了三层卷积结构,Resnet的网络参数少于2D-CNN,因此同等情况下,Resnet对于单个样本的计算时间比2D-CNN要短,运算速度更快,时效性更好。由此可以看出在本实施例的应用场景下,Resnet网络的综合性能优于2D-CNN。
对于增加注意力机制的情况:首先,对于参数设置中的缩减比,它是注意力机制CBAM模块中的一个超参数,主要影响CBAM中输入输出通道的比值,默认值为16,适用于大尺寸大样本量的数据集。实验发现对于本实施例中数据样本量和尺寸都较小的数据集,适当减小缩减比会得到最好的性能,并通过实验得出最佳的缩减比值为4。然后,比较2D-CNN和2D-CNN+CBAM,平均识别准确率从96.95%提升到97.85%,增加了1.84%,而且收敛效果有所改善,由于增加了注意力机制模块,2D-CNN+CBAM的网络参数多于2D-CNN,使得2D-CNN+CBAM的识别时间长于2D-CNN;比较Resnet和Resnet+CBAM,平均识别准确率从97.03%提升到98.90%,增加了1.87%,收敛效果也有所改善,同样的,Resnet+CBAM的识别时间也长于Resnet。最后,再比较2D-CNN+CBAM和Resnet+CBAM:在相同的Epoch数和缩减比的情况下,Resnet+CBAM的平均识别准确率为98.90%,略优于2D-CNN+CBAM的98.79%,Resnet+CBAM的收敛效果也优于2D-CNN+CBAM;而且,对于二者的在线识别时间,Resnet+CBAM也有明显的优势。由此可以看出,注意力机制使网络模型能够更快地聚焦于振动事件信号的关键部分,通过通道和空间这两个通道表达了信号中有意义的主要特征,提高了模型的识别准确率,这也验证了注意力机制的可行性。
表4的在线识别时间的结果表明:识别速度依次是,Resnet快于2D-CNN,Resnet+CBAM快于2D-CNN+CBAM。由于网络增加了注意力机制模块,Resnet+CBAM和2D-CNN+CBAM的识别时间分别长于Resnet和2D-CNN;但是,Resnet+CBAM的识别时间为0.003329s,明显少于2D-CNN+CBAM的0.018502s,与2D-CNN相近,仅比2D-CNN慢了0.000835s;由此可以看出,本实施例中的Resnet+CBAM也具有较好的时效性。从图6的四条损失曲线图可以看出:2D-CNN、Resnet、2D-CNN+CBAM和Resnet+CBAM的损失曲线斜率逐渐增大,即模型的收敛速度依次增大,Resnet+CBAM的网络收敛效果最好。从图7的十折交叉验证可以看出:本发明提出的Resnet+CBAM模型可以稳定地达到98.7%的识别率,依次优于相同条件下2D-CNN+CBAM、Resnet、2D-CNN的识别率。从图8的四个模型抗过拟合能力对比图可以看出:本发明提出的Resnet+CBAM模型具有较好的抗过拟合能力,并依次优于相同条件下Resnet、2D-CNN+CBAM、2D-CNN的抗过拟合能力。
综上,对于2D-CNN、Resnet、2D-CNN+CBAM和Resnet+CBAM这四个网络模型(网络模型又称深度学习模型),本发明提出的Resnet+CBAM模型在识别准确率、抗过拟合能力、收敛效果、计算效率上性能最佳,并分别优于2D-CNN+CBAM、Resnet、2D-CNN等网络。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明的保护范围,任何熟悉本领域的技术人员在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于注意力机制的Resnet的分布式光纤传感信号识别方法,其特征在于:包括以下步骤:
步骤1:数据准备,构建不同类型的事件信号数据集;
步骤2:信号预处理,对事件信号数据集中的时间信号做信号预处理,构建时频特征数据集;
步骤3:构建基于注意力机制的残差网络:基于典型事件时频数据集,构建Resnet+CBAM网络模型,对模型进行离线训练,得到最终的事件识别模型;
步骤4:识别分类,利用最优模型对待测事件的时频数据集进行识别;
所述步骤3包括以下步骤:
步骤3.1:基于典型事件时频数据集,构建Resnet+CBAM网络模型,并设置Resnet+CBAM网络模型的参数;
步骤3.2:训练步骤3.1所得到的Resnet+CBAM网络模型;
步骤3.3:对训练后的Resnet+CBAM网络模型进行网络调优,若迭代结束,保存结果最好的模型作为最终的事件识别模型;否则,跳转至步骤3.2;
具体地:
所述步骤3.1中,构建的Resnet+CBAM网络模型,具体为:输入层-卷积层C1-ReLU层-池化层P1-残差块+CBAM1-卷积层C2-ReLU层-池化层P2-残差块+CBAM2-全连接层FC1-全连接层FC2-输出层;
所述步骤3.2包括以下步骤:
步骤3.2.1:初始化所述Resnet+CBAM网络模型的参数,包括矩阵权重和偏置;
步骤3.2.2:将训练集中的时频特征样本信号输入到所述Resnet+CBAM的网络模型进行前向传播,得到时频信号样本的预测标签。
2.根据权利要求1所述的一种基于注意力机制的Resnet的分布式光纤传感信号识别方法,其特征在于:所述步骤1具体包括以下步骤:
步骤1.1:利用基于相敏光时域反射仪的分布式光纤振动、声波传感***硬件,采集多场景复杂背景环境下管道沿线的分布式光纤传感信号;
步骤1.2:该***每个时刻返回沿空间分布的原始信号轨迹,在时间轴上连续累积T条原始信号轨迹,构建得到一个时间T维,空间S维的时空响应信号矩阵;
步骤1.3:在累积得到的时空响应信号矩阵中,抽取事件影响的任意一个空间点的一维时间序列,依次按列沿时间轴进行事件信号分割,来构建不同类型事件信号数据集。
3.根据权利要求2所述的一种基于注意力机制的Resnet的分布式光纤传感信号识别方法,其特征在于:所述分布式光纤振动、声波传感***硬件包括探测光缆、光信号解调设备和信号处理主机。
4.根据权利要求1所述的一种基于注意力机制的Resnet的分布式光纤传感信号识别方法,其特征在于:所述步骤2具体包括以下步骤:
步骤2.1:时间信号通过短时傅里叶变换得到时频图;
步骤2.2:对时频图进行预处理,包括裁剪、灰度转换并将二维图像转换为二维数据矩阵,构建事件信号样本的二维时频特征数据集。
5.根据权利要求1所述的一种基于注意力机制的Resnet的分布式光纤传感信号识别方法,其特征在于:所述步骤3.2.2中,注意力机制的具体实现为:在给出一个中间特征映射F后,CBAM模块沿着通道和空间两个维度依次推导出注意力映射,设通道注意力映射为MC,空间注意力映射为MS,最终的特征细化输出F″计算过程如下:
Figure FDA0003539827700000021
Figure FDA0003539827700000022
MC(F)=σ(MLP(AvgPool(F))+MLP(MaxPool(F)))
MS(F)=σ(f7×7([AvgPool(F);MaxPool(F)]))
其中:σ表示Sigmoid函数,f7×7表示一个卷积运算,滤波器尺寸为7×7。
6.根据权利要求1所述的一种基于注意力机制的Resnet的分布式光纤传感信号识别方法,其特征在于:所述步骤3.3具体包括以下步骤:
步骤3.3.1:利用交叉信息熵损失函数计算所述预测标签与真实标签的损失值,计算公式:
Figure FDA0003539827700000023
其中:x,n,a,y分别表示样本、样本总数、样本预测标签、样本真实标签;
步骤3.3.2:利用所述损失值反向计算所述Resnet+CBAM网络模型的参数梯度,利用所述参数梯度更新Resnet+CBAM网络模型;采用Adam算法进行优化;
步骤3.3.3:用模型参数θ更新Resnet+CBAM网络模型后,利用训练损失值判断更新后的Resnet+CBAM网络模型是否收敛,若收敛,保存结果最好的模型作为最终的事件识别模型;否则,跳转至步骤3.2。
CN202110283686.XA 2021-03-16 2021-03-16 一种基于注意力机制的Resnet的分布式光纤传感信号识别方法 Active CN113049084B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110283686.XA CN113049084B (zh) 2021-03-16 2021-03-16 一种基于注意力机制的Resnet的分布式光纤传感信号识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110283686.XA CN113049084B (zh) 2021-03-16 2021-03-16 一种基于注意力机制的Resnet的分布式光纤传感信号识别方法

Publications (2)

Publication Number Publication Date
CN113049084A CN113049084A (zh) 2021-06-29
CN113049084B true CN113049084B (zh) 2022-05-06

Family

ID=76512894

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110283686.XA Active CN113049084B (zh) 2021-03-16 2021-03-16 一种基于注意力机制的Resnet的分布式光纤传感信号识别方法

Country Status (1)

Country Link
CN (1) CN113049084B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113719764A (zh) * 2021-08-04 2021-11-30 中国人民解放军陆军勤务学院 一种管道泄漏检测方法
CN113610857B (zh) * 2021-08-24 2024-02-06 济南大学 一种基于残差网络的苹果分级方法及***
CN115276853B (zh) * 2022-06-16 2023-10-03 宁波大学 一种基于cnn-cbam的频谱感知方法
CN114866172B (zh) * 2022-07-05 2022-09-20 中国人民解放军国防科技大学 基于倒残差深度神经网络的干扰识别方法和装置
CN115952409A (zh) * 2023-03-13 2023-04-11 山东省科学院激光研究所 碰撞识别方法、装置、设备和存储介质
CN116310597A (zh) * 2023-05-09 2023-06-23 广东工业大学 垃圾分类和定位方法、无人清洁艇控制方法及***
CN116863251B (zh) * 2023-09-01 2023-11-17 湖北工业大学 一种分布式光纤传感扰动识别方法
CN117390413B (zh) * 2023-10-19 2024-06-14 东北电力大学 分布式电力光纤振动信号降噪与时序特征提取的识别方法
CN117376977B (zh) * 2023-12-07 2024-02-13 深圳市华粤世通软件科技有限公司 一种手机5g无线信号测试***、方法、设备及介质
CN117636269A (zh) * 2024-01-23 2024-03-01 济南博赛网络技术有限公司 道路护栏碰撞智能检测的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111339858A (zh) * 2020-02-17 2020-06-26 电子科技大学 一种基于神经网络的油气管道标志物识别方法
WO2020155606A1 (zh) * 2019-02-02 2020-08-06 深圳市商汤科技有限公司 面部识别方法及装置、电子设备和存储介质
CN111666898A (zh) * 2020-06-09 2020-09-15 北京字节跳动网络技术有限公司 用于识别车辆所属类别的方法和装置
CN112036509A (zh) * 2020-09-30 2020-12-04 北京百度网讯科技有限公司 用于训练图像识别模型的方法和装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10949660B2 (en) * 2017-04-10 2021-03-16 Pearson Education, Inc. Electronic handwriting processor with convolutional neural networks
CN108010514B (zh) * 2017-11-20 2021-09-10 四川大学 一种基于深度神经网络的语音分类方法
CN109147048B (zh) * 2018-07-23 2021-02-26 复旦大学 一种利用单张彩色图的三维网格重建方法
CN108921911B (zh) * 2018-08-01 2021-03-09 中国科学技术大学 结构化图片自动转换为源代码的方法
CN110995339B (zh) * 2019-11-26 2022-08-19 电子科技大学 一种分布式光纤传感信号时空信息提取与识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020155606A1 (zh) * 2019-02-02 2020-08-06 深圳市商汤科技有限公司 面部识别方法及装置、电子设备和存储介质
CN111339858A (zh) * 2020-02-17 2020-06-26 电子科技大学 一种基于神经网络的油气管道标志物识别方法
CN111666898A (zh) * 2020-06-09 2020-09-15 北京字节跳动网络技术有限公司 用于识别车辆所属类别的方法和装置
CN112036509A (zh) * 2020-09-30 2020-12-04 北京百度网讯科技有限公司 用于训练图像识别模型的方法和装置

Also Published As

Publication number Publication date
CN113049084A (zh) 2021-06-29

Similar Documents

Publication Publication Date Title
CN113049084B (zh) 一种基于注意力机制的Resnet的分布式光纤传感信号识别方法
CN108932480B (zh) 基于1d-cnn的分布式光纤传感信号特征学习与分类方法
Wu et al. A dynamic time sequence recognition and knowledge mining method based on the hidden Markov models (HMMs) for pipeline safety monitoring with Φ-OTDR
CN110995339B (zh) 一种分布式光纤传感信号时空信息提取与识别方法
CN109344195B (zh) 基于hmm模型的管道安全事件识别及知识挖掘方法
CN111649817B (zh) 一种分布式光纤振动传感器***及其模式识别方法
CN111442827B (zh) 一种变压器绕组振动的光纤无源在线监测***
Yang et al. Pipeline safety early warning by multifeature-fusion CNN and LightGBM analysis of signals from distributed optical fiber sensors
CN114857504A (zh) 基于分布式光纤传感器和深度学习的管道安全监测方法
CN114692681B (zh) 基于scnn的分布式光纤振动及声波传感信号识别方法
CN103226028B (zh) 一种相敏光时域反射仪扰动信号检测与识别方法
Yang et al. Long-distance pipeline safety early warning: a distributed optical fiber sensing semi-supervised learning method
CN111695465B (zh) 基于压力波模式识别的管网故障诊断与定位方法及***
CN113687433B (zh) 一种基于Bi-LSTM的大地电磁信号去噪方法及***
CN112985574B (zh) 基于模型融合的光纤分布式声波传感信号高精度分类识别方法
CN116818080A (zh) Das信号的多维深度特征提取与识别方法
Jia et al. Event Identification by F-ELM Model for $\varphi $-OTDR Fiber-Optic Distributed Disturbance Sensor
Sheng et al. Optical fiber intrusion signal recognition method based on TSVD-SCN
Wu et al. Improved generalization in signal identification with unsupervised spiking neuron networks for fiber-optic distributed acoustic sensor
CN111539393B (zh) 基于emd分解与lstm的油气管道第三方施工预警方法
Liang et al. Prediction of fiber Rayleigh scattering responses based on deep learning
CN111951505A (zh) 基于分布式光纤***的围栏振动入侵定位和模式识别方法
CN116091897A (zh) 一种基于轻量化的分布式光纤传感事件识别方法及***
Li et al. A spatial and temporal signal fusion based intelligent event recognition method for buried fiber distributed sensing system
CN112464777B (zh) 一种光纤振动源垂直距离智能估算方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant