CN117909719A - 基于自主学习算法的终端物联设备监控预警方法及*** - Google Patents

基于自主学习算法的终端物联设备监控预警方法及*** Download PDF

Info

Publication number
CN117909719A
CN117909719A CN202410312063.4A CN202410312063A CN117909719A CN 117909719 A CN117909719 A CN 117909719A CN 202410312063 A CN202410312063 A CN 202410312063A CN 117909719 A CN117909719 A CN 117909719A
Authority
CN
China
Prior art keywords
output
neural network
data
query
convolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410312063.4A
Other languages
English (en)
Other versions
CN117909719B (zh
Inventor
卞辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qinyuan Jiangsu Technology Co ltd
Original Assignee
Qinyuan Jiangsu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qinyuan Jiangsu Technology Co ltd filed Critical Qinyuan Jiangsu Technology Co ltd
Priority to CN202410312063.4A priority Critical patent/CN117909719B/zh
Publication of CN117909719A publication Critical patent/CN117909719A/zh
Application granted granted Critical
Publication of CN117909719B publication Critical patent/CN117909719B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16YINFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
    • G16Y40/00IoT characterised by the purpose of the information processing
    • G16Y40/10Detection; Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2123/00Data types
    • G06F2123/02Data types in the time domain, e.g. time-series data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Fuzzy Systems (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于自主学习算法的终端物联设备监控预警方法及***,涉及设备监控技术领域,包括:采集初始数据,将初始数据分解为时序数据和空间数据,对空间数据进行卷积,得到卷积输出,将卷积输出拆分为查询项,查询键和查询值,计算相似度得到注意力权重,对查询值进行加权求和,得到第一输出;初始化循环神经网络,分别调整更新门和重置门对应的权重,结合可变学习率生成多个双向循环神经网络,计算正向输出和反向输出,沿通道维度拼接,得到第二输出;将第一输出和第二输出作为输入,分别进行卷积,应用激活函数,得到初始故障概率,计算损失值,根据损失值堆叠层数进行调整,使用调整后的模型处理初始数据,得到设备故障概率。

Description

基于自主学习算法的终端物联设备监控预警方法及***
技术领域
本发明涉及设备监控技术领域,尤其涉及一种基于自主学习算法的终端物联设备监控预警方法及***。
背景技术
现有技术中,CN116929459A公开了一种基于物联网的电子设备自动化测试预警***及方法,属于电子设备测试技术领域。本发明包括:S10:对电子设备内部各电子器件在各时刻的工作温度进行预测;S20:对电子设备内部各电子器件在各时刻被腐蚀的程度进行预测;S30:基于电子设备内部各电子器件的重要程度,对电子设备在各时刻发生故障的概率进行预测:S40:根据S30中预测的电子设备在各时刻发生故障的概率,选择是否向测试端界面发送预警信息。
综上,现有技术虽然能够通过设备数据对故障概率进行预测,但无法结合实际生产任务对预测方法进行适应性调整,无法适用于大部分任务,因此需要一种方案解决现有技术中存在的问题。
发明内容
本发明实施例提供一种基于自主学习算法的终端物联设备监控预警方法及***,至少能解决现有技术中存在的部分问题。
本发明实施例的第一方面,提供一种基于自主学习算法的终端物联设备监控预警方法,包括:
基于物联网设备上的传感器采集初始数据,根据时间节点将所述初始数据分解为时序数据和空间数据,通过深度融合网络模型中的卷积神经网络对所述空间数据进行卷积和池化,得到卷积输出,通过预先引入的注意力机制将所述卷积输出拆分为查询项,查询键和查询值,通过点积操作计算所述查询项和所述查询键的相似度得到注意力权重,根据注意力权重对所述查询值进行加权求和,得到第一输出;
将所述时序数据作为所述深度融合网络模型中的循环神经网络的输入,初始化所述循环神经网络,分别调整更新门和重置门对应的权重,结合预先设置的可变学习率对所述重置门进行更新后,堆叠多个正向循环神经网络和反向循环神经网络生成多个双向循环神经网络,对于所述时序数据中的每个时间步,分别计算当前时间步对应的正向输出和反向输出,将所述正向输出和所述反向输出沿通道维度拼接,得到第二输出;
根据所述第一输出和所述第二输出,确定一维卷积层中卷积核大小,将所述第一输出和所述第二输出作为所述一维卷积层的输入,分别进行卷积,对卷积结果应用激活函数,得到初始故障概率,基于所述初始故障概率,结合预先构建的损失函数计算损失值,并根据所述损失值对所述深度融合网络模型中双向循环神经网络堆叠层数进行调整,使用调整后的模型处理所述初始数据,得到设备故障概率。
在一种可选的实施方式中,
所述基于物联网设备上的传感器采集初始数据,根据时间节点将所述初始数据分解为时序数据和空间数据,通过深度融合网络模型中的卷积神经网络对所述空间数据进行卷积和池化,得到卷积输出包括:
获取物联网设备上的传感器采集到的初始数据,对所述初始数据进行解析,识别所述初始数据中与时间相关的变量,得到所述时序数据,根据所述初始数据中传感器的位置坐标和物联网设备的地理位置以及物联网设备周围的环境布局确定所述空间数据;
对于所述空间数据,通过卷积神经网络中的卷积层在所述空间数据上滑动卷积核,提取空间数据中的特征,输出空间特征图,初始化池化窗口,设置所述池化窗口的大小和步幅,在所述输出空间特征图上应用所述池化窗口,选择所述池化窗口中的最大值,重复选择直至当前输出空间特征图被处理完成,得到所述卷积输出。
在一种可选的实施方式中,
所述过预先引入的注意力机制将所述卷积输出拆分为查询项,查询键和查询值,通过点积操作计算所述查询项和所述查询键的相似度得到注意力权重,根据注意力权重对所述查询值进行加权求和,得到第一输出包括:
将所述卷积输出转换为三维特征图,对于所述三维特征图的每一个维度,设置对应的权重矩阵和偏置项,根据所述权重矩阵对所述三维特征图的每一个维度进行线性变换,得到所述查询项,查询键和查询值,对于每个线性变换后的结果进行批归一化,得到归一化数值,将所述归一化数值与所述卷积输出进行残差连接,得到预测输出;
对于所述查询项和所述查询键,通过点积操作确定相似度,基于所述相似度,确定每个查询项和每个查询键之间的关联强度,生成对应的注意力矩阵,基于所述注意力矩阵对所述查询值进行加权求和,结合所述预测输出,应用激活函数得到所述第一输出。
在一种可选的实施方式中,
所述将所述时序数据作为所述深度融合网络模型中的循环神经网络的输入,初始化所述循环神经网络,分别调整更新门和重置门对应的权重,结合预先设置的可变学习率对所述重置门进行更新后,堆叠多个正向循环神经网络和反向循环神经网络生成多个双向循环神经网络包括:
初始化所述循环神经网络,根据所述时序数据随机生成第一训练集,调整所述循环神经网络中所述更新门对应的第一权重和重置门对应的第二权重,根据所述第一训练集计算正向循环神经网络对应的重置门和更新门数据,并计算循环神经网络中的隐藏状态和候选隐藏状态,根据计算结果调整所述更新门对应的第一权重;
对于所述重置门,初始化所述第二权重和偏置,结合所述可变学习率,通过余弦退火算法确定所述重置门更新后的第一学习率,根据所述第一学习率,通过梯度下降算法调整所述重置门的超参数,对所述重置门进行更新;
基于更新后的重置门和所述更新门,确定所述正向循环神经网络和反向循环神经网络的组成结构,根据所述时序数据,确定堆叠层数,根据堆叠层数,在每个需要堆叠的层堆叠一个对应的双向循环神经网络,其中所述双向循环神经网络包含一个正向循环神经网络和一个反向循环神经网络,正向循环神经网络用于处理正向时间序列,反向循环神经网络用于处理反向时间序列。
在一种可选的实施方式中,
所述结合所述可变学习率,通过余弦退火算法确定所述重置门更新后的第一学习率如下公式所示:
其中,η t 表示时间步t处的学习率,η min 表示学习率最小值,η max 表示学习率最大值,t表示时间步tT表示总时间步。
在一种可选的实施方式中,
所述对于所述时序数据中的每个时间步,分别计算当前时间步对应的正向输出和反向输出,将所述正向输出和所述反向输出沿通道维度拼接,得到第二输出包括:
根据所述双向循环神经网络,对于所述时序数据中的每个时间步,初始化双向循环神经网络的隐藏状态,从第一个时间步开始,将所述时序数据和正向循环神经网络的前一时间步隐藏状态添加至所述正向循环神经网络,计算当前时间步对应的正向输出;
从所述时序数据的最后一个时间步开始,对于每个时间步,将时序数据和反向循环神经网络的前一时间步隐藏状态添加至所述反向循环神经网络,得到所述反向输出;
根据所述正向输出和所述反向输出,在每个时间步上,将正向输出张量的通道维度和反向输出张量的通道维度通过拼接操作连接,得到拼接输出;
在堆叠的双向循环神经网络层中间,添加失活层,将所述拼接输出作为所述失活层的输入,根据预设的失活概率判断所述拼接输出是否被失活,若是,则将所述拼接输出置零,若不是,则将所述拼接输出作为所述第二输出并输出。
在一种可选的实施方式中,
所述根据所述第一输出和所述第二输出,确定一维卷积层中卷积核大小,将所述第一输出和所述第二输出作为所述一维卷积层的输入,分别进行卷积,对卷积结果应用激活函数,得到初始故障概率,基于所述初始故障概率,结合预先构建的损失函数计算损失值,并根据所述损失值对所述深度融合网络模型中双向循环神经网络堆叠层数进行调整,使用调整后的模型处理所述初始数据,得到设备故障概率包括:
基于所述第一输出和所述第二输出,在融合层中添加一维卷积层,确定所述一维卷积层中卷积核的大小和步幅,将所述第一输出和所述第二输出作为输入数据添加至所述一维卷积层;
对所述第一输出和所述第二输出分别进行一维卷积操作,通过逐元素相加进行融合,得到融合输出,对所述融合输出应用非线性激活函数,得到所述初始故障概率;
将所述初始故障概率与实际故障概率进行比较,通过损失函数计算所述初始故障概率与实际故障概率之间的损失值,将所述损失值与预设的损失阈值进行比较,若所述损失值大于预设的损失阈值,则认为所述初始故障概率不可信,否则,认为所述初始故障概率可信,将所述初始故障概率作为设备故障概率并输出;
若所述初始故障概率不可信,则基于所述初始数据生成包含多个数据的第二训练集,获取多个初始数据作为验证集,分别计算所述第二训练集和所述验证集的损失值,若所述损失值在第二训练集中下降,在验证集中上升,则认为出现过拟合,减少所述深度融合网络模型中堆叠的双向循环神经网络的层数,使用调整后的深度融合网络模型处理所述初始数据,得到所述设备故障概率。
在一种可选的实施方式中,
所述通过损失函数计算所述初始故障概率与实际故障概率之间的损失值如下公式所示:
其中,L表示损失函数值,N表示训练集中样本总数量,y i 表示样本i的实际标签,z i 表示模型对样本i的预测值,λ表示正则化强度,表示模型中所有参数的平方和。
本发明实施例的第二方面,提供一种基于自主学习算法的终端物联设备监控预警***,包括:
第一单元,用于基于物联网设备上的传感器采集初始数据,根据时间节点将所述初始数据分解为时序数据和空间数据,通过深度融合网络模型中的卷积神经网络对所述空间数据进行卷积和池化,得到卷积输出,通过预先引入的注意力机制将所述卷积输出拆分为查询项,查询键和查询值,通过点积操作计算所述查询项和所述查询键的相似度得到注意力权重,根据注意力权重对所述查询值进行加权求和,得到第一输出;
第二单元,用于将所述时序数据作为所述深度融合网络模型中的循环神经网络的输入,初始化所述循环神经网络,分别调整更新门和重置门对应的权重,结合预先设置的可变学习率对所述重置门进行更新后,堆叠多个正向循环神经网络和反向循环神经网络生成多个双向循环神经网络,对于所述时序数据中的每个时间步,分别计算当前时间步对应的正向输出和反向输出,将所述正向输出和所述反向输出沿通道维度拼接,得到第二输出;
第三单元,用于根据所述第一输出和所述第二输出,确定一维卷积层中卷积核大小,将所述第一输出和所述第二输出作为所述一维卷积层的输入,分别进行卷积,对卷积结果应用激活函数,得到初始故障概率,基于所述初始故障概率,结合预先构建的损失函数计算损失值,并根据所述损失值对所述深度融合网络模型中双向循环神经网络堆叠层数进行调整,使用调整后的模型处理所述初始数据,得到设备故障概率。
本发明实施例的第三方面,
提供一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现前述所述的方法。
本发明中,卷积神经网络处理空间数据,提取空间特征,而循环神经网络对时序数据进行处理,捕捉时序模式,引入注意力机制增强模型对关键信息的关注度。通过多个双向循环神经网络的拼接,得到更丰富的时序特征表示,一维卷积层有效融合时空信息,生成初始故障概率。通过损失函数优化模型,自适应调整网络层数,提高了模型的泛化性和可靠性,为设备故障概率的准确预测提供了有效手段,综上,本发明在综合利用多模态信息、提高特征学习、适应性网络调整等方面表现出色,为设备故障预测提供了强大而可靠的技术手段。
附图说明
图1为本发明实施例基于自主学习算法的终端物联设备监控预警方法的流程示意图;
图2为本发明实施例基于自主学习算法的终端物联设备监控预警***的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图1为本发明实施例基于自主学习算法的终端物联设备监控预警方法的流程示意图,如图1所示,所述方法包括:
S1.基于物联网设备上的传感器采集初始数据,根据时间节点将所述初始数据分解为时序数据和空间数据,通过深度融合网络模型中的卷积神经网络对所述空间数据进行卷积和池化,得到卷积输出,通过预先引入的注意力机制将所述卷积输出拆分为查询项,查询键和查询值,通过点积操作计算所述查询项和所述查询键的相似度得到注意力权重,根据注意力权重对所述查询值进行加权求和,得到第一输出;
所述初始数据是指直接从物联网设备上的传感器获取的原始数据,包括各种传感器的读数,例如温度、湿度、光照,所述时序数据是初始数据根据时间节点分解得到的序列数据,表示数据随着时间的变化而采集的情况,所述空间数据是初始数据根据空间维度(可能是设备上的不同传感器)分解得到的数据,所述卷积神经网络是一种深度学习模型,用于处理具有空间结构的数据,所述查询项是卷积输出被拆分后得到的数据,用于描述希望关注的内容,所述查询键用于描述被比较的内容,以计算相似度,所述查询值用于被加权求和,得到最终的输出。
在一种可选的实施方式中,
所述基于物联网设备上的传感器采集初始数据,根据时间节点将所述初始数据分解为时序数据和空间数据,通过深度融合网络模型中的卷积神经网络对所述空间数据进行卷积和池化,得到卷积输出包括:
获取物联网设备上的传感器采集到的初始数据,对所述初始数据进行解析,识别所述初始数据中与时间相关的变量,得到所述时序数据,根据所述初始数据中传感器的位置坐标和物联网设备的地理位置以及物联网设备周围的环境布局确定所述空间数据;
对于所述空间数据,通过卷积神经网络中的卷积层在所述空间数据上滑动卷积核,提取空间数据中的特征,输出空间特征图,初始化池化窗口,设置所述池化窗口的大小和步幅,在所述输出空间特征图上应用所述池化窗口,选择所述池化窗口中的最大值,重复选择直至当前输出空间特征图被处理完成,得到所述卷积输出。
通过物联网设备上的传感器采集初始数据,这些数据可能包括各种传感器的读数,例如温度、湿度、光照等,对初始数据进行解析,从解析后的初始数据中提取与时间相关的变量,通过提取时间戳和日期等操作,形成时序数据,利用初始数据中的传感器位置坐标和物联网设备的地理位置,结合物联网设备周围的环境布局,确定每个传感器的位置,传感器之间的相对位置关系以及拍摄的设备空间图像,确定空间数据;
示例性地,假设本方案是引用于智能农业的物联设备监测***,则传感器采集的数据包括温度、湿度、土壤湿度、光照,通过解析初始数据,提取温度和湿度等变量,形成时间序列数据,初始数据中包含了每个传感器的地理坐标,以及物联网设备在农场中的位置,环境布局包括不同作物的种植区域、水源位置以及视频采集设备拍摄的传感器和物联设备的图像,解析初始数据,提取温湿度等时序数据,利用传感器坐标和设备地理位置,确定空间数据,包括传感器的具***置和作物的分布情况;
利用确定的空间数据,作为输入添加至所述卷积神经网络中,在所述空间数据上滑动卷积核,通过卷积操作提取空间数据中的特征,将卷积层的输出以空间特征图的形式输出,其中包含通过卷积操作提取的不同特征,初始化池化窗口,设置池化窗口的大小和步幅,在输出的空间特征图上,通过池化窗口进行最大池化操作,即使用池化窗口在特征图上滑动,每次选择窗口内的最大值,重复选择最大值的操作,直至整个输出空间特征图被处理完成,得到所述卷积输出。
示例性地,假设有一个农场,部署了传感器来监测不同地区的土壤湿度,每个传感器对应一个位置坐标,形成了空间数据,将传感器位置坐标和土壤湿度数据作为空间数据输入,使用卷积核在土壤湿度数据上滑动,提取不同地区的土壤湿度特征,得到一个包含了土壤湿度特征的空间特征图,初始化池化窗口,设置池化窗口的大小和步幅,在输出的空间特征图上,通过池化窗口进行最大池化操作,重复选择最大值的操作,直至整个输出空间特征图被处理完成,最终输出是从土壤湿度数据中提取的有用特征。
所述卷积核是一个小的矩阵,通常是3x3或5x5大小,用于在输入数据上进行卷积操作,卷积核通过滑动在输入数据上,与局部区域进行逐元素相乘并求和,从而产生输出特征图,所述空间特征图是卷积操作的输出,每个元素都对应了卷积核在输入数据上的一个局部区域,所述池化窗口是一个移动的窗口,用于对空间特征图进行池化操作,所述步幅指卷积核或池化窗口在输入数据上滑动的步长,如果步幅为1,则每次滑动一个单位;如果步幅为2,则每次滑动两个单位,步幅的选择会影响输出特征图的尺寸。
本实施例中,通过解析初始数据,成功识别与时间相关的变量,得到时序数据,使***能够理解物联网设备采集的数据中的时间信息,从而更好地分析和预测时间趋势,卷积神经网络的卷积层通过滑动卷积核在空间数据上提取特征,有助于学习空间数据中的关键模式和结构,帮助***理解传感器之间的空间关系,进而提高对环境的感知和理解,卷积和池化操作有助于捕获空间数据中的局部模式和结构,在降低数据的维度的同时保留关键信息,综上,本实施例能够在时序和空间层面上对传感器采集的数据进行深度学习和特征提取,有助于识别数据中的模式、趋势和异常,并为后续的任务提供更有信息量的输入。
在一种可选的实施方式中,
所述过预先引入的注意力机制将所述卷积输出拆分为查询项,查询键和查询值,通过点积操作计算所述查询项和所述查询键的相似度得到注意力权重,根据注意力权重对所述查询值进行加权求和,得到第一输出包括:
将所述卷积输出转换为三维特征图,对于所述三维特征图的每一个维度,设置对应的权重矩阵和偏置项,根据所述权重矩阵对所述三维特征图的每一个维度进行线性变换,得到所述查询项,查询键和查询值,对于每个线性变换后的结果进行批归一化,得到归一化数值,将所述归一化数值与所述卷积输出进行残差连接,得到预测输出;
对于所述查询项和所述查询键,通过点积操作确定相似度,基于所述相似度,确定每个查询项和每个查询键之间的关联强度,生成对应的注意力矩阵,基于所述注意力矩阵对所述查询值进行加权求和,结合所述预测输出,应用激活函数得到所述第一输出。
所述三维特征图是由卷积神经网络生成的一种数据结构,通常具有三个维度:高度、宽度和通道,高度和宽度对应图像的空间维度,而通道对应不同的特征,所述偏置项是一个与神经元关联的常数,通过加到权重输入的总和上,为神经元提供了一种灵活性,使其能够更好地适应数据,所述关联强度表示两个元素之间的关联程度,本实施例中,指的是查询项和查询键之间的相似度。
获取所述卷积输出,通过逐元素卷积对所述卷积输出压缩通道维度,将所述卷积输出转换为三维特征图,为三维特征图的每个维度分别设置对应的权重矩阵和偏置项,对于每个维度,使用相应的权重矩阵对卷积输出进行线性变换,得到所述查询项,查询键和查询值,示例性地,假设卷积输出为H*W*C,其中H表示高度,W表示宽度,C表示通道数,每个维度对应的权重矩阵分别为Wq,Wk和Wv,通过线性矩阵变换后,所述查询项可以表示为H*Wq,查询键表示为H*Wk,查询值表示为H*Wv,通过调整每个维度上的均值和方差对每个线性变换后的结果进行批归一化,将归一化后的查询项、查询键、查询值与卷积输出通过逐元素相加的方式进行残差连接,得到所述预测输出;
对于每个查询项和查询键的维度,执行点积操作,通过将查询项和查询键的相应维度相乘,然后对结果进行求和,得到相似度矩阵,基于相似度矩阵将相似度转换为每个查询项对所有查询键的关注权重,得到所述关联强度的同时生成注意力矩阵,使用注意力矩阵对查询值进行加权求和,得到所述预测输出,示例性地,对所述查询值进行加权求和如下公式所示,
其中,Attention(Q,K)表示通过执行点积操作得到的相似度矩阵,K表示查询键,Attention(Q,K,V)表示关注权重;
对所述预测输出应用激活函数,得到所述第一输出。
本实施例中,通过特征变换,网络可以学习到更高层次的抽象特征,提升了对输入数据的表达能力,自注意力机制允许模型在不同位置的输入之间建立关联,使得模型能够更好地理解序列中各个部分之间的依赖关系,残差连接的使用有助于防止梯度消失,保留了原始卷积输出的信息,使得模型更容易进行训练,综上,本实施例有助于提取更抽象、更有意义的特征,同时关注序列或空间中不同部分的信息,增强了模型的表达能力,使其更适应处理时序和空间数据的复杂关系。
S2.将所述时序数据作为所述深度融合网络模型中的循环神经网络的输入,初始化所述循环神经网络,分别调整更新门和重置门对应的权重,结合预先设置的可变学习率对所述重置门进行更新后,堆叠多个正向循环神经网络和反向循环神经网络生成多个双向循环神经网络,对于所述时序数据中的每个时间步,分别计算当前时间步对应的正向输出和反向输出,将所述正向输出和所述反向输出沿通道维度拼接,得到第二输出;
所述更新门是门控循环单元,负责控制当前时间步的信息有多少要被记忆或遗忘,通过更新门,网络可以选择性地保留或丢弃先前的信息,有助于解决长期依赖问题,所述重置门决定了要忽略当前输入和先前的隐藏状态的程度,通过重置门,模型可以决定在当前时间步要遗忘多少先前的信息,所述可变学习率通常指的是在训练过程中可以调整学习率的一种策略,所述双向循环神经网络是一种结构,它在时间步上同时考虑过去和未来的信息,包含两个方向的隐藏状态,一个按时间正向传递信息,另一个按时间反向传递信息。
在一种可选的实施方式中,
所述将所述时序数据作为所述深度融合网络模型中的循环神经网络的输入,初始化所述循环神经网络,分别调整更新门和重置门对应的权重,结合预先设置的可变学习率对所述重置门进行更新后,堆叠多个正向循环神经网络和反向循环神经网络生成多个双向循环神经网络包括:
初始化所述循环神经网络,根据所述时序数据随机生成第一训练集,调整所述循环神经网络中所述更新门对应的第一权重和重置门对应的第二权重,根据所述第一训练集计算正向循环神经网络对应的重置门和更新门数据,并计算循环神经网络中的隐藏状态和候选隐藏状态,根据计算结果调整所述更新门对应的第一权重;
对于所述重置门,初始化所述第二权重和偏置,结合所述可变学习率,通过余弦退火算法确定所述重置门更新后的第一学习率,根据所述第一学习率,通过梯度下降算法调整所述重置门的超参数,对所述重置门进行更新;
基于更新后的重置门和所述更新门,确定所述正向循环神经网络和反向循环神经网络的组成结构,根据所述时序数据,确定堆叠层数,根据堆叠层数,在每个需要堆叠的层堆叠一个对应的双向循环神经网络,其中所述双向循环神经网络包含一个正向循环神经网络和一个反向循环神经网络,正向循环神经网络用于处理正向时间序列,反向循环神经网络用于处理反向时间序列。
根据任务需求选择循环神经网络的结构,包括输入层、隐藏层和输出层,初始化网络参数,从时序数据中随机选择一部分数据,作为第一训练集,随机初始化更新门和重置门对应的权重,使用第一训练集进行正向传播,对于每个时间步,计算更新门、重置门、隐藏状态和候选隐藏状态等信息,使用正向传播计算得到的结果与实际标签比较,计算损失,根据损失使用反向传播算法,计算对于更新门和重置门权重的梯度,通过调整权重,使得模型能够更好地拟合训练数据,重复更新权重,直至达到预设的训练次数;
为重置门的第二权重和偏置初始化随机值,设定初始基础学习率,使用余弦退火算法计算当前训练步数对应的学习率,根据输入数据进行正向传播,计算模型的输出,根据输出值计算损失函数,衡量模型预测值与实际标签之间的差异,使用反向传播算法计算相对于重置门第二权重和偏置的梯度,利用第一学习率,使用梯度下降算法更新重置门的第二权重和偏置,使用梯度下降算法得到的新的重置门第二权重和偏置,更新模型中的重置门参数,重复操作直至达到预定的训练次数,在每一轮训练中,继续使用余弦退火算法动态调整学习率;
使用之前训练得到的更新后的重置门和更新门构建正向循环神经网络和反向循环神经网络的组成结构,其中正向循环神经网络用于处理正向时间序列,而反向循环神经网络用于处理反向时间序列,根据任务需求和模型复杂度,确定堆叠的层数,示例性地,假设要解决一个时序数据的预测任务,例如股票价格预测,开始时,选择一个相对较小的堆叠层数,例如1或2层,在训练集上训练模型,然后在验证集上评估性能,观察模型的学习曲线和验证误差,如果模型在验证集上的性能仍然有改进的空间,并且计算资源允许,逐渐增加堆叠层数,使用交叉验证来验证模型在不同数据子集上的性能,如果增加层数导致在训练集上表现更好但在验证集上过拟合则减少堆叠层数,根据交叉验证的结果和性能曲线,选择在验证集上性能最佳的堆叠层数,对于每一层,堆叠一个对应的双向循环神经网络,根据确定的堆叠层数,将每一层的正向循环神经网络和反向循环神经网络叠加起来,整体模型的输出从正向循环神经网络和反向循环神经网络的最后一层获取,是最后一个时间步的隐藏状态或输出。
本实施例中,通过随机初始化权重和偏置,为模型提供一个初始状态,有助于避免模型陷入局部最小值,并为训练提供一个良好的起点,通过比较模型输出和实际标签,使用反向传播算法计算梯度,并通过梯度下降算法调整更新门和重置门的权重,有助于模型更好地学习时序数据的依赖关系,根据任务需求和模型复杂度,确定堆叠的层数增加了模型的深度,有助于提高时序数据建模的能力,综上,本实施例有助于模型更好地学习时序数据的结构和模式,提高模型的表现力和泛化能力,同时,通过堆叠双向循环神经网络,能够更好地捕捉时序数据中的长期依赖关系,从而提高整体的时序数据建模效果。
在一种可选的实施方式中,
所述结合所述可变学习率,通过余弦退火算法确定所述重置门更新后的第一学习率如下公式所示:
其中,η t 表示时间步t处的学习率,η min 表示学习率最小值,η max 表示学习率最大值,t表示时间步tT表示总时间步。
本函数中,通过余弦函数的形状,实现了在训练初期迅速下降,在训练后期逐渐趋于稳定的学***滑的方式调整学习率,更好地引导模型的训练,提高训练的稳定性和效果。
在一种可选的实施方式中,
所述对于所述时序数据中的每个时间步,分别计算当前时间步对应的正向输出和反向输出,将所述正向输出和所述反向输出沿通道维度拼接,得到第二输出包括:
根据所述双向循环神经网络,对于所述时序数据中的每个时间步,初始化双向循环神经网络的隐藏状态,从第一个时间步开始,将所述时序数据和正向循环神经网络的前一时间步隐藏状态添加至所述正向循环神经网络,计算当前时间步对应的正向输出;
从所述时序数据的最后一个时间步开始,对于每个时间步,将时序数据和反向循环神经网络的前一时间步隐藏状态添加至所述反向循环神经网络,得到所述反向输出;
根据所述正向输出和所述反向输出,在每个时间步上,将正向输出张量的通道维度和反向输出张量的通道维度通过拼接操作连接,得到拼接输出;
在堆叠的双向循环神经网络层中间,添加失活层,将所述拼接输出作为所述失活层的输入,根据预设的失活概率判断所述拼接输出是否被失活,若是,则将所述拼接输出置零,若不是,则将所述拼接输出作为所述第二输出并输出。
所述失活层是一种用于防止过拟合的正则化技术,通过在训练期间以一定的概率随机将神经元置零(失活)来减少过拟合,所述隐藏状态是网络在处理每个时间步时保持的内部状态,存储了网络在观察到当前时间步输入后所学到的信息,起到了记忆和传递上下文信息的作用。
对于每个时间步,初始化双向循环神经网络的正向循环神经网络和反向循环神经网络的隐藏状态,从第一个时间步开始,迭代处理时序数据,对于当前时间步,将时序数据和正向循环神经网络的前一时间步隐藏状态输入到正向循环神经网络中,正向循环神经网络通过门控单元的计算,隐藏状态的更新,计算当前时间步对应的正向输出,将当前时间步的正向循环神经网络的隐藏状态更新为计算得到的隐藏状态;
从时序数据的最后一个时间步开始,逐步处理每个时间步,对于当前时间步,将时序数据和反向循环神经网络的前一时间步隐藏状态输入到反向循环神经网络中,反向循环神经网络通过反向传播,即反向计算门控单元的计算,隐藏状态的更新,计算得到当前时间步对应的反向输出,将当前时间步的反向循环神经网络的隐藏状态更新为计算得到的隐藏状态;
在每个时间步,准备正向循环神经网络的输出张量(记为Y_forward)和反向循环神经网络的输出张量(记为Y_backward),对于每个时间步,对Y_forward和Y_backward的通道维度进行拼接操作,其中,通道维度即深度方向,因此这是一个深度拼接,将两个张量在通道维度上连接起来,连接后的张量即为拼接输出;
在每个堆叠的双向循环神经网络层之间,添加一个失活层,预先设定失活概率,即决定在每个时间步是否执行失活操作的概率,将所述拼接输出作为所述失活层的输入,根据所述拼接输出,对于每个时间步,根据预设的失活概率,判断是否执行失活操作,如果判断执行失活,则将拼接输出置零,否则将拼接输出保持不变,若所述拼接输出未被失活,则将这一拼接输出作为所述第二输出。
本实施例中,从第一个时间步开始,正向循环神经网络接收当前时刻的时序数据和前一时间步的正向隐藏状态,并计算当前时间步对应的正向输出,有助于网络学习时序数据中的正向依赖关系,在每个时间步,将正向输出和反向输出的张量沿通道维度进行拼接,融合了正向和反向信息的拼接输出,提供更丰富的上下文信息,通过在训练时以一定概率将神经元置零,防止过拟合,综上,本实施例有助于捕捉时序数据中的复杂模式和长期依赖关系,同时在训练中具备更好的泛化能力。
S3.根据所述第一输出和所述第二输出,确定一维卷积层中卷积核大小,将所述第一输出和所述第二输出作为所述一维卷积层的输入,分别进行卷积,对卷积结果应用激活函数,得到初始故障概率,基于所述初始故障概率,结合预先构建的损失函数计算损失值,并根据所述损失值对所述深度融合网络模型中双向循环神经网络堆叠层数进行调整,使用调整后的模型处理所述初始数据,得到设备故障概率。
所述一维卷积层用于处理一维序列数据,一维卷积层包含多个卷积核,每个卷积核都是一个可学习的参数矩阵。
在一种可选的实施方式中,
所述根据所述第一输出和所述第二输出,确定一维卷积层中卷积核大小,将所述第一输出和所述第二输出作为所述一维卷积层的输入,分别进行卷积,对卷积结果应用激活函数,得到初始故障概率,基于所述初始故障概率,结合预先构建的损失函数计算损失值,并根据所述损失值对所述深度融合网络模型中双向循环神经网络堆叠层数进行调整,使用调整后的模型处理所述初始数据,得到设备故障概率包括:
基于所述第一输出和所述第二输出,在融合层中添加一维卷积层,确定所述一维卷积层中卷积核的大小和步幅,将所述第一输出和所述第二输出作为输入数据添加至所述一维卷积层;
对所述第一输出和所述第二输出分别进行一维卷积操作,通过逐元素相加进行融合,得到融合输出,对所述融合输出应用非线性激活函数,得到所述初始故障概率;
将所述初始故障概率与实际故障概率进行比较,通过损失函数计算所述初始故障概率与实际故障概率之间的损失值,将所述损失值与预设的损失阈值进行比较,若所述损失值大于预设的损失阈值,则认为所述初始故障概率不可信,否则,认为所述初始故障概率可信,将所述初始故障概率作为设备故障概率并输出;
若所述初始故障概率不可信,则基于所述初始数据生成包含多个数据的第二训练集,获取多个初始数据作为验证集,分别计算所述第二训练集和所述验证集的损失值,若所述损失值在第二训练集中下降,在验证集中上升,则认为出现过拟合,减少所述深度融合网络模型中堆叠的双向循环神经网络的层数,使用调整后的深度融合网络模型处理所述初始数据,得到所述设备故障概率。
在融合层中添加一维卷积层,确定卷积核的大小和步幅,其中所述卷积核的大小根据所述第一输出和所述第二输出的数据结构和任务需求确定,将第一输出和第二输出作为输入数据添加至一维卷积层,这两个输出分别代表了模型在正向和反向方向上的学习特征,示例性地,考虑第一输出和第二输出的数据结构,了解特征向量的长度,是否有时序关系,以及特征的分布情况,对于不同的任务,卷积核的大小和步幅可能需要不同的设置,例如,对于时序数据,卷积核的大小通常应能够捕获重要的时序模式,如果特征之间存在局部模式,可以选择较小的卷积核,如果特征之间的关系更为全局,可能需要更大的卷积核,例如,如果特征之间的关联跨足较长的时间步,则较大的卷积核可能更适合,示例性地,假设存在一个任务,其中第一输出和第二输出都是包含时序信息的特征向量,长度为20,任务的目标是在时序数据中检测故障,则对卷积核的大小和步幅的设置可以如下,选择卷积核大小为3,选择步幅为1,这样的设置可以在卷积层中有效捕获时序数据中的局部模式,同时保持输出长度;
对第一输出和第二输出分别进行一维卷积操作。每个卷积操作使用相同的卷积核,以在两个方向上捕捉更复杂的时空模式,通过逐元素相加对两个卷积操作的输出进行融合,对融合输出应用非线性激活函数,如ReLU激活函数,得到输出值,该输出值即为所述初始故障概率;
将模型预测的初始故障概率与实际故障概率进行比较,使用给定的损失函数计算预测概率与实际概率之间的损失值,将计算得到的损失值与预设的损失阈值进行比较,若损失值大于预设的损失阈值,认为初始故障概率不可信;反之,认为初始故障概率可信,若初始故障概率被认为可信,则将其作为设备故障概率输出,示例性地,假设损失函数计算公式为二分类交叉熵损失,损失阈值为0.1。模型预测的初始故障概率为0.2,实际故障概率为0.1,使用二分类交叉熵损失函数计算损失值,若损失值为0.08,小于预设的损失阈值0.1,由于损失值小于阈值,认为初始故障概率可信,将初始故障概率(0.2)作为设备故障概率输出;
若初始故障概率不可信,基于初始数据生成包含多个数据的第二训练集,并获取多个初始数据作为验证集,使用深度融合网络模型处理第二训练集进行训练,并在验证集上计算损失值,比较第二训练集和验证集的损失值。若在第二训练集中损失值下降而在验证集中上升,可能存在过拟合现象,若判断出现过拟合,减少深度融合网络模型中堆叠的双向循环神经网络的层数,使用调整后的深度融合网络模型处理初始数据,在调整后的模型上计算初始故障概率,作为设备故障概率输出。
本实施例中,通过对第一输出和第二输出进行一维卷积操作,并通过逐元素相加进行融合,实现了不同层次特征的融合,有助于提高模型对复杂关系的学习能力,在融合输出上应用非线性激活函数,引入了非线性变换,使得模型可以更好地捕捉数据中的复杂模式和非线性关系,综上,本实施例具有对复杂数据的高级特征提取、信任度评估、自适应调整等多方面的优越性,为设备故障预测提供了可靠而灵活的解决方案。
在一种可选的实施方式中,
所述通过损失函数计算所述初始故障概率与实际故障概率之间的损失值如下公式所示:
其中,L表示损失函数值,N表示训练集中样本总数量,y i 表示样本i的实际标签,z i 表示模型对样本i的预测值,λ表示正则化强度,表示模型中所有参数的平方和。
本函数中,评估了实际标签和模型预测之间的差异,能够促使模型更好地拟合实际标签,正则化项有助于控制模型的复杂度,防止模型在训练集上过度拟合,并提高泛化能力,综上,本函数综合考虑了模型的预测性能和过拟合问题,通过最小化该损失函数,模型在训练中将更倾向于学习与实际标签一致的预测,同时通过正则化项对参数进行约束,提高了模型的泛化性能。
图2为本发明实施例基于自主学习算法的终端物联设备监控预警***的结构示意图,如图2所示,所述***包括:
第一单元,用于基于物联网设备上的传感器采集初始数据,根据时间节点将所述初始数据分解为时序数据和空间数据,通过深度融合网络模型中的卷积神经网络对所述空间数据进行卷积和池化,得到卷积输出,通过预先引入的注意力机制将所述卷积输出拆分为查询项,查询键和查询值,通过点积操作计算所述查询项和所述查询键的相似度得到注意力权重,根据注意力权重对所述查询值进行加权求和,得到第一输出;
第二单元,用于将所述时序数据作为所述深度融合网络模型中的循环神经网络的输入,初始化所述循环神经网络,分别调整更新门和重置门对应的权重,结合预先设置的可变学习率对所述重置门进行更新后,堆叠多个正向循环神经网络和反向循环神经网络生成多个双向循环神经网络,对于所述时序数据中的每个时间步,分别计算当前时间步对应的正向输出和反向输出,将所述正向输出和所述反向输出沿通道维度拼接,得到第二输出;
第三单元,用于根据所述第一输出和所述第二输出,确定一维卷积层中卷积核大小,将所述第一输出和所述第二输出作为所述一维卷积层的输入,分别进行卷积,对卷积结果应用激活函数,得到初始故障概率,基于所述初始故障概率,结合预先构建的损失函数计算损失值,并根据所述损失值对所述深度融合网络模型中双向循环神经网络堆叠层数进行调整,使用调整后的模型处理所述初始数据,得到设备故障概率。
本发明实施例的第三方面,
提供一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现前述所述的方法。
本发明可以是方法、装置、***和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本发明的各个方面的计算机可读程序指令。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.基于自主学习算法的终端物联设备监控预警方法,其特征在于,包括:
基于物联网设备上的传感器采集初始数据,根据时间节点将所述初始数据分解为时序数据和空间数据,通过深度融合网络模型中的卷积神经网络对所述空间数据进行卷积和池化,得到卷积输出,通过预先引入的注意力机制将所述卷积输出拆分为查询项,查询键和查询值,通过点积操作计算所述查询项和所述查询键的相似度得到注意力权重,根据注意力权重对所述查询值进行加权求和,得到第一输出;
将所述时序数据作为所述深度融合网络模型中的循环神经网络的输入,初始化所述循环神经网络,分别调整更新门和重置门对应的权重,结合预先设置的可变学习率对所述重置门进行更新后,堆叠多个正向循环神经网络和反向循环神经网络生成多个双向循环神经网络,对于所述时序数据中的每个时间步,分别计算当前时间步对应的正向输出和反向输出,将所述正向输出和所述反向输出沿通道维度拼接,得到第二输出;
根据所述第一输出和所述第二输出,确定一维卷积层中卷积核大小,将所述第一输出和所述第二输出作为所述一维卷积层的输入,分别进行卷积,对卷积结果应用激活函数,得到初始故障概率,基于所述初始故障概率,结合预先构建的损失函数计算损失值,并根据所述损失值对所述深度融合网络模型中双向循环神经网络堆叠层数进行调整,使用调整后的模型处理所述初始数据,得到设备故障概率。
2.根据权利要求1所述的方法,其特征在于,所述基于物联网设备上的传感器采集初始数据,根据时间节点将所述初始数据分解为时序数据和空间数据,通过深度融合网络模型中的卷积神经网络对所述空间数据进行卷积和池化,得到卷积输出包括:
获取物联网设备上的传感器采集到的初始数据,对所述初始数据进行解析,识别所述初始数据中与时间相关的变量,得到所述时序数据,根据所述初始数据中传感器的位置坐标和物联网设备的地理位置以及物联网设备周围的环境布局确定所述空间数据;
对于所述空间数据,通过卷积神经网络中的卷积层在所述空间数据上滑动卷积核,提取空间数据中的特征,输出空间特征图,初始化池化窗口,设置所述池化窗口的大小和步幅,在所述输出空间特征图上应用所述池化窗口,选择所述池化窗口中的最大值,重复选择直至当前输出空间特征图被处理完成,得到所述卷积输出。
3.根据权利要求1所述的方法,其特征在于,所述过预先引入的注意力机制将所述卷积输出拆分为查询项,查询键和查询值,通过点积操作计算所述查询项和所述查询键的相似度得到注意力权重,根据注意力权重对所述查询值进行加权求和,得到第一输出包括:
将所述卷积输出转换为三维特征图,对于所述三维特征图的每一个维度,设置对应的权重矩阵和偏置项,根据所述权重矩阵对所述三维特征图的每一个维度进行线性变换,得到所述查询项,查询键和查询值,对于每个线性变换后的结果进行批归一化,得到归一化数值,将所述归一化数值与所述卷积输出进行残差连接,得到预测输出;
对于所述查询项和所述查询键,通过点积操作确定相似度,基于所述相似度,确定每个查询项和每个查询键之间的关联强度,生成对应的注意力矩阵,基于所述注意力矩阵对所述查询值进行加权求和,结合所述预测输出,应用激活函数得到所述第一输出。
4.根据权利要求1所述的方法,其特征在于,所述将所述时序数据作为所述深度融合网络模型中的循环神经网络的输入,初始化所述循环神经网络,分别调整更新门和重置门对应的权重,结合预先设置的可变学习率对所述重置门进行更新后,堆叠多个正向循环神经网络和反向循环神经网络生成多个双向循环神经网络包括:
初始化所述循环神经网络,根据所述时序数据随机生成第一训练集,调整所述循环神经网络中所述更新门对应的第一权重和重置门对应的第二权重,根据所述第一训练集计算正向循环神经网络对应的重置门和更新门数据,并计算循环神经网络中的隐藏状态和候选隐藏状态,根据计算结果调整所述更新门对应的第一权重;
对于所述重置门,初始化所述第二权重和偏置,结合所述可变学习率,通过余弦退火算法确定所述重置门更新后的第一学习率,根据所述第一学习率,通过梯度下降算法调整所述重置门的超参数,对所述重置门进行更新;
基于更新后的重置门和所述更新门,确定所述正向循环神经网络和反向循环神经网络的组成结构,根据所述时序数据,确定堆叠层数,根据堆叠层数,在每个需要堆叠的层堆叠一个对应的双向循环神经网络,其中所述双向循环神经网络包含一个正向循环神经网络和一个反向循环神经网络,正向循环神经网络用于处理正向时间序列,反向循环神经网络用于处理反向时间序列。
5.根据权利要求1所述的方法,其特征在于,所述结合所述可变学习率,通过余弦退火算法确定所述重置门更新后的第一学习率如下公式所示:
其中,η t 表示时间步t处的学习率,η min 表示学习率最小值,η max 表示学习率最大值,t表示时间步tT表示总时间步。
6.根据权利要求1所述的方法,其特征在于,所述对于所述时序数据中的每个时间步,分别计算当前时间步对应的正向输出和反向输出,将所述正向输出和所述反向输出沿通道维度拼接,得到第二输出包括:
根据所述双向循环神经网络,对于所述时序数据中的每个时间步,初始化双向循环神经网络的隐藏状态,从第一个时间步开始,将所述时序数据和正向循环神经网络的前一时间步隐藏状态添加至所述正向循环神经网络,计算当前时间步对应的正向输出;
从所述时序数据的最后一个时间步开始,对于每个时间步,将时序数据和反向循环神经网络的前一时间步隐藏状态添加至所述反向循环神经网络,得到所述反向输出;
根据所述正向输出和所述反向输出,在每个时间步上,将正向输出张量的通道维度和反向输出张量的通道维度通过拼接操作连接,得到拼接输出;
在堆叠的双向循环神经网络层中间,添加失活层,将所述拼接输出作为所述失活层的输入,根据预设的失活概率判断所述拼接输出是否被失活,若是,则将所述拼接输出置零,若不是,则将所述拼接输出作为所述第二输出并输出。
7.根据权利要求1所述的方法,其特征在于,所述根据所述第一输出和所述第二输出,确定一维卷积层中卷积核大小,将所述第一输出和所述第二输出作为所述一维卷积层的输入,分别进行卷积,对卷积结果应用激活函数,得到初始故障概率,基于所述初始故障概率,结合预先构建的损失函数计算损失值,并根据所述损失值对所述深度融合网络模型中双向循环神经网络堆叠层数进行调整,使用调整后的模型处理所述初始数据,得到设备故障概率包括:
基于所述第一输出和所述第二输出,在融合层中添加一维卷积层,确定所述一维卷积层中卷积核的大小和步幅,将所述第一输出和所述第二输出作为输入数据添加至所述一维卷积层;
对所述第一输出和所述第二输出分别进行一维卷积操作,通过逐元素相加进行融合,得到融合输出,对所述融合输出应用非线性激活函数,得到所述初始故障概率;
将所述初始故障概率与实际故障概率进行比较,通过损失函数计算所述初始故障概率与实际故障概率之间的损失值,将所述损失值与预设的损失阈值进行比较,若所述损失值大于预设的损失阈值,则认为所述初始故障概率不可信,否则,认为所述初始故障概率可信,将所述初始故障概率作为设备故障概率并输出;
若所述初始故障概率不可信,则基于所述初始数据生成包含多个数据的第二训练集,获取多个初始数据作为验证集,分别计算所述第二训练集和所述验证集的损失值,若所述损失值在第二训练集中下降,在验证集中上升,则认为出现过拟合,减少所述深度融合网络模型中堆叠的双向循环神经网络的层数,使用调整后的深度融合网络模型处理所述初始数据,得到所述设备故障概率。
8.根据权利要求7所述的方法,其特征在于,所述通过损失函数计算所述初始故障概率与实际故障概率之间的损失值如下公式所示:
其中,L表示损失函数值,N表示训练集中样本总数量,y i 表示样本i的实际标签,z i 表示模型对样本i的预测值,λ表示正则化强度, 表示模型中所有参数的平方和。
9.基于自主学习算法的终端物联设备监控预警***,用于实现前述权利要求1-8中任一项所述的基于自主学习算法的终端物联设备监控预警方法,其特征在于,包括:
第一单元,用于基于物联网设备上的传感器采集初始数据,根据时间节点将所述初始数据分解为时序数据和空间数据,通过深度融合网络模型中的卷积神经网络对所述空间数据进行卷积和池化,得到卷积输出,通过预先引入的注意力机制将所述卷积输出拆分为查询项,查询键和查询值,通过点积操作计算所述查询项和所述查询键的相似度得到注意力权重,根据注意力权重对所述查询值进行加权求和,得到第一输出;
第二单元,用于将所述时序数据作为所述深度融合网络模型中的循环神经网络的输入,初始化所述循环神经网络,分别调整更新门和重置门对应的权重,结合预先设置的可变学习率对所述重置门进行更新后,堆叠多个正向循环神经网络和反向循环神经网络生成多个双向循环神经网络,对于所述时序数据中的每个时间步,分别计算当前时间步对应的正向输出和反向输出,将所述正向输出和所述反向输出沿通道维度拼接,得到第二输出;
第三单元,用于根据所述第一输出和所述第二输出,确定一维卷积层中卷积核大小,将所述第一输出和所述第二输出作为所述一维卷积层的输入,分别进行卷积,对卷积结果应用激活函数,得到初始故障概率,基于所述初始故障概率,结合预先构建的损失函数计算损失值,并根据所述损失值对所述深度融合网络模型中双向循环神经网络堆叠层数进行调整,使用调整后的模型处理所述初始数据,得到设备故障概率。
10.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至8中任意一项所述的方法。
CN202410312063.4A 2024-03-19 2024-03-19 基于自主学习算法的终端物联设备监控预警方法及*** Active CN117909719B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410312063.4A CN117909719B (zh) 2024-03-19 2024-03-19 基于自主学习算法的终端物联设备监控预警方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410312063.4A CN117909719B (zh) 2024-03-19 2024-03-19 基于自主学习算法的终端物联设备监控预警方法及***

Publications (2)

Publication Number Publication Date
CN117909719A true CN117909719A (zh) 2024-04-19
CN117909719B CN117909719B (zh) 2024-05-24

Family

ID=90697218

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410312063.4A Active CN117909719B (zh) 2024-03-19 2024-03-19 基于自主学习算法的终端物联设备监控预警方法及***

Country Status (1)

Country Link
CN (1) CN117909719B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114077811A (zh) * 2022-01-19 2022-02-22 华东交通大学 一种基于图神经网络的电力物联网设备异常检测方法
WO2023045278A1 (zh) * 2021-09-27 2023-03-30 西安交通大学 数据双驱动的台风灾害下电网故障预测方法、装置和设备
CN116611013A (zh) * 2023-04-14 2023-08-18 西安电子科技大学青岛计算技术研究院 针对工业时序数据的异常检测以及根因分析方法及***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023045278A1 (zh) * 2021-09-27 2023-03-30 西安交通大学 数据双驱动的台风灾害下电网故障预测方法、装置和设备
CN114077811A (zh) * 2022-01-19 2022-02-22 华东交通大学 一种基于图神经网络的电力物联网设备异常检测方法
CN116611013A (zh) * 2023-04-14 2023-08-18 西安电子科技大学青岛计算技术研究院 针对工业时序数据的异常检测以及根因分析方法及***

Also Published As

Publication number Publication date
CN117909719B (zh) 2024-05-24

Similar Documents

Publication Publication Date Title
Wongchai et al. Artificial intelligence-enabled soft sensor and internet of things for sustainable agriculture using ensemble deep learning architecture
CN107369166B (zh) 一种基于多分辨率神经网络的目标跟踪方法及***
US11585918B2 (en) Generative adversarial network-based target identification
CN109754078A (zh) 用于优化神经网络的方法
CN113807399B (zh) 一种神经网络训练方法、检测方法以及装置
Muruganandham Semantic segmentation of satellite images using deep learning
CN115545334B (zh) 土地利用类型预测方法、装置、电子设备及存储介质
CN114091554A (zh) 一种训练集处理方法和装置
CN113269182A (zh) 一种基于变体transformer对小区域敏感的目标果实检测方法及***
CN111666974B (zh) 图像匹配方法、装置、计算机设备及存储介质
CN115564983A (zh) 目标检测方法、装置、电子设备、存储介质及其应用
Kadim et al. Deep-learning based single object tracker for night surveillance.
CN117372877A (zh) 一种基于神经网络的星图识别方法、装置及相关介质
CN115496144A (zh) 配电网运行场景确定方法、装置、计算机设备和存储介质
CN112200210A (zh) 使基础分类器适应于新奇类
WO2020190951A1 (en) Neural network trained by homographic augmentation
Mukherjee et al. Identification of the types of disease for tomato plants using a modified gray wolf optimization optimized MobileNetV2 convolutional neural network architecture driven computer vision framework
CN117909719B (zh) 基于自主学习算法的终端物联设备监控预警方法及***
CN117172355A (zh) 融合时空粒度上下文神经网络的海表温度预测方法
CN116704335A (zh) 一种猕猴桃溃疡监测方法、***、设备及介质
Zhou et al. A dendritic neuron model for exchange rate prediction
Mozaffari et al. A modular ridge randomized neural network with differential evolutionary distributor applied to the estimation of sea ice thickness
CN114842506A (zh) 一种人体姿态估计方法及***
Leke et al. Missing data estimation using ant-lion optimizer algorithm
CN111652246B (zh) 一种基于深度学习的图像自适应稀疏化表征方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant