CN115879569B - 一种IoT观测数据的在线学习方法及*** - Google Patents

一种IoT观测数据的在线学习方法及*** Download PDF

Info

Publication number
CN115879569B
CN115879569B CN202310214205.9A CN202310214205A CN115879569B CN 115879569 B CN115879569 B CN 115879569B CN 202310214205 A CN202310214205 A CN 202310214205A CN 115879569 B CN115879569 B CN 115879569B
Authority
CN
China
Prior art keywords
normal distribution
distribution
data
value
quasi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310214205.9A
Other languages
English (en)
Other versions
CN115879569A (zh
Inventor
张兆虔
李响
赵志刚
王春晓
耿丽婷
郭莹
吴晓明
王英龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qilu University of Technology
Shandong Computer Science Center National Super Computing Center in Jinan
Original Assignee
Qilu University of Technology
Shandong Computer Science Center National Super Computing Center in Jinan
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qilu University of Technology, Shandong Computer Science Center National Super Computing Center in Jinan filed Critical Qilu University of Technology
Priority to CN202310214205.9A priority Critical patent/CN115879569B/zh
Publication of CN115879569A publication Critical patent/CN115879569A/zh
Application granted granted Critical
Publication of CN115879569B publication Critical patent/CN115879569B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出了一种IoT观测数据的在线学习方法及***,涉及数据处理技术领域,根据获取的初始时序观测数据,初始化在线深度学习模型;实时获取传感器生成的时序观测数据,根据时序观测数据形成输入数据流;在线深度学习模型处理输入数据流,生成最终预测结果;在处理输入数据流的过程中,对输入数据流进行即时学习,实时动态更新在线深度学习模型;即时学习,是基于数据流的均值和方差,学习数据分布,构造准正态分布,重构新的样本,实现变分注意力网络,基于分布差异、重构差异和推理差异,进行模型的动态调整;本发明学习不同隐藏层之间的隐藏信息,提高模型推理的准确性,同时通过在线学习,对不同隐藏层间的参数进行动态调整。

Description

一种IoT观测数据的在线学习方法及***
技术领域
本发明属于数据处理技术领域,尤其涉及一种IoT观测数据的在线学习方法及***。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
近年来,随着物联网(Internet of Things,简称IoT)的高速发展,各种类型的物联网传感器也变得越来越普遍;与此相对应,物联网传感器产生的时间序列观测数据呈指数级增长,对这些数据的实时智能分析在智能环境监测、工业监测、数据中心监测等应用领域显得尤为迫切和必要。
随着人工智能的快速发展,在上述应用领域,需要从数据中精确地挖掘知识;深度学习(DL)具有强大的非线性建模能力和逐层提取抽象特征的能力,在对各种数据形态进行建模方面取得了巨大成功,例如,图像、自然语言、语音、生物信号等;因此,大量的深度学习模型被不断提出,并在物联网数据建模中被验证其有效性。
需要指出的是,深度学***稳数据,其概率分布会随着时间的推移而发生变化,从而导致"概念漂移"问题,概念漂移指的是数据分布随时间发生变化,导致原有的预测器或模型无法继续准确地预测新数据的趋势或属性。在数据流预测领域,概念漂移是一个重要的挑战,因为它会对模型的准确性和效果造成影响。
在概念漂移的情况下,如何获得相对稳定的推理性能是非常重要的,为此一些与概念漂移问题相关的研究被不断地讨论和探索;虽然各种基于人工智能的时间序列预测模型已经得到了广泛的研究和应用,但是这些模型对具有概念漂移的物联网数据流的预测是不可靠的,并且会导致整体性能的下降;如何有效地从非平稳数据流中进行学习和推理仍然是一个很大的挑战,特别是,如何调整模型以适应概念漂移是很多研究者关注并试图解决的问题,近年来,结合深度学习的方法解决上述问题取得了较好的效果,尽管如此,这些研究还是有一定的局限性,特别是它们对解决某些类型的概念漂移模式往往只做出有限的假设;因此,目前还缺乏合适的方法和理论来有效地处理概念漂移问题而不影响最终结果的准确性与可靠性。
如上所述,离线训练的深度学习模型无法很好地适应具有演进分布的数据流,即使周期性地更新模型,将新知识"注入"到模型中,两次相邻更新之间的数据仍必须面对性能下降的问题;物联网数据的采样率越高,采用这种模型更新策略时性能下降的问题就越严重;此外,这些模型的表达能力还受到其预定义的固定结构的限制;因此,该模型将无法学习未来数据可能具有的极其复杂的模式;当前方法中的上述问题将导致累积偏差决策,由于流数据分析遵循"一遍处理"的方案,每个数据点仅处理一次而不进一步检查,因此此类错误可能会被不断放大并且无法修复,这将会导致连锁反应,对智慧海洋、智慧城市、智能数据中心等物联网监控***产生潜在的重大不良影响,甚至危及整体***运行。
对于时间序列预测,主要的方法大致分为两类,即基于统计的模型和基于深度学***滑数据的预测非常好,前提是时间序列数据趋势是一致的,并且不发生变化;例如ARIMA模型及统计机器学习方法GBDT、GBRT等,这些模型需要进行大量的数据预处理和劳动密集型的特征工程,因此无法捕捉时间序列中的复杂模式。
基于深度学习的模型在时间序列数据预测领域的突出表现越来越受到关注,例如,基于RNN的模型、seq2seq和LSNET已被证明可有效捕获短期或长期模式;与上述模型相比,最近提出的基于Transformer的模型在长序列中表现出更优异的性能,然而,基于Transformer的模型仍需依赖于丰富的数据来优化其具体参数,无法满足具有概念漂移的流数据的准确推理预测;上述方法,非但无法有效解决概念漂移问题,同样无法解决模型的冷启动问题。
发明内容
为克服上述现有技术的不足,本发明提供了一种IoT观测数据的在线学习方法及***,学习不同隐藏层之间的隐藏信息,提高模型推理的准确性,同时通过在线学习,对不同隐藏层间的参数进行动态调整,解决概念漂移问题和冷启动问题,使模型能够随着时间的推移对数据进行不断且精准地学习和更新,从而更好地适应不断变化的数据特征和模式,保证模型的性能和准确度始终保持在最优状态。
为实现上述目的,本发明的一个或多个实施例提供了如下技术方案:
本发明第一方面提供了一种IoT观测数据的在线学习方法;
一种IoT观测数据的在线学习方法,包括:
根据获取的初始时序观测数据,初始化在线深度学习模型;
实时获取传感器生成的时序观测数据,根据时序观测数据形成输入数据流;
所述在线深度学习模型处理输入数据流,以生成并输出最终预测结果;
在处理输入数据流的过程中,对输入数据流进行即时学习,实时动态更新在线深度学习模型;
所述即时学习,是基于数据流的均值和方差,学习数据分布,构造准正态分布,重构新的样本,实现变分注意力网络,基于分布差异、重构差异和推理差异,进行模型的动态调整。
进一步的,所述在线深度学习模型,包括编码器、解码器和结果融合模块,以数据流为输入,输出对下一时刻数据值的预测。
进一步的,所述编码器,执行两部分操作:
(1)提取隐藏层间的隐藏信息,输入到结果融合模块,进行最终预测值的计算;
(2)以标准正态分布作为目标,编码隐藏信息,通过重参数化设置,输出满足准正态分布的均值
Figure SMS_1
与标准差/>
Figure SMS_2
进一步的,所述解码器,从编码器生成的准正态分布中,随机选择样本,输出与数据流的原始特征结构一致的数据。
进一步的,所述结果融合模块,将编码器提取的多个特征进行加权融合,得到当前预测值;
其中,权重用于动态调整每个隐藏层的贡献度,通过变分注意力网络,在每次输入样本处理后,实时计算每个隐藏层的权重。
进一步的,所述变分注意力网络,根据编码器中每个隐藏层之间的关系以及每个子结构的必要程度,计算每个隐藏层的权重。
进一步的,所述在线深度学习模型的损失函数包括:
重构损失,衡量真实值和重构值之间的差异;
KL损失,衡量准正态分布与标准正态分布之间的差异;
预测损失,衡量真实值与当前预测值之间的差异;
通过三个损失的加权融合,衡量最终预测值与真实值之间的差异。
本发明第二方面提供了一种IoT观测数据的在线学习***。
一种IoT观测数据的在线学习***,包括初始化模块、获取模块、预测模块和学习模块:
初始化模块,被配置为:根据获取的初始时序观测数据,初始化在线深度学习模型;
获取模块,被配置为:实时获取传感器生成的时序观测数据,根据时序观测数据形成输入数据流;
预测模块,被配置为:所述在线深度学习模型处理输入数据流,以生成并输出最终预测结果;
学习模块,被配置为:在处理输入数据流的过程中,对输入数据流进行即时学习,实时动态更新在线深度学习模型;
所述即时学习,是基于数据流的均值和方差,学习数据分布,构造准正态分布,重构新的样本,实现变分注意力网络,基于分布差异、重构差异和推理差异,进行模型的动态调整。
本发明第三方面提供了计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如本发明第一方面所述的一种IoT观测数据的在线学习方法中的步骤。
本发明第四方面提供了电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本发明第一方面所述的一种IoT观测数据的在线学习方法中的步骤。
以上一个或多个技术方案存在以下有益效果:
本发明设计了一种自适应在线深度学习模型,用于对物联网传感器的时间序列数据流进行实时学习;该模型能够从浅层网络开始,收敛速度更快,对具有概念漂移的物联网观测数据有较高泛化能力,可以随着观测时间序列数据的变化而自动演化,并且能够灵活调整模型复杂度和表示能力,有效解决物联网观测数据流中的概念漂移问题,同时所提出的模型可以直接应用以冷启动方式处理数据流;在基准数据集以及监控***收集的数据上进行了相关验证,结果表明在线深度学习模型相对于传统方法能够明显提高推理结果的实时准确性。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为第一个实施例的方法流程图。
图2为第一个实施例的在线深度学习模型的结构图。
图3为第一个实施例的在线学习运行机制的示意图。
图4为第一个实施例的推理网络各层权重的演化示意图。
图5为第二个实施例的***结构图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
为了解决概念漂移问题而不影响最终结果的准确性与可靠性,需要对数据流采取快速和实时学习的方法,这种方法通常被称为"在线学习"或"终身学习",在线学习是一种时序数据流的学习方式,现有方案多在训练速度和推理速度上存在不足,不能真正实现实时性,影响在线学习的效果,本发明所做的工作即是为了解决这一问题。对于深度学习模型,可以简单地周期性地更新其参数,然而,这种方法具有以下缺点:
一、只注重于在线多任务之间不同参数的调整,而忽略了不同隐藏层参数的重要性,即不能灵活调整模型。
二、无法调整模型复杂度,即无法进行模型选择,在线学习环境中,需要一个模型来从浅到深地学习数据流,从而克服在数据量较少时(冷启动阶段)的过拟合问题和在数据量较大时的欠拟合问题。
因此,本发明设计了一种在线学习方法,叫作“即时学习”,能够学习不同隐藏层之间的隐藏信息,满足模型最终的推理准确性,同时能满足不同隐藏层间参数的动态调整,实现模型的实时动态调整,与现有在线学习方法相比,提高训练速度和推理速度,真正能够实现实时性。
本发明的设计理念遵循如下现有的在线学习范式:
对于时序观测数据,
Figure SMS_3
由传感器实时生成,其中,T表示数据个数,x t表示第t时刻的数据,X表示具有无界T的流数据。在在线学习环境中,这个时间序列不是一次全部可用,而是以流的形式一个接一个进行处理的,对于每个时刻t,只有历史数据
Figure SMS_4
是可以通过传感器得到的,但可以通过历史数据/>
Figure SMS_5
来预测t时刻的数值为/>
Figure SMS_6
,进而观察并揭示真实的值x t
进而,通过当前时刻t产生的真实的值与预测值的残差计算其瞬时损失;当然,对于具体的应用场景,时间序列
Figure SMS_7
在当前时刻t的值,也可以以窗口的形式来预测;根据预测值/>
Figure SMS_8
与相应真实值计算当前的瞬时损失:/>
Figure SMS_9
该算法利用每个输入训练样本产生的损失和梯度迭代更新,通过对每个输入数据进行训练,可以满足并实现海量数据的在线训练。
目前现有的在线学习架构仅能实现“数据改进”,但本发明提出的架构还能够实现数据的生成,同时能够学习潜在变量的分布;通过构造准正态分布,学习其均值和方差,进而生成新的样本,并基于融合模块进行接下来的推理预测。
实施例一
在一个或多个实施方式中,公开了一种IoT观测数据的在线学习方法,图1是其方法流程图,如图1所示,包括如下步骤:
步骤S1:根据获取的初始时序观测数据,初始化在线深度学习模型。
步骤S2:实时获取传感器生成的时序观测数据,根据时序观测数据形成输入数据流。
步骤S3:所述在线深度学习模型处理输入数据流,以生成并输出最终预测结果。
步骤S4:在处理输入数据流的过程中,对输入数据流进行即时学习,实时动态更新在线深度学习模型,即时学习是基于数据流的均值和方差,学习数据分布,构造准正态分布,重构新的样本,实现变分注意力网络,基于分布差异、重构差异和推理差异,进行模型的动态调整。
下面对本实施例一种IoT观测数据的在线学习方法的实现过程进行详细说明。
图2是在线深度学习模型的结构图,如图2所示,在线深度学习模型,包括编码器、解码器和结果融合模块,以数据流为输入,输出对下一时刻数据值的预测。
编码器与结果融合模块连接,用于对预测数据值,而引入解码器,与编码器与结果融合模块相配合,用于对在线深度学习模型进行动态更新。
编码器
基于深度神经网络构建,有多个隐藏层组成,考虑到可用的计算能力,最大网络容量可以有k+1个隐藏层
Figure SMS_10
,以数据流的形式一个样本接一个样本地进行多尺度学习,学习后的隐藏层有两部分功能:
(1)计算隐藏层的预测向量和注意力权重
为了充分利用编码器不同隐藏层中的信息,提取每个隐藏层中的隐藏信息,得到k+1个预测向量p i,输入到结果融合模块中,通过加权融合,得到最终预测结果,其中,预测向量p i的计算公式为:
Figure SMS_11
其中,pred()是将隐藏层表示转化为局部预测的前馈网络,h i表示第i个隐藏层。
为了实现在最终预测中动态调整每个隐藏层的贡献权重,设计一个能够满足上述需求的变分注意力网络,以学习隐藏层的注意力权重,即:
Figure SMS_12
其中,attention()是具有Softmax函数的前馈网络,其主要负责计算每个隐藏层的权重,所有隐藏层的权重归一化为
Figure SMS_13
,目的是确定整个模型中每个隐藏层之间的关系以及各子结构在最终预测中的必要程度。
为了实现模型的迭代更新,基于上述内容实现了重权重操作的重要技术,即实现权重的实时动态调整,通过重权重操作,所有隐藏层的权重在每次输入样本处理后重新计算并归一化,这将在每次迭代后完成。
(2)构造准正态分布
编码器尝试将样本携带的所有特征信息的分布转码为准正态分布,尽管准正态分布是以标准正态分布作为目标来编码的,但它通常不能被编码成标准正态分布(目标分布),这里称该标准正态分布为潜在分布;在该过程中,编码器直接输出满足准正态分布的均值
Figure SMS_14
与标准差/>
Figure SMS_15
作为编码结果,也即,在编码处理中生成的均值/>
Figure SMS_16
与标准差/>
Figure SMS_17
,不是通过均值或标准差定义来计算的,而是直接从编码器输出的。
为保证编码器输出的均值
Figure SMS_18
与标准差/>
Figure SMS_19
满足标准正态分布,在损失函数中设置惩罚项,一旦基于均值和标准差所反馈的准正态分布(实际分布)和标准正态分布(目标分布)有差异,该实施例模型将会受到惩罚机制的影响而做出进一步调整。
因此,在实际的算法操作流程中,编码器负责输出均值和标准差,损失函数确保平均值和标准差符合某种准正态分布,这就等价于将原始数据向准正态分布的方向编码,再输出该准正态分布的均值与标准差,并随机采样生成数据
Figure SMS_20
进行后续的解码器操作。
与此同时,为保证采样数据
Figure SMS_21
的概率分布符合输入样本,首先需要假设存在一个/>
Figure SMS_22
关于X的后验概率P(Z|X),并进一步假设这个概率分布是正态分布:/>
Figure SMS_23
,那么采样数据/>
Figure SMS_24
的概率分布P(Z)为:
Figure SMS_25
因此,P(Z)先验分布和
Figure SMS_26
后验分布都符合标准正态分布。
此外,从标准正态分布
Figure SMS_27
中随机选择样本/>
Figure SMS_28
,并将该样本输入解码器。由于这个过程中存在随机采样,使得架构中的梯度信息流是断裂的,反向传播无法通过传统的链式法则进行,因此,设计使用独特的重参数化技巧来完成该实施例模型的反向传播,以满足典型神经网络的特性。在重参数化中,该实施例采用随机抽样的方法生成一组满足正态分布的变量,从/>
Figure SMS_29
中取样z,等同于从/>
Figure SMS_30
中采样ε,然后令/>
Figure SMS_31
,因此,可以应用梯度下降法;最后,解码器对z进行解码,并输出样本x的重构数据。
因此,在编码器的编码阶段,计算每个输入样本
Figure SMS_32
的均值/>
Figure SMS_33
与方差/>
Figure SMS_34
,用来构造准正态分布。
解码器
从编码器生成的准正态分布中,随机选择样本,输出与数据流的原始特征结构一致的数据,即通过解码器复原原始输入的结构以生成新的数据样本
Figure SMS_35
,期望从潜在变量空间采样的数据/>
Figure SMS_36
遵循原始数据X的概率分布,使得从采样数据/>
Figure SMS_37
产生的新数据
Figure SMS_38
也遵循原始数据的概率分布,相对而言,本实施例潜在变量空间越大,就可以保留越多关于概率分布的信息。
结果融合模块
模型的最终预测是基于每个隐藏层的预测向量
Figure SMS_39
,进行加权融合,得到最终的预测结果,即下一时刻的预测值,基于变分注意力机制的加权融合,具体为:
Figure SMS_40
Figure SMS_41
其中,
Figure SMS_42
是从第i个隐藏层的表示中预测出来的,/>
Figure SMS_43
是第i个隐藏层的权重,
Figure SMS_44
是/>
Figure SMS_45
的参数。
以上就是在线深度学习模型的构成,在构建好在线深度学习模型后,又分为两个流程:实时预测和在线学习。
图3是在线学习的示意图,如图3所示,在线学习是在数据流的样本一个接一个输入到线深度学习模型中进行处理的过程中,不断学习样本的特征,通过参数的变化,进而更新模型的参数,实现模型的动态实时调整,如图4所示,通过本实施例设置三个隐藏层作为验证发现,隐藏层-1、隐藏层-2和隐藏层-3的权重随着数据流样本数的增加不断发生变化,在不同阶段下各层之间的权重也在发生着变化,这更能说明本实施例在应对概念漂移问题时能动态准确地捕捉其变化;在学习的过程中,每个输入样本产生的损失和梯度迭代更新,通过对每个输入样本进行训练,满足并实现海量数据的在线训练,其中,损失采用损失函数量化,本实施例使用三个损失计算最终总损失:重构损失、KL损失和预测损失。
(1)预测损失
与传统的神经网络模型不同,该模型的预测不是来自最后一层的最终表示,最终的预测向量是通过对每个隐藏层得到的预测向量进行加权得到的,以保证绝对的高精度。
因此,对于流式IoT数据的观测,当前预测阶段时间t的预测损失Lt为:
Figure SMS_46
其中,y是真实值,
Figure SMS_47
是预测值,/>
Figure SMS_48
代表t时刻的预测瞬时损失函数。
这里的预测损失函数可以是任意凸函数,本实施例使用均方损失函数(MSE),在原始反向传播中,误差导数是从最后一个输出层反向传播的,不同于原始的反向传播,误差导数从每个预测器pj反向传播,如:
Figure SMS_49
/>
其中,
Figure SMS_50
分别是t时刻和t+1时刻第j层网络的参数,/>
Figure SMS_51
表示更新率,/>
Figure SMS_52
表示梯度,/>
Figure SMS_53
表示每一层的预测值,/>
Figure SMS_54
表示当前时刻的损失。
根据上述等式计算各层参数的梯度,在时间t内,更新实施例模型第j层的参数,根据每层参数的梯度来计算最终预测;值得说明的是,当数据样本较小时,该模型可以通过快速学习隐藏信息的浅层网络实现快速收敛;随着数据的增加,使用变分注意力机制可以允许动态调整不同深度网络的
Figure SMS_55
,从而符合模型容量的可扩展性。
(2)KL损失
KL损失(Kullback-Leibler Loss),用于衡量准正态分布与标准正态分布之间的差异,即均值
Figure SMS_56
与方差/>
Figure SMS_57
之间的差异。
给定具有已知均值
Figure SMS_58
与方差/>
Figure SMS_59
的维度k的隐变量空间,KL 损失定义为:
Figure SMS_60
其中,
Figure SMS_61
代表每个维度生成的均值和方差。
(3)重构损失
这里的重构损失使用标准的L2损失,即MSE,假设当有 n 个样本时,有原始值x和重构值
Figure SMS_62
,重建损失定义为:
Figure SMS_63
最后,为了增强模型的表达能力和预测精度,该实施例的总损失由以上三个损失函数组成,系数是
Figure SMS_64
,具体为:
Figure SMS_65
因此,在每一轮结束时,算法会根据接下来几轮的瞬时损失进行自我调整,这也解决了概念漂移场景下模型灵活性的问题。
实时预测,是数据流输入到在线深度学习模型中,经过编码器隐藏层的编码,得到每个隐藏层对应的预测向量,再对预测向量进行加权融合,得到最终的预测结果,即下一时刻的预测值。
实施例二
本实施例公开了一种IoT观测数据的在线学习***;
如图5所示,一种IoT观测数据的在线学习***,包括初始化模块、获取模块、预测模块和学习模块:
初始化模块,被配置为:根据获取的初始时序观测数据,初始化在线深度学习模型;
获取模块,被配置为:实时获取传感器生成的时序观测数据,根据时序观测数据形成输入数据流;
预测模块,被配置为:所述在线深度学习模型处理输入数据流,以生成并输出最终预测结果;
学习模块,被配置为:在处理输入数据流的过程中,对输入数据流进行即时学习,实时动态更新在线深度学习模型;
所述即时学习,是基于数据流的均值和方差,学习数据分布,构造准正态分布,重构新的样本,实现变分注意力网络,基于分布差异、重构差异和推理差异,进行模型的动态调整。
实施例三
本实施例的目的是提供计算机可读存储介质。
计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开实施例一所述的一种IoT观测数据的在线学习方法中的步骤。
实施例四
本实施例的目的是提供电子设备。
电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开实施例一所述的一种IoT观测数据的在线学习方法中的步骤。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种IoT观测数据的在线学习方法,其特征在于,包括:
根据获取的初始时序观测数据,初始化在线深度学习模型;
实时获取传感器生成的时序观测数据,根据时序观测数据形成输入数据流;
所述在线深度学习模型处理输入数据流,以生成并输出最终预测结果;
在处理输入数据流的过程中,对输入数据流进行即时学习,实时动态更新在线深度学习模型;
所述即时学习,是基于数据流的均值和方差,学习数据分布,构造准正态分布,重构新的样本,实现变分注意力网络,基于分布差异、重构差异和推理差异,进行模型的动态调整;
所述在线深度学习模型,包括编码器、解码器和结果融合模块,以数据流为输入,输出对下一时刻数据值的预测;
所述编码器,执行两部分操作:
(1)提取隐藏层间的隐藏信息,输入到结果融合模块,进行最终预测值的计算;
(2)以标准正态分布作为目标,编码隐藏信息,通过重参数化设置,输出满足准正态分布的均值
Figure QLYQS_1
与标准差/>
Figure QLYQS_2
所述构造准正态分布,具体为:
编码器尝试将样本携带的所有特征信息的分布转码为准正态分布,尽管准正态分布是以标准正态分布作为目标来编码的,但它通常不能被编码成标准正态分布,这里称该标准正态分布为潜在分布;在该过程中,编码器直接输出满足准正态分布的均值
Figure QLYQS_3
与标准差/>
Figure QLYQS_4
作为编码结果,也即,在编码处理中生成的均值/>
Figure QLYQS_5
与标准差/>
Figure QLYQS_6
,不是通过均值或标准差定义来计算的,而是直接从编码器输出的;
为保证编码器输出的均值
Figure QLYQS_7
与标准差/>
Figure QLYQS_8
满足标准正态分布,在损失函数中设置惩罚项,一旦基于均值和标准差所反馈的准正态分布和标准正态分布有差异,模型将会受到惩罚机制的影响而做出进一步调整;
因此,在实际的算法操作流程中,编码器负责输出均值和标准差,损失函数确保平均值和标准差符合某种准正态分布,这就等价于将原始数据向准正态分布的方向编码,再输出该准正态分布的均值与标准差,并随机采样生成数据
Figure QLYQS_9
进行后续的解码器操作;
与此同时,为保证采样数据
Figure QLYQS_10
的概率分布符合输入样本,首先需要假设存在一个/>
Figure QLYQS_11
关于X的后验概率P(Z|X),并进一步假设这个概率分布是正态分布:/>
Figure QLYQS_12
,那么采样数据/>
Figure QLYQS_13
的概率分布P(Z)为:
Figure QLYQS_14
因此,P(Z)先验分布和
Figure QLYQS_15
后验分布都符合标准正态分布;
此外,从标准正态分布
Figure QLYQS_16
中随机选择样本/>
Figure QLYQS_17
,并将该样本输入解码器;由于这个过程中存在随机采样,使得架构中的梯度信息流是断裂的,反向传播无法通过传统的链式法则进行,因此,设计使用独特的重参数化技巧来完成模型的反向传播,以满足典型神经网络的特性;在重参数化中,采用随机抽样的方法生成一组满足正态分布的变量,从/>
Figure QLYQS_18
中取样z,等同于从/>
Figure QLYQS_19
中采样ε,然后令/>
Figure QLYQS_20
,因此,应用梯度下降法;最后,解码器对z进行解码,并输出样本x的重构数据;
在编码器的编码阶段,计算每个输入样本
Figure QLYQS_21
的均值/>
Figure QLYQS_22
与方差/>
Figure QLYQS_23
,用来构造准正态分布;
所述在线深度学习模型的损失函数,通过三个损失的加权融合,衡量最终预测值与真实值之间的差异:
(1)重构损失
Figure QLYQS_24
,衡量真实值和重构值之间的差异,具体公式为:
Figure QLYQS_25
其中, n表示样本个数, x表示原始值,
Figure QLYQS_26
表示重构值;
(2)KL损失,衡量准正态分布与标准正态分布之间的差异,具体公式为:
Figure QLYQS_27
其中,
Figure QLYQS_28
代表每个维度生成的均值和方差,k是均值/>
Figure QLYQS_29
与方差/>
Figure QLYQS_30
的维度数;
(3)预测损失
Figure QLYQS_31
,衡量真实值与当前预测值之间的差异,具体公式为:
Figure QLYQS_32
其中,y是真实值,
Figure QLYQS_33
是预测值, />
Figure QLYQS_34
代表t时刻的预测瞬时损失函数。
2.如权利要求1所述的一种IoT观测数据的在线学习方法,其特征在于,所述解码器,从编码器生成的准正态分布中,随机选择样本,输出与数据流的原始特征结构一致的数据。
3.如权利要求1所述的一种IoT观测数据的在线学习方法,其特征在于,所述结果融合模块,将编码器提取的多个特征进行加权融合,得到当前预测值;
其中,权重用于动态调整每个隐藏层的贡献度,通过变分注意力网络,在每次输入样本处理后,实时计算每个隐藏层的权重。
4.如权利要求3所述的一种IoT观测数据的在线学习方法,其特征在于,所述变分注意力网络,根据编码器中每个隐藏层之间的关系以及每个子结构的必要程度,计算每个隐藏层的权重。
5.一种IoT观测数据的在线学习***,其特征在于,包括初始化模块、获取模块、预测模块和学习模块:
初始化模块,被配置为:根据获取的初始时序观测数据,初始化在线深度学习模型;
获取模块,被配置为:实时获取传感器生成的时序观测数据,根据时序观测数据形成输入数据流;
预测模块,被配置为:所述在线深度学习模型处理输入数据流,以生成并输出最终预测结果;
学习模块,被配置为:在处理输入数据流的过程中,对输入数据流进行即时学习,实时动态更新在线深度学习模型;
所述即时学习,是基于数据流的均值和方差,学习数据分布,构造准正态分布,重构新的样本,实现变分注意力网络,基于分布差异、重构差异和推理差异,进行模型的动态调整;
所述在线深度学习模型,包括编码器、解码器和结果融合模块,以数据流为输入,输出对下一时刻数据值的预测;
所述编码器,执行两部分操作:
(1)提取隐藏层间的隐藏信息,输入到结果融合模块,进行最终预测值的计算;
(2)以标准正态分布作为目标,编码隐藏信息,通过重参数化设置,输出满足准正态分布的均值
Figure QLYQS_35
与标准差/>
Figure QLYQS_36
所述构造准正态分布,具体为:
编码器尝试将样本携带的所有特征信息的分布转码为准正态分布,尽管准正态分布是以标准正态分布作为目标来编码的,但它通常不能被编码成标准正态分布,这里称该标准正态分布为潜在分布;在该过程中,编码器直接输出满足准正态分布的均值
Figure QLYQS_37
与标准差/>
Figure QLYQS_38
作为编码结果,也即,在编码处理中生成的均值/>
Figure QLYQS_39
与标准差/>
Figure QLYQS_40
,不是通过均值或标准差定义来计算的,而是直接从编码器输出的;
为保证编码器输出的均值
Figure QLYQS_41
与标准差/>
Figure QLYQS_42
满足标准正态分布,在损失函数中设置惩罚项,一旦基于均值和标准差所反馈的准正态分布和标准正态分布有差异,模型将会受到惩罚机制的影响而做出进一步调整;
因此,在实际的算法操作流程中,编码器负责输出均值和标准差,损失函数确保平均值和标准差符合某种准正态分布,这就等价于将原始数据向准正态分布的方向编码,再输出该准正态分布的均值与标准差,并随机采样生成数据
Figure QLYQS_43
进行后续的解码器操作;
与此同时,为保证采样数据
Figure QLYQS_44
的概率分布符合输入样本,首先需要假设存在一个/>
Figure QLYQS_45
关于X的后验概率P(Z|X),并进一步假设这个概率分布是正态分布:/>
Figure QLYQS_46
,那么采样数据/>
Figure QLYQS_47
的概率分布P(Z)为:
Figure QLYQS_48
因此,P(Z)先验分布和
Figure QLYQS_49
后验分布都符合标准正态分布;
此外,从标准正态分布
Figure QLYQS_50
中随机选择样本/>
Figure QLYQS_51
,并将该样本输入解码器;由于这个过程中存在随机采样,使得架构中的梯度信息流是断裂的,反向传播无法通过传统的链式法则进行,因此,设计使用独特的重参数化技巧来完成模型的反向传播,以满足典型神经网络的特性;在重参数化中,采用随机抽样的方法生成一组满足正态分布的变量,从/>
Figure QLYQS_52
中取样z,等同于从/>
Figure QLYQS_53
中采样ε,然后令/>
Figure QLYQS_54
,因此,应用梯度下降法;最后,解码器对z进行解码,并输出样本x的重构数据;
在编码器的编码阶段,计算每个输入样本
Figure QLYQS_55
的均值/>
Figure QLYQS_56
与方差/>
Figure QLYQS_57
,用来构造准正态分布;/>
所述在线深度学习模型的损失函数,通过三个损失的加权融合,衡量最终预测值与真实值之间的差异:
(1)重构损失
Figure QLYQS_58
,衡量真实值和重构值之间的差异,具体公式为:
Figure QLYQS_59
其中, n表示样本个数, x表示原始值,
Figure QLYQS_60
表示重构值;
(2)KL损失,衡量准正态分布与标准正态分布之间的差异,具体公式为:
Figure QLYQS_61
其中,
Figure QLYQS_62
代表每个维度生成的均值和方差,k是均值/>
Figure QLYQS_63
与方差/>
Figure QLYQS_64
的维度数;
(3)预测损失
Figure QLYQS_65
,衡量真实值与当前预测值之间的差异,具体公式为:
Figure QLYQS_66
其中,y是真实值,
Figure QLYQS_67
是预测值, />
Figure QLYQS_68
代表t时刻的预测瞬时损失函数。
6.一种电子设备,其特征是,包括:
存储器,用于非暂时性存储计算机可读指令;以及
处理器,用于运行所述计算机可读指令,
其中,所述计算机可读指令被所述处理器运行时,执行上述权利要求1-4任一项所述的方法。
7.一种存储介质,其特征是,非暂时性地存储计算机可读指令,其中,当所述非暂时性计算机可读指令由计算机执行时,执行权利要求1-4任一项所述方法的指令。
CN202310214205.9A 2023-03-08 2023-03-08 一种IoT观测数据的在线学习方法及*** Active CN115879569B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310214205.9A CN115879569B (zh) 2023-03-08 2023-03-08 一种IoT观测数据的在线学习方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310214205.9A CN115879569B (zh) 2023-03-08 2023-03-08 一种IoT观测数据的在线学习方法及***

Publications (2)

Publication Number Publication Date
CN115879569A CN115879569A (zh) 2023-03-31
CN115879569B true CN115879569B (zh) 2023-05-23

Family

ID=85762015

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310214205.9A Active CN115879569B (zh) 2023-03-08 2023-03-08 一种IoT观测数据的在线学习方法及***

Country Status (1)

Country Link
CN (1) CN115879569B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109102126A (zh) * 2018-08-30 2018-12-28 燕山大学 一种基于深度迁移学习的理论线损率预测模型
CN112836808A (zh) * 2021-03-22 2021-05-25 哈尔滨理工大学 基于深度学习的分布式参数***建模的时空耦合学习方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200160207A1 (en) * 2018-11-15 2020-05-21 General Electric Company Automated model update based on model deterioration
CA3097655A1 (en) * 2019-10-30 2021-04-30 Royal Bank Of Canada System and method for machine learning architecture with differential privacy
US11443335B2 (en) * 2019-12-19 2022-09-13 Beijing Didi Infinity Technology And Development Co., Ltd. Model-based deep reinforcement learning for dynamic pricing in an online ride-hailing platform
US11531903B2 (en) * 2020-08-02 2022-12-20 Actimize Ltd Real drift detector on partial labeled data in data streams
CN114186668A (zh) * 2021-12-09 2022-03-15 山东省计算中心(国家超级计算济南中心) 一种物联网数据流预测的在线深度学习方法、***和设备
CN114676622A (zh) * 2022-02-17 2022-06-28 国网冀北电力有限公司承德供电公司 基于自编码器深度学习模型的短期光伏功率预测方法
CN114970674A (zh) * 2022-04-15 2022-08-30 北京大学 一种基于关联度对齐的时序数据概念漂移适配方法
CN114881331A (zh) * 2022-05-09 2022-08-09 西安交通大学 一种面向在线教育的学习者异常学习状态预测方法
CN114911831A (zh) * 2022-05-12 2022-08-16 大连大学 一种基于Flink流式计算和深度学习的农业实时预警方法及***
CN115293662A (zh) * 2022-10-10 2022-11-04 山东省计算中心(国家超级计算济南中心) 融合并行与分布式的海洋观测数据智能计算方法及***
CN115731396A (zh) * 2022-11-28 2023-03-03 辽宁工程技术大学 一种基于贝叶斯变分推断的持续学习方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109102126A (zh) * 2018-08-30 2018-12-28 燕山大学 一种基于深度迁移学习的理论线损率预测模型
CN112836808A (zh) * 2021-03-22 2021-05-25 哈尔滨理工大学 基于深度学习的分布式参数***建模的时空耦合学习方法

Also Published As

Publication number Publication date
CN115879569A (zh) 2023-03-31

Similar Documents

Publication Publication Date Title
CN108900346B (zh) 基于lstm网络的无线网络流量预测方法
CN112364975B (zh) 基于图神经网络的终端运行状态预测方法及***
CN113177633B (zh) 一种深度解耦时间序列预测方法
CN108764568B (zh) 一种基于lstm网络的数据预测模型调优方法及装置
CN113095550B (zh) 基于变分递归网络和自注意力机制的空气质量预测方法
CN108197736A (zh) 一种基于变分自编码器和极限学习机的空气质量预测方法
CN110232461A (zh) 基于量子遗传算法优化的多关联向量机水质预测方法
CN110737952A (zh) 一种结合AE和bi-LSTM的机械设备关键零部件剩余寿命预测方法
CN115271186B (zh) 一种基于延时因子和PSO RNN Attention模型的水库水位预测预警方法
CN113537539B (zh) 一种基于注意力机制的多时间步供热用气量预测模型
CN117977576B (zh) 一种基于多尺度历史负荷数据的台区负荷预测方法
CN109447333A (zh) 一种基于不定长模糊信息粒的时间序列预测方法和装置
CN115935834A (zh) 一种基于深度自回归网络和持续学习策略的历史拟合方法
CN116432697A (zh) 一种融合长短期记忆网络与注意力机制的时间序列预测方法
CN111754033B (zh) 一种基于循环神经网络的非平稳时序数据预测方法
CN115879569B (zh) 一种IoT观测数据的在线学习方法及***
CN117291069A (zh) 一种基于改进de与注意力机制的lstm污水水质预测方法
CN117272040A (zh) 一种基于元学习框架的小样本时间序列预测方法
CN115860232A (zh) 一种蒸汽负荷预测方法、***、电子设备及介质
CN113807005B (zh) 基于改进fpa-dbn的轴承剩余寿命预测方法
CN115659201A (zh) 物联网气体浓度检测方法及监控***
CN115730197A (zh) 基于DRSupAE的转炉炼钢终点碳温预测方法及应用
CN116861962A (zh) 一种数据处理方法及装置
Zheng et al. A Remaining Useful Life Prediction Method of Rolling Bearings Based on Deep Reinforcement Learning
CN114186668A (zh) 一种物联网数据流预测的在线深度学习方法、***和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant