CN114648097A - 基于深度学习的电梯困人特征解析与时间序列预测模型构建方法、所得模型及预测方法 - Google Patents

基于深度学习的电梯困人特征解析与时间序列预测模型构建方法、所得模型及预测方法 Download PDF

Info

Publication number
CN114648097A
CN114648097A CN202210267761.8A CN202210267761A CN114648097A CN 114648097 A CN114648097 A CN 114648097A CN 202210267761 A CN202210267761 A CN 202210267761A CN 114648097 A CN114648097 A CN 114648097A
Authority
CN
China
Prior art keywords
elevator
features
prediction
data
deep learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202210267761.8A
Other languages
English (en)
Inventor
许卫全
陈武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Youhu Technology Co ltd
Original Assignee
Nanjing Youhu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Youhu Technology Co ltd filed Critical Nanjing Youhu Technology Co ltd
Priority to CN202210267761.8A priority Critical patent/CN114648097A/zh
Publication of CN114648097A publication Critical patent/CN114648097A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Human Resources & Organizations (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Elevator Control (AREA)

Abstract

本发明涉及基于深度学习的电梯困人特征解析与时间序列预测模型构建方法、所得模型及预测方法。该构建方法包括采集电梯原始数据,采用软标签,将稀疏特征和密集特征转换,拼接,传入LSTM神经网络计算得到时序抽象特征,传入全连接层并转换为预测困人概率,以交叉熵损失函数计算预测损失,并通过反向传播更新LSTM神经网络参数以训练模型。该预测方法包括采用构建方法获得多个预测模型,利用侧重点略有差别的多个预测模型进行综合处理并得到综合困人概率作为预测结果。本发明能在不使用电梯组件具体运行数据的前提下,使用软标签、电梯的静态数据与历史动态数据,学习到电梯困人事件的相关特征,预测电梯在下一个时间点的困人概率。

Description

基于深度学习的电梯困人特征解析与时间序列预测模型构建 方法、所得模型及预测方法
技术领域
本发明涉及一种基于深度学习的电梯困人特征解析与时间序列预测模型构建方法,由该构建方法获得的预测模型,以及采用该模型的预测方法,属于计算机科学与技术、深度学习、设备安全、故障预测技术领域。
背景技术
故障预测,是指基于存储在大数据存储与分析平台中的数据,通过设备使用数据、工况数据、主机及配件性能数据、配件更换数据等设备与服务数据,进行设备故障、服务、配件需求的预测,为主动服务提供技术支撑,延长设备使用寿命,降低故障率。
现有的故障预测方法大多面向简单、规则性较强的变化形态。对于复杂装备,由于其***组成及故障机理的复杂性,不同组件之间存在较强的耦合性,难以分别对其单独建模进行故障预测,已有的单一模型很难得到理想的预测效果。
为此,部分学者提出组合的故障预测方法,针对现有的变电设备故障率预测模型,往往会出现不同时期的预测数值不尽统一的现象,通过研究基于累积失效规律结合灰色线性回归模型的故障率组合预测方法,得到了较单一模型更好的预测效果。然而,该组合方法的构建过程复杂、人工依赖性强,且不利于在实际中推广和应用。
深度学习是通过模拟人脑神经元的活动,输入大量的历史数据,以学习到样本数据的内在规律和表示形式。当前在自然语言处理、语音识别、人脸识别等多个领域,深度学习已经取得了大量的成果。由于深度学习原理的抽象性,能够快速地运用到新领域中。
随着***安全性与可靠性要求的进一步提高,人们更希望根据装备的历史运行数据,对其运行状态进行分析,预测装备未来的运行状况,减少装备的故障率。具体到电梯安全领域,当前仍然存在着大量不具备物联网设备安装条件从而缺乏电梯组件具体运行数据的老旧电梯,这类电梯往往只有静态数据和历史动态数据,采用现有的故障预测模型及方法会因直接有效数据不足而难以实现有效预测。因此,迫切需要研制出能够仅仅使用电梯的静态数据与历史动态数据实现有效预测的预测模型及方法。
经检索发现,申请号CN202110977026.1、申请公布号CN113734928A的发明专利,公开了一种基于神经网络的在用电梯故障预测方法,利用传感器采集电梯的运行数据,针对采集数据建立电梯故障预测模型;传感器采集信号后通过采集装置内的4G模块传输给后台处理***。后台数据处理装置利用神经网络模型根据电梯运行状态参数对电梯往后一段时间可能发生的故障类型进行有效预测。然而,以该技术方案为代表的现有技术并不能仅凭电梯的静态数据与历史动态数据实现有效预测,这就很难套用到前文提到的老旧电梯上进行预测。
此外,申请号CN202010861302.3、申请公布号CN112001548A的发明专利公开了一种基于深度学习的OD客流预测方法。虽然此类预测方法也采用了深度学习技术,但是并未教导如何将该技术进行改进以适应于前文提到的老旧电梯进行有效预测。
发明内容
本发明的主要目的是:克服现有技术存在的问题,提供一种基于深度学习的电梯困人特征解析与时间序列预测模型构建方法,该方法构建所得模型,以及采用该模型的预测方法,可以在不使用电梯组件具体运行数据的前提下,仅使用电梯的静态数据与历史动态数据,抽取电梯的时序特征,预测电梯在下一个时间点的困人概率,从而针对不具备物联网设备安装条件而缺乏电梯组件具体运行数据的老旧电梯给出可行有效的解决方案。
本发明解决其技术问题的技术方案如下:
一种基于深度学习的电梯困人特征解析与时间序列预测模型构建方法,其特征是,包括以下步骤:
第一步、采集作为数据源的电梯的原始数据,并传入深度学习模型;所述原始数据包括静态信息数据和历史动态信息数据;
第二步、采用软标签修改深度学习训练集标签;
第三步、将静态信息数据的各项特征、历史动态信息数据的各项特征分别分类为稀疏特征、密集特征,其中,所述稀疏特征是指具有多个不相关的离散值、不同值之间只代表含义不同、且不包含次序关系的特征,所述密集特征是指具有离散值或连续值、且包含次序关系的特征;之后,将各个特征分别进行转换,其中,对于稀疏特征,将该特征通过隐层映射表映射到对应的特征空间以实现转换,对于密集特征,将该特征通过全连接层进行特征提取以实现转换;
第四步、将转换后各个特征信息在通道层进行拼接,获得拼接特征;
第五步、将拼接特征传入LSTM神经网络计算得到时序抽象特征;
第六步、将时序抽象特征传入全连接层并转换为预测困人概率;
第七步、将预测困人概率与困人真实值传入交叉熵损失函数,计算预测损失,并通过反向传播更新LSTM神经网络参数以训练模型;所述困人真实值来自作为数据源的电梯的原始数据;预测模型构建结束。
该构建方法采用软标签(Soft-Label)以增强深度学习模型对电梯损耗状况的学习能力,并能增强训练集中困人信息的含量,使得模型能够更好地学习到电梯困人事件的相关特征;综合利用电梯的静态信息数据与历史动态信息数据,先分类为稀疏特征和密集特征并分别处理,再通过LSTM神经网络并经处理获得预测困人概率,然后训练模型即可投入实际部署使用。
本发明进一步完善的技术方案如下:
优选地,第一步中,所述静态信息数据选自或包括:所在位置、场所类型、场所名称、制造单位、安装单位;所述历史动态信息数据选自或包括:天气、气温、困人记录、故障记录。
更优选地,所述原始数据的数据来源为电梯的电梯清单表、困人或故障记录表、天气气温表。
采用以上优选方案,可进一步优化第一步的具体技术特征。
优选地,第二步中,修改时,只修改位于最近一次困人记录之前、且距离该困人记录的时间长度为预设值的时间段内的深度学习训练集标签,并将该深度学习训练集的困人概率设为预定值。
采用以上优选方案,可进一步优化第二步的具体技术特征。
优选地,第三步中,将各个特征分别进行转换时按下式转换:
fs=embedding(xs) I
fd=Wd·xd+bd II
式I中,xs为稀疏特征,embedding为隐层映射层、能将稀疏特征映射到对应的特征空间,fs为将稀疏特征转换所得特征信息;
式II中,xd为密集特征,Wd为抽象密集特征的权重矩阵,bd为抽象密集特征的偏置矩阵,fd为将密集特征转换所得特征信息;
第四步中,拼接时,将位于同一个时间序列的稀疏特征和密集特征保存在同一个张量中。
采用以上优选方案,可进一步优化第三步和第四步的具体技术特征。
优选地,第五步中,所述LSTM神经网络由多个LSTM单元构成;对于单个LSTM单元,其输入数据为上一个LSTM单元的短期记忆输出ht-1和当前时间点输入的拼接特征xt
所述单个LSTM单元由遗忘门、输入门、输出门构成;
首先,所述遗忘门按下式进行处理并获得遗忘权重ft
ft=σ(Wf·[ht-1,xt]+bf) III
式III中,Wf为遗忘门的权重矩阵,bf为遗忘门的偏置矩阵,σ为Sigmoid 激活函数、将输入值映射为0到1之间的输出值;
其次,所述输入门按下式进行处理并获得输入权重if和候选特征
Figure BDA0003552504530000041
if=σ(Wi·[ht-1,xt]+bi) IV
Figure BDA0003552504530000042
式IV中,Wi为输入门的权重矩阵,bi为输入门的偏置矩阵,σ为Sigmoid 激活函数、将输入值映射为0到1之间的输出值;
式V中,WC为输入门的权重矩阵,bC为输入门的偏置矩阵,tanh为tanh 激活函数、将输入值转换为-1到1之间的输出值;
之后,结合遗忘门的遗忘权重ft、输入门的输入权重if和候选特征
Figure BDA0003552504530000051
当前LSTM单元按下式更新长期记忆Ct
Figure BDA0003552504530000052
式VI中,Ct-1为经上一个LSTM单元更新的长期记忆;
接着,所述输出门按下式处理并获得当前LSTM单元的短期记忆输出ht
ot=σ(Wo·[ht-1,xt]+bo) VII
ht=ot*tanh(Ct) VIII
式VII中,ot为输出权重,Wo为输出门的权重矩阵,bo为输出门的偏置矩阵,σ为Sigmod激活函数、将输入值映射为0到1之间的输出值;
式VIII中,Ct为长期记忆,tanh为tanh激活函数。
更优选地,第五步中,所述LSTM神经网络将传入的拼接特征进行提取后,按照时序顺序输出各个LSTM单元提取的短期记忆输出特征,此即每个时间点的时序特征,取最后一个时间点的时序特征作为时序抽象特征st;所述LSTM 神经网络的具体参数选自或包括:LSTM层数、输入特征维度、隐层神经元个数、输出特征维度。
采用以上优选方案,可进一步优化第五步的具体技术特征。
优选地,第六步中,按下式进行转换:
f1=W1·st+b1 IX
Figure BDA0003552504530000053
式IX中,W1为第一层全连接层的权重矩阵,b1为第一层全连接层的偏置矩阵;
式X中,W2为第二层全连接层的权重矩阵,b2为第二层全连接层的偏置矩阵,
Figure BDA0003552504530000054
为预测困人概率;
第七步中,采用样本均衡的交叉熵损失函数,具体见下式:
Figure BDA0003552504530000055
Figure BDA0003552504530000061
Figure BDA0003552504530000062
式XI和式XII中,αtrue为正样本的权重系数,αfakse为负样本的权重系数, ntrue为正样本的数量,nfalse为负样本的数量;
式XIII中,
Figure BDA0003552504530000063
为电梯困人的真实情况,取值0或1;
Figure BDA0003552504530000064
为预测困人概率; L为预测损失。
采用以上优选方案,可进一步优化第六步和第七步的具体技术特征。
本发明还提供:
由前文所述构建方法构建获得的电梯困人特征解析与时间序列预测模型。
该预测模型可经正式部署用于预测目标电梯的困人概率。
本发明还提供:
一种基于深度学习的电梯困人特征解析与时间序列预测方法,其特征是,包括以下步骤:
S1、采用前文所述基于深度学习的电梯困人特征解析与时间序列预测模型构建方法,通过使用相同的数据源、在同一训练过程中的不同阶段分别保存模型,以获得多个权重参数有差异的预测模型;
S2、采集目标电梯的原始数据,分别传入S1的多个预测模型并获得多个预测困人概率,将其过滤处理后,得到综合困人概率作为预测结果;所述过滤处理选自或包括取平均值、取最小值;预测方法结束。
该预测方法利用侧重点略有差别的多个预测模型进行综合处理并得到综合困人概率,这样在有效数据有限的前提下,能达到较好的预测性能。
与现有技术相比,本发明采用软标签(Soft-Label)以增强深度学习模型对电梯损耗状况的学习能力,并能增强训练集中困人信息的含量,使得模型能够更好地学习到电梯困人事件的相关特征;模型对静态信息和动态信息具体分析,将其分类为稀疏特征和密集特征并分别处理,通过LSTM神经网络并经处理获得电梯在下一个时间点的预测困人概率。
本发明适用于混合了稀疏特征和密集特征的电梯困人预测;本发明能在不使用电梯组件具体运行数据的前提下,使用软标签(Soft-Label)、电梯的静态数据与历史动态数据,学习到电梯困人事件的相关特征,预测电梯在下一个时间点的困人概率。在当前物联网设备安装不足、直接有效数据不足的情况下,本发明是一种可行、有效的电梯困人预测方案,在实际工程应用中能提供有效的困人预测辅助。
附图说明
图1为本发明实施例1的主体流程示意图。
图2为本发明实施例1中LSTM神经网络示意图。
图3为本发明实施例2的精确率变化图。
具体实施方式
在具体实施时,本发明基于深度学习的电梯困人特征解析与时间序列预测模型构建方法、预测模型、预测方法分别含有前文发明内容中相应部分记载的全部技术特征(含优选方案的特征),其具体内容此处不再重复赘述。
下面参照附图并结合实施例对本发明作进一步详细描述。但是本发明不限于所给出的例子。
实施例1
本实施例为基于深度学习的电梯困人特征解析与时间序列预测模型构建方法,基本过程如前文所述。
如图1所示,本实施例的具体内容如下:
第一步、将电梯的所在位置、场所类型、场所名称等静态信息,天气、气温、困人记录、故障记录等历史动态信息,传入深度学习模型。
上述数据涉及三类表,分别是电梯清单表、困人/故障记录表和天气气温表。
电梯清单表包含的信息如表1所示。
表1电梯清单表的具体内容
Figure BDA0003552504530000071
Figure BDA0003552504530000081
困人/故障记录表包含的信息如表2所示。
表2困人/故障记录表的具体内容
Figure BDA0003552504530000082
天气气温表包含的信息如表3所示。
表3天气气温表的具体内容
Figure BDA0003552504530000083
第二步、采用软标签(Soft-Label)修改深度学习训练集标签。
由于电梯的损耗状况是隐性的,而困人事件是显性的,可能电梯已经有潜在的强损耗而还未发生困人事件,因此采用软标签(Soft-Label)以增强模型对电梯损耗状况的学习能力,并能增强训练集中困人信息的含量,使得模型能够更好地学习到电梯困人事件的相关特征。
由于本实施例使用的时间序列单元为1个月,相对较长,所以将1个月设为预设值,只修改最近一次困人记录前1个月的深度学习训练集标签,将其困人概率设置为预定值0.6。
第三步、对静态信息和动态信息具体分析,分类为稀疏特征和密集特征。
稀疏特征,如维保单位,其具有多个不相关的离散值,每个值对应着不同的维保单位,且不同值之间只代表含义不同,不包含次序关系;密集特征,如气温,可以是离散值或连续值,其值包含次序关系。
对于稀疏特征,通过隐层映射表先映射到每个特征对应的特征空间;对于密集特征,通过一层全连接层做初级的特征提取。
其计算过程可以表示为下式:
fs=embedding(xs) I
fd=wd·xd+bd II
式I中,xs为稀疏特征,embedding为隐层映射层、能将稀疏特征映射到对应的特征空间,fs为将稀疏特征转换所得特征信息;
式II中,xd为密集特征,Wd为抽象密集特征的权重矩阵,bd为抽象密集特征的偏置矩阵,fd为将密集特征转换所得特征信息。
第四步、将转换后的稀疏特征和密集特征在通道层拼接起来得到拼接特征,使得位于同一个时间序列的稀疏特征和密集特征保存在同一个张量中。
第五步、将拼接特征传入LSTM神经网络(LSTM:long short-term memory,又译作:长短期记忆),计算获得时序抽象特征。
由于所采集数据为时序数据,选择使用以LSTM神经网络算法进行预测。 LSTM是一种为了解决对时序关系有依赖问题的特殊的神经网络模型,本实施例采用图2所示的LSTM神经网络。一方面,LSTM使用遗忘门和输入门控制长短期记忆之间的遗忘和更新,使得神经网络能够更好地学习长期记忆。另一方面,LSTM由遗忘门、输入门、输出门组成,相比基础神经网络,有更强的提取长期时序特征的能力。
LSTM网络由多个LSTM单元构成,对于单个LSTM单元,其输入数据为上一个LSTM单元的短期记忆输出ht-1和当前时间点输入的拼接特征xt(注:这两个参数下文中会多次用到,下文不再单独解释其含义)。
首先通过遗忘门控制需要去除的信息并获得遗忘权重ft,如下式所示:
ft=σ(Wf·[ht-1,xt]+bf) III
式III中,Wf为遗忘门的权重矩阵,bf为遗忘门的偏置矩阵,σ为Sigmoid 激活函数、将输入值映射为0到1之间的输出值。
再计算输入门,控制需要更新LSTM长期记忆的信息,并获得输入权重if和候选特征
Figure BDA0003552504530000101
如下式所示:
if=σ(Wi·[ht-1,xt]+bi) IV
Figure BDA0003552504530000102
式IV中,Wi为输入门的权重矩阵,bi为输入门的偏置矩阵,σ为Sigmoid 激活函数、将输入值映射为0到1之间的输出值;
式V中,WC为输入门的权重矩阵,bC为输入门的偏置矩阵,tanh为tanh 激活函数、将输入值转换为-1到1之间的输出值。
输入门包括两部分,第一部分结合短期记忆ht-1和当前输入xt,使用输入门的权重矩阵Wi和偏置矩阵bi计算特征,再通过Sigmod激活函数,输出0到 1之间的数值,生成输入权重if,决定新特征传入长期记忆的比例;第二部分结合短期记忆ht-1和当前输入xt,使用权重矩阵WC和偏置矩阵bC计算特征,通过tanh激活函数,产生一个候选特征
Figure BDA0003552504530000105
候选特征的每一个值在-1到1之间。
结合遗忘门的遗忘权重ft和输入门的输入权重if和候选特征
Figure BDA0003552504530000103
当前LSTM 单元更新长期记忆Ct,计算公式见下式:
Figure BDA0003552504530000104
式VI中,Ct-1为经上一个LSTM单元更新的长期记忆。
接着,输出门将长期记忆与短期记忆混合,共同决定当前LSTM单元的短期记忆输出ht,计算方法如下式所示:
ot=σ(Wo·[ht-1,xt]+bo) VII
ht=ot*tanh(Ct) VIII
式VII中,ot为输出权重,Wo为输出门的权重矩阵,bo为输出门的偏置矩阵,σ为Sigmod激活函数、将输入值映射为0到1之间的输出值;
式VIII中,Ct为长期记忆,tanh为tanh激活函数。
拼接特征在经过LSTM提取特征之后,按照时序顺序输出各个LSTM单元提取的短期记忆输出特征,取最后一个时间点的特征作为时序抽象特征st
在本实施例中,此时LSTM神经网络的具体参数如下:
LSTM参数
LSTM层数 2
输入特征维度 368
隐层神经元个数 128
输出特征维度 128
第六步、将时序抽象特征st传入两层全连接层,转换为预测困人概率。其计算方式如下式:
f1=W1·st+b1 IX
Figure BDA0003552504530000111
式IX中,W1为第一层全连接层的权重矩阵,b1为第一层全连接层的偏置矩阵;式X中,W2为第二层全连接层的权重矩阵,b2为第二层全连接层的偏置矩阵,
Figure BDA0003552504530000112
为预测困人概率。注:为便于模型训练,困人概率、不困人概率为两个值,其和为1。
第七步、将模型预测困人概率与真实困人情况传入交叉熵损失函数,计算预测损失L,并通过反向传播更新神经网络参数以训练模型;困人真实值来自作为数据源的电梯的原始数据。
注:通过反向传播更新神经网络参数为本领域现有技术手段,例如: Rumelhart,D.,Hinton,G.&Williams,R.Learning representations by back-propagatingerrors.Nature 323,533–536 (1986).(https://doi.org/10.1038/323533a0),所以此处不再赘述其具体内容。
通常情况下,电梯发生困人事件是时序稀疏的,其中不困人的记录数为困人的记录数的20倍以上,将困人时间序列与不困人时间序列不加处理地输入深度学习模型并训练,会导致模型倾向于预测不困人,因此应添加权重均衡,使得模型能够综合正负样本,减少样本不均衡对模型训练的影响,使得模型能够更准确地预测电梯困人概率。
本实施例中,权重均衡的实现方式为:在计算损失预测值与真实值的损失时,为不同类型的样本乘以不同的权重系数,权重系数的计算方法如下:
Figure BDA0003552504530000121
Figure BDA0003552504530000122
其中,αtrue为正样本的权重系数,αfalse为负样本的权重系数,ntrue为正样本的数量,nfalse为负样本的数量。
采用样本均衡的交叉熵损失函数,具体见下式:
Figure BDA0003552504530000123
其中,
Figure BDA0003552504530000124
为电梯困人的真实情况,取值0或1;
Figure BDA0003552504530000125
为预测困人概率。这样能减少样本不均衡对模型预测的影响。
至此预测模型构建结束。
实施例2
本实施例为基于深度学习的电梯困人特征解析与时间序列预测方法,基本过程如前文所述。
本实施例为实施例1的正式部署阶段,本实施例的具体内容如下:
利用实施例1,用训练出的多个模型对输入预测序列做过滤,取多个模型的公认困人概率作为最终预测结果,过滤方式有取平均值和取最小值两种。也即:将多个模型的预测困人概率经过滤处理后得到综合困人概率作为预测结果。
本实施例采用的多个模型结构一致,使用训练数据相同,为同一个训练流程在不同阶段保存的模型,因此这些模型的权重参数不同。由于深度学习模型泛化能力的要求,单一模型对于时间序列的特征提取各有侧重,在下一阶段训练得到模型是对前一个模型的微调,其特征提取的侧重点会改变,结合不同模型的侧重点,将这些模型串联起来,可以得到综合困人概率。
本实施例中,使用21196台电梯作为数据源,使用其在2021年7月的数据作为测试数据集。按照本实施例方法预测电梯困人概率后,比较不同阈值下困人概率的预测性能。注:当电梯预测困人概率与真实困人情况之间的差值小于阈值时,判断模型预测正确。
识别性能对比表如表4所示,对应的精确率随阈值的变化如图3所示。可以看出,本实施例的预测模型在数据有效性有限的前提下,能达到较好的预测性能。
当阈值为0.01时,电梯困人的召回率为39.1%,精确率为10.9%,说明本实施例的电梯困人预测模型具有较好的召回性能。
当阈值为0.0002时,电梯困人的召回率为20.9%,精确率为17.3%,说明本实施例的电梯困人预测模型具有较好的预测性能。
这意味着本实施例的模型在实际工程应用中能提供有效的困人预测辅助,同时,由于在实际电梯检修中的信息详细度与本实施例使用的信息详细度一致,因此,本实施例具有较高的可行性和实用性。
表4
月份 召回率 精确率 命中数 预测数 真实困人数 偏差阈值
2021-07 39.14% 10.93% 335 3066 856 0.01
2021-07 25.82% 14.96% 221 1477 856 0.0005
2021-07 23.25% 16.18% 199 1230 856 0.0003
2021-07 20.91% 17.34% 179 1032 856 0.0002
除上述实施例外,本发明还可以有其他实施方式。凡采用等同替换或等效变换形成的技术方案,均落在本发明要求的保护范围。

Claims (10)

1.一种基于深度学习的电梯困人特征解析与时间序列预测模型构建方法,其特征是,包括以下步骤:
第一步、采集作为数据源的电梯的原始数据,并传入深度学习模型;所述原始数据包括静态信息数据和历史动态信息数据;
第二步、采用软标签修改深度学习训练集标签;
第三步、将静态信息数据的各项特征、历史动态信息数据的各项特征分别分类为稀疏特征、密集特征,其中,所述稀疏特征是指具有多个不相关的离散值、不同值之间只代表含义不同、且不包含次序关系的特征,所述密集特征是指具有离散值或连续值、且包含次序关系的特征;之后,将各个特征分别进行转换,其中,对于稀疏特征,将该特征通过隐层映射表映射到对应的特征空间以实现转换,对于密集特征,将该特征通过全连接层进行特征提取以实现转换;
第四步、将转换后各个特征信息在通道层进行拼接,获得拼接特征;
第五步、将拼接特征传入LSTM神经网络计算得到时序抽象特征;
第六步、将时序抽象特征传入全连接层并转换为预测困人概率;
第七步、将预测困人概率与困人真实值传入交叉熵损失函数,计算预测损失,并通过反向传播更新LSTM神经网络参数以训练模型;所述困人真实值来自作为数据源的电梯的原始数据;预测模型构建结束。
2.根据权利要求1所述的基于深度学习的电梯困人特征解析与时间序列预测模型构建方法,其特征是,第一步中,所述静态信息数据选自或包括:所在位置、场所类型、场所名称、制造单位、安装单位;所述历史动态信息数据选自或包括:天气、气温、困人记录、故障记录。
3.根据权利要求2所述的基于深度学习的电梯困人特征解析与时间序列预测模型构建方法,其特征是,所述原始数据的数据来源为电梯的电梯清单表、困人或故障记录表、天气气温表。
4.根据权利要求1所述的基于深度学习的电梯困人特征解析与时间序列预测模型构建方法,其特征是,第二步中,修改时,只修改位于最近一次困人记录之前、且距离该困人记录的时间长度为预设值的时间段内的深度学习训练集标签,并将该深度学习训练集的困人概率设为预定值。
5.根据权利要求1所述的基于深度学习的电梯困人特征解析与时间序列预测模型构建方法,其特征是,第三步中,将各个特征分别进行转换时按下式转换:
fs=embedding(xs) I
fd=Wd·xd+bd II
式I中,xs为稀疏特征,embedding为隐层映射层、能将稀疏特征映射到对应的特征空间,fs为将稀疏特征转换所得特征信息;
式II中,xd为密集特征,Wd为抽象密集特征的权重矩阵,bd为抽象密集特征的偏置矩阵,fd为将密集特征转换所得特征信息;
第四步中,拼接时,将位于同一个时间序列的稀疏特征和密集特征保存在同一个张量中。
6.根据权利要求1所述的基于深度学习的电梯困人特征解析与时间序列预测模型构建方法,其特征是,第五步中,所述LSTM神经网络由多个LSTM单元构成;对于单个LSTM单元,其输入数据为上一个LSTM单元的短期记忆输出ht-1和当前时间点输入的拼接特征xt
所述单个LSTM单元由遗忘门、输入门、输出门构成;
首先,所述遗忘门按下式进行处理并获得遗忘权重ft
ft=σ(Wf·[ht-1,xt]+bf) III
式III中,Wf为遗忘门的权重矩阵,bf为遗忘门的偏置矩阵,σ为Sigmoid激活函数、将输入值映射为0到1之间的输出值;
其次,所述输入门按下式进行处理并获得输入权重if和候选特征
Figure FDA0003552504520000022
if=σ(Wi·[ht-1,xt]+bi) IV
Figure FDA0003552504520000021
式IV中,Wi为输入门的权重矩阵,bi为输入门的偏置矩阵,σ为Sigmoid激活函数、将输入值映射为0到1之间的输出值;
式V中,WC为输入门的权重矩阵,bC为输入门的偏置矩阵,tanh为tanh激活函数、将输入值转换为-1到1之间的输出值;
之后,结合遗忘门的遗忘权重ft、输入门的输入权重if和候选特征
Figure FDA0003552504520000034
当前LSTM单元按下式更新长期记忆Ct
Figure FDA0003552504520000031
式VI中,Ct-1为经上一个LSTM单元更新的长期记忆;
接着,所述输出门按下式处理并获得当前LSTM单元的短期记忆输出ht
ot=σ(Wo·[ht-1,xt]+bo) VII
ht=ot*tanh(Ct) VIII
式VII中,ot为输出权重,Wo为输出门的权重矩阵,bo为输出门的偏置矩阵,σ为Sigmod激活函数、将输入值映射为0到1之间的输出值;
式VIII中,Ct为长期记忆,tanh为tanh激活函数。
7.根据权利要求6所述的基于深度学习的电梯困人特征解析与时间序列预测模型构建方法,其特征是,第五步中,所述LSTM神经网络将传入的拼接特征进行提取后,按照时序顺序输出各个LSTM单元提取的短期记忆输出特征,此即每个时间点的时序特征,取最后一个时间点的时序特征作为时序抽象特征st;所述LSTM神经网络的具体参数选自或包括:LSTM层数、输入特征维度、隐层神经元个数、输出特征维度。
8.根据权利要求7所述的基于深度学习的电梯困人特征解析与时间序列预测模型构建方法,其特征是,第六步中,按下式进行转换:
f1=W1·st+b1 IX
Figure FDA0003552504520000032
式IX中,W1为第一层全连接层的权重矩阵,b1为第一层全连接层的偏置矩阵;
式X中,W2为第二层全连接层的权重矩阵,b2为第二层全连接层的偏置矩阵,
Figure FDA0003552504520000033
为预测困人概率;
第七步中,采用样本均衡的交叉熵损失函数,具体见下式:
Figure FDA0003552504520000041
Figure FDA0003552504520000042
Figure FDA0003552504520000043
式XI和式XII中,αtrue为正样本的权重系数,αfalse为负样本的权重系数,ntrue为正样本的数量,nfalse为负样本的数量;
式XIII中,
Figure FDA0003552504520000044
为电梯困人的真实情况,取值0或1;
Figure FDA0003552504520000045
为预测困人概率;L为预测损失。
9.由权利要求1至8任一项所述构建方法构建获得的电梯困人特征解析与时间序列预测模型。
10.一种基于深度学习的电梯困人特征解析与时间序列预测方法,其特征是,包括以下步骤:
S1、采用权利要求1至8任一项所述基于深度学习的电梯困人特征解析与时间序列预测模型构建方法,通过使用相同的数据源、在同一训练过程中的不同阶段分别保存模型,以获得多个权重参数有差异的预测模型;
S2、采集目标电梯的原始数据,分别传入S1的多个预测模型并获得多个预测困人概率,将其过滤处理后,得到综合困人概率作为预测结果;所述过滤处理选自或包括取平均值、取最小值;预测方法结束。
CN202210267761.8A 2022-03-17 2022-03-17 基于深度学习的电梯困人特征解析与时间序列预测模型构建方法、所得模型及预测方法 Withdrawn CN114648097A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210267761.8A CN114648097A (zh) 2022-03-17 2022-03-17 基于深度学习的电梯困人特征解析与时间序列预测模型构建方法、所得模型及预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210267761.8A CN114648097A (zh) 2022-03-17 2022-03-17 基于深度学习的电梯困人特征解析与时间序列预测模型构建方法、所得模型及预测方法

Publications (1)

Publication Number Publication Date
CN114648097A true CN114648097A (zh) 2022-06-21

Family

ID=81995691

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210267761.8A Withdrawn CN114648097A (zh) 2022-03-17 2022-03-17 基于深度学习的电梯困人特征解析与时间序列预测模型构建方法、所得模型及预测方法

Country Status (1)

Country Link
CN (1) CN114648097A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115049814A (zh) * 2022-08-15 2022-09-13 聊城市飓风工业设计有限公司 采用神经网络模型的护眼灯智能调节方法
CN115795351A (zh) * 2023-01-29 2023-03-14 杭州市特种设备检测研究院(杭州市特种设备应急处置中心) 一种基于残差网络和2d特征表示的电梯大数据风险预警方法
CN116720048A (zh) * 2022-07-18 2023-09-08 华能汕头海门发电有限责任公司 一种基于机器学习模型的电站辅机故障诊断方法和***
CN117435997A (zh) * 2023-12-20 2024-01-23 杭州市特种设备检测研究院(杭州市特种设备应急处置中心) 一种基于Transformer和时序压缩机制的电梯预警及按需维保方法
CN117435918A (zh) * 2023-12-20 2024-01-23 杭州市特种设备检测研究院(杭州市特种设备应急处置中心) 一种基于空间注意力网络与特征划分的电梯风险预警方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116720048A (zh) * 2022-07-18 2023-09-08 华能汕头海门发电有限责任公司 一种基于机器学习模型的电站辅机故障诊断方法和***
CN115049814A (zh) * 2022-08-15 2022-09-13 聊城市飓风工业设计有限公司 采用神经网络模型的护眼灯智能调节方法
CN115795351A (zh) * 2023-01-29 2023-03-14 杭州市特种设备检测研究院(杭州市特种设备应急处置中心) 一种基于残差网络和2d特征表示的电梯大数据风险预警方法
CN117435997A (zh) * 2023-12-20 2024-01-23 杭州市特种设备检测研究院(杭州市特种设备应急处置中心) 一种基于Transformer和时序压缩机制的电梯预警及按需维保方法
CN117435918A (zh) * 2023-12-20 2024-01-23 杭州市特种设备检测研究院(杭州市特种设备应急处置中心) 一种基于空间注意力网络与特征划分的电梯风险预警方法
CN117435997B (zh) * 2023-12-20 2024-03-01 杭州市特种设备检测研究院(杭州市特种设备应急处置中心) 一种基于Transformer和时序压缩机制的电梯预警及按需维保方法
CN117435918B (zh) * 2023-12-20 2024-03-15 杭州市特种设备检测研究院(杭州市特种设备应急处置中心) 一种基于空间注意力网络与特征划分的电梯风险预警方法

Similar Documents

Publication Publication Date Title
CN114648097A (zh) 基于深度学习的电梯困人特征解析与时间序列预测模型构建方法、所得模型及预测方法
CN107544904B (zh) 一种基于深度cg-lstm神经网络的软件可靠性预测方法
Lachtermacher et al. Backpropagation in hydrological time series forecasting
CN107636691A (zh) 用于识别图像中的文本的方法和设备
CN109583565A (zh) 基于注意力模型长短时记忆网络的洪水预测方法
CN110750641B (zh) 一种基于序列连接模型和二叉树模型的分类纠错方法
Ahmadi et al. Learning fuzzy cognitive maps using imperialist competitive algorithm
CN114266201B (zh) 一种基于深度学习的自注意力电梯困人预测方法
CN112685504A (zh) 一种面向生产过程的分布式迁移图学习方法
CN112116137A (zh) 一种基于混合深度神经网络的学生辍课预测方法
CN112365885A (zh) 唤醒模型的训练方法、装置和计算机设备
CN112329974B (zh) 基于lstm-rnn的民航安保事件行为主体识别与预测方法及***
CN113505924A (zh) 一种基于级联时空特征的信息传播预测方法及***
CN112580848A (zh) 一种基于pt-lstm的时间序列预测***与方法
CN113469013A (zh) 一种基于迁移学习和时间序列的电机故障预测方法及***
Li et al. A lstm-based method for comprehension and evaluation of network security situation
CN111815075B (zh) 一种重大公共卫生事件下交通出行需求的预测方法
JPH0934863A (ja) ニューラルネットワークによる情報統合処理方法
JP2019095599A (ja) 音響モデル学習装置、音声認識装置、それらの方法、及びプログラム
CN109978013B (zh) 一种用于人物动作识别的深度聚类方法
CN117010683A (zh) 基于混合神经网络和多Agent的作业安全风险预测方法
CN112633607B (zh) 一种动态时空事件预测方法及***
CN115456173A (zh) 一种通用化的人工神经网络无监督本地学习方法、***及应用
CN115293249A (zh) 一种基于动态时序预测的电力***典型场景概率预测方法
He et al. Application of neural network model based on combination of fuzzy classification and input selection in short term load forecasting

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20220621

WW01 Invention patent application withdrawn after publication