CN116432856A - 基于cnn-glstm模型的管道动态预警方法及装置 - Google Patents
基于cnn-glstm模型的管道动态预警方法及装置 Download PDFInfo
- Publication number
- CN116432856A CN116432856A CN202310486613.XA CN202310486613A CN116432856A CN 116432856 A CN116432856 A CN 116432856A CN 202310486613 A CN202310486613 A CN 202310486613A CN 116432856 A CN116432856 A CN 116432856A
- Authority
- CN
- China
- Prior art keywords
- model
- cnn
- glstm
- operation data
- gate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 99
- 238000012549 training Methods 0.000 claims abstract description 48
- 238000007781 pre-processing Methods 0.000 claims abstract description 9
- 230000008569 process Effects 0.000 claims description 36
- 230000006870 function Effects 0.000 claims description 35
- 238000005457 optimization Methods 0.000 claims description 28
- 230000002159 abnormal effect Effects 0.000 claims description 18
- 238000003860 storage Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 10
- 238000012795 verification Methods 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 6
- 238000002790 cross-validation Methods 0.000 claims description 5
- 238000010200 validation analysis Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 239000000523 sample Substances 0.000 claims 4
- 239000000758 substrate Substances 0.000 claims 3
- 230000008859 change Effects 0.000 abstract description 8
- 238000004364 calculation method Methods 0.000 description 6
- 238000010606 normalization Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Economics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Algebra (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及燃气管道预警技术领域,特别涉及一种基于CNN‑GLSTM模型的管道动态预警方法及装置,其中方法包括:获取历史时段内同一管道且同一阀室下的管道运行数据,并进行预处理;构建以CNN‑LSTM网络为主体的CNN‑GLSTM模型,用于预测管道运行数据;对构建的CNN‑GLSTM模型进行训练,得到训练后的CNN‑GLSTM模型;获取待检测的管道运行数据集;基于待检测的管道运行数据集和训练后的CNN‑GLSTM模型,预测未来时段的管道运行数据;根据预测的管道运行数据和预设的阈值,判断是否进行预警。本发明能够对管道运行数据未来变化趋势进行预测,以便及时、准确预警。
Description
技术领域
本发明实施例涉及燃气管道预警技术领域,特别涉及一种基于CNN-GLSTM模型的管道动态预警方法、装置、电子设备及存储介质。
背景技术
燃气管道预警是油田生产决策部门调整生产运行计划的重要依据。目前,燃气管道预警的主要方法是现场专家根据人工经验对管道运行数据未来发展趋势进行推断和甄别,这种方法在一定程度上能够避免故障的发生,但是由于推测的数据变化趋势不准、预警知识覆盖不全、知识描述不准等问题,使得燃气管道预警准确率低、工作效率差。
发明内容
基于依赖人工的燃气管道预警技术准确率低、工作效率差的问题,本发明实施例提供了一种基于CNN-GLSTM模型的管道动态预警方法、装置、电子设备及存储介质,能够对管道运行数据未来变化趋势进行预测,从而及时、准确地进行管道预警。
第一方面,本发明实施例提供了一种基于CNN-GLSTM模型的管道动态预警方法,包括:
获取历史时段内同一管道且同一阀室下的管道运行数据,并进行预处理;
构建以CNN-LSTM网络为主体的CNN-GLSTM模型,用于预测管道运行数据;所述CNN-GLSTM模型相比CNN-LSTM网络新增了一个遗忘门和一个输入门,原遗忘门、新增遗忘门、原输入门、新增输入门和输出门均采用L1、L2范数进行线性组合,形成一个正则项来约束网络权重大小,总遗忘门基于原遗忘门和新增遗忘门确定,总输入门基于原输入门和新增输入门确定;
基于预处理后的历史时段管道运行数据得到样本数据集,对构建的所述CNN-GLSTM模型进行训练,得到训练后的所述CNN-GLSTM模型;
获取待检测的管道运行数据集;
基于待检测的管道运行数据集和训练后的所述CNN-GLSTM模型,预测未来时段的管道运行数据;
根据预测的管道运行数据和预设的阈值,判断是否进行预警。
可选地,所述进行预处理包括:
对获取的历史时段管道运行数据进行缺失值填补、异常数据处理及归一化处理。
可选地,构建的所述CNN-GLSTM模型的工作过程遵循如下公式:
其中,和/>分别表示新增遗忘门和新增输入门,/>和/>分别表示原遗忘门和原输入门,ft和it分别表示总遗忘门和总输入门,ot表示输出门;/> 和Wo表示为可学习的权重,分别对应新增遗忘门、原遗忘门、新增输入门、原输入门和输出门,和bo表示可学习的偏置向量,分别对应新增遗忘门、原遗忘门、新增输入门、原输入门和输出门,/>为无物理含义的中间量,||||1表示L1范数,/>表示L2范数,σ()表示sigmoid函数,[ht-1,xt]表示拼接,ht-1表示t-1时刻的隐藏层状态,xt表示t时刻的输入数据。
可选地,所述对构建的所述CNN-GLSTM模型进行训练,包括:
在训练过程中,采用贝叶斯优化法对所述CNN-GLSTM模型的超参数进行优化。
可选地,所述CNN-GLSTM模型的超参数包括CNN网络的网络深度、初始学习率和L2正则化系数,以及GLSTM网络的批处理大小、迭代次数、隐藏层节点数和弃权系数。
可选地,所述在训练过程中,采用贝叶斯优化法对所述CNN-GLSTM模型的超参数进行优化,包括:
确定所述CNN-GLSTM模型的超参数及对应的取值范围;
将样本数据集按照预设的比例分为8个子集,采用8折交叉验证法进行训练,每次采用其中1个子集作为验证集,其余7个子集作为训练集;
设置优化目标函数;所述优化目标函数的输入为CNN-GLSTM模型的超参数,输出为所述CNN-GLSTM模型最小预测误差;
通过随机采样,获得初始观测值,用于初始化高斯过程模型;
结合所述优化目标函数的输出调整高斯过程模型;
在调整所述高斯过程模型后,利用采样函数选择下一组超参数,并基于对应的训练集训练所述CNN-GLSTM模型,更新超参数组合;
基于对应的验证集,获得8次验证的性能评估指标平均值,作为评价该组超参数组合的指标;
根据该组超参数组合的指标,判断是否达到最小化预测误差要求,若是则结束训练,将该组超参数组合应用于CNN-GLSTM模型,否则返回所述结合所述优化目标函数的输出调整高斯过程模型的步骤。
可选地,所述根据预测的管道运行数据和预设的阈值,判断是否进行预警,包括:
根据预测的管道运行数据中的进站压力、出站压力及管道温度,结合对应的阈值,判断是否进行预警。
第二方面,本发明实施例还提供了一种基于CNN-GLSTM模型的管道动态预警装置,包括:
第一获取模块,用于获取历史时段内同一管道且同一阀室下的管道运行数据,并进行预处理;
模型构建模块,用于构建以CNN-LSTM网络为主体的CNN-GLSTM模型,用于预测管道运行数据;所述CNN-GLSTM模型相比CNN-LSTM网络新增了一个遗忘门和一个输入门,原遗忘门、新增遗忘门、原输入门、新增输入门和输出门均采用L1、L2范数进行线性组合,形成一个正则项来约束网络权重大小,总遗忘门基于原遗忘门和新增遗忘门确定,总输入门基于原输入门和新增输入门确定;
模型训练模块,用于基于预处理后的历史时段管道运行数据得到样本数据集,对构建的所述CNN-GLSTM模型进行训练,得到训练后的所述CNN-GLSTM模型;
第二获取模块,用于获取待检测的管道运行数据集;
数据预测模块,用于基于待检测的管道运行数据集和训练后的所述CNN-GLSTM模型,预测未来时段的管道运行数据;
预警判断模块,用于根据预测的管道运行数据和预设的阈值,判断是否进行预警。
第三方面,本发明实施例还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时,实现本说明书任一实施例所述的方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行本说明书任一实施例所述的方法。
本发明实施例提供了一种基于CNN-GLSTM模型的管道动态预警方法、装置、电子设备及存储介质,本发明构建以CNN-LSTM网络为主体的预测模型,并对其中的LSTM网络进行改进,分别添加一个遗忘门和输入门,并使新添加的门与原本的门相互交互,构建改进的多层级门控LSTM网络,提高LSTM网络筛选管道运行数据信息的能力,且采用L1、L2范数,利用L1范数正则化LSTM模型,使其具有稀疏性,利用L2范数正则化LSTM模型,增强其抗干扰能力,结合二者的优点,将L1、L2范数进行线性组合,形成一个正则项来约束网络输入权重的大小,以达到正则化LSTM模型的目的,能够更好地解决过拟合问题;本发明能够准确得到未来一段时间内的管道运行数据预测值,以便依据管道运行数据预测值及时判断是否进行燃气管道预警。本发明可较好地解决当前燃气管道预警问题,代替人力实现动态预警,极大地提高了工作效率,有效减少由于隐患发现不及时导致的故障,以确保管道安全运行。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的一种基于CNN-GLSTM模型的管道动态预警方法流程图;
图2(a)是GLSTM网络结构图;
图2(b)是8折交叉验证示意图;
图3是本发明一实施例提供的一种电子设备的硬件架构图;
图4是本发明一实施例提供的一种基于CNN-GLSTM模型的管道动态预警装置结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如前所述,目前燃气管道预警的主要方法是现场专家根据人工经验对管道运行数据未来发展趋势进行推断和甄别,这种方法在一定程度上能够避免故障的发生,但是由于推测的数据变化趋势不准、预警知识覆盖不全、知识描述不准等问题,使得燃气管道预警准确率低、工作效率差。因此,构建燃气管道智能预警模型,及时准确地推断未来管道运行数据的状态,达到提前警示的目的,已成为目前燃气管道预警工作中的迫切需求。有鉴于此,本发明提供了一种基于深度学习神经网络实现管道动态预警的方案,并对现有技术的LSTM神经网络进行改进,以适应燃气管道动态运行数据的特点。
下面描述以上构思的具体实现方式。
请参考图1,本发明实施例提供了一种基于CNN-GLSTM模型的管道动态预警方法,该方法包括:
步骤100,获取历史时段内同一管道且同一阀室下的管道运行数据,并进行预处理;
步骤102,构建以CNN-LSTM网络为主体的CNN-GLSTM模型(GLSTM,改进的长短期记忆神经网络),用于预测管道运行数据;
燃气管道动态运行数据作为一种时序数据,具有复杂度高、维度高等特点,且数据之内存在关联;为更有效地提取运行数据特征,实现降维及数值预测,所述CNN-GLSTM模型相比传统的CNN-LSTM网络新增了一个遗忘门和一个输入门,原遗忘门、新增遗忘门、原输入门、新增输入门和输出门均采用L1、L2范数进行线性组合,形成一个正则项来约束网络权重大小,从而保障网络学习数据的变化规律,总遗忘门基于原遗忘门和新增遗忘门确定,总输入门基于原输入门和新增输入门确定;
步骤104,基于预处理后的历史时段管道运行数据得到样本数据集,对构建的所述CNN-GLSTM模型进行训练,得到训练后的所述CNN-GLSTM模型;
所述CNN-GLSTM模型是以样本历史时段管道运行数据(简称样本数据)为输入和对应的未来时段(即相对于样本数据更新的时段)的管道运行数据为输出进行训练的;神经网络的训练具体可参考现有技术,在此不再进一步赘述;
步骤106,获取待检测的管道运行数据集;
步骤108,基于待检测的管道运行数据集和训练后的所述CNN-GLSTM模型,预测未来时段的管道运行数据;
步骤110,根据预测的管道运行数据和预设的阈值,判断是否进行预警。
本发明实施例构建以CNN-LSTM网络为主体的预测模型,并对常规的LSTM网络进行改进,以更适应燃气管道运行数据的特点,能够准确得到未来一段时间内的管道运行数据预测值,以便依据管道运行数据预测值及时判断是否进行燃气管道预警。相比依赖人工的燃气管道预警技术,具有更加智能、准确及高效的优势。
下面描述图1所示的各个步骤的执行方式。
针对步骤100,所述进行预处理包括:
对获取的历史时段管道运行数据进行缺失值填补、异常数据处理及归一化处理。
一般情况下,采集的管道运行数据由于网络状态或者人工误操作,会出现一些空值和异常值,完整有效的历史管道运行数据是预测模型准确率的保障,因此,在进行预测模型训练前要对管道运行数据进行预处理。需要说明的是,若缺失值或异常数据占比超过一定阈值,则应对相应区间的数据进行删除。采用上述实施例,可以提高训练预测模型(即CNN-GLSTM模型)的可靠性、准确性。
进一步地,所述缺失值填补包括:
基于KNNI计算方法,进行燃气管道运行数据缺失值填补。
KNNI计算方法是一种基于K近邻算法的缺失值填补方法,可以基于相邻时间点的值进行插值,从而能够保留管道运行数据的时序特征。基本思想是:通过度量相似性,在数据集合中检索和待预测数据最相关的k个数据,再将k个数据的平均值作为缺失数据的填补值。选取欧式距离d计算样本间的相似性,计算公式如下:
d=||x1-x2||
x1和x2表示两个样本。
具体地,所述缺失值填补包括:
S1:选取包含缺失值的管道运行数据构建数据集。
S2:采用归一化对数据集进行处理,使其具有相同的范围和分布。
S3:对于缺失管道运行数据的实例,计算它与其他所有管道运行数据实例间的欧式距离d。
S4:按照欧式距离d从小到大的顺序对计算结果进行排序,选取最近的k个邻居作为需要填充管道运行数据实例的关联样本集。
S5:按照距离分配不同的权重,使距离更近的邻居具有更高的权重,采用反比例权重方法进行计算,公式如下:
wi是第i个管道运行数据的权重,xi是第i个管道运行数据的属性值,a为常数,作用是确保所有管道运行数据的权重和为1。
S6:若实例缺失的管道运行数据是离散性的,则采用k个邻居中出现次数最多的管道运行数据作为填补值;若实例缺失的管道运行数据是连续性的,则采用k个邻居中所对应数据的中位数或者平均数进行填补。
进一步地,所述异常数据处理包括将异常值进行剔除或者用相应的值替代。
通过对采集的管道运行数据观察,发现其受到数据专网网络状态的影响而出现了数值为0.0000或者数值保持不变的异常情况,这些异常数据无法用其他的值进行替代,因此,需要对这些数据进行删除。
若管道运行数据中间段出现缺失值NULL,可以采用邻近的4个点的均值作为填补值。
为检测那些难以发现的异常数据,引入统计学思想解决问题,阈值设定为正负3倍标准差,在阈值范围内则正常,否则反之。若任意除去这些异常值,则会对预测模型的效果产生一定的影响。因此,对于发现的异常值可采用基于KNNI的燃气管道运行数据缺失值填补方法进行处理,即替代异常值。
以某场站的压力值为例,压力数据采集的是时间段08:00~20:00的数据,共计1440个数据点,将网络状态异常情况下的异常点剔除后数据量为1405,然后使用3σ异常检测方法处理1405个数据点,其平均值为3.0894,标准差为0.1122,异常数据有20条,然后用上述填补方法替代异常数据。
若对不同数据类型的数值进行处理,会对预警结果有较大的影响,由于其具有不同的数量级并存在较大的差异。因此,在训练模型前,归一化处理可以消除每个变量不同的量纲和数量级的影响,另一方面能提高模型的收敛速度,使得管道运行数据预测值更加准确。归一化处理是典型的标准化处理,即将燃气管道运行数据数值控制在(0,1)区间内。
针对步骤102,构建的所述CNN-GLSTM模型的工作过程遵循如下公式:
其中,和/>分别表示新增遗忘门和新增输入门,/>和/>分别表示原遗忘门和原输入门,ft和it分别表示总遗忘门和总输入门,ot表示输出门;/> 和Wo表示为可学习的权重,分别对应新增遗忘门、原遗忘门、新增输入门、原输入门和输出门,和bo表示可学习的偏置向量,分别对应新增遗忘门、原遗忘门、新增输入门、原输入门和输出门,/>ut表示无物理含义的中间量,||||1表示L1范数,/>表示L2范数,σ()表示sigmoid函数,[ht-1,xt]表示拼接,ht-1表示t-1时刻的隐藏层状态,xt表示t时刻的输入数据,如图2(a)所示。
采用上述实施例,GLSTM网络在LSTM网络的基础上分别添加一个遗忘门和输入门,并使新添加的门与原本的门相互交互,能够提高筛选管道运行数据信息的能力,且采用L1、L2范数,利用L1范数正则化GLSTM模型,使其具有稀疏性,利用L2范数正则化LSTM模型,增强其抗干扰能力,结合二者的优点,将L1、L2范数进行线性组合,形成一个正则项来约束网络输入权重的大小,以达到正则化GLSTM模型的目的,不仅利于挖掘数据变化规律,还能够更好地解决过拟合问题,提高模型的预测准确性。
可选地,针对步骤104,所述对构建的所述CNN-GLSTM模型进行训练,包括:
在训练过程中,采用贝叶斯优化法对所述CNN-GLSTM模型的超参数进行优化。
贝叶斯优化是一种用于优化黑箱函数超参数的方法,它在全局优化方面表现良好。该方法通过概率代理模型来对未知的目标函数进行拟合,随后利用采集函数评估余下的数据,确定下一步的超参数采样位置,实现高效地搜索最优超参数的过程。选取后续能够完善目标函数的数据点。贝叶斯定理的公式表示如下:
式中,f是目标函数,;Dt={(x1,f(x1)),(x2,f(x2)),…(xt,f(xt))}是已经观测集合;xt表示需要优化的参数,yt=f(xt)+εt是观测值,其中εt是观察误差;p(D1:t|f)为y的似然分布;p(f)作为f的先验概率;p(D1:t)是边际化f的似然分布;p(f|D1:t)表示f的后验概率分布。
本发明在CNN-GLSTM模型的超参数优化过程中,采用贝叶斯优化确定超参数和优化目标,并以最小化模型预测误差作为迭代过程中的目标。在选择概率模型时,由于非参数模型中随机森林的泛化能力较低,而CNN-GLSTM网络需要选择的参数比较多,使用它进一步提高了计算复杂度,综合分析,优选高斯过程作为概率代理模型。EI不需要调整参数,也就不会加大高斯过程参数训练的复杂程度,因此,采用EI采集函数。
本发明采用的贝叶斯优化法实现流程如下:
输入:待优化的超参数S,目标函数f,采集函数l,高斯模型M
输出:最优CNN-GLSTM模型
D←InitSamples(f,S);/*初始化超参数*/
For t∈1,…T do
p(y|s,D)←FitModel(M,D);/*拟合模型,进行参数评估*/
si←argmaxss∈χl(s,p(y|s,D);/*得到超参数*/
yi←f(si);
D←D∪(si,yi)。/*更新超参数组合*/
进一步地,所述CNN-GLSTM模型的超参数包括CNN网络的网络深度、初始学习率和L2正则化系数,以及GLSTM网络的批处理大小、迭代次数、隐藏层节点数和弃权系数。
以上述超参数为目的进行优化,有利于确保CNN-GLSTM模型具有较佳的性能。
进一步地,CNN-GLSTM模型的超参数选取范围如表1所示:
表1CNN-GLSTM模型的超参数选取范围
CNN网络的网络深度:表示卷积层-池化层的层数,选取合理的深度可以在一定程度上提高模型的泛化能力。
L2正则化系数:对目标函数添加L2正则项,λ是正则化系数,表示模型复杂度的惩罚项,此值较大会较大程度约束模型的复杂度。
α:表示初始学习率,用于控制权重更新至损失值最小的速度,α较大容易出现梯度***,过小会出现梯度消失问题。
Batch_size:表示数据的批处理大小,影响着模型训练的时间效率。
Epoch:表示训练过程中迭代的次数,在训练过程中,若迭代次数过多,将会显著增加模型训练的时间成本;反之,若迭代次数过少,则会降低模型的拟合度,进而影响预测的准确性。
Hidden_layer_unit:表示隐藏层神经元个数,隐藏层节点过少模型效果不好,过多造成网络收敛的速度变慢。
Dropout:表示弃权系数或称丢弃率,在模型训练的过程中随机丢弃网络中的某些单元,该超参数能够在一定程度上避免模型出现过拟合。
上述实施例给出了CNN-GLSTM模型的超参数选取范围,相应范围考虑了燃气管道动态运行数据特点及优化效率,能够提高处理效率,并进一步提高模型预测精度。
需要说明的是,其他超参数也可根据经验进行选择。本发明采用的贝叶斯优化法中,优化器为Adam,激活函数为ReLU,目标函数采用交叉损失熵函数。
在采用贝叶斯优化CNN-GLSTM模型超参数前,设定优化目标,本发明设置的优化目标是最小化模型预测误差,在训练CNN-GLSTM模型前,通过验证集选择模型,将预测误差作为评价指标,用于指导超参数的优化,但也容易造成CNN-GLSTM网络对验证集产生过拟合的现象,因此,优选地,可选择8折交叉验证方法进行8次实验,取得结果平均值,以达到确保模型泛化能力的目的。如图2(b)所示,8折交叉验证是指将数据集按照一定的比例划分为8个子集,然后进行8次实验,每次实验过程中选择其中一个子集作为验证集,剩余的7个子集作为训练集,最后将8次实验中的性能评估指标求平均值,用于评价该组超参数组合。
进一步地,针对步骤104,所述在训练过程中,采用贝叶斯优化法对所述CNN-GLSTM模型的超参数进行优化,包括:
确定所述CNN-GLSTM模型的超参数及对应的取值范围;
将样本数据集按照预设的比例分为8个子集,采用8折交叉验证法进行训练,每次采用其中1个子集作为验证集,其余7个子集作为训练集;
设置优化目标函数;所述优化目标函数的输入为CNN-GLSTM模型的超参数,输出为所述CNN-GLSTM模型最小预测误差;
通过随机采样,获得初始观测值,用于初始化高斯过程模型;
结合所述优化目标函数的输出调整高斯过程模型;
在调整所述高斯过程模型后,利用采样函数选择下一组超参数,并基于对应的训练集训练所述CNN-GLSTM模型,更新超参数组合;
基于对应的验证集,获得8次验证的性能评估指标平均值,作为评价该组超参数组合的指标;
根据该组超参数组合的指标,判断是否达到最小化预测误差要求,若是,则结束训练,将该组超参数组合应用于CNN-GLSTM模型,否,则返回所述结合所述优化目标函数的输出调整高斯过程模型的步骤。
采用上述实施例优化CNN-GLSTM模型,能够充分利用历史信息,减少了搜索时间,从而得到最优超参数组合。
可选地,针对步骤106,获取待检测的管道运行数据集后还可对其中的数据进行预处理,以提高数据质量。
可选地,针对步骤108,将预处理后的待检测的管道运行数据集输入训练后的所述CNN-GLSTM模型,即可用于预测未来时段的管道运行数据。
可选地,针对步骤110,进一步包括:
根据预测的管道运行数据中的进站压力、出站压力及管道温度,结合对应的阈值,判断是否进行预警。
管道运行数据按照数据形态可分为静态数据和动态数据。静态数据是指在生产运行期间不会被修改或更新的数据,比如,管道材质、管道直径、管壁粗糙度等。动态数据是描述随着外部因素变化而不断更新的数据,一般是按照时间序列进行存储,例如,进站压力、出站压力、管道流量、管道温度等。通过分析发现管道运行数据具有显著的时序性和趋势性,重点研究数据的变化规律及数据间的相关性。
进站压力、出站压力及管道温度通常能够有效反映燃气管道运行状态,通过进站压力、出站压力及管道温度与对应阈值的之间的差异,结合预警知识,可判断是否出现数据异常,以便及时预警。
如图3、图4所示,本发明实施例提供了一种基于CNN-GLSTM模型的管道动态预警装置(简称管道动态预警装置)。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。从硬件层面而言,如图3所示,为本发明实施例提供的一种基于CNN-GLSTM模型的管道动态预警装置所在电子设备的一种硬件架构图,除了图3所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的电子设备通常还可以包括其他硬件,如负责处理报文的转发芯片等等。以软件实现为例,如图4所示,作为一个逻辑意义上的装置,是通过其所在电子设备的CPU将非易失性存储器中对应的计算机程序读取到内存中运行形成的。本实施例提供的一种基于CNN-GLSTM模型的管道动态预警装置,包括:
第一获取模块401,用于获取历史时段内同一管道且同一阀室下的管道运行数据,并进行预处理;
模型构建模块402,用于构建以CNN-LSTM网络为主体的CNN-GLSTM模型,用于预测管道运行数据;所述CNN-GLSTM模型相比CNN-LSTM网络新增了一个遗忘门和一个输入门,原遗忘门、新增遗忘门、原输入门、新增输入门和输出门均采用L1、L2范数进行线性组合,形成一个正则项来约束网络权重大小,总遗忘门基于原遗忘门和新增遗忘门确定,总输入门基于原输入门和新增输入门确定;
模型训练模块403,用于基于预处理后的历史时段管道运行数据得到样本数据集,对构建的所述CNN-GLSTM模型进行训练,得到训练后的所述CNN-GLSTM模型;
第二获取模块404,用于获取待检测的管道运行数据集;
数据预测模块405,用于基于待检测的管道运行数据集和训练后的所述CNN-GLSTM模型,预测未来时段的管道运行数据;
预警判断模块406,用于根据预测的管道运行数据和预设的阈值,判断是否进行预警。
在本发明实施例中,第一获取模块401可用于执行上述方法实施例中的步骤100,模型构建模块402可用于执行上述方法实施例中的步骤102,模型训练模块403可用于执行上述方法实施例中的步骤104,第二获取模块404可用于执行上述方法实施例中的步骤106,数据预测模块405可用于执行上述方法实施例中的步骤108,预警判断模块406可用于执行上述方法实施例中的步骤110。
可以理解的是,本发明实施例示意的结构并不构成对一种基于CNN-GLSTM模型的管道动态预警装置的具体限定。在本发明的另一些实施例中,一种基于CNN-GLSTM模型的管道动态预警装置可以包括比图示更多或者更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或者软件和硬件的组合来实现。
上述装置内的各模块之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
本发明实施例还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时,实现本发明任一实施例中的一种基于CNN-GLSTM模型的管道动态预警方法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序在被处理器执行时,使所述处理器执行本发明任一实施例中的一种基于CNN-GLSTM模型的管道动态预警方法。
具体地,可以提供配有存储介质的***或者装置,在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该***或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。
在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本发明的一部分。
用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上下载程序代码。
此外,应该清楚的是,不仅可以通过执行计算机所读出的程序代码,而且可以通过基于程序代码的指令使计算机上操作的操作***等来完成部分或者全部的实际操作,从而实现上述实施例中任意一项实施例的功能。
此外,可以理解的是,将由存储介质读出的程序代码写到***计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展模块中设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展模块上的CPU等来执行部分和全部实际操作,从而实现上述实施例中任一实施例的功能。
本发明各实施例至少具有如下有益效果:
1、在本发明一个实施例中,提供了一种基于CNN-GLSTM模型的管道动态预警方法,通过构建有针对性的神经网络模型(即CNN-GLSTM模型)并进行训练,实现对未来时段的管道运行数据进行预测,及时准确地推断未来管道运行数据的状态,达到提前警示的目的;
2、在本发明一个实施例中,提供了一种基于CNN-GLSTM模型的管道动态预警方法,对数据进行缺失值填补、异常数据处理及归一化处理,提高数据质量,进而提高CNN-GLSTM模型的准确性及可靠性;
3、在本发明一个实施例中,提供了一种基于CNN-GLSTM模型的管道动态预警方法,在预测模型训练过程中,采用贝叶斯优化法对所述CNN-GLSTM模型的超参数进行优化,能够快速获得CNN-GLSTM模型。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于CNN-GLSTM模型的管道动态预警方法,其特征在于,包括:
获取历史时段内同一管道且同一阀室下的管道运行数据,并进行预处理;
构建以CNN-LSTM网络为主体的CNN-GLSTM模型,用于预测管道运行数据;所述CNN-GLSTM模型相比CNN-LSTM网络新增了一个遗忘门和一个输入门,原遗忘门、新增遗忘门、原输入门、新增输入门和输出门均采用L1、L2范数进行线性组合,形成一个正则项来约束网络权重大小,总遗忘门基于原遗忘门和新增遗忘门确定,总输入门基于原输入门和新增输入门确定;
基于预处理后的历史时段管道运行数据得到样本数据集,对构建的所述CNN-GLSTM模型进行训练,得到训练后的所述CNN-GLSTM模型;
获取待检测的管道运行数据集;
基于待检测的管道运行数据集和训练后的所述CNN-GLSTM模型,预测未来时段的管道运行数据;
根据预测的管道运行数据和预设的阈值,判断是否进行预警。
2.根据权利要求1所述的方法,其特征在于,
所述进行预处理包括:
对获取的历史时段管道运行数据进行缺失值填补、异常数据处理及归一化处理。
3.根据权利要求1所述的方法,其特征在于,
构建的所述CNN-GLSTM模型的工作过程遵循如下公式:
4.根据权利要求3所述的方法,其特征在于,
所述对构建的所述CNN-GLSTM模型进行训练,包括:
在训练过程中,采用贝叶斯优化法对所述CNN-GLSTM模型的超参数进行优化。
5.根据权利要求4所述的方法,其特征在于,
所述CNN-GLSTM模型的超参数包括CNN网络的网络深度、初始学习率和L2正则化系数,以及GLSTM网络的批处理大小、迭代次数、隐藏层节点数和弃权系数。
6.根据权利要求5所述的方法,其特征在于,
所述在训练过程中,采用贝叶斯优化法对所述CNN-GLSTM模型的超参数进行优化,包括:
确定所述CNN-GLSTM模型的超参数及对应的取值范围;
将样本数据集按照预设的比例分为8个子集,采用8折交叉验证法进行训练,每次采用其中1个子集作为验证集,其余7个子集作为训练集;
设置优化目标函数;所述优化目标函数的输入为CNN-GLSTM模型的超参数,输出为所述CNN-GLSTM模型最小预测误差;
通过随机采样,获得初始观测值,用于初始化高斯过程模型;
结合所述优化目标函数的输出调整高斯过程模型;
在调整所述高斯过程模型后,利用采样函数选择下一组超参数,并基于对应的训练集训练所述CNN-GLSTM模型,更新超参数组合;
基于对应的验证集,获得8次验证的性能评估指标平均值,作为评价该组超参数组合的指标;
根据该组超参数组合的指标,判断是否达到最小化预测误差要求,若是则结束训练,将该组超参数组合应用于CNN-GLSTM模型,否则返回所述结合所述优化目标函数的输出调整高斯过程模型的步骤。
7.根据权利要求1所述的方法,其特征在于,
所述根据预测的管道运行数据和预设的阈值,判断是否进行预警,包括:
根据预测的管道运行数据中的进站压力、出站压力及管道温度,结合对应的阈值,判断是否进行预警。
8.一种基于CNN-GLSTM模型的管道动态预警装置,其特征在于,包括:
第一获取模块,用于获取历史时段内同一管道且同一阀室下的管道运行数据,并进行预处理;
模型构建模块,用于构建以CNN-LSTM网络为主体的CNN-GLSTM模型,用于预测管道运行数据;所述CNN-GLSTM模型相比CNN-LSTM网络新增了一个遗忘门和一个输入门,原遗忘门、新增遗忘门、原输入门、新增输入门和输出门均采用L1、L2范数进行线性组合,形成一个正则项来约束网络权重大小,总遗忘门基于原遗忘门和新增遗忘门确定,总输入门基于原输入门和新增输入门确定;
模型训练模块,用于基于预处理后的历史时段管道运行数据得到样本数据集,对构建的所述CNN-GLSTM模型进行训练,得到训练后的所述CNN-GLSTM模型;
第二获取模块,用于获取待检测的管道运行数据集;
数据预测模块,用于基于待检测的管道运行数据集和训练后的所述CNN-GLSTM模型,预测未来时段的管道运行数据;
预警判断模块,用于根据预测的管道运行数据和预设的阈值,判断是否进行预警。
9.一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如权利要求1-7中任一项所述的方法。
10.一种存储介质,其上存储有计算机程序,其特征在于,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310486613.XA CN116432856A (zh) | 2023-04-28 | 2023-04-28 | 基于cnn-glstm模型的管道动态预警方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310486613.XA CN116432856A (zh) | 2023-04-28 | 2023-04-28 | 基于cnn-glstm模型的管道动态预警方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116432856A true CN116432856A (zh) | 2023-07-14 |
Family
ID=87081522
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310486613.XA Pending CN116432856A (zh) | 2023-04-28 | 2023-04-28 | 基于cnn-glstm模型的管道动态预警方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116432856A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117113858A (zh) * | 2023-10-23 | 2023-11-24 | 北京中环信科科技股份有限公司 | 一种氢气***的预警方法及装置 |
-
2023
- 2023-04-28 CN CN202310486613.XA patent/CN116432856A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117113858A (zh) * | 2023-10-23 | 2023-11-24 | 北京中环信科科技股份有限公司 | 一种氢气***的预警方法及装置 |
CN117113858B (zh) * | 2023-10-23 | 2024-02-06 | 北京中环信科科技股份有限公司 | 一种氢气***的预警方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Farmani et al. | Pipe failure prediction in water distribution systems considering static and dynamic factors | |
CN107092582B (zh) | 一种基于残差后验的异常值在线检测及置信度评估方法 | |
CN116757534B (zh) | 一种基于神经训练网络的智能冰箱可靠性分析方法 | |
CN111813084B (zh) | 一种基于深度学习的机械装备故障诊断方法 | |
CN114399032B (zh) | 一种电能表计量误差预测方法及*** | |
CN113255848A (zh) | 基于大数据学习的水轮机空化声信号辨识方法 | |
CN112231980B (zh) | 一种发动机寿命预测方法、存储介质及计算设备 | |
CN108399434B (zh) | 基于特征提取的高维时间序列数据的分析预测方法 | |
CN117390536B (zh) | 基于人工智能的运维管理方法及*** | |
Zhou et al. | Trustworthy fault diagnosis with uncertainty estimation through evidential convolutional neural networks | |
CN116432856A (zh) | 基于cnn-glstm模型的管道动态预警方法及装置 | |
CN115422687A (zh) | 一种滚动轴承的寿命预测方法 | |
CN115640744A (zh) | 一种油田集输管道外腐蚀速率预测方法 | |
CN113780420B (zh) | 基于gru-gcn的变压器油中溶解气体浓度预测方法 | |
CN116245227A (zh) | 逐日气象干旱预测方法、装置、存储介质和设备 | |
CN114596726B (zh) | 基于可解释时空注意力机制的停车泊位预测方法 | |
CN114970353A (zh) | 基于缺失数据填充的mswi过程二噁英排放软测量方法 | |
Wang et al. | Three‐stage feature selection approach for deep learning‐based RUL prediction methods | |
Voronov et al. | Predictive maintenance of lead-acid batteries with sparse vehicle operational data | |
CN116303786B (zh) | 一种基于多维数据融合算法的区块链金融大数据管理*** | |
CN116522065A (zh) | 一种基于深度学习的磨煤机健康度评估方法 | |
CN112733903B (zh) | 基于svm-rf-dt组合的空气质量监测与告警方法、***、装置和介质 | |
CN114565185A (zh) | 基于多源数据的腐蚀速率预测*** | |
CN113849479A (zh) | 基于即时学习和自适应阈值的综合能源供应站油罐泄漏检测方法 | |
Tian et al. | Structure feature extraction for hierarchical alarm flood classification and alarm prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |