CN115081749A - 基于贝叶斯优化lstm的盾构掘进载荷超前预测方法及*** - Google Patents

基于贝叶斯优化lstm的盾构掘进载荷超前预测方法及*** Download PDF

Info

Publication number
CN115081749A
CN115081749A CN202210900027.0A CN202210900027A CN115081749A CN 115081749 A CN115081749 A CN 115081749A CN 202210900027 A CN202210900027 A CN 202210900027A CN 115081749 A CN115081749 A CN 115081749A
Authority
CN
China
Prior art keywords
data
parameters
lstm
model
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210900027.0A
Other languages
English (en)
Inventor
吴贤国
冯宗宝
李昕懿
刘俊
陈虹宇
王廷辉
裴以军
张金军
戴小松
徐文胜
覃亚伟
吴克宝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN202210900027.0A priority Critical patent/CN115081749A/zh
Publication of CN115081749A publication Critical patent/CN115081749A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • EFIXED CONSTRUCTIONS
    • E21EARTH OR ROCK DRILLING; MINING
    • E21DSHAFTS; TUNNELS; GALLERIES; LARGE UNDERGROUND CHAMBERS
    • E21D9/00Tunnels or galleries, with or without linings; Methods or apparatus for making thereof; Layout of tunnels or galleries
    • E21D9/003Arrangement of measuring or indicating devices for use during driving of tunnels, e.g. for guiding machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Mining & Mineral Resources (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Animal Husbandry (AREA)
  • Agronomy & Crop Science (AREA)
  • Development Economics (AREA)
  • Primary Health Care (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Environmental & Geological Engineering (AREA)
  • General Life Sciences & Earth Sciences (AREA)
  • Geochemistry & Mineralogy (AREA)
  • Geology (AREA)
  • Excavating Of Shafts Or Tunnels (AREA)

Abstract

本发明公开了一种基于贝叶斯优化LSTM的盾构掘进载荷超前预测方法及***,该方法包括以下步骤:获取盾构施工参数的监测数据,进行数据预处理;利用Pearson相关分析进行冗余参数分析过滤,并采用随机森林算法进行特征选择,得到最优参数集;基于最优参数集,进行贝叶斯优化LSTM的盾构掘进载荷预测。对于采集的初始数据进行预处理,过滤了停机数据、异常值和缺失值等无关数据,通过相关性分析过滤了高度耦合参数,在此基础上利用RF进行重要性排序和特征选择,得到了最优参数集,用贝叶斯优化确定了LSTM预测模型的最优超参数,基于选择的超参数构建刀盘扭矩和总推进力预测模型,实现准确的掘进载荷超前预测,为盾构机的运行操作提供参考。

Description

基于贝叶斯优化LSTM的盾构掘进载荷超前预测方法及***
技术领域
本发明属于盾构隧道施工载荷预测技术领域,更具体地,涉及一种基于贝叶斯优化LSTM的盾构掘进载荷超前预测方法及***。
背景技术
在隧道掘进施工过程中,掘进载荷会随着地质环境、盾构机掘进速度、操作状态的变化而变化,一定程度上反映了岩机之间的相互作用,对于避免刀盘卡死、减少刀盘磨损、保证掘进效率和调整盾构机运行参数等都具有重要意义。此外,掘进载荷控制不当,还有可能导致盾构机损坏和隧道上层土体的破坏,造成严重的经济损失和安全事故。因此,对掘进载荷进行超前预测,为盾构机的运行参数调整提供参考和指导,是保证盾构隧道掘进安全和掘进效率的重要工作。
然而,在实际工程中,由于地质环境的不可预知性和复杂多变性,以及载荷在掘进过程中的时序变化性,实现精准的掘进载荷超前预测仍然是一项困难而具有挑战性的工作。
为解决上述问题,专利CN 110895730 A公开了一种基于LSTM算法的TBM掘进参数的预测方法,根据上升阶段预测稳定阶段刀盘转速、推进速度,为TBM司机提供后续操作参数建议,提高盾构行业施工信息化、智能化的水平。但是其主要针对TBM施工,对于采集数据的处理不够精准,对预测的模型进行的评估测试不具有说服力,因此采用其预测结果作为参考依据并不合理。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供一种基于贝叶斯优化LSTM的盾构掘进载荷超前预测方法及***,对于采集的初始数据进行预处理,过滤了停机数据、异常值和缺失值等无关数据,通过相关性分析过滤了高度耦合参数,在此基础上利用RF进行重要性排序和特征选择,得到了最优参数集,用贝叶斯优化确定了LSTM预测模型的最优超参数,基于选择的超参数构建刀盘扭矩和总推进力预测模型,实现准确的掘进载荷超前预测,为盾构机的运行操作提供参考。
为实现上述目的,按照本发明的一方面,提供一种基于贝叶斯优化LSTM的盾构掘进载荷超前预测方法,包括以下步骤:
S100 获取盾构施工参数的监测数据,进行数据预处理;
S200利用Pearson相关分析进行冗余参数分析过滤,并采用随机森林算法进行特征选择,得到最优参数集;
S300 基于最优参数集,进行贝叶斯优化LSTM的盾构掘进载荷预测。
进一步地,所述S300包括:
S310数据归一化处理,具体公式为:
Figure 198635DEST_PATH_IMAGE001
其中,
Figure 646934DEST_PATH_IMAGE002
表示归一化之后的标准值,
Figure 692251DEST_PATH_IMAGE003
Figure 353039DEST_PATH_IMAGE004
分别默认是1和0,表示归一化后 的最大值和最小值,
Figure 432990DEST_PATH_IMAGE005
代表样本值,
Figure 786611DEST_PATH_IMAGE006
Figure 319224DEST_PATH_IMAGE007
分别是样本值的最大值和最小值;
S320基于贝叶斯的LSTM超参数选择:采用贝叶斯优化方法进行调参,得到超参数的最优取值;
S330模型性能评估与对比。
进一步地,所述S320具体包括步骤如下:
S321定义模型训练误差MSE最小化为目标函数,在寻优范围内随机生成初始化参数组合,根据初始化参数组合训练LSTM预测模型,得到模型输出结果MSE值;
S322将初始化参数组合导入高斯过程中,以拟合初始高斯模型作为目标函数的代理模型,利用上一步中得到的LSTM预测模型训练误差MSE值对初始代理模型进行修正,使其分布与模型训练误差MSE的真实分布更加贴近;
S323通过期望改进采集函数选择目标函数最小值作为下一个待评估参数组合,并重复前两步的LSTM预测模型训练和高斯模型修正;
S324当达到最大迭代次数时,停止优化过程,LSTM预测模型的MSE值最小时对应的超参数组合即为最优超参数。
进一步地,所述S330具体包括:
S331采用决定系数,均方根误差和平均绝对误差三个常用指标来评估预测模型的性能表现;
S332将贝叶斯优化LSTM预测模型与其他常用模型的预测性能进行比较。
进一步地,所述S200包括如下步骤:
S210 Pearson参数相关分析:利用皮尔逊相关系数对参数之间的线性相关性进行度量;
S220基于RF算法进行特征选择:基于RF算法通过评价特征变量变化对基尼指数的影响,从而度量出变量的重要性,并结合特征选择方法进行参数的进一步筛选。
进一步地,所述S220具体包括:
S221建立回归决策树:用随机森林模型对OOB进行预测,可以得到b个袋外数据的 均方残差,分别为
Figure 285168DEST_PATH_IMAGE008
,其计算式如下:
Figure 219626DEST_PATH_IMAGE009
其中,
Figure 744148DEST_PATH_IMAGE010
为数据量,
Figure 764057DEST_PATH_IMAGE011
表示袋外数据中因变量的真实值;
Figure 766648DEST_PATH_IMAGE012
表示回归模型预测值, 随机改变袋外数据第
Figure 821192DEST_PATH_IMAGE013
个特征参数
Figure 516615DEST_PATH_IMAGE014
的值,并计算新的袋外误差准确度
Figure 23820DEST_PATH_IMAGE015
值;
S222生成误差矩阵:在生成回归决策树时,随机选择特征参数进行决策树***,将 参数
Figure 564523DEST_PATH_IMAGE014
Figure 473573DEST_PATH_IMAGE016
个袋外数据样本中进行随机置换,从而形成一个新的OOB测试集,用已经建立的 随机森林回归模型对新的测试集再次进行预测,可以得到新的OOB残差均方
Figure 74319DEST_PATH_IMAGE017
,生成误 差矩阵
Figure 334399DEST_PATH_IMAGE018
为:
Figure 678792DEST_PATH_IMAGE019
其中
Figure 955532DEST_PATH_IMAGE020
为影响因素变量的个数;
Figure 992759DEST_PATH_IMAGE016
为训练样本集的个数;
S223进行重要性评分:用
Figure 474556DEST_PATH_IMAGE008
与误差矩阵的相应行相减,对 相减后的结果取平均值,然后除以标准误差就可以得到变量
Figure 622640DEST_PATH_IMAGE021
的均方残差平均减小量,即 特征变量的重要性评分
Figure 240703DEST_PATH_IMAGE022
,可表示为:
Figure 448831DEST_PATH_IMAGE023
其中,
Figure 152345DEST_PATH_IMAGE015
为第
Figure 104120DEST_PATH_IMAGE013
个样本的均方残差;
Figure 842269DEST_PATH_IMAGE024
为标准误差;
S224特征选择:通过特征选择依次去掉重要性最小的特征,截取得到不同数量的特征子集,对这些特征子集分别进行建模和评估,依据评估结果确定最佳子集。
进一步地,所述S100包括:
S110停机数据过滤:选取推进速度、刀盘转速、总推进力和刀盘扭矩四个主要的施工参数作为判别指标,判别函数如下:
Figure 221298DEST_PATH_IMAGE025
Figure 677687DEST_PATH_IMAGE026
上式中,
Figure 167574DEST_PATH_IMAGE027
Figure 494650DEST_PATH_IMAGE028
Figure 546045DEST_PATH_IMAGE029
Figure 489730DEST_PATH_IMAGE030
分别对应总推进力、刀盘扭矩、推进速度和刀盘转速,
Figure 783308DEST_PATH_IMAGE031
表示四 个参数值的乘积。当四个参数的乘积不为0时,说明盾构机处于工作状态,对应的数据予以 保留;当四个参数的乘积为0时,即其中任一参数的值为0,即认为盾构机在非工作状态,对 于非工作状态的数据直接剔除掉;
S120异常值识别与处理:利用箱型图法识别异常值并去除,对于去除的异常值,采用该值前一秒或后一秒的数据进行填充;
S130常量参数过滤:识别常量参数并进行剔除
S140缺失值处理:将直接删除法与常量填充法相结合,对数据缺失分不同情况进行处理,以更好地保证数据的有效性。
按照本发明的第二方面,提供一种基于贝叶斯优化LSTM的盾构掘进载荷超前预测方法,包括:
第一主模块,用于获取盾构施工参数的监测数据,进行数据预处理;
第二主模块,用于利用Pearson相关分析进行冗余参数分析过滤,并采用随机森林算法进行特征选择,得到最优参数集;
第三主模块,用于基于最优参数集,进行贝叶斯优化LSTM的盾构掘进载荷预测。
按照本发明的第三方面,提供 一种电子设备,包括:
至少一个处理器、至少一个存储器和通信接口;其中,
所述处理器、存储器和通信接口相互间进行通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以执行所述的方法。
按照本发明的第四方面,提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行所述的方法。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
1.本发明的盾构掘进载荷超前预测方法,提出了一种盾构隧道掘进载荷实时预测框架,构建了盾构掘进载荷智能预测***。该掘进载荷智能预测方法和***首先调动数据库中的相关数据进行预处理,清洗了异常值、缺失值以及无关数据,然后基于预处理的数据进行参数相关性分析和特征选择,过滤了冗余参数,最后基于选择后的最优参数集构建贝叶斯优化LSTM掘进载荷预测模型,分别对刀盘扭矩和总推力进行了超前预测,为隧道的掘进施工提供了及时有用的信息和指导;
2.本发明的盾构掘进载荷超前预测方法,对时间序列数据进行建模的LSTM网络在工程领域的应用为掘进载荷的超前预测提供了新的思路和解决方法。为了实现精准的盾构隧道掘进载荷超前预测,为盾构机运行操作提供指导和参考;
3. 本发明的盾构掘进载荷超前预测方法,对于采集的初始数据进行预处理,过滤了停机数据、异常值和缺失值等无关数据,通过相关性分析过滤了高度耦合参数,在此基础上利用RF进行重要性排序和特征选择,分别得到了刀盘扭矩和总推进力的最优参数集,为基于贝叶斯优化LSTM模型的掘进载荷高精度预测提供了条件。
4. 本发明的盾构掘进载荷超前预测方法,采用贝叶斯优化确定了LSTM预测模型的最优超参数,基于选择的超参数构建刀盘扭矩和总推进力预测模型,实现准确的掘进载荷超前预测,为盾构机的运行操作提供参考。
附图说明
图1为本发明实施例提供的基于贝叶斯优化LSTM的盾构掘进载荷超前预测方法和***的流程图;
图2为本发明实施例提供的基于贝叶斯优化LSTM的盾构掘进载荷超前预测方法和***结构示意图;
图3为本发明实施例提供的电子设备的实体结构示意图;
图4为本发明实施例提供的异常值识别结果示例;
图5为本发明实施例提供的盾构参数重要性评价结果图(图5中(a)为刀盘扭矩结果,图5中(b)为总推动力结果);
图6为本发明实施例提供的不同特征子集的MSE变化趋势图(图6中(a)为刀盘扭矩变化趋势,图6中(b)为总推动力变化趋势);
图7为本发明实施例提供的贝叶斯优化迭代过程图(图7中(a)为刀盘扭矩迭代过程,图7中(b)为总推动力迭代过程);
图8为本发明实施例提供的基于贝叶斯优化LSTM的刀盘扭矩预测结果图(图8中(a)为刀盘扭矩实际值,图8中(b)为刀盘扭矩预测值,图8中(c)为刀盘扭矩实际值与预测值对比图);
图9为本发明实施例提供的基于贝叶斯优化LSTM的总推进力预测结果图(图9中(a)为总推进力实际值,图9中(b)为总推进力预测值,图9中(c)为总推进力实际值与预测值对比图)。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
如图1所示,本发明提供一种基于贝叶斯优化LSTM的盾构掘进载荷超前预测方法,包括以下步骤:
S100 获取盾构施工参数的监测数据,进行数据预处理;
S200利用Pearson相关分析进行冗余参数分析过滤,采用随机森林(randomforest,RF)算法进行特征选择,得到最优参数集;
S300 基于最优参数集,进行贝叶斯优化LSTM的盾构掘进载荷预测。
具体而言,所述S100进行数据预处理包括过滤原始数据中的停机数据和常量参数,并对数据中的异常值和缺失值进行识别和处理,初步清洗掉数据中的无关信息和参数,包括如下步骤:
S110停机数据过滤:
停机状态下的数据主要是在盾构机更换刀盘、停机休息、维护等情况下收集的,对于盾构机非工作状态的判定可以根据它自身的施工参数来识别,当收集到的施工参数数据为0时,可以认为盾构机在非工作状态。选取推进速度、刀盘转速、总推进力和刀盘扭矩四个主要的施工参数作为判别指标,判别函数如下:
Figure 230470DEST_PATH_IMAGE025
(1)
Figure 951301DEST_PATH_IMAGE026
(2)
上式中,
Figure 116704DEST_PATH_IMAGE027
Figure 948393DEST_PATH_IMAGE028
Figure 515641DEST_PATH_IMAGE029
Figure 141794DEST_PATH_IMAGE030
分别对应总推进力、刀盘扭矩、推进速度和刀盘转速,
Figure 60072DEST_PATH_IMAGE031
表示四 个参数值的乘积。当四个参数的乘积不为0时,说明盾构机处于工作状态,对应的数据予以 保留;当四个参数的乘积为0时,即其中任一参数的值为0,即认为盾构机在非工作状态,对 于非工作状态的数据直接剔除掉。
S120异常值识别与处理:利用箱型图法识别异常值并去除,对于去除的异常值,采用该值前一秒或后一秒的数据进行填充;
采用箱型图法进行异常值的识别与剔除,它对数据没有限制性要求,不需要事先假定数据的分布形式,并且箱型图法是基于四分位数进行异常值的判断。利用箱型图法识别异常值首先要根据四分位数确定正常值的上下限,计算方法如下:
Figure 695452DEST_PATH_IMAGE032
(3)
Figure 851627DEST_PATH_IMAGE033
(4)
Figure 914261DEST_PATH_IMAGE034
(5)
其中,
Figure 555720DEST_PATH_IMAGE035
Figure 994792DEST_PATH_IMAGE036
分别表示下四分位数和上四分位数,
Figure 271053DEST_PATH_IMAGE030
为数据个数,数据按照从小到 大的顺序进行排列,
Figure 770167DEST_PATH_IMAGE037
为四分位数差,
Figure 131878DEST_PATH_IMAGE038
Figure 109061DEST_PATH_IMAGE039
分别为数据的下限和上限。根据进行过异 常值的识别,当数据值在
Figure 239829DEST_PATH_IMAGE040
之间时,为正常数据,当数据值小于
Figure 644265DEST_PATH_IMAGE038
或大于
Figure 758852DEST_PATH_IMAGE039
时, 即可判定为异常值,应当直接去除。对于去除的异常值,采用该值前一秒或后一秒的数据进 行填充。
S130常量参数过滤:识别常量参数并进行剔除
在整个盾构掘进***中,有一些盾构参数的设定值是恒定的,这类参数属于常量参数。由于它们在施工过程中不会随着盾构机的推进而变化,因此它们的数据对于施工参数的预测和管控并没有太大的参考意义。为了减少不必要数据的干扰和后续分析的工作量,这些常量参数可以直接过滤掉,通过观察识别常量参数并进行剔除。
S140缺失值处理:将直接删除法与常量填充法相结合,对数据缺失分不同情况进行处理,以更好地保证数据的有效性。
所述S140具体包括如下步骤:
S141直接删除:当一个特征参数的数据缺失值比例超过30%时,可以认为该参数数据中可利用的有效信息过少,应当直接进行删除;
S142常量填充:当参数数据中的缺失值比例低于30%时,说明参数数据中存在较多可利用的有效信息,采用参数数据的中位数对缺失值进行填充。
具体而言,所述S200具体包括:
S210 Pearson参数相关分析:利用皮尔逊相关系数(PCC)对参数之间的线性相关性进行度量;
为了进一步分析不同参数之间的关系,利用皮尔逊相关系数(PCC)对参数之间的线性相关性进行度量。Pearson相关系数的计算公式表达为:
Figure 274147DEST_PATH_IMAGE041
(6)
上式中,
Figure 524999DEST_PATH_IMAGE042
Figure 100337DEST_PATH_IMAGE043
Figure 203685DEST_PATH_IMAGE044
Figure 522671DEST_PATH_IMAGE043
Figure 628030DEST_PATH_IMAGE045
二者之间的协方差,
Figure 374269DEST_PATH_IMAGE046
Figure 932289DEST_PATH_IMAGE047
分别对应两 个变量的平均值,
Figure 320545DEST_PATH_IMAGE048
Figure 280411DEST_PATH_IMAGE049
分别变量两个变量的偏差。相关系数
Figure 197551DEST_PATH_IMAGE020
的值介于区间[-1,1]之 间,根据其值的大小和正负可以对参数之间的相关性进行分析和判断。当
Figure 508447DEST_PATH_IMAGE050
时,说明两 个变量之间正相关;当
Figure 434815DEST_PATH_IMAGE051
时,说明两个变量之间负相关。当
Figure 249187DEST_PATH_IMAGE052
的值介于[0,0.09]之间 时,说明两个参数之间不相关;当
Figure 602808DEST_PATH_IMAGE052
的值介于[0.09,0.3]之间时,说明两个参数之间为低 相关性;当
Figure 135420DEST_PATH_IMAGE052
的值介于[0.3,0.5]之间时,说明两个参数之间为中等相关性;当
Figure 366944DEST_PATH_IMAGE052
的值介于 [0.5,1]之间时,说明两个参数之间显著相关。
S220基于RF算法进行特征选择:基于RF算法通过评价特征变量变化对基尼指数的影响,从而度量出变量的重要性,并结合特征选择方法进行参数的进一步筛选。
基于RF算法通过评价特征变量变化对基尼指数的影响,从而度量出变量的重要性。它主要基于OBB误差对参数的重要性程度进行评价,在对参数进行随机置换后,对模型均方残差减小量(%Inc MSE)或模型精度的减小量(Inc Node Purity)进行衡量,从而可以判断特征参数的重要性,其计算步骤如下:
S221建立回归决策树。用随机森林模型对OOB(袋外数据)进行预测,可以得到b个 袋外数据的均方残差,分别为
Figure 35823DEST_PATH_IMAGE008
,其计算式如下:
Figure 560345DEST_PATH_IMAGE009
(7)
其中,
Figure 845833DEST_PATH_IMAGE010
为数据量,
Figure 848424DEST_PATH_IMAGE011
表示袋外数据中因变量的真实值;
Figure 637388DEST_PATH_IMAGE012
表示回归模型预测值, 随机改变袋外数据第
Figure 332812DEST_PATH_IMAGE013
个特征参数
Figure 574437DEST_PATH_IMAGE014
的值,并计算新的袋外误差准确度
Figure 380719DEST_PATH_IMAGE015
值;
S222生成误差矩阵。在生成回归决策树时,随机选择特征参数进行决策树***,将 参数
Figure 555349DEST_PATH_IMAGE014
Figure 156094DEST_PATH_IMAGE016
个袋外数据样本中进行随机置换,从而形成一个新的OOB测试集,用已经建立的 随机森林回归模型对新的测试集再次进行预测,可以得到新的OOB残差均方
Figure 150595DEST_PATH_IMAGE017
,生成误 差矩阵
Figure 494989DEST_PATH_IMAGE018
为:
Figure 25589DEST_PATH_IMAGE019
(8)
其中
Figure 797236DEST_PATH_IMAGE020
为影响因素变量的个数;
Figure 279033DEST_PATH_IMAGE016
为训练样本集的个数;
S223进行重要性评分。用
Figure 427118DEST_PATH_IMAGE008
与误差矩阵的相应行相减,对 相减后的结果取平均值,然后除以标准误差就可以得到变量
Figure 45181DEST_PATH_IMAGE021
的均方残差平均减小量,即 特征变量的重要性评分
Figure 518888DEST_PATH_IMAGE022
,可表示为:
Figure 222401DEST_PATH_IMAGE023
(9)
其中,
Figure 908598DEST_PATH_IMAGE015
为第
Figure 646747DEST_PATH_IMAGE013
个样本的均方残差;
Figure 25775DEST_PATH_IMAGE024
为标准误差。特征变量的重要性评分越 高,说明该变量对模型结果重要程度越高。
S224特征选择:通过特征选择依次去掉重要性最小的特征,截取得到不同数量的特征子集,对这些特征子集分别进行建模和评估,依据评估结果确定最佳子集。
通过随机森林对特征变量进行重要性评分,虽然能够得到变量的排序结果,但无法确定哪些变量应当被过滤掉,需要结合特征选择方法进行参数的进一步筛选。通过特征选择依次去掉重要性最小的特征,截取得到不同数量的特征子集,对这些特征子集分别进行建模和评估,依据评估结果确定最佳子集。
所述S300中盾构掘进载荷超前预测包括盾构刀盘扭矩和总推进力的预测,所述S300具体包括以下步骤:
S310数据归一化处理,具体公式为:
Figure 216585DEST_PATH_IMAGE001
(10)
其中,
Figure 706472DEST_PATH_IMAGE002
表示归一化之后的标准值,
Figure 299128DEST_PATH_IMAGE003
Figure 849058DEST_PATH_IMAGE004
分别默认是1和0,表示归一化后 的最大值和最小值,
Figure 294208DEST_PATH_IMAGE005
代表样本值,
Figure 322207DEST_PATH_IMAGE006
Figure 769369DEST_PATH_IMAGE007
分别是样本值的最大值和最小值;
为了消除不同参数尺度对模型求解效率和精度的影响,需要对数据进行归一化处理,将它们缩放到同一数量级。选***-max归一化法,计算简单且能保留原始数据之间的关系。本发明选择把数据归一化到区间[0,1]上。归一化处理的计算公式如下:
Figure 755779DEST_PATH_IMAGE001
(10)
其中,
Figure 921181DEST_PATH_IMAGE002
表示归一化之后的标准值,
Figure 752871DEST_PATH_IMAGE003
Figure 585698DEST_PATH_IMAGE004
分别默认是1和0,表示归一化后 的最大值和最小值,
Figure 477430DEST_PATH_IMAGE005
代表样本值,
Figure 395708DEST_PATH_IMAGE006
Figure 765509DEST_PATH_IMAGE007
分别是样本值的最大值和最小值。
S320基于贝叶斯的LSTM超参数选择:采用贝叶斯优化方法进行调参,得到超参数的最优取值;
采用贝叶斯优化方法进行调参,它只需要少量的迭代次数就能解决复杂的参数搜索问题,得到超参数的最优取值,适合LSTM预测模型的超参数调优。
所述S320具体包括步骤如下:
S321定义模型训练误差MSE最小化为目标函数,在寻优范围内随机生成初始化参数组合,根据初始化参数组合训练LSTM预测模型,得到模型输出结果MSE值;
S322将初始化参数组合导入高斯过程中,以拟合初始高斯模型作为目标函数的代理模型,利用上一步中得到的LSTM预测模型训练误差MSE值对初始代理模型进行修正,使其分布与模型训练误差MSE的真实分布更加贴近;
S323通过期望改进采集函数选择目标函数最小值作为下一个待评估参数组合,并重复前两步的LSTM预测模型训练和高斯模型修正;
S324当达到最大迭代次数时,停止优化过程,LSTM预测模型的MSE值最小时对应的超参数组合即为最优超参数。
S330模型性能评估与对比。
S331采用决定系数(
Figure 954307DEST_PATH_IMAGE053
),均方根误差(
Figure 282521DEST_PATH_IMAGE054
)和平均绝对误差(
Figure 156936DEST_PATH_IMAGE055
)三个常用指 标来评估预测模型的性能表现。
采用决定系数(
Figure 596007DEST_PATH_IMAGE053
),均方根误差(
Figure 137847DEST_PATH_IMAGE054
)和平均绝对误差(
Figure 371382DEST_PATH_IMAGE055
)三个常用指标来 评估预测模型的性能表现。
Figure 733094DEST_PATH_IMAGE053
的值度量了模型预测值与实际观测值的拟合优度,取值范围 为0-1,其取值越接近于1,说明模型的拟合越完美,预测性能越好。
Figure 444698DEST_PATH_IMAGE054
计算的是预测误差 的标准差,
Figure 841044DEST_PATH_IMAGE055
计算的是模型预测值与实际观测值之间的差值,它们都衡量了预测值与实 际值之间的偏差。它们的值越小,说明模型预测值与实际值之间的偏差越小,则模型的预测 精度越高。三个评估指标的计算公式如下:
Figure 245480DEST_PATH_IMAGE056
(11)
Figure 94488DEST_PATH_IMAGE057
(12)
Figure 875362DEST_PATH_IMAGE058
(13)
其中,其中
Figure 126215DEST_PATH_IMAGE030
为样本数据集中的数据总数;
Figure 191299DEST_PATH_IMAGE059
Figure 527602DEST_PATH_IMAGE060
分别表示模型预测值和实际 观测值;
Figure 112167DEST_PATH_IMAGE061
表示平均实际值。
S332将贝叶斯优化LSTM预测模型与其他常用模型的预测性能进行比较。
为了进一步验证本发明所建立的贝叶斯优化LSTM预测模型的可靠性,将贝叶斯优化LSTM预测模型与其他常用模型的预测性能进行比较。RF、SVM和LSTM是用于刀盘扭矩和总推进力预测的主要方法,因此选择RF、SVM和LSTM三种模型进行对比。为了使模型对比的结果更加公平,RF、SVM、LSTM这三种预测模型与贝叶斯优化LSTM预测模型采用相同的编程环境、性能评价指标和数据样本。
为了使本发明的目的、技术方案及优点更加清楚明白,下面结合附图,本发明对从武汉市轨道交通16号线一期工程第五标段区间隧道进行相关研究,该标段为老关村站至国博中心南站区间,以获取的工程现场数据为例对本发明的方法的具体实施过程进行进一步描述:
(1)数据预处理
原始数据包括了盾构机刀盘驱动***、护盾***、推进***、支撑***各组成部分共121个盾构施工参数,其中刀盘扭矩和总推进力两个参数为预测对象,每组数据的时间间隔为3s,数据量共3627组。
由于盾构机停机、传感器信号干扰等原因,原始数据中存在大量的异常数据和无效数据,需要对数据进行预处理才能用于后续的分析。根据前文所述,对原始数据依次进行数据清洗和缺失值处理,主要包括以下四步:
1)停机数据过滤:根据式(1)和式(2)判别原始数据集中的停机数据,共识别停机数据27组,将停机数据直接剔除。
2)异常值识别和处理:根据式(3)、(4)、(5)采用箱型图法进行异常值识别,以刀盘功率、推进压力、铰接压力、盾尾密封压力和变频器输出电流为例,其异常值识别结果如图4所示。当数据值小于Lmin或大于Lmax时,即可判定为异常值,直接去除。经过异常值识别和数据剔除后,盾构机数据集的参数由121个降为100个,这些被剔除的参数主要是监测值全部为0的参数。对于去除的异常值,采用该值前一秒或后一秒的数据进行填充。
3)常量参数过滤:通过观察原始数据集识别出43个常量参数,这些常量参数对掘进载荷的预测没有意义,直接将其剔除,剔除后数据集中还有57个参数。
4)缺失值处理:经过对所有数据的分析计算,所有参数数据缺失值比例均低于30%,说明没有需要删除的参数,所有参数的数据中均有可利用信息。对剩下的参数采用中位数填充法填补缺失值,经过缺失值处理后,一共还有57个参数。
(2)参数相关性分析
对经过低方差值过滤处理后剩余的57个参数进行相关性分析,根据式(6)计算它们之间的相关系数,根据相关系数的大小去除冗余参数,对相关性较高的两个变量,只保留一个即可。为了尽可能地保留有效信息,将冗余参数的判别区间设为[0.8,1],当两个参数之间的相关系数绝对值大于0.8时,这两个参数的相关性极高,可以认为它们的数据信息相似度极高,只需保留其中一个参数。
根据相关系数计算结果,设备桥压力与铰接位移、工业水总累积量、泡沫原液罐压力等10个参数的相关系数绝对值均大于0.8,它们之间具有极高的信息相似度,只需要保留设备桥压力参数即可。刀盘功率与变频器输出功率、变频器输出扭矩的相关系数均大于0.95,也只需要保留刀盘功率参数。按照上述分析进行参数筛选后,最后保留了20个输入参数。
剩余的21个参数及刀盘扭矩、总推进力的相关性结果可以看出,剩余21个输入参数中,有些参数之间仍具有显著相关性,如设备桥压力与盾尾密封压力之间的相关性为-0.738,相关性显著。这些参数之间可能仍存在耦合信息,需要进一步分析过滤。此外,输出参数刀盘扭矩与刀盘功率、变频器输出电流、推进速度等具有显著相关性,总推进力与推进压力、铰接压力等具有显著相关性,说明这些参数对掘进载荷的值具有较大影响。
(3)特征选择
为了进一步过滤冗余参数,利用随机森林对输入参数进行重要性分析和特征选择,确定最优参数集。
1)建立回归决策树。用随机森林模型对OOB(袋外数据)进行预测,可以得到b个袋 外数据的均方残差,分别为
Figure 217526DEST_PATH_IMAGE062
,其计算式如下:
Figure 963766DEST_PATH_IMAGE063
(7)
其中,
Figure 787365DEST_PATH_IMAGE064
为数据量,
Figure 910042DEST_PATH_IMAGE065
表示袋外数据中因变量的真实值;
Figure 135487DEST_PATH_IMAGE066
表示回归模型预测值, 随机改变袋外数据第
Figure 318206DEST_PATH_IMAGE067
个特征参数
Figure 629102DEST_PATH_IMAGE068
的值,并计算新的袋外误差准确度
Figure 555470DEST_PATH_IMAGE069
值。
2)生成误差矩阵。在生成回归决策树时,随机选择特征参数进行决策树***,将参 数
Figure 871307DEST_PATH_IMAGE068
Figure 224928DEST_PATH_IMAGE070
个袋外数据样本中进行随机置换,从而形成一个新的OOB测试集,用已经建立的随 机森林回归模型对新的测试集再次进行预测,可以得到新的OOB残差均方
Figure 757540DEST_PATH_IMAGE071
,生成误差 矩阵
Figure 956440DEST_PATH_IMAGE072
为:
Figure 156478DEST_PATH_IMAGE073
(8)
其中
Figure 681000DEST_PATH_IMAGE074
为影响因素变量的个数;
Figure 435329DEST_PATH_IMAGE070
为训练样本集的个数。
3)进行重要性评分。用
Figure 703500DEST_PATH_IMAGE062
与误差矩阵的相应行相减,对相减后的 结果取平均值,然后除以标准误差就可以得到变量
Figure 758043DEST_PATH_IMAGE075
的均方残差平均减小量,即特征变量 的重要性评分
Figure 187888DEST_PATH_IMAGE076
,可表示为:
Figure 695092DEST_PATH_IMAGE077
(9)
其中,
Figure 766953DEST_PATH_IMAGE069
为第
Figure 410424DEST_PATH_IMAGE067
个样本的均方残差;
Figure 778214DEST_PATH_IMAGE078
为标准误差。特征变量的重要性评分越 高,说明该变量对模型结果重要程度越高。
在Python中利用随机森林对输入参数进行重要性评价,将叶节点数设为60,树的深度设为12,刀盘扭矩和总推力分别作为输出变量,计算剩余21个参数的重要性评分并进行排序,结果如图5所示。
由图5可知,刀盘功率、变频器输出电流、螺机转速是对于刀盘扭矩重要性排名前三的参数,推进压力、铰接压力、土仓压力则是对于总进推力重要性排名前三的参数。从工程实践经验来看,刀盘扭矩与刀盘的扭力直接相关,而刀盘扭力大小则与刀盘功率、转速的大小密不可分,因此刀盘功率对刀盘扭矩具有明显影响,刀盘功率的大小又与变频器输出电流存在很大的相关性,因此,刀盘功率、变频器输出电流、螺机转速确实对刀盘扭矩的影响较大。盾构机的总推进力则是推进压力与其他各种压力的总和,其值大小与推进压力的大小直接相关,与盾构***中的其他压力也具有一定的相关性。综上所述,基于RF算法得到的刀盘扭矩与总进推力的参数重要性排序结果比较合理。
采取5折交叉验证对模型精度进行检验,在重要性排序结果的基础上进行特征选择,得到不同特征子集的均方误差MSE的变化趋势,如图6所示。由图6可知,模型误差MSE整体上呈现出先下降后上升的趋势,这说明了随着一些不重要参数被剔除后,模型的预测精度会得到有效提高;当特征子集的参数个数达到某一值时,再继续对特征参数进行剔除反而会导致模型预测精度下降,这说明进一步剔除特征参数会误删掉一些重要的特征。
由图6可知,对于刀盘扭矩,当特征子集中的参数个数为10时,均方误差值最小,模型精度最高;对于总推进力,当特征子集中的参数个数为9时,均方误差值最小,模型精度最高,即此时的特征参数分别为刀盘扭矩和总推进力的最优参数集。从整体上讲,将RF算法与特征选择相结合进行参数筛选,能够有效剔除无关的特征参数,进而提高模型的预测精度。结合图5的参数重要性排序筛选出的最优特征子集如表1所示,筛选后的参数都是对刀盘扭矩和总推力非常重要的参数,将它们作为输入变量构建后续的掘进载荷预测模型。
Figure 772715DEST_PATH_IMAGE079
(4)基于贝叶斯优化LSTM的掘进载荷预测
1)数据归一化处理
基于冗余参数过滤后的数据构建掘进载荷贝叶斯优化LSTM预测模型,其数据特征如表2所示。为了避免数据级不一致对模型训练效果和精度造成影响,根据式(10)对数据进行归一化处理,使所有变量处于同一维度。归一化处理后对数据进行分集,将前80%数据作为训练集,用于训练LSTM预测模型,后20%数据作为测试集,用于对预测模型的性能进行验证。为了保证模型训练过程的合理性,对训练集再进行分集,将训练集的80%作为训练集,训练集的20%作为模型训练的测试集。
Figure 382688DEST_PATH_IMAGE080
2)基于贝叶斯的LSTM超参数选择
采用贝叶斯优化方法进行调参,它只需要少量的迭代次数就能解决复杂的参数搜索问题,得到超参数的最优取值,适合LSTM预测模型的超参数调优。包括步骤如下:
2.1)定义模型训练误差MSE最小化为目标函数,在寻优范围内随机生成初始化参数组合,根据初始化参数组合训练LSTM预测模型,得到模型输出结果MSE值;
2.2)将初始化参数组合导入高斯过程中,以拟合初始高斯模型作为目标函数的代理模型,利用上一步中得到的LSTM预测模型训练误差MSE值对初始代理模型进行修正,使其分布与模型训练误差MSE的真实分布更加贴近;
2.3)通过期望改进采集函数选择目标函数最小值作为下一个待评估参数组合,并重复前两步的LSTM预测模型训练和高斯模型修正;
2.4)当达到最大迭代次数时,停止优化过程,LSTM预测模型的MSE值最小时对应的超参数组合即为最优超参数。
采用贝叶斯优化对LSTM预测模型的超参数进行优选,将训练模型的MSE损失函数作为目标函数,优化的超参数包括网络隐藏层层数(num layers)、隐藏层神经元个数(numunits)、学习率(learning rate)和批次大小(batch size),网络输入层根据刀盘扭矩和总推进力的输入变量数分别为10和9,网络输出层均为1,其他参数保持默认设置,将模型迭代次数控制为50次。
将模型迭代次数控制为50,刀盘扭矩和总推进力的贝叶斯优化迭代过程如图7所示。图中最小观测目标为每次迭代之前的最小观测值,即迭代结束时的最优值,估计最小目标表示根据贝叶斯优化算法得到的最小估计值,它决定了选择哪个点作为目标。由图7中的(a)和(b)可以看出,刀盘扭矩和总推进力的估计最小目标与最小观测目标的点线图非常贴近,说明二者的贝叶斯优化过程合理。在50次迭代中,刀盘扭矩预测模型在第22次就找到目标函数的最小值,总推进力预测模型则在第26次找到目标函数的最小值,寻优所需迭代次数均较小,可以看出贝叶斯优化能够快速找到模型的最优超参数组合,搜索过程稳定且搜索效率高。通过贝叶斯优化得到LSTM的最优超参数结果如表3所示。
Figure 146244DEST_PATH_IMAGE081
3)模型性能评估与对比
基于贝叶斯优化的结果对预测模型进行超参数设置,分别对刀盘扭矩和总推进力 建立贝叶斯优化LSTM预测模型,根据式(11)、(12)和(13)使用
Figure 511367DEST_PATH_IMAGE082
Figure 258743DEST_PATH_IMAGE083
Figure 406827DEST_PATH_IMAGE084
三个指标来 评估模型的预测性能。基于贝叶斯优化LSTM预测模型得到刀盘扭矩和总推力在训练集和测 试集上预测结果如图8所示。
由图8中的(a)、(b)和(c)可知,刀盘扭矩训练集上预测的
Figure 24891DEST_PATH_IMAGE082
Figure 468904DEST_PATH_IMAGE083
Figure 172417DEST_PATH_IMAGE084
分别为 0.930、58.94和23.45,模型拟合度较高,训练误差较小,说明贝叶斯优化LSTM预测模型较好 的学习了盾构参数与刀盘扭矩之间的关系。刀盘扭矩在测试集上预测的
Figure 124193DEST_PATH_IMAGE082
Figure 862342DEST_PATH_IMAGE083
Figure 241371DEST_PATH_IMAGE084
分别为0.907、67.46和37.06,模型预测精度较高,说明通过前80%的数据进行训练,能够较 为准确的预测后20%的刀盘扭矩,基于贝叶斯优化LSTM预测模型能够实现准确的刀盘扭矩 超前预测。
由图9中的(a)、(b)和(c)可知,总推进力训练集上预测的
Figure 432180DEST_PATH_IMAGE082
Figure 922068DEST_PATH_IMAGE083
Figure 780302DEST_PATH_IMAGE084
分别为 0.919、187.34和76.25,测试集上预测结果的
Figure 330232DEST_PATH_IMAGE082
Figure 742759DEST_PATH_IMAGE083
Figure 36337DEST_PATH_IMAGE084
分别为0.898、180.59和 157.83,模型测试集的预测误差略高于训练集的预测误差,但模型训练误差和测试误差均 较小,且拟合优度在0.9左右,说明通过前80%的数据进行训练,能够较为准确的预测后20% 的总推进力,基于贝叶斯优化LSTM预测模型能够得到高精度预测结果,实现准确的总推进 力超前预测。
为了进一步验证本文建立的贝叶斯优化LSTM预测模型的可靠性能,采用LSTM、RF、SVM三种模型对盾构隧道掘进载荷进行预测,并与贝叶斯优化LSTM预测结果进行对比分析,对多个预测模型选择相同的输入、输出进行训练和预测。
四种预测模型对刀盘扭矩和总推进力在训练集和测试集的预测性能表现如表4所 示。由表4可知,对于刀盘扭矩和总推进力的训练集,四种模型
Figure 749078DEST_PATH_IMAGE082
均超过了0.8,但贝叶斯优 化LSTM预测模型的拟合优度最高,均方根误差和平均相对误差最小,对于刀盘扭矩和总推 进力的测试集,四种模型中贝叶斯优化LSTM预测模型的拟合优度仍为最高,误差也为最小, 说明相比之下,贝叶斯优化LSTM模型能够更好地捕捉预测目标参数的实际值,实现更加精 准的掘进载荷预测。
Figure 469910DEST_PATH_IMAGE085
基于上述实施例,作为一种可选的实施例,本发明实施例中提供的一种基于贝叶斯优化LSTM的盾构掘进载荷超前预测***,包括:
第一主模块,用于获取盾构施工参数的监测数据,进行数据预处理;
第二主模块,用于利用Pearson相关分析进行冗余参数分析过滤,并采用随机森林算法进行特征选择,得到最优参数集;
第三主模块,用于基于最优参数集,进行贝叶斯优化LSTM的盾构掘进载荷预测。
需要说明的是,本发明提供的装置实施例中的装置,除了可以用于实现上述方法实施例中的方法外,还可以用于实现本发明提供的其他方法实施例中的方法,区别仅仅在于设置相应的功能模块,其原理与本发明提供的上述装置实施例的原理基本相同,只要本领域技术人员在上述装置实施例的基础上,参考其他方法实施例中的具体技术方案,通过组合技术特征获得相应的技术手段,以及由这些技术手段构成的技术方案,在保证技术方案具备实用性的前提下,就可以对上述装置实施例中的装置进行改进,从而得到相应的装置类实施例,用于实现其他方法类实施例中的方法。
本发明的方法是依托电子设备实现的,因此对相关的电子设备有必要做一下介绍。基于此目的,本发明的实施例提供了一种电子设备,如图3所示,该电子设备包括:至少一个处理器(processor)、通信接口(Communications Interface)、至少一个存储器(memory)和通信总线,其中,至少一个处理器,通信接口,至少一个存储器通过通信总线完成相互间的通信。至少一个处理器可以调用至少一个存储器中的逻辑指令,以执行前述各个方法实施例提供的方法的全部或部分步骤。
此外,上述的至少一个存储器中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个方法实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
附图中的流程图和框图显示了根据本发明的多个实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。基于这种认识,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
在本专利中,术语"包括"、"包含"或者其任何其它变体意在涵盖非排它性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句"包括……"限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于贝叶斯优化LSTM的盾构掘进载荷超前预测方法,其特征在于,包括以下步骤:
S100 获取盾构施工参数的监测数据,进行数据预处理;
S200利用Pearson相关分析进行冗余参数分析过滤,并采用随机森林算法进行特征选择,得到最优参数集;
S300 基于最优参数集,进行贝叶斯优化LSTM的盾构掘进载荷预测。
2.根据权利要求1所述的基于贝叶斯优化LSTM的盾构掘进载荷超前预测方法,其特征在于,所述S300包括:
S310数据归一化处理,具体公式为:
Figure 299864DEST_PATH_IMAGE001
其中,
Figure 808337DEST_PATH_IMAGE002
表示归一化之后的标准值,
Figure 518804DEST_PATH_IMAGE003
Figure 528348DEST_PATH_IMAGE004
分别默认是1和0,表示归一化后的最 大值和最小值,
Figure 765294DEST_PATH_IMAGE005
代表样本值,
Figure 834881DEST_PATH_IMAGE006
Figure 298224DEST_PATH_IMAGE007
分别是样本值的最大值和最小值;
S320基于贝叶斯的LSTM超参数选择:采用贝叶斯优化方法进行调参,得到超参数的最优取值;
S330模型性能评估与对比。
3.根据权利要求2所述的基于贝叶斯优化LSTM的盾构掘进载荷超前预测方法,其特征在于,所述S320具体包括步骤如下:
S321定义模型训练误差MSE最小化为目标函数,在寻优范围内随机生成初始化参数组合,根据初始化参数组合训练LSTM预测模型,得到模型输出结果MSE值;
S322将初始化参数组合导入高斯过程中,以拟合初始高斯模型作为目标函数的代理模型,利用上一步中得到的LSTM预测模型训练误差MSE值对初始代理模型进行修正,使其分布与模型训练误差MSE的真实分布更加贴近;
S323通过期望改进采集函数选择目标函数最小值作为下一个待评估参数组合,并重复前两步的LSTM预测模型训练和高斯模型修正;
S324当达到最大迭代次数时,停止优化过程,LSTM预测模型的MSE值最小时对应的超参数组合即为最优超参数。
4.根据权利要求2所述的基于贝叶斯优化LSTM的盾构掘进载荷超前预测方法,其特征在于,所述S330具体包括:
S331采用决定系数,均方根误差和平均绝对误差三个常用指标来评估预测模型的性能表现;
S332将贝叶斯优化LSTM预测模型与其他常用模型的预测性能进行比较。
5.根据权利要求1所述的基于贝叶斯优化LSTM的盾构掘进载荷超前预测方法,其特征在于,所述S200包括如下步骤:
S210 Pearson参数相关分析:利用皮尔逊相关系数对参数之间的线性相关性进行度量;
S220基于RF算法进行特征选择:基于RF算法通过评价特征变量变化对基尼指数的影响,从而度量出变量的重要性,并结合特征选择方法进行参数的进一步筛选。
6.根据权利要求1所述的基于贝叶斯优化LSTM的盾构掘进载荷超前预测方法,其特征在于,所述S220具体包括:
S221建立回归决策树:用随机森林模型对OOB进行预测,可以得到b个袋外数据的均方 残差,分别为
Figure 219781DEST_PATH_IMAGE008
,其计算式如下:
Figure 186600DEST_PATH_IMAGE009
其中,
Figure 551722DEST_PATH_IMAGE010
为数据量,
Figure 236782DEST_PATH_IMAGE011
表示袋外数据中因变量的真实值;
Figure 853708DEST_PATH_IMAGE012
表示回归模型预测值,随机 改变袋外数据第
Figure 550399DEST_PATH_IMAGE013
个特征参数
Figure 227368DEST_PATH_IMAGE014
的值,并计算新的袋外误差准确度
Figure 399724DEST_PATH_IMAGE015
值;
S222生成误差矩阵:误差矩阵
Figure 413816DEST_PATH_IMAGE016
为:
Figure 620807DEST_PATH_IMAGE017
其中
Figure 328998DEST_PATH_IMAGE018
为影响因素变量的个数;
Figure 723070DEST_PATH_IMAGE019
为训练样本集的个数;
Figure 681799DEST_PATH_IMAGE020
为影响因素变量i个、训 练样本集有j个时的袋外数据的均方残差,i=1,2,3,……,p,j=1,2,3,……,b;
S223进行重要性评分:获取变量
Figure 602350DEST_PATH_IMAGE021
的均方残差平均减小量,即特征变量的重要性评分
Figure 621122DEST_PATH_IMAGE022
,可表示为:
Figure 377857DEST_PATH_IMAGE023
其中,
Figure 874697DEST_PATH_IMAGE015
为第
Figure 525121DEST_PATH_IMAGE013
个样本的均方残差;
Figure 839428DEST_PATH_IMAGE024
为标准误差;
Figure 208092DEST_PATH_IMAGE019
为训练样本集的个数;
Figure 616946DEST_PATH_IMAGE020
为影响因素变量i个、第j个样本集时的袋外数据的均方残差,i=1,2,3,……,p,j=1,2, 3,……,b;
S224特征选择:通过特征选择依次去掉重要性最小的特征,截取得到不同数量的特征子集,对这些特征子集分别进行建模和评估,依据评估结果确定最佳子集。
7.根据权利要求1所述的基于贝叶斯优化LSTM的盾构掘进载荷超前预测方法,其特征在于,所述S100包括:
S110停机数据过滤:选取推进速度、刀盘转速、总推进力和刀盘扭矩四个主要的施工参数作为判别指标,判别函数如下:
Figure 387456DEST_PATH_IMAGE025
Figure 482451DEST_PATH_IMAGE026
上式中,
Figure 728624DEST_PATH_IMAGE027
Figure 301688DEST_PATH_IMAGE028
Figure 192284DEST_PATH_IMAGE029
Figure 333546DEST_PATH_IMAGE030
分别对应总推进力、刀盘扭矩、推进速度和刀盘转速,
Figure 676803DEST_PATH_IMAGE031
表示四个参 数值的乘积;当四个参数的乘积不为0时,说明盾构机处于工作状态,对应的数据予以保留; 当四个参数的乘积为0时,即其中任一参数的值为0,即认为盾构机在非工作状态,对于非工 作状态的数据直接剔除掉;
S120异常值识别与处理:利用箱型图法识别异常值并去除,对于去除的异常值,采用该值前一秒或后一秒的数据进行填充;
S130常量参数过滤:识别常量参数并进行剔除;
S140缺失值处理:将直接删除法与常量填充法相结合,对数据缺失分不同情况进行处理,以更好地保证数据的有效性。
8.一种基于贝叶斯优化LSTM的盾构掘进载荷超前预测***,其特征在于,包括:
第一主模块,用于获取盾构施工参数的监测数据,进行数据预处理;
第二主模块,用于利用Pearson相关分析进行冗余参数分析过滤,并采用随机森林算法进行特征选择,得到最优参数集;
第三主模块,用于基于最优参数集,进行贝叶斯优化LSTM的盾构掘进载荷预测。
9.一种电子设备,其特征在于,包括:
至少一个处理器、至少一个存储器和通信接口;其中,
所述处理器、存储器和通信接口相互间进行通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以执行权利要求1至7任一项权利要求所述的方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行权利要求1至7中任一项权利要求所述的方法。
CN202210900027.0A 2022-07-28 2022-07-28 基于贝叶斯优化lstm的盾构掘进载荷超前预测方法及*** Pending CN115081749A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210900027.0A CN115081749A (zh) 2022-07-28 2022-07-28 基于贝叶斯优化lstm的盾构掘进载荷超前预测方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210900027.0A CN115081749A (zh) 2022-07-28 2022-07-28 基于贝叶斯优化lstm的盾构掘进载荷超前预测方法及***

Publications (1)

Publication Number Publication Date
CN115081749A true CN115081749A (zh) 2022-09-20

Family

ID=83242519

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210900027.0A Pending CN115081749A (zh) 2022-07-28 2022-07-28 基于贝叶斯优化lstm的盾构掘进载荷超前预测方法及***

Country Status (1)

Country Link
CN (1) CN115081749A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116187831A (zh) * 2023-01-30 2023-05-30 山西潞安环保能源开发股份有限公司 一种基于大数据的掘进机智能管控***及方法
CN116682505A (zh) * 2023-06-14 2023-09-01 东北大学 一种基于分位数回归森林的hrb400e钢材力学性能预测方法
CN117032120A (zh) * 2023-08-16 2023-11-10 广东超级龙节能环保科技有限公司 集成一体式空压站智能云控制***及控制方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107480441A (zh) * 2017-08-04 2017-12-15 方芳 一种基于支持向量机的儿童脓毒性休克预后预测的建模方法及***
CN109766932A (zh) * 2018-12-25 2019-05-17 新华三大数据技术有限公司 一种特征筛选方法以及特征筛选装置
CN110895730A (zh) * 2019-12-31 2020-03-20 盾构及掘进技术国家重点实验室 一种基于lstm算法的tbm掘进参数的预测方法
CN111653359A (zh) * 2020-05-30 2020-09-11 吾征智能技术(北京)有限公司 一种出血性疾病的智能预测模型构建方法和预测***
CN112132334A (zh) * 2020-09-18 2020-12-25 上海大学 一种用于城市生活垃圾产量的预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107480441A (zh) * 2017-08-04 2017-12-15 方芳 一种基于支持向量机的儿童脓毒性休克预后预测的建模方法及***
CN109766932A (zh) * 2018-12-25 2019-05-17 新华三大数据技术有限公司 一种特征筛选方法以及特征筛选装置
CN110895730A (zh) * 2019-12-31 2020-03-20 盾构及掘进技术国家重点实验室 一种基于lstm算法的tbm掘进参数的预测方法
CN111653359A (zh) * 2020-05-30 2020-09-11 吾征智能技术(北京)有限公司 一种出血性疾病的智能预测模型构建方法和预测***
CN112132334A (zh) * 2020-09-18 2020-12-25 上海大学 一种用于城市生活垃圾产量的预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
张茜: ""盾构装备掘进中的力学特征分析与载荷建模"", 《中国博士学位论文全文数据库 工程科技Ⅱ辑》 *
沈明磊: ""面向盾构施工地表沉降的多源数据融合分析与隧道安全性评价"", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 *
马梓程: ""基于贝叶斯优化的LSTM模型在动力电池SoC估算中的应用"", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116187831A (zh) * 2023-01-30 2023-05-30 山西潞安环保能源开发股份有限公司 一种基于大数据的掘进机智能管控***及方法
CN116187831B (zh) * 2023-01-30 2024-04-02 山西潞安环保能源开发股份有限公司 一种基于大数据的掘进机智能管控***及方法
CN116682505A (zh) * 2023-06-14 2023-09-01 东北大学 一种基于分位数回归森林的hrb400e钢材力学性能预测方法
CN116682505B (zh) * 2023-06-14 2023-11-21 东北大学 一种基于分位数回归森林的hrb400e钢材力学性能预测方法
CN117032120A (zh) * 2023-08-16 2023-11-10 广东超级龙节能环保科技有限公司 集成一体式空压站智能云控制***及控制方法

Similar Documents

Publication Publication Date Title
CN115081749A (zh) 基于贝叶斯优化lstm的盾构掘进载荷超前预测方法及***
DE102022201761A1 (de) Verfahren, System und Speichermedium zur automatischen Diagnose vonVorrichtungen
CN114015825B (zh) 基于注意力机制的高炉热负荷异常状态监测方法
CN112434390B (zh) 基于多层网格搜索的pca-lstm轴承剩余寿命预测方法
DE102021201296A1 (de) Vorhersagemodell zum Vorhersagen von Produktqualitätsparameterwerten
CN108961460B (zh) 基于稀疏esgp与多目标优化的故障预测方法及装置
CN115099260A (zh) 双螺杆输油泵在线监测机械故障实时诊断方法
CN113806889A (zh) 一种tbm刀盘扭矩实时预测模型的处理方法、装置以及设备
CN115759409A (zh) 多时间模式注意力机制优化lstm模型的水闸形变预测方法
CN115496384A (zh) 工业设备的监控管理方法、装置和计算机设备
CN111783242A (zh) 一种基于rvm-kf的滚动轴承剩余寿命预测方法及装置
CN115526258A (zh) 基于Spearman相关系数特征提取的电力***暂稳评估方法
CN114863170A (zh) 一种基于深度学习的新能源车电池自燃预警方法及装置
CN117312972A (zh) 一种刮板输送机减速器健康状态识别方法
CN113822336A (zh) 一种云硬盘故障预测方法、装置、***及可读存储介质
CN114036647A (zh) 一种基于实车数据的动力电池安全风险评估方法
CN111915184A (zh) 汽车行业零件质量早期预警方法及存储介质
Dui et al. Reliability Evaluation and Prediction Method with Small Samples.
CN116522065A (zh) 一种基于深度学习的磨煤机健康度评估方法
CN116432856A (zh) 基于cnn-glstm模型的管道动态预警方法及装置
CN116540098A (zh) 电池残值评估方法、装置、设备及可读存储介质
CN115859826A (zh) 一种基于集成学习的盾构设备故障融合预测方法
CN115660091A (zh) 一种量子计算机比特量子翻转预警及阈值设置的方法
CN112733903B (zh) 基于svm-rf-dt组合的空气质量监测与告警方法、***、装置和介质
CN111444658B (zh) 一种槽型轨几何参数趋势预测方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20220920