CN115049124A - 一种基于贝叶斯网络的深长隧道突涌水预测方法 - Google Patents
一种基于贝叶斯网络的深长隧道突涌水预测方法 Download PDFInfo
- Publication number
- CN115049124A CN115049124A CN202210644546.5A CN202210644546A CN115049124A CN 115049124 A CN115049124 A CN 115049124A CN 202210644546 A CN202210644546 A CN 202210644546A CN 115049124 A CN115049124 A CN 115049124A
- Authority
- CN
- China
- Prior art keywords
- bayesian network
- node
- model
- water
- inrush
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 94
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 86
- 238000010276 construction Methods 0.000 claims abstract description 14
- 239000011229 interlayer Substances 0.000 claims abstract description 4
- 238000004364 calculation method Methods 0.000 claims description 32
- 239000011435 rock Substances 0.000 claims description 22
- 230000006870 function Effects 0.000 claims description 21
- 238000012549 training Methods 0.000 claims description 21
- 238000007476 Maximum Likelihood Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 14
- 239000010410 layer Substances 0.000 claims description 12
- 230000015572 biosynthetic process Effects 0.000 claims description 8
- 238000010586 diagram Methods 0.000 claims description 5
- 238000010845 search algorithm Methods 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000012876 topography Methods 0.000 claims description 3
- 229910052739 hydrogen Inorganic materials 0.000 claims description 2
- 239000001257 hydrogen Substances 0.000 claims description 2
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 claims 1
- 238000004458 analytical method Methods 0.000 abstract description 6
- 238000011156 evaluation Methods 0.000 abstract description 3
- 239000011159 matrix material Substances 0.000 description 15
- 238000012360 testing method Methods 0.000 description 12
- 230000001364 causal effect Effects 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 239000013589 supplement Substances 0.000 description 4
- 238000009933 burial Methods 0.000 description 3
- 238000013398 bayesian method Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 239000003673 groundwater Substances 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 125000004435 hydrogen atom Chemical class [H]* 0.000 description 1
- 238000009440 infrastructure construction Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/08—Construction
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Software Systems (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Examining Or Testing Airtightness (AREA)
Abstract
本发明属于隧道工程灾害预测领域,具体涉及一种基于贝叶斯网络的深长隧道突涌水预测方法,包括确定深长隧道突涌水的影响因素,完善致灾因子和突涌水评价指标的等级划分,建立隧道突涌水样本库;应用解释结构模型方法建立突涌水影响因素的层次结构关系,确定影响因素的排序和层间指向性连接,建立解释结构模型;基于解释结构模型,改进贝叶斯网络结构的构建方法;针对不同样本库的情况,应用改进方法构建贝叶斯网络模型;依据贝叶斯网络模型,进行深长隧道突涌水的定量预测。本发明能够实现定性和定量的综合分析,对完备数据样本和不完备数据样本同时具有适用性,对小样本具有适用性,独立于主观判断,更准确、更客观的进行深长隧道突涌水预测。
Description
技术领域
本发明属于隧道工程灾害预测领域,具体为一种基于贝叶斯网络的深长隧道突涌水预测方法。
背景技术
近年来,我国基础设施建设发展迅速,交通、水利水电等重大工程建设的需求增加。作为交通、水利水电等重大工程的关键控制性工程,隧道的建设也得到了迅速发展。隧道工程在建设的过程中经常会遇到各种地质灾害,造成工期延误、经济损失、人员伤亡等危害。其中,突涌水灾害约占各类隧道灾害的40%,是不容忽视、亟待解决的安全问题。
而随着西部大开发的推进,大量的重大交通工程和水利工程,催生了大量的深长隧道的建设。深长隧道穿越的自然环境更加复杂,突涌水灾害发生的频率更大,突涌水灾害导致的损伤也更加严重。
为了保证隧道施工的安全性、避免人员伤亡和减少不必要的经济损失,***突涌水的发生,从而合理选择预防措施是十分重要的。对此,许多国内外专家进行了广泛的研究,并取得了大量的成果。从早期单纯定性地对突涌水进行预测,发展到现如今能对突涌水进行定量的评估和计算。现在的定量分析结果相对于定性分析结果,其科学性已经得到了很大的提高。
但由于深长隧道突涌水涉及的影响因素包含定性变量和定量变量,很多方法不具备同时处理两种类型变量训练学习的能力。有些可以处理包含定性和定量变量训练学习的方法,或多或少都有其局限性。如神经网络,具备对两种变量训练学习的能力,但其所需样本数量大,计算收敛速度慢,容易陷入局部最小,从而影响模型训练结果。
由于深长隧道工程的复杂性,隧道突涌水样本数据难以完整收集。一方面,隧道工程突涌水影响因素众多,导致多数情况下收集的样本不完备,缺少一个或者多个影响因素的取值。另外一方面,收集的样本数量不够多,属于小样本。常规的机器学习算法,如神经网络方法和、故障树等方法,不具备处理不完备小样本的能力。
因此,建立一种能够同时处理定性变量和定量变量,对包含完备样本和不完备样本的小样本具有适用性的学习方法,对于深长隧道突涌水的预测,具有非常重要的价值。
发明内容
针对以上不足,本发明提出了基于贝叶斯网络的深长隧道突涌水预测方法,该方法基于统计的深长隧道突涌水案例,构建样本库;应用解释结构模型的方法,确定影响因素之间的解释结构模型;基于解释结构模型确定的层次结构关系和变量因果关系,改进贝叶斯网络模型结构的构建方法,构建深长隧道突涌水预测的贝叶斯网络模型。
本发明一种基于贝叶斯网络的深长隧道突涌水预测方法,包括以下步骤:
S1:确定引发突涌水的影响因素;
S2:对突涌水影响因素进行等级划分,对最大集中涌水量进行区间划分,形成深长隧道突涌水样本库;
S3:应用解释结构模型方法,将深长隧道突涌水的***问题转化成一个多级递阶的层次结构图,确定层间的指向性连接,建立影响因素的解释结构模型;
S4:根据解释结构模型,改进贝叶斯网络结构的学习方法;基于改进的学习方法,构建贝叶斯网络模型结构;
S5:基于参数学习方法,构建贝叶斯网络模型的条件概率表;
S6:进行贝叶斯网络模型推理,构建深长隧道的突涌水预测模型;
S7:依据建立的突涌水预测模型,进行新建隧道的突涌水预测。
本发明优选的实施方式在于:在S1中,所述的影响因素包括埋深、地形地貌、岩层产状、地层岩性、不良地质、围岩级别、层间裂隙、可溶岩与非可溶岩接触带、地下水位、一周内降雨量、施工扰动程度、支护措施共12个影响因素。
本发明优选的实施方式在于:在S4中,基于影响因素的解释结构模型,确定贝叶斯网络结构学习方法的节点排序,以及确定每个节点允许的最大父节点数量为4。
本发明优选的实施方式在于:
在S4中,基于影响因素的解释结构模型,提前指定部分贝叶斯网络节点之间的指向性联系。
本发明优选的实施方式在于:
在S4中,对于完备样本,基于解释结构模型对基于评分搜索的K2算法进行优化;基于优化K2算法得到贝叶斯网络模型结构,具体的计算过程为:
确定评分函数,用P(G,D)作为评分函数,公式为:
其中,评分函数各变量含义如下:D:数据集;G:拟选的网络模型;n:变量个数;P(G):网络结构G的先验概率分布;ri:变节点xi的取值数量;i:节点的编号;j:节点xi的父节点的取值编号;π(xi):节点xi的父节点;qi:π(xi)的取值数量;Nijk:节点xi的父节点π(xi)取第j个值,xi取第k个值时的样本数量;Nij:节点xi父节点集π(xi)的第j个状态组合所对应的样本数量;
根据贝叶斯网络结构学习方法的节点排序,以及每个节点允许的最大父节点数量为4,确定节点的编号i(1,,2,3...13)的取值和qi的取值;
根据提前指定的部分贝叶斯网络节点之间的指向性联系,确定部分π(xi)的取值;
确定搜索策略为贪婪搜索算法;搜索将评分函数最大的父节点变量放入集合;当无法使评分函数增大时,停止搜索,则找到最优的模型;
基于训练集的样本数据,通过上述优化的K2算法,建立贝叶斯网络模型结构。
本发明优选的实施方式在于:
在S4中,对于不完备样本,基于解释结构模型对基于评分搜索的EM算法进行优化;基于训练集的样本数据,通过上述优化的EM算法,建立贝叶斯网络模型结构。
EM算法本身就是K2算法的一个改进;主要改进内容是基于迭代计算进行缺失数据的补充,其他的计算原理和应用逻辑是一样的。基于解释结构模型,对EM算法进行优化,其优化过程也与K2算法的优化过程相同。鉴于EM算法与K2算法相同的计算原理和应用逻辑,此处不再对EM算法的优化过程进行详细阐述。
本发明优选的实施方式在于:
在S5中,对于完备样本库,采用最大似然估计法进行贝叶斯网络模型的条件概率表的构建;对于不完备样本库,采用期望极大化法进行贝叶斯网络模型的条件概率表的构建。
本发明优选的实施方式在于:
在S5中,对于完备样本,采用最大似然估计法进行贝叶斯网络模型的条件概率表的构建,具体方法是:
确定似然度的对数函数形式为:
其中,N为样本数据,n为节点xi的个数;令节点xi的父节点为π(xi),qi为父节点π(xi)的取值数量,ri为变节点xi的取值数量;Nijk为节点xi的父节点π(xi)取第j个值,xi取第k个值时的样本数量;θijk为节点xi的父节点π(xi)取第j个值,xi取第k个值时所对应的参数值,
对上述对数函数求取最大值,即对参数θ求导得到最大值,即可以得到参数θijk的取值为:
基于训练集的样本数据,通过上述方法,建立贝叶斯网络模型的条件概率表。
本发明优选的实施方式在于:
在S5中,对于不完备样本库,采用期望极大化法进行贝叶斯网络模型的条件概率表的构建。期望极大化算法实质上为最大似然估计法的改进算法,主要思想是通过迭代计算对样本缺省数据进行补充,其具体计算方法为:
(1)令X表示已观测变量集,Z表示不完备样本库中未观测变量集,也称隐变量集,Θ表示模型参数。对模型参数Θ做最大似然估计,即:
LL(Θ|X,Z)=logP(X,Z|Θ);
(2)以初始值Θ0为起点,对上式迭代执行E步和M步直至收敛;
(3)E步:基于Θt推断隐变量Z的期望,记为Zt;
(4)M步:基于已观测变量X和Zt对参数做最大似然估计,记为Θt+1;
基于训练集的样本数据,通过上述方法,建立贝叶斯网络模型的条件概率表。
本发明优选的实施方式在于:在S6中,对贝叶斯网络进行推理学习,其具体计算过程如下:
假设贝叶斯网络模型的最大集中涌水量用变量D表示,影响因素简化为用A,B,C表示;A为根节点,D为叶节点,A为B和C的父节点,B和C分别为D的父节点。已知影响因素A,B,C的取值,计算最大集中涌水量的计算方法为:P(D/A,B,C)=P(D)*P(A,B,C/D)/P(A,B,C),此时,A,B,C之间并不相互独立。因为在贝叶斯网络模型中建立了A,B,C三个节点间的关系,则可以有效的对上述关系进行深入的分析,此时,需要引入另外一个马尔科夫链规则公式:
P(x1,...,xn)=P(x1)P(x2|x1)...P(xn|x1,x2,...,xn-1)
其中,x1,...,xn表示贝叶斯网络的各个节点变量,上述链规则表示,在对变量进行科学的排序的基础上,各个变量的联合概率分布,等于每一个变量的条件概率的乘积,因此,对于上述公式P(D|A,B,C)=P(D)*P(A,B,C|D)/P(A,B,C),可以做进一步的分析,如下:
P(A,B,C|D)=P(A,B,C,D)/P(D)=P(A).P(B|A)P(C|A,B)P(D/A,B,C)/P(D)
上述三个公式中,先验概率(即边缘概率)可以从样本库中直接获取,而条件概率需要做进一步的分析,此时,根据贝叶斯网络中的各个变量间的依存关系,引入如下所示的条件独立性公式,
其中,π(xi)为变量xi的父节点的集合,此时,上述公式中的每一个条件概率的条件项,仅仅保留其父节点项,而剔除了其他的项,此时,每一个条件概率都可以从贝叶斯网络的节点参数CPT中获取,从而实现公式的计算,
从而可以得到:
∑D P(A).P(B|A)P(C|A)P(D|B,C)=
P(A)P(B|A)P(C|B)P(D/B,C)/∑D P(A).P(B|A)P(C|A)P(D|B,C)。
本发明具备如下突出的技术优势:
本发明利用贝叶斯网络模型的学习与推理的能力,实现了突涌水预测分析,解决了定性变量和定量变量混杂、不完备小样本等带来的不良影响,从不完全、不精确或不确定的信息中做出准确推理,提高了隧道突涌水预测的准确性,对隧道突涌水分析具有重要的科学价值和实用价值。
本发明结合解释结构模型和评分搜索算法,进行贝叶斯网络模型结构的构建,一方面可以克服解释结构模型构建的网络结构的结构跨层不连接的缺点;另外一方面可以解决常规评分算法在确定节点顺序和节点最大父节点数量时的主观性,同时可以减小常规评分算法的搜索范围,提高搜索效率。相对于传统方法,本发明的贝叶斯网络模型结构的构建方法,具有更好的客观性、科学性和高效率。
附图说明
图1为本发明基于贝叶斯网络的深长隧道突涌水预测方法实施例一和实施例二的流程图;
图2为本发明实施例一的解释结构模型图;
图3为本发明实施例一和实施例二的贝叶斯网络模型结构图;
图4为本发明实施例一的贝叶斯网络模型的条件概率表;
图5为本发明实施例一的贝叶斯网络模型简化示意图;
图6为本发明实施例二的贝叶斯网络模型的条件概率表。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明,应当理解,下述所描述的优选实施例仅用于对本发明进行解释说明,并不会对本发明的保护范围起到限定作用。
实施例一
本实施例所公开的基于贝叶斯网络的深长隧道突涌水预测方法,具体包括以下内容:
步骤1:根据工程勘察资料及相关文献资料,确定12个引发突涌水的影响因素:隧道埋深、地形地貌、岩层产状、地层岩性、不良地质、围岩级别、层间裂隙、可溶岩与非可溶岩接触带、地下水位、一周内降雨量、施工扰动程度、支护措施,以最大集中涌水量作为隧道突涌水的评价指标。本发明可不限于上述12个突涌水的影响因素,还可以包括其他的影响因素。
步骤2:根据步骤1确定的影响因素,采集数据,形成案例库。基于相关文献、专家经验、工程规范、工程实践情况和工程需要,对影响因素致灾等级进行定性和定量划分,如表1所示为突涌水影响因素等级划分表;如表2所示为对最大集中涌水量进行区间划分。
表1
表2
基于上述影响因素和评价指标的等级划分和区间划分,对案例库进行处理,形成满足贝叶斯网络模型要求的样本库。
步骤3:建立解释结构模型,对影响因素间的相互关系进行处理,将***问题转化成一个多级递阶的层次结构图。
步骤3中,具体步骤如下:
(1)选择构成***的影响关键问题的有关变量:
步骤1中已经确定了适用于隧道突涌水预警的12个输入指标和1个输出指标,将其进行编码,分别为:埋深S1、地形地貌S2、岩层产状S3、地层岩性S4、不良地质S5、围岩级别S6、层间裂隙S7、可溶岩与非可溶岩接触带S8、地下水位S9、一周内降雨量S10、施工扰动程度S11、支护措施S12、最大集中涌水量S13。
(2)通过专家经验确定变量间的因果关系,建立变量关系表:
根据领域知识、实践经验或者专家咨询等方式确定变量间的因果关系,如表3。C表示横排因素影响纵排因素,L表示纵排因素影响横排因素,X表示两个因素之间没有关系,O表示两个因素相互影响。表3为突涌水重要影响因素的相互关系。
表3
S<sub>1</sub> | S<sub>2</sub> | S<sub>3</sub> | S<sub>4</sub> | S<sub>5</sub> | S<sub>6</sub> | S<sub>7</sub> | S<sub>8</sub> | S<sub>9</sub> | S<sub>10</sub> | S<sub>11</sub> | S<sub>12</sub> | S<sub>13</sub> | |
X | X | X | X | X | X | X | C | X | X | X | C | S<sub>1</sub> | |
X | L | X | C | C | C | C | X | X | X | C | S<sub>2</sub> | ||
X | X | X | X | C | X | X | X | X | C | S<sub>3</sub> | |||
L | X | C | C | C | X | X | C | C | S<sub>4</sub> | ||||
C | L | L | X | X | X | X | C | S<sub>5</sub> | |||||
X | C | L | X | X | X | C | S<sub>6</sub> | ||||||
C | C | X | X | X | X | S<sub>7</sub> | |||||||
X | X | X | X | C | S<sub>8</sub> | ||||||||
L | X | X | C | S<sub>9</sub> | |||||||||
C | C | C | S<sub>10</sub> | ||||||||||
C | C | S<sub>11</sub> | |||||||||||
C | S<sub>12</sub> | ||||||||||||
S<sub>13</sub> |
(3)把变量之间的因果关系图转化成邻接矩阵A:
(4)通过矩阵运算求出该***的可达矩阵R:
根据布尔矩阵的运算法则,设I为单位矩阵,进行矩阵A+I的幂运算,当A+I≠(A+I)2≠……≠(A+I)n-1=(A+I)n时,得到可达矩阵R=(A+I)n。计算得到可达矩阵为:
(5)对可达矩阵R进行区域分解和级间分解:
分别求影响因素Si的可达集R(Si)和前因集Q(Si),当R(Si)∩Q(Si)=R(Si)时,Si为当前符合条件的最高级要素,先找出符合条件的最高级要素,将它们从可达矩阵中划去得到一个新的矩阵,然后再找到新矩阵中符合条件的最高级要素,用该方法层层递进得到最终的影响因素层级划分,见表4。表4为可达矩阵层级划分表。
表4
(6)建立解释结构模型:
根据可达矩阵层级划分表和影响因素之间的因果关系,绘制解释结构模型,如附图2所示。
其中,最大集中涌水量属于第一层,支护措施、不良地质、围岩级别和地下水位属于第二层,施工扰动程度、可溶岩与非可溶岩接触带、一周降雨量和埋深属于第三层,岩层产状和层间裂隙属于第四层,地形地貌属于第五层,地层岩性属于第六层。
步骤4:采用众数插补法对不完备数据进行填充,形成完备样本库。
步骤5:将完备样本库进行训练集和测试集划分,以完备样本库的80%作为训练集,20%作为测试集。
步骤6:使用K2算法进行结构学习;根据解释结构模型,确定节点顺序,如表5所示为节点顺序表。根据解释结构模型图,确定每个节点允许的最大父节点数量为4。为避免忽略影响因素间的重要连接关系,根据解释结构模型,提前指定部分影响因素间的指定性连接,如表6所示为指向性连接关系表。
表5
顺序号 | 因素名称 |
1 | 地层岩性 |
2 | 地形地貌 |
3 | 岩层产状 |
4 | 层间裂隙 |
5 | 可溶岩与非可溶岩接触带 |
6 | 埋深 |
7 | 一周降雨量 |
8 | 施工扰动程度 |
9 | 地下水位 |
10 | 支护措施 |
11 | 围岩级别 |
12 | 不良地质 |
13 | 最大集中涌水量 |
表6
指向性连接关系 | dag=1 | dag=0 |
dag[1,2] | √ | |
dag[2,4] | √ | |
dag[(3,4),5] | √ | |
dag[(9,10,11,12),13] | √ | |
dag[7,13] | √ | |
dag[7,3] | √ | |
dag[7,6] | √ |
表6中,dag表示有向无环图;dag=1指节点间存在指向性连接;dag=0指节点间不存在指向性连接。如dag[1,2]=1表示存在地层岩性(节点序号为1)指向地形地貌(节点序号为2)的连接,dag[7,3]=0表示一周降雨量(节点序号为7)与岩层产状间(节点序号为3)不存在指向性连接关系。其他的没有指定的节点关系,通过数据学习进行确定。
步骤7:基于解释结构模型,对基于评分搜索的K2算法进行优化;基于优化K2算法,得到贝叶斯网络模型结构,具体的计算过程为:
(1)确定评分函数,用P(G,D)作为评分函数,公式为:
表7为评分函数各变量含义。
表7
(2)根据步骤6,确定节点的编号i(1,,2,3...13)的取值如表5所示,qi的最大取值为4。根据步骤6,确定部分π(xi)的取值如表6所示。确定搜索策略为贪婪搜索算法;搜索将评分函数最大的父节点变量放入集合;当无法使评分函数增大时,停止搜索,则可以找到最优的模型。
基于训练集的样本数据,通过上述优化的K2算法,建立贝叶斯网络模型结构,如附图3所示。
步骤8:对于完备样本库,采用最大似然估计法进行贝叶斯网络模型的条件概率表的构建;对于不完备样本库,采用期望极大化法进行贝叶斯网络模型的条件概率表的构建。
对于完备样本,采用最大似然估计法进行贝叶斯网络模型的条件概率表的构建,具体方法是:
确定似然度的对数函数形式为:
其中,N为样本数据,n为节点xi的个数;令节点xi的父节点为π(xi),qi为父节点π(xi)的取值数量,ri为变节点xi的取值数量;Nijk为节点xi的父节点π(xi)取第j个值,xi取第k个值时的样本数量;θijk为节点xi的父节点π(xi)取第j个值,xi取第k个值时所对应的参数值,
对上述对数函数求取最大值,即对参数θ求导得到最大值,即可以得到参数θijk的取值为:
基于训练集的样本数据,通过上述方法,建立贝叶斯网络模型的条件概率表,如附图4所示。
附图4中,鉴于条件概率表过大,仅给出了通过条件概率表计算得到的边缘概率表,通过边缘概率来表示条件概率。
步骤9:对贝叶斯网络进行推理学习,其具体计算过程如下:
假设本发明的贝叶斯网络模型的最大集中涌水量用变量D表示,影响因素简化为用A,B,C表示,假设建立的贝叶斯网络模型为附图5所示的简化模型。根据这个简化模型的计算过程,解释贝叶斯网络模型的推理计算过程。
贝叶斯网络模型是在贝叶斯定理的基础上发展而来的。经典的贝叶斯定理具体表达式为:
式中,X为证据项,Y为目标项;P(Y|X=e)为后验概率,是已知X的某个新证据e情况下Y发生的概率;P(Y)为先验概率,是考虑X的新证据e之前变量Y的概率,可以根据历史数据学习获得;P(X=e|Y)为Y的似然度,也是一个条件概率,一般基于历史数据计算得到;P(X=e)为X的新证据发生的概率。
按照经典贝叶斯方法,在已知影响因素的取值,计算最大集中涌水量的计算方法为:P(D/A,B,C)=P(D)*P(A,B,C/D)/P(A,B,C)。此时,由于A,B,C之间并不相互独立,则经典贝叶斯方法无法继续进行分析:无法求取P(A,B,C/D)和P(A,B,C)的值。但是,因为在贝叶斯网络模型中建立了A,B,C三个节点间的关系,则可以有效的对上述关系进行深入的分析。此时,需要引入另外一个公式——马尔科夫链规则:
P(x1,...,xn)=P(x1)P(x2|x1)...P(xn|x1,x2,...,xn-1)
其中,x1,...,xn表示贝叶斯网络的各个节点变量。
上述链规则表示,在对变量进行科学的排序的基础上,各个变量的联合概率分布,等于每一个变量的条件概率的乘积。因此,对于上述公式P(D|A,B,C)=P(D)*P(A,B,C|D)/P(A,B,C),可以做进一步的分析,如下:
P(A,B,C|D)=P(A,B,C,D)/P(D)=P(A).P(B|A)P(C|A,B)P(D/A,B,C)/P(D)
上述三个公式中,P(A)等先验概率(边缘概率)可以从样本库中直接获取,而条件概率需要做进一步的分析。此时,根据贝叶斯网络中的各个变量间的依存关系,引入如下所示的条件独立性公式。
其中,π(xi)为变量xi的父节点的集合。此时,上述公式中的每一个条件概率的条件项,仅仅保留其父节点项,而剔除了其他的项。此时,每一个条件概率都可以从贝叶斯网络的节点参数CPT中获取,从而实现公式的计算。
从而可以得到:
一般的情况下,贝叶斯网络可以通过变量消元法、团树传播法等方法对上述公式进行精确的推理和演算,得到目标项的状态概率;如果模型过于庞大,计算过于复杂,可以使用多树传播法等近似方法进行计算。计算方法的选择,只会影响计算效率,不会影响最终的结果。本发明基于上述建立的贝叶斯网络模型结构和条件概率表,使用团树传播法进行推理计算,建立贝叶斯网络模型的逻辑推理关系。
步骤10:将测试集样本数据代入到贝叶斯网络模型中,根据测试集样本数据的证据项,求解其目标项最大集中涌水量,进行贝叶斯网络模型的测试验证。
表8为基于实施例一的方案得到的测试结果。
表8
实施例二
本实施例公开的基于贝叶斯网络的深长隧道突涌水预测方法,包括如下步骤:
步骤1、2、3与实施例一步骤1、2、3相同。
通过步骤1、2、3,建立深长隧道突涌水的影响因素的解释结构模型。
步骤4:将不完备样本库进行训练集和测试集划分,以样本库的80%作为训练集,20%作为测试集。
步骤5:基于解释结构模型对基于评分的EM算法进行优化;基于优化EM算法,进行贝叶斯网络模型的结构学习。
EM算法本身就是K2算法的一个改进;主要改进内容是基于迭代计算进行缺失数据的补充,其他的计算原理和应用逻辑是一样的。基于解释结构模型的优化方法,主要包括确定节点顺序、节点的最大父节点数量和部分节点指向性连接,其优化过程与K2算法的优化过程相同。鉴于EM算法与K2算法相同的计算原理和应用逻辑,此处不再对EM算法的优化过程进行详细阐述。
基于训练集的样本数据,通过上述优化的EM算法,建立贝叶斯网络模型结构,如附图3所示。
优化EM算法建立的贝叶斯网络模型结构,与实施例一中优化K2算法建立的结构相同,互相印证了两种算法的正确性和可靠性。
步骤6:采用期望极大化法算法对贝叶斯网络模型进行参数学习,期望极大化算法实质上为最大似然估计法的改进算法,主要思想是通过迭代计算对样本缺省数据进行补充,其具体计算思路为:
(1)令X表示已观测变量集,Z表示不完备样本库中未观测变量集,也称隐变量集,Θ表示模型参数。对模型参数Θ做最大似然估计,即:
LL(Θ|X,Z)=logP(X,Z|Θ);
(2)以初始值Θ0为起点,对上式迭代执行E步和M步直至收敛;
(3)E步:基于Θt推断隐变量Z的期望,记为Zt;
(4)M步:基于已观测变量X和Zt对参数做最大似然估计,记为Θt+1。
基于训练集样本数据,通过上述方法建立贝叶斯网络模型的条件概率表,如附图6所示。
步骤7:贝叶斯网络模型的推理计算原理和方法,与实施例一步骤9相同。
步骤8:将测试集样本数据带入到模型中,根据样本数据的证据项,计算样本数据的目标项——最大集中突涌水,进行贝叶斯网络结构模型的测试验证。
表9为采用实施例二的方案得到的测试结果。
表9
选用常用的机器学习算法支持向量机与BP神经网络,针对同一样本库,同一训练集和测试集比例,对深长隧道突涌水进行预测,结果如表10所示。可见,贝叶斯网络模型的预测能力要优于支持向量机和BP神经网络。
表10为各深长隧道突涌水预测方法结果对比表。
表10
本发明针对深长隧道工程突涌水影响因素复杂多样、样本采集困难、样本数据不完整等工程特征,实现了基于贝叶斯网络的深长隧道突涌水预测,具有很强的工程适用性。
以上结合附图详细阐述了本申请的优选实施方式,优选实施方式中典型的公知结构及公知性常识技术在此未作过多描述,所属领域普通技术人员可以在本实施方式给出的启示下,结合自身能力完善并实施本发明技术方案,一些典型的公知结构、公知方法或公知性常识技术不应当成为所属领域普通技术人员实施本申请的障碍。
本申请要求的保护范围应当以其权利要求书的内容为准,发明内容、具体实施方式及说明书附图记载的内容用于解释权利要求书。
在本申请的技术构思范围内,还可以对本申请的具体实施方式作出若干变型,这些变型后的具体实施方式也应该视为在本申请的保护范围内。
Claims (10)
1.一种基于贝叶斯网络的深长隧道突涌水预测方法,其特征在于,包括以下步骤:
S1:确定引发突涌水的影响因素;
S2:对突涌水影响因素进行等级划分,对最大集中涌水量进行区间划分,形成深长隧道突涌水样本库;
S3:应用解释结构模型方法,将深长隧道突涌水的***问题转化成一个多级递阶的层次结构图,确定层间的指向性连接,建立影响因素的解释结构模型;
S4:根据解释结构模型,改进贝叶斯网络结构的学习方法;基于改进的学习方法,构建贝叶斯网络模型结构;
S5:基于参数学习方法,构建贝叶斯网络模型的条件概率表;
S6:进行贝叶斯网络模型推理,构建深长隧道的突涌水预测模型;
S7:依据建立的突涌水预测模型,进行新建隧道的突涌水预测。
2.根据权利要求1所述的基于贝叶斯网络的突涌水预测方法,其特征在于:在S1中,所述的影响因素包括埋深、地形地貌、岩层产状、地层岩性、不良地质、围岩级别、层间裂隙、可溶岩与非可溶岩接触带、地下水位、一周内降雨量、施工扰动程度、支护措施共12个影响因素。
3.根据权利要求1所述的基于贝叶斯网络的突涌水预测方法,其特征在于:
在S4中,基于影响因素的解释结构模型,确定贝叶斯网络结构学习方法的节点排序,以及确定每个节点允许的最大父节点数量为4。
4.根据权利要求3所述的基于贝叶斯网络的突涌水预测方法,其特征在于:
在S4中,基于影响因素的解释结构模型,提前指定部分贝叶斯网络节点之间的指向性联系。
5.根据权利要求3或4所述的基于贝叶斯网络的突涌水预测方法,其特征在于:
在S4中,对于完备样本,基于解释结构模型对基于评分搜索的K2算法进行优化;基于优化的K2算法,得到贝叶斯网络模型结构,具体的计算过程为:
确定评分函数,用P(G,D)作为评分函数,公式为:
其中,评分函数各变量含义如下:D:数据集;G:拟选的网络模型;n:变量个数;P(G):网络结构G的先验概率分布;ri:变节点xi的取值数量;i:节点的编号;j:节点xi的父节点的取值编号;π(xi):节点xi的父节点;qi:π(xi)的取值数量;Nijk:节点xi的父节点π(xi)取第j个值,xi取第k个值时的样本数量;Nij:节点xi父节点集π(xi)的第j个状态组合所对应的样本数量;
根据贝叶斯网络结构学习方法的节点排序,以及每个节点允许的最大父节点数量为4,确定节点的编号i(1,,2,3...13)的取值和qi的取值;
根据提前指定的部分贝叶斯网络节点之间的指向性联系,确定部分π(xi)的取值;
确定搜索策略为贪婪搜索算法;搜索将评分函数最大的父节点变量放入集合;当无法使评分函数增大时,停止搜索,则找到最优的模型;
基于训练集的样本数据,通过上述优化的K2算法,建立贝叶斯网络模型结构。
6.根据权利要求3或4所述的基于贝叶斯网络的突涌水预测方法,其特征在于:
在S4中,对于不完备样本,基于解释结构模型对基于评分搜索的EM算法进行优化;基于训练集的样本数据,通过上述优化的EM算法,建立贝叶斯网络模型结构。
7.根据权利要求1所述的基于贝叶斯网络的突涌水预测方法,其特征在于:
在S5中,对于完备样本库,采用最大似然估计法进行贝叶斯网络模型的条件概率表的构建;对于不完备样本库,采用期望极大化法进行贝叶斯网络模型的条件概率表的构建。
8.根据权利要求7所述的基于贝叶斯网络的突涌水预测方法,其特征在于:
在S5中,对于完备样本,采用最大似然估计法进行贝叶斯网络模型的条件概率表的构建,具体方法是:
确定似然度的对数函数形式为:
其中,N为样本数据,n为节点xi的个数;令节点xi的父节点为π(xi),qi为父节点π(xi)的取值数量,ri为变节点xi的取值数量;Nijk为节点xi的父节点π(xi)取第j个值,xi取第k个值时的样本数量;θijk为节点xi的父节点π(xi)取第j个值,xi取第k个值时所对应的参数值,
对上述对数函数求取最大值,即对参数θ求导得到最大值,即可以得到参数θijk的取值为:
基于训练集的样本数据,通过上述方法,建立贝叶斯网络模型的条件概率表。
9.根据权利要求7所述的基于贝叶斯网络的突涌水预测方法,其特征在于:
在S5中,对于不完备样本,采用期望极大化算法进行贝叶斯网络模型的条件概率表的构建,具体计算方法为:
(1)令X表示已观测变量集,Z表示不完备样本库中未观测变量集,也称隐变量集,Θ表示模型参数。对模型参数Θ做最大似然估计,即:
LL(Θ|X,Z)=log P(X,Z|Θ);
(2)以初始值Θ0为起点,对上式迭代执行E步和M步直至收敛;
(3)E步:基于Θt推断隐变量Z的期望,记为Zt;
(4)M步:基于已观测变量X和Zt对参数做最大似然估计,记为Θt+1。
基于训练集的样本数据,通过上述方法,建立贝叶斯网络模型的条件概率表。
10.根据权利要求1所述的基于贝叶斯网络的突涌水预测方法,其特征在于:
在S6中,对贝叶斯网络进行推理学习,其具体计算过程如下:
假设贝叶斯网络模型的最大集中涌水量用变量D表示,影响因素简化为用A,B,C表示;A为根节点,D为叶节点,A为B和C的父节点,B和C分别为D的父节点,已知影响因素A,B,C的取值,计算最大集中涌水量的计算方法为:P(D/A,B,C)=P(D)*P(A,B,C/D)/P(A,B,C),此时,A,B,C之间并不相互独立,因为在贝叶斯网络模型中建立了A,B,C三个节点间的关系,则可以有效的对上述关系进行深入的分析,此时,需要引入另外一个马尔科夫链规则公式:
P(x1,...,xn)=P(x1)P(x2|x1)...P(xn|x1,x2,...,xn-1)
其中,x1,...,xn表示贝叶斯网络的各个节点变量,
上述链规则表示,在对变量进行排序的基础上,各个变量的联合概率分布,等于每一个变量的条件概率的乘积,因此,对于上述公式P(D|A,B,C)=P(D)*P(A,B,C|D)/P(A,B,C),可以做进一步的分析,如下:
P(A,B,C|D)=P(A,B,C,D)/P(D)=P(A).P(B|A)P(C|A,B)P(D/A,B,C)/P(D)
上述三个公式中,先验概率可以从样本库中直接获取,而条件概率需要做进一步的分析,此时,根据贝叶斯网络中的各个变量间的依存关系,引入如下所示的条件独立性公式,
其中,π(xi)为变量xi的父节点的集合;此时,上述公式中的每一个条件概率的条件项,仅仅保留其父节点项,而剔除了其他的项,此时,每一个条件概率都可以从贝叶斯网络的节点参数CPT中获取,从而实现公式的计算,
从而可以得到:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210644546.5A CN115049124A (zh) | 2022-06-08 | 2022-06-08 | 一种基于贝叶斯网络的深长隧道突涌水预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210644546.5A CN115049124A (zh) | 2022-06-08 | 2022-06-08 | 一种基于贝叶斯网络的深长隧道突涌水预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115049124A true CN115049124A (zh) | 2022-09-13 |
Family
ID=83161343
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210644546.5A Pending CN115049124A (zh) | 2022-06-08 | 2022-06-08 | 一种基于贝叶斯网络的深长隧道突涌水预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115049124A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115392797A (zh) * | 2022-10-27 | 2022-11-25 | 北京城建设计发展集团股份有限公司 | 基于贝叶斯网络的运营隧道结构病害快速智能诊断方法 |
CN117745081A (zh) * | 2024-02-20 | 2024-03-22 | 中国石油大学(华东) | 一种台风风暴潮灾害风险评估方法和装置 |
CN117853486A (zh) * | 2024-03-07 | 2024-04-09 | 云南省交通规划设计研究院股份有限公司 | 一种数据缺失条件下隧道工作面岩体质量自动化评价方法 |
-
2022
- 2022-06-08 CN CN202210644546.5A patent/CN115049124A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115392797A (zh) * | 2022-10-27 | 2022-11-25 | 北京城建设计发展集团股份有限公司 | 基于贝叶斯网络的运营隧道结构病害快速智能诊断方法 |
CN117745081A (zh) * | 2024-02-20 | 2024-03-22 | 中国石油大学(华东) | 一种台风风暴潮灾害风险评估方法和装置 |
CN117853486A (zh) * | 2024-03-07 | 2024-04-09 | 云南省交通规划设计研究院股份有限公司 | 一种数据缺失条件下隧道工作面岩体质量自动化评价方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115049124A (zh) | 一种基于贝叶斯网络的深长隧道突涌水预测方法 | |
CN110363344B (zh) | 基于miv-gp算法优化bp神经网络的概率积分参数预测方法 | |
CN109165664A (zh) | 一种基于生成对抗网络的属性缺失数据集补全与预测方法 | |
CN101093559B (zh) | 一种基于知识发现的专家***构造方法 | |
CN110059963A (zh) | 一种基于模糊多态贝叶斯网络的隧道风险评价方法 | |
CN111079977A (zh) | 基于svd算法的异构联邦学习矿井电磁辐射趋势跟踪方法 | |
CN112949202A (zh) | 一种基于贝叶斯网络的岩爆概率预测方法 | |
KR20180116922A (ko) | 쉴드 tbm의 순굴진속도 예측 장치 및 그 방법 | |
Dorfeshan et al. | A new enhanced ARAS method for critical path selection of engineering projects with interval type-2 fuzzy sets | |
CN105869100A (zh) | 一种基于大数据思维的滑坡多场监测数据的融合及预测方法 | |
CN115376318B (zh) | 一种基于多属性融合神经网络的交通数据补偿方法 | |
CN113779880B (zh) | 一种基于超前钻探数据的隧道围岩二维质量评价方法 | |
CN115017791A (zh) | 隧道围岩级别识别方法和装置 | |
CN113689004A (zh) | 基于机器学习的地下管网承载力评价方法及*** | |
Qiu et al. | TBM tunnel surrounding rock classification method and real-time identification model based on tunneling performance | |
CN116485029A (zh) | 油田开发动态数据准确性检测方法、装置、设备及介质 | |
CN116308152B (zh) | 一种基于bim和激光点云数据的输电线路工程进度评估方法 | |
Lin | A VaFALCON neuro-fuzzy system for mining of incomplete construction databases | |
Armstrong et al. | The application of data mining techniques to characterize agricultural soil profiles. | |
Elwakil et al. | Construction knowledge discovery system using fuzzy approach | |
Wang et al. | A fuzzy intelligent system for land consolidation–a case study in Shunde, China | |
CN115222196B (zh) | 一种山区道路网脆弱性评估与驱动力探测方法 | |
CN105718739A (zh) | 一种巷道冒顶影响因素重要性研究方法 | |
Peña et al. | A synthesis of structural equation model-analytical hierarchy process, nonlinear autoregressive and backpropagation neural network-sensitivity analysis for construction and demolition waste assessment in the Philippines | |
CN115019476A (zh) | 一种基于多源信息融合的滑坡时空信息监测预警方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |