CN114034334A - 岩溶管道污染源和流量的识别方法 - Google Patents
岩溶管道污染源和流量的识别方法 Download PDFInfo
- Publication number
- CN114034334A CN114034334A CN202111079568.3A CN202111079568A CN114034334A CN 114034334 A CN114034334 A CN 114034334A CN 202111079568 A CN202111079568 A CN 202111079568A CN 114034334 A CN114034334 A CN 114034334A
- Authority
- CN
- China
- Prior art keywords
- model
- pipeline
- flow
- concentration
- lstm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000012360 testing method Methods 0.000 claims abstract description 42
- 230000035515 penetration Effects 0.000 claims abstract description 39
- 239000003344 environmental pollutant Substances 0.000 claims abstract description 29
- 231100000719 pollutant Toxicity 0.000 claims abstract description 29
- 238000005457 optimization Methods 0.000 claims abstract description 15
- 238000013528 artificial neural network Methods 0.000 claims abstract description 9
- 238000005070 sampling Methods 0.000 claims abstract description 9
- 239000000700 radioactive tracer Substances 0.000 claims description 51
- 238000012549 training Methods 0.000 claims description 28
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 21
- 238000004088 simulation Methods 0.000 claims description 16
- 238000012544 monitoring process Methods 0.000 claims description 13
- 230000005540 biological transmission Effects 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 12
- 230000000694 effects Effects 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 12
- 238000007781 pre-processing Methods 0.000 claims description 10
- 238000012795 verification Methods 0.000 claims description 10
- 239000003795 chemical substances by application Substances 0.000 claims description 9
- 238000011109 contamination Methods 0.000 claims description 9
- 238000013135 deep learning Methods 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000005259 measurement Methods 0.000 claims description 6
- 238000005192 partition Methods 0.000 claims description 6
- 238000006467 substitution reaction Methods 0.000 claims description 6
- 239000000356 contaminant Substances 0.000 claims description 5
- 239000006185 dispersion Substances 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000007423 decrease Effects 0.000 claims description 3
- 238000010200 validation analysis Methods 0.000 claims description 3
- 238000013459 approach Methods 0.000 claims description 2
- 238000012937 correction Methods 0.000 claims description 2
- 238000009792 diffusion process Methods 0.000 claims description 2
- 238000002474 experimental method Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims description 2
- 238000002347 injection Methods 0.000 claims description 2
- 239000007924 injection Substances 0.000 claims description 2
- 230000014759 maintenance of location Effects 0.000 claims description 2
- 238000003062 neural network model Methods 0.000 claims description 2
- 210000002569 neuron Anatomy 0.000 claims description 2
- 239000000126 substance Substances 0.000 claims description 2
- 238000013508 migration Methods 0.000 description 11
- 230000005012 migration Effects 0.000 description 11
- 210000004027 cell Anatomy 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 239000003673 groundwater Substances 0.000 description 3
- 238000007637 random forest analysis Methods 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000003403 water pollutant Substances 0.000 description 1
- 238000003911 water pollution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01D—MEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
- G01D21/00—Measuring or testing not otherwise provided for
- G01D21/02—Measuring two or more variables by means not covered by a single other subclass
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/23—Design optimisation, verification or simulation using finite element methods [FEM] or finite difference methods [FDM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Computer Hardware Design (AREA)
- Mathematical Physics (AREA)
- Geometry (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及岩溶管道污染源和流量的识别方法,其包括步骤一,在野外岩溶管道开展示踪试验;步骤二,采用暂时存储模型(TSM)模拟试验曲线,分析模型参数与管道流量的关系;步骤三,推断采样流量对应的模型参数;步骤四,生成不同管道流量的多条穿透曲线;步骤五,利用穿透曲线,构建长短期记忆神经网络(LSTM)作为TSM的替代模型;步骤六,建立LSTM模拟‑优化模型;步骤七,识别预测污染物泄露强度和管道流量,分析该方法的预测误差,验证该方法的可靠性。
Description
技术领域
本发明涉及将深度学习方法应用于岩溶地区污染源和水流条件的识别,特别是涉及岩溶管道污染源和流量的识别方法。
背景技术
岩溶管道在我国西南岩溶地区广泛分布,为岩溶地区污染物运移最主要的通道。随着社会经济的发展,该地区的污染日益严重,当污染物意外通过落水洞或天窗泄漏到岩溶管道中时,会快速运移扩散到其他地方,造成该地区地下水大面积污染。为准确找到污染源并及时切断污染路径,以尽量减少对依赖岩溶地下水作为水资源的水生生物和人类的损害,快速识别污染源信息尤为重要。
目前被用于地下水污染源识别的主要研究方法之一是模拟-优化方法,其基本原理是借助运筹学中的优化算法,通过反复调用地下水污染物迁移模型,对模型参数进行优化,使得模型的输出与观测数据尽可能拟合。该方法求解效率比较低的主要原因是污染物迁移模型计算速度较慢,因此通过建立污染物迁移模型的替代模型来提高计算效率,主要包括核极限学习机(KELM)、支持向量机(SVM)、随机森林(RF)、梯度提升决策树(GBDT)等方法。但是,如果污染物运移数值模拟模型的非线性程度增加,例如待识别的变量类型(污染源位置、释放强度和模拟模型参数等)增加,则数值模拟模型的输入和输出之间的转换关系将变得复杂,采用上述浅层机器学习方法作为替代模型的优势将会降低。
本发明改变传统思路,创造性的采用深度学习方法,其在模拟复杂非线性数值模拟模型的输入输出转换方面具有很大优势,因此可采用该方法构建污染物运移模型的替代模型,包括全连接层神经网络(MLP)、循环神经网络(RNN)、长短期记忆网络(LSTM)、卷积神经网络(CNN)等,上述深度学习方法在地下水污染源识别的应用几乎处于空白,没有人想到采用上述方法。更为重要的是,岩溶管道入口污染源识别,不同于多孔介质地下水的溯污染源识别,岩溶管道结构复杂,非均质性较强,非线性程度高,在岩溶管道入口污染源识别中目前还没有采用深度学习方法作为替代模型进行模拟-优化的先例,并且由于岩溶地下水与多孔介质地下水的结构以及污染物运移模型有显著差异,本领域技术人员也无法将上述多孔介质污染源识别的方法直接套用至岩溶管道入口的污染源识别中。
污染源识别是污染物运移问题的反问题,因此岩溶管道污染源识别需要充分认识岩溶管道中的污染物运移规律。定量示踪试验为研究岩溶管道污染物运移规律的一种常规手段,对某一岩溶管道而言,水流条件为影响污染物运移规律的关键因素,因此,污染物运移规律的充分认识需要不同水流条件的示踪试验数据。深度学习方法一般基于大量的数据,该方法在岩溶管道污染源识别中的应用则需要大量的不同水流条件的示踪试验数据,而大量开展野外示踪试验费时费力,也很难包括野外可能出现的所有水流条件,使得该方法的应用比较困难。
发明内容
本发明的目的在于,提供一种岩溶管道污染源信息(其包括泄露位置、泄露强度)和管道流量的识别方法。岩溶管道污染源位置通常为天窗,因此本发明重点识别污染物的泄露强度。本发明方法理论可行、实践方便、耗时短,能够定量判别岩溶管道入口污染物的泄露强度和管道流量,同时根据判别结果及时发出预警。
为解决上述问题,本发明技术方案结合少量野外示踪试验和溶质运移模型解决了这一难题;通过模拟丰水期和枯水期的示踪试验数据分析模型参数的变化规律,据此得到其他流量的模型参数;最后,采用溶质运移模型生成大量的示踪试验数据,为深度学习的应用提供了基础。
本发明包括如下步骤;
步骤一,在野外岩溶管道开展示踪试验;
基于野外岩溶管道,分别在丰水期和枯水期不同流量条件下分别开展示踪实验。在投放示踪剂前,将仪器布设在岩溶管道出口处,在岩溶管道入口处的天窗投放示踪剂,在线监测不同时间的示踪剂浓度,形成示踪剂浓度-时间过程线,即穿透曲线,并在岩溶管道出口处测量管道流量Q;
其中,示踪剂选用保守型溶质,示踪剂投放方式为连续投放;
步骤二,采用暂时存储模型(TSM)模拟试验曲线,分析模型参数与管道流量的关系;
首先,采用OTIS软件,保持管道流量和输入浓度固定不变,根据示踪剂投放强度qi,i=1,2…,k,计算输入浓度Ci=qi/Q,实现TSM对步骤一中获得的穿透曲线的模拟;然后,由于示踪剂为保守型溶质,在模拟结束后,校正获得四个溶质运移模型参数,主管道截面积A、存储区截面积As,交换系数α,弥散系数D;不同管道流量对应不同的模型参数;其次,分析模型参数与管道流量的关系;
其中,在TSM模拟过程中,首先,在OTIS软件中,采用有限差分法求解模型方程;然后,模拟计算得到不同时刻穿透曲线的浓度值,同时,结合非线性最小二乘法自动寻找最优的参数组合(A,As,D,α),使得模拟穿透曲线和实测穿透曲线的匹配度最好;
其中,TSM将步骤二的模拟区域划分为主通道和存储区域,并将主通道和存储区域之间进行线性溶质交换;主通道定义为岩溶管道***中以对流和弥散为主要传输过程的部分,即管道部分;由于相对于主通道中心处的水流流速减慢,导致溶质的暂时性滞留,存储区域中水域的水流流速被假设为静止的,建立TSM模型方程如下:
其中,t为时间,量纲T;x为注入点下游距离,量纲L;C和Cs分别为主通道和存储区中浓度;A和As分别为主通道和存储区截面积,量纲L2;Q为管道流量,量纲L3/T;D为弥散系数,量纲L2/T,α为交换系数,单位T-1;
步骤三,推断采样流量对应的模型参数;
首先,在步骤一中确定的管道流量Q的变化范围内,采用拉丁超立方抽样方法等概率地随机抽取ntr组参数(Q,q1,q2,…,qk)生成ntr条穿透曲线,用于生成训练和验证样本;然后,抽取nte组参数生成nte条穿透曲线,用于生成测试样本;其次,根据TSM模型参数的变化规律推断采样流量对应的模型参数;
步骤四,生成不同管道流量的多条穿透曲线;
将模型参数、管道流量和输入浓度Ci代入到OTIS软件中,计算生成穿透曲线,Ci=qi/Q,穿透曲线的时间步数为Ns;
步骤五,利用穿透曲线,构建长短期记忆神经网络(LSTM)模型作为TSM的替代模型;
首先,构建长短期记忆神经网络(LSTM)作为TSM的替代模型,相同的参数作为输入,当LSTM输出和步骤三中TSM输出一致度达到设定要求时,把LSTM 视为TSM的替代模型;然后,由于管道流量、管道结构、示踪剂投放强度和时间共同决定出口浓度数值大小,管道结构唯一不变,因此,LSTM以管道流量、示踪剂投放强度和时间(Q,q1,q2,…,qk,t)作为输入,中间经过矩阵运算,输出得到浓度值;其中,
步骤五一,训练、验证LSTM,调整模型参数;首先,进行神经网络模型的训练,通过不断自动调整模型的权重矩阵,手动调整模型的训练轮次、模型的层数或每层神经元个数,使得输出浓度逐渐靠近实测浓度,其中,训练和验证样本数为Nsi为第i条穿透曲线的时间步,模型的损失函数为均方误差MSE,训练过程中监控平均绝对误差MAE;然后,将Ntr个样本打乱顺序后划分为4个分区,将每个LSTM模型在3个分区上训练,并在剩下的1个分区上进行验证;其次,LSTM模型的验证分数等于4次验证平均绝对误差MAE的平均值;再次,训练轮次为epochs=num_epochs,训练中保存每轮的验证分数,绘制验证分数随着训练轮次的变化曲线,选取验证分数最低的训练轮次,作为最佳训练轮次;
步骤五二,使用步骤五一中最佳模型参数在Ntr个非测试样本上训练最终模型LSTM模型;
步骤五三,分析步骤五二中的最终LSTM模型对测试样本的预测效果;
首先,采用最终LSTM模型在个测试样本上进行测试,Nsj为第j 条穿透曲线的时间步数;然后,采用Nash系数表征模型对测试样本的预测效果;其次,当模型输出浓度序列和测试样本的浓度序列的Nash系数大于0.95 时,说明模型预测效果好,否则模型预测效果不好;
步骤五四,当模型预测效果好,采用LSTM作为TSM的替代模型,其中, Nash系数计算公式如下:
当模型预测效果不好,则重复步骤五一到步骤五三;
步骤六,建立LSTM模拟-优化模型;
首先,建立LSTM模拟-优化模型,搜寻最优参数组合(Q,q1,q2,…,qm),使目标函数值最小,即模型输出和野外实测穿透曲线的差距最小,目标函数值是管道出口实测浓度与替代模型的输出浓度的最小平方误差和;其次,为了节省计算时间,每次迭代计算时,不再采用TSM生成不同时刻的浓度值,而是采用LSTM模型获取不同时刻的浓度值;
LSTM模拟-优化模型表示为如下形式:
其中,F(Q,q1,q2,...,qk,t)为目标函数;Q为管道流量,qi为不同时刻的污染物泄露强度;Cm(t)为LSTM模型输出的不同时刻浓度值,Co(t)为实测的不同时刻浓度值,t=t1,t1+dt,t1+2dt,...,t2;
步骤七,识别预测污染物泄露强度和管道流量,分析该方法的预测误差,验证该方法的可靠性;
首先,假设步骤一中示踪试验的示踪剂投放强度和管道流量未知;然后,采用LSTM模拟-优化模型识别预测示踪剂投放强度和管道流量,与实际投放强度和实测流量对比,分析污染物泄漏强度和管道流量的预测误差。
其中污染物限定是不经过生物转化或化学变化的保守型污染物。
为达到上述目的,本发明借助于基于深度学习的岩溶管道污染源和流量识别***,其包括:数据监测模块、数据预处理模块、数据交换模块、显示控制模块、控制模块及预警模块;
数据交换模块,用于进行数据监测模块、数据预处理模块、显示控制模块、控制模块及预警模块各模块间的数据传输;
数据监测模块,用于岩溶管道出口污染物浓度的在线实时监测;
数据预处理模块,与数据监测模块数据传输连接,用于将监测的浓度数据进行预处理,包括标准化、提取时间和对应浓度;
控制模块,与数据预处理模块数据传输连接,用于嵌入污染源和流量识别模型及进行***控制;在线监测的数据和预处理后的数据传输给控制模块,控制模块利用所述显示模块实时显示结果,将预处理后的数据输送至所述污染源和流量识别模型,利用所述污染源和流量识别模型对岩溶管道入口污染物泄露强度和管道流量进行判别,再把判别结果返回至所述显示模块显示预测结果;
显示模块,与控制模块数据传输连接,用于进行结果显示;
预警模块,与控制模块数据传输连接,用于污染和水文预警,当预测的污染泄露强度和管道流量超过预警值时,则启动预警。
与现有技术对比,本发明的优点和有益效果是:
(1)一种基于深度学习模型模拟-优化的岩溶管道污染源和流量识别技术,耗时短、精度高、成本低,可以精准地根据监测的穿透曲线对岩溶管道入口污染物泄露强度和管道流量进行快速判别;
(2)一种岩溶管道污染源和流量识别***操作简便,能根据在线监测的穿透曲线实时判别、显示污染源泄露强度和管道流量,并及时发出预警。
附图说明
图1是本发明的岩溶管道污染源和流量识别方法流程图。
图2是本发明的穿透曲线示意图。
图3是本发明的暂时存储模型对实测穿透曲线的模拟结果示意图。
图4是本发明的LSTM的构建流程图。
图5是本发明的RNN结构示意图。
图6是本发明的岩溶管道污染源和流量识别***结构示意图。
具体实施方式
如图1-6,作为中国西南某地区具体应用,一种基于深度学习的岩溶管道污染源和流量识别方法,实施例中步骤如下:
步骤一:基于野外岩溶管道,分别在丰水期和枯水期不同流量条件下开展示踪试验。取保守型溶质做示踪剂,通过天窗将示踪剂连续投放至岩溶管道内。在投放示踪剂前,将仪器布设在岩溶管道出口处,在线监测不同时间的示踪剂浓度,形成示踪剂浓度-时间过程线,即穿透曲线(图2),并在岩溶管道出口处测量管道流量(Q)。
其中,示踪剂选用保守型溶质。不同时刻的投放强度可能不同,不同示踪试验的投放强度可能不同。
步骤二:采用暂时存储模型(TSM)模拟岩溶管道示踪试验结果。在OTIS软件中,通过TSM模拟步骤一中获得的穿透曲线(图3),根据示踪剂投放强度(qi, i=1,2…,k)计算输入浓度(Ci=qi/Q),保持管道流量和输入浓度固定不变,校正四个溶质运移模型参数:主管道截面积(A)、存储区截面积(As),交换系数(α),弥散系数(D),并分析模型参数与管道流量的关系。
步骤三:在步骤一中确定的管道流量Q的变化范围内,采用拉丁超立方抽样方法等概率地随机抽取ntr组参数(Q,q1,q2,…,qk)生成ntr条穿透曲线,用于生成训练和验证样本;抽取nte组参数生成nte条穿透曲线,用于生成测试样本。根据步骤二中模型参数与管道流量的关系推断采样流量对应的模型参数(A, As,D,α),将模型参数、管道流量和输入浓度(Ci=qi/Q)代入到OTIS软件中,计算得到管道出口的穿透曲线,穿透曲线的时间步数为Ns(图2)。
步骤四:构建长短期记忆神经网络(LSTM)作为TSM的替代模型(图4),相同的参数作为输入,当LSTM输出和步骤三中TSM输出一致度达到设定要求时,把LSTM视为TSM的替代模型。由于管道流量、管道结构、示踪剂投放强度和时间共同决定出口浓度数值大小,管道结构唯一不变,因此,LSTM以管道流量、示踪剂投放强度和时间(Q,q1,q2,…,qk,t)作为输入,以浓度作为输出。
步骤五:建立LSTM模拟-优化模型,搜寻最优参数组合(Q,q1,q2,…,qm),使目标函数值最小,即模型输出和野外实测穿透曲线的差距最小,目标函数值是管道出口实测浓度与替代模型的输出浓度的最小平方误差和;其次,为了节省计算时间,每次迭代计算时,不再采用TSM生成不同时刻的浓度值,而是采用LSTM模型获取不同时刻的浓度值。
LSTM模拟-优化模型表示为如下形式:
其中,F(Q,q1,q2,...,qk,t)为目标函数;Q为管道流量,qi为不同时刻的污染物泄露强度;Cm(t)为LSTM模型输出的不同时刻浓度值,Co(t)为实测的不同时刻浓度值,t=t1,t1+dt,t1+2dt,...,t2。
步骤六:识别预测污染物泄露强度和管道流量,分析该方法的预测误差。假设步骤一中示踪试验的示踪剂投放强度和管道流量未知,采用该方法识别预测示踪剂投放强度和管道流量,与实际投放强度和实测流量对比,分析污染物泄漏强度和管道流量的预测误差。
其中,在图5中,LSTM是为了解决标准RNN很难学***线形式在图上方贯穿运行。LSTM通过三个门(遗忘门、输入门、输出门)去除或者增加信息到细胞状态。RNN结构示意图中LSTM模型进行运算步骤如下:
(1)遗忘门层ft(一个sigmoid层)决定从细胞状态中丢弃和保留的信息;
ft=σ(Wfxt+Ufht-1+bf)
(2)确定什么样的新信息被存放在细胞状态中。“输入门层”it(一个 sigmoid层)决定将要更新的值;然后,利用一个tanh层创建一个新的候选值
it=σ(Wixt+Uiht-1+bi)
(3)将旧细胞状态Ct-1更新为新细胞状态Ct;
(4)确定输出值。运行输出门Ot(一个sigmoid层);然后,把细胞状态Ct通过tanh进行处理(得到一个在-1到1之间的值)并将它和Ot相乘;
Ot=σ(Woxt+Uoht-1+bo)
ht=Ot*tanh(Ct)
其中,σ(τ)=1/(1+e-τ)为sigmoid激活函数,它可以将一个实数值映射到区间 [0,1],用来描述有多少信息通过。当门的输出值为0时,不传递任何信息,当值为1时,所有信息都可以传递;Wf、Wi、Wo分别是将输入连接到遗忘门、输入门和输出门的权重矩阵;Uf、Ui和Uo是将隐藏层连接到遗忘门、输入门和输出门的权重矩阵。bf,bi,bo分别是输入门、遗忘门和输出门的偏置向量; *表示对应元素的乘法。进一步地,在Jupyter Notebook(Python交互式运行平台)中,基于Keras模块实现LSTM的构建和训练。Keras是一个模型级的库,为开发深度学习模型提供了高层次的构建模块。它不处理张量操作、求微分等低层次运算。相反,它依赖于一个专门的、高度优化的张量库来完成这些运算,这个张量库就是TensorFlow后端引擎。进一步地,除此之外,作为对比,还可采用浅层学习方法(KELM、SVM、RF、GBDT)和其他深度学习方法(MLP、CNN、 RNN)作为替代模型。
本发明具体应用途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进,这些改进也应视为本发明的保护范围。
Claims (9)
1.一种岩溶管道污染源和流量的识别方法,其特征在于:包括以下步骤;
步骤一,在野外岩溶管道开展示踪试验;
步骤二,采用暂时存储模型TSM模拟试验曲线,分析模型参数与管道流量的关系;
步骤三,推断采样流量对应的模型参数;
步骤四,生成不同管道流量的多条穿透曲线;
步骤五,利用穿透曲线,构建长短期记忆神经网络LSTM作为TSM的替代模型;
步骤六,建立LSTM模拟-优化模型;
步骤七,识别预测污染物泄露强度和管道流量,分析该方法的预测误差。
2.根据权利要求1所述的岩溶管道污染源和流量的识别方法,其特征在于:在步骤一中,基于野外岩溶管道,分别在丰水期和枯水期不同流量条件下分别开展示踪实验。在投放示踪剂前,将仪器布设在岩溶管道出口处,在岩溶管道入口处的天窗投放示踪剂,在线监测不同时间的示踪剂浓度,形成示踪剂浓度-时间过程线,即穿透曲线,并在岩溶管道出口处测量管道流量Q;
其中,示踪剂选用保守型溶质,示踪剂投放方式为连续投放。
3.根据权利要求1所述的岩溶管道污染源和流量的识别方法,其特征在于:在步骤二中,首先,采用OTIS软件,保持管道流量和输入浓度固定不变,根据示踪剂投放强度qi,i=1,2…,k,计算输入浓度Ci=qi/Q,实现TSM对步骤一中获得的穿透曲线的模拟;然后,由于示踪剂为保守型溶质,在模拟结束后,校正获得四个溶质运移模型参数,主管道截面积A、存储区截面积As,交换系数α,弥散系数D;不同管道流量对应不同的模型参数;其次,分析模型参数与管道流量的关系;
其中,在TSM模拟过程中,首先,在OTIS软件中,采用有限差分法求解TSM模型方程;然后,模拟计算得到不同时刻穿透曲线的浓度值,同时,结合非线性最小二乘法自动寻找最优的参数组合(A,As,D,α),使得模拟穿透曲线和实测穿透曲线的匹配度最好;
其中,TSM将步骤二的模拟区域划分为主通道和存储区域,并将主通道和存储区域之间进行线性溶质交换;主通道定义为岩溶管道***中以对流和弥散为主要传输过程的部分,即管道部分;由于相对于主通道中心处的水流流速减慢,导致溶质的暂时性滞留,存储区域中水域的水流流速被假设为静止的,建立TSM模型方程如下:
其中,t为时间,量纲T;x为注入点下游距离,量纲L;C和Cs分别为主通道和存储区中浓度;A和As分别为主通道和存储区截面积,量纲L2;Q为管道流量,量纲L3/T;D为弥散系数,单位L2/T,α为交换系数,量纲T-1。
4.根据权利要求1所述的岩溶管道污染源和流量的识别方法,其特征在于:在步骤三中,首先,在步骤一中确定的管道流量Q的变化范围内,采用拉丁超立方抽样方法等概率地随机抽取ntr组参数(Q,q1,q2,…,qk)生成ntr条穿透曲线,用于生成训练和验证样本;然后,抽取nte组参数生成nte条穿透曲线,用于生成测试样本;其次,根据TSM模型参数的变化规律推断采样流量对应的模型参数(A,As,D,α)。
5.根据权利要求1所述的岩溶管道污染源和流量的识别方法,其特征在于:在步骤四中,将步骤三中获得的模型参数、管道流量和输入浓度Ci代入到OTIS软件中,计算生成穿透曲线,Ci=qi/Q,穿透曲线的时间步数为Ns。
6.根据权利要求1所述的岩溶管道污染源和流量的识别方法,其特征在于:在步骤五中,首先,构建长短期记忆神经网络LSTM作为暂时存储模型TSM的替代模型,相同的参数作为输入,当LSTM输出和步骤四中TSM输出一致度达到设定要求时,把LSTM视为TSM的替代模型;然后,由于管道流量、管道结构、示踪剂投放强度和时间共同决定出口浓度数值大小,管道结构唯一不变,因此,LSTM以管道流量、示踪剂投放强度和时间(Q,q1,q2,…,qk,t)作为输入,中间经过矩阵运算,输出得到浓度值。
7.根据权利要求6所述的岩溶管道污染源和流量的识别方法,其特征在于:其中,
步骤五一,训练、验证LSTM,调整模型参数;首先,进行神经网络模型的训练,通过不断自动调整模型的权重矩阵,手动调整模型的训练轮次、模型的层数或每层神经元个数,使得输出浓度逐渐靠近实测浓度,其中,训练和验证样本数为Nsi为第i条穿透曲线的时间步,模型的损失函数为均方误差MSE,训练过程中监控平均绝对误差MAE;然后,将Ntr个样本打乱顺序后划分为4个分区,将每个LSTM模型在3个分区上训练,并在剩下的1个分区上进行验证;其次,LSTM模型的验证分数等于4次验证平均绝对误差MAE的平均值;再次,训练轮次为epochs=num_epochs,训练中保存每轮的验证分数,绘制验证分数随着训练轮次的变化曲线,选取验证分数最低的训练轮次,作为最佳训练轮次;
步骤五二,使用步骤五一中最佳模型参数在Ntr个非测试样本上训练最终LSTM模型;
步骤五三,分析步骤五二中的最终LSTM模型对测试样本的预测效果;
首先,采用最终LSTM模型在个测试样本上进行测试,Nsj为第j条穿透曲线的时间步数;然后,采用Nash系数表征模型对测试样本的预测效果;其次,当模型输出浓度序列和测试样本的浓度序列的Nash系数大于0.95时,说明模型预测效果好,否则模型预测效果不好;
步骤五四,当模型预测效果好,采用LSTM作为TSM的替代模型,其中,Nash系数计算公式如下:
当模型预测效果不好,则重复步骤五一到步骤五三。
8.根据权利要求1所述的岩溶管道污染源和流量的识别方法,其特征在于:在步骤六中,首先,建立LSTM模拟-优化模型,搜寻最优参数组合(Q,q1,q2,…,qm),使目标函数值最小,即模型输出和野外实测穿透曲线的差距最小,目标函数为管道出口实测浓度与替代模型的输出浓度的最小平方误差和;其次,为了节省计算时间,每次迭代计算时,不再采用TSM生成不同时刻的浓度值,而是采用LSTM模型获取不同时刻的浓度值;
LSTM模拟-优化模型表示为如下形式:
其中,F(Q,q1,q2,...,qk,t)为目标函数;Q为管道流量,qi为不同时刻的污染物泄露强度;Cm(t)为LSTM模型输出的不同时刻浓度值,Co(t)为实测的不同时刻浓度值,t=t1,t1+dt,t1+2dt,...,t2;
在步骤七中,首先,假设步骤一中示踪试验的示踪剂投放强度和管道流量未知;然后,采用LSTM模拟-优化模型识别预测示踪剂投放强度和管道流量,与实际投放强度和实测流量对比,分析污染物泄漏强度和管道流量的预测误差。
9.根据权利要求1所述的岩溶管道污染源和流量的识别方法,其特征在于:其中污染物限定是不经过生物转化或化学变化的保守型污染物;该方法借助于基于深度学习的岩溶管道污染源和流量识别***,其包括:数据监测模块、数据预处理模块、数据交换模块、显示控制模块、控制模块及预警模块;
数据交换模块,用于进行数据监测模块、数据预处理模块、显示控制模块、控制模块及预警模块各模块间的数据传输;
数据监测模块,用于岩溶管道出口污染物浓度的在线实时监测;
数据预处理模块,与数据监测模块数据传输连接,用于将监测的浓度数据进行预处理,包括标准化、提取时间和对应浓度;
控制模块,与数据预处理模块数据传输连接,用于嵌入污染源和流量识别模型及进行***控制;在线监测的数据和预处理后的数据传输给控制模块,控制模块利用所述显示模块实时显示结果,将预处理后的数据输送至所述污染源和流量识别模型,利用所述污染源和流量识别模型对岩溶管道入口污染物泄露强度和管道流量进行判别,再把判别结果返回至所述显示模块显示预测结果;
显示模块,与控制模块数据传输连接,用于进行结果显示;
预警模块,与控制模块数据传输连接,用于污染和水文预警,当预测的污染泄露强度和管道流量超过预警值时,则启动预警。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111079568.3A CN114034334B (zh) | 2021-09-15 | 2021-09-15 | 岩溶管道污染源和流量的识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111079568.3A CN114034334B (zh) | 2021-09-15 | 2021-09-15 | 岩溶管道污染源和流量的识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114034334A true CN114034334A (zh) | 2022-02-11 |
CN114034334B CN114034334B (zh) | 2023-11-07 |
Family
ID=80134384
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111079568.3A Active CN114034334B (zh) | 2021-09-15 | 2021-09-15 | 岩溶管道污染源和流量的识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114034334B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114925554A (zh) * | 2022-07-22 | 2022-08-19 | 山东省地质矿产勘查开发局八〇一水文地质工程地质大队(山东省地矿工程勘察院) | 一种北方岩溶发育带地下水补给径流区污染控制模拟方法 |
CN115307687A (zh) * | 2022-09-29 | 2022-11-08 | 四川省公路规划勘察设计研究院有限公司 | 一种边坡稳定性监测方法、***、存储介质及电子设备 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103335989A (zh) * | 2013-06-16 | 2013-10-02 | 桂林理工大学 | 一种模拟岩溶地下河污染物迁移与归宿的方法 |
CN109190280A (zh) * | 2018-09-18 | 2019-01-11 | 东北农业大学 | 一种基于核极限学习机替代模型的地下水污染源反演识别方法 |
WO2020000557A1 (zh) * | 2018-06-25 | 2020-01-02 | 山东大学 | 基于岩溶管道介质特征反演的室内示踪试验*** |
CA3067573A1 (en) * | 2019-01-14 | 2020-07-14 | Harbin Engineering University | Target tracking systems and methods for uuv |
CN111639748A (zh) * | 2020-05-15 | 2020-09-08 | 武汉大学 | 一种基于lstm-bp时空组合模型的流域污染物通量预测方法 |
AU2020102748A4 (en) * | 2020-10-16 | 2020-12-10 | Tianjin University | Intelligent feedback real-time control system and method for hydrodynamic circulation under external interference |
CN112116147A (zh) * | 2020-09-16 | 2020-12-22 | 南京大学 | 一种基于lstm深度学习的河流水温预测方法 |
KR102210698B1 (ko) * | 2020-09-16 | 2021-02-01 | 서울대학교산학협력단 | 하천 유해화학물질 유출 시나리오 기반 기계학습모형과 재귀적 특징 제거법을 결합한 화학사고 발생원 역추적 방법 |
CN113128106A (zh) * | 2021-04-06 | 2021-07-16 | 汕头大学 | 一种岩溶地层盾构施工引起地表沉降的确定方法 |
CN113127531A (zh) * | 2021-03-15 | 2021-07-16 | 首都师范大学 | 一种基于神经网络的区域地面沉降时空模拟***和方法 |
CN113204824A (zh) * | 2021-05-21 | 2021-08-03 | 上海大学 | 多模型融合的盾构施工沉降预测方法及*** |
-
2021
- 2021-09-15 CN CN202111079568.3A patent/CN114034334B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103335989A (zh) * | 2013-06-16 | 2013-10-02 | 桂林理工大学 | 一种模拟岩溶地下河污染物迁移与归宿的方法 |
WO2020000557A1 (zh) * | 2018-06-25 | 2020-01-02 | 山东大学 | 基于岩溶管道介质特征反演的室内示踪试验*** |
CN109190280A (zh) * | 2018-09-18 | 2019-01-11 | 东北农业大学 | 一种基于核极限学习机替代模型的地下水污染源反演识别方法 |
CA3067573A1 (en) * | 2019-01-14 | 2020-07-14 | Harbin Engineering University | Target tracking systems and methods for uuv |
CN111639748A (zh) * | 2020-05-15 | 2020-09-08 | 武汉大学 | 一种基于lstm-bp时空组合模型的流域污染物通量预测方法 |
CN112116147A (zh) * | 2020-09-16 | 2020-12-22 | 南京大学 | 一种基于lstm深度学习的河流水温预测方法 |
KR102210698B1 (ko) * | 2020-09-16 | 2021-02-01 | 서울대학교산학협력단 | 하천 유해화학물질 유출 시나리오 기반 기계학습모형과 재귀적 특징 제거법을 결합한 화학사고 발생원 역추적 방법 |
AU2020102748A4 (en) * | 2020-10-16 | 2020-12-10 | Tianjin University | Intelligent feedback real-time control system and method for hydrodynamic circulation under external interference |
CN113127531A (zh) * | 2021-03-15 | 2021-07-16 | 首都师范大学 | 一种基于神经网络的区域地面沉降时空模拟***和方法 |
CN113128106A (zh) * | 2021-04-06 | 2021-07-16 | 汕头大学 | 一种岩溶地层盾构施工引起地表沉降的确定方法 |
CN113204824A (zh) * | 2021-05-21 | 2021-08-03 | 上海大学 | 多模型融合的盾构施工沉降预测方法及*** |
Non-Patent Citations (2)
Title |
---|
XIAYAN YU: "Deep learing emulators for groundwater contaminant transport modelling", 《JOURNAL OF HYDROLOGY》 * |
赵小二: "岩溶地下河污染物运移模型对比研究", 《环境科学学报》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114925554A (zh) * | 2022-07-22 | 2022-08-19 | 山东省地质矿产勘查开发局八〇一水文地质工程地质大队(山东省地矿工程勘察院) | 一种北方岩溶发育带地下水补给径流区污染控制模拟方法 |
CN115307687A (zh) * | 2022-09-29 | 2022-11-08 | 四川省公路规划勘察设计研究院有限公司 | 一种边坡稳定性监测方法、***、存储介质及电子设备 |
CN115307687B (zh) * | 2022-09-29 | 2022-12-27 | 四川省公路规划勘察设计研究院有限公司 | 一种边坡稳定性监测方法、***、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN114034334B (zh) | 2023-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110110466B (zh) | 一种机器学习和工艺仿真的污水处理目标参数预测方法 | |
CN108009674A (zh) | 基于cnn和lstm融合神经网络的空气pm2.5浓度预测方法 | |
CN114034334B (zh) | 岩溶管道污染源和流量的识别方法 | |
CN112418426A (zh) | 排污口污染物排放溯源方法、装置、计算设备及存储介质 | |
CN108334943A (zh) | 基于主动学习神经网络模型的工业过程半监督软测量建模方法 | |
Rajabi et al. | Efficient fuzzy Bayesian inference algorithms for incorporating expert knowledge in parameter estimation | |
CN111814956A (zh) | 一种基于多维度二次特征提取的多任务学习的空气质量预测方法 | |
CN112418266A (zh) | 一种基于卷积神经网络的桩基础完整性分类识别方法 | |
CN109377440B (zh) | 一种基于多任务集成学习器的pm2.5和o3浓度协同预测方法 | |
CN111428419A (zh) | 悬浮泥沙浓度预测方法、装置、计算机设备和存储介质 | |
CN106568647B (zh) | 一种基于神经网络的混凝土强度预测方法 | |
CN114492164A (zh) | 基于多核极限学习机的有机污染物迁移数值模型替代方法 | |
CN117521512A (zh) | 一种基于多尺度贝叶斯卷积Transformer模型的轴承剩余使用寿命预测方法 | |
CN114239397A (zh) | 基于动态特征提取与局部加权深度学习的软测量建模方法 | |
CN117076893B (zh) | 一种基于长短期记忆神经网络的声速分布预报方法 | |
CN112750507B (zh) | 基于混合机器学习模型的同时检测水中硝酸盐和亚硝酸盐含量的方法 | |
CN113192569A (zh) | 基于改进粒子群和误差反馈神经网络的有害气体监测方法 | |
Lazarevska et al. | Determination of fire resistance of eccentrically loaded reinforced concrete columns using fuzzy neural networks | |
CN116757321A (zh) | 太阳直接辐射量预测方法、***、设备及存储介质 | |
CN116050630A (zh) | 机理与数据联合驱动的湖泊多深度温度预测方法及模型 | |
CN113988311A (zh) | 质量变量的预测方法、装置、终端及存储介质 | |
Hazrati-Yadkoori et al. | Characterization of groundwater contaminant sources by utilizing MARS based surrogate model linked to optimization model | |
CN117633721B (zh) | 机理模型与数据联合驱动的城市河网透明度预测方法 | |
Xu et al. | Application of BP Neural Network in Airport Passenger Volume Forecast | |
Li et al. | Remote sensing and artificial neural network estimation of on-road vehicle emissions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |