CN110363344B

CN110363344B - 基于miv-gp算法优化bp神经网络的概率积分参数预测方法

Info

Publication number: CN110363344B
Application number: CN201910625366.0A
Authority: CN
Inventors: 池深深; 余学祥; 王磊; 吕伟才
Original assignee: Anhui University of Science and Technology
Current assignee: Anhui University of Science and Technology
Priority date: 2019-07-11
Filing date: 2019-07-11
Publication date: 2022-07-12
Anticipated expiration: 2039-07-11
Also published as: CN110363344A

Abstract

本发明提出一种基于遗传算法和粒子群算法的组合算法(GP)优化BP神经网络的概率积分法参数预测模型，并采用平均影响值算法(MIV)来优化BP神经网络的输入层，从而降低网络的复杂程度，达到提高预测精度的目的。以50个工作面的实测资料作为BP神经网络的训练集和测试集建立MIV‑GP‑BP模型，并分析模型预测结果的精度和可靠性，结果表明：在5个参数中，均方根误差均在0.0058～1.1575之间，q、tanβ、b、θ的最大相对误差不超过5.42％，平均相对中误差低于2.81％，s/H相对误差不超过9.66％，平均相对中误差低于4.31％(参数本身较小),优化后的神经网络模型具有更高的预测精度和稳定性。

Description

基于MIV-GP算法优化BP神经网络的概率积分参数预测方法

技术领域

本发明涉及概率积分参数预测领域，尤其涉及一种基于MIV-GP算法优化BP神经网络的概率积分参数预测方法。

背景技术

随着中国经济的快速发展，对煤炭资源的需求量也越来越大。近年来地下煤炭资源被大量开采出来，地下煤炭开采造成一系列环境问题，如：地表沉陷、裂缝、粉尘、固态垃圾等，给矿区的生产生活带来严重的威胁。为最大程度采出煤炭资源并减小地表大面积沉陷，学者们对开采沉陷预计理论展开广泛的研究。其中基于随机介质力学理论的概率积分法是应用较为广泛的开采沉陷预计方法，所以概率积分法参数的获取是预测的关键。概率积分法参数求取的常用方法有:第一种方法是基于实测数据采用智能优化算法拟合求取参数(遗传算法、量子退火法等)；第二种方法是利用机器学习的方法求取参数(神经网络、支持向量机等)；第三种方法是利用相似理论结合覆岩岩性计算，这些算法预测模型在一定的程度提高了概率积分法的求参精度。

自概率积分法在中国盛行以来，多数矿区相继进行了岩移观测，并获取了相应矿区的概率积分法参数，为开采沉陷理论研究提供了宝贵的资料，这些实测资料包括概率积分法基本参数(下沉系数q,水平移动系数b,主要影响角正切tanb,拐点偏移距s，开采影响传播角θ)和地质采矿条件(上覆岩层的岩性f,煤层采深H,开采厚度M,煤层倾角T，采动程度n，松散层厚度W,重复采动X)，概率积分法参数与地质采矿条件之间存在复杂的非线性关系，很难用具体的数学模型描述。上述方法一和方法三均是基于实测变形量求取概率积分法参数的方法，这常常需要建立大量的地表移动观测站，耗费大量的人力、物力，而且观测周期长，无法获取新建矿区的参数。上述的神经网络技术具有较好的自学习、自适应性和强容错性能，能建立复杂的非线性映射关系，被广泛应用于模式分类、聚类分析、回归拟合分析以及优化计算等领域。

为充分利用已有的矿区资料，建立地质采矿条件与概率积分法参数之间的关系，基于神经网络学习的求参方法得以广泛应用。对于BP神经网络来说，其权值和阈值选择具有随机性，从而导致标准的BP神经网络算法收敛速度慢且容易陷入局部最优值。利用智能优化算法优化BP神经网络训练过程中的参数优化过程，可以达到提高训练效率的目的。这些算法包括模拟退火法(SA)、GA算法、PSO算法等，这些优化算法中PSO算法简单、运算效率高，但是它具有精度不高，容易陷入局部最优等缺点。

发明内容

为克服上述技术问题，本发明提出一种基于MIV-GP算法优化BP神经网络的概率积分参数预测方法，目的在于提高神经网络的预测精度，从而应用在概率积分法参数的预测中。

本发明提出了一种基于MIV-GP算法优化BP神经网络的概率积分参数预测方法，所述方法包括如下步骤:

步骤S1、基于MIV算法对BP神经网络的输入变量进行筛选，对影响概率积分法参数的因子进行排序，剔除排序靠后的影响因子；

步骤S2、采用G-P算法优化BP神经网络的权值和阈值，从而建立MIV-GP-BP神经网络预测模型，实现概率积分参数预测。

优选的，所述步骤S1之前还包括构建BP神经网络。

优选的，所述步骤S1具体包括，

步骤S101、在所述BP神经网络训练终止之后，将训练单一自变量样本在原值的基础上增加和减少一定的比例，形成两组新的样本P₁、P₂；

步骤S102、利用训练好的样本P₁、P₂,得到各自的预测输出数据T₁、T₂；

步骤S103、求两组预测数据T₁、T₂之间的差值，得到变动该自变量对输出产生的影响变化值IV；

步骤S104、剔除每组样本值中的异常值，将获取的样本值的IV按照观测样本数取平均，得到该自变量对因变量网络输出的MIV值。

优选的，所述比例为10％。

优选的，所述步骤S2具体包括，

步骤S201、初始化BP神经网络的拓扑结构,设定所述BP神经网络的输入层、隐含层、输出层节点的个数；

步骤S202、初始化种群，将需要待优化的权值和阈值信息根据预设编码规则进行编码；并按照设定的种群规模和初始化方法初始化种群；

步骤S203、将初始化后的种群按照GP算法规则进行迭代运算，直至算法满足结束条件时，最终得到全局最优个体，解码得到权值和阈值信息；

步骤S204、将解码得到的权值和阈值信息带入到BP神经网络中，得到网络的初始权值和阈值；

步骤S205、对神经网络进行反复学习训练，直至满足结束条件，最终得到优化后的BP神经网络的输出。

优选的，所述GP算法规则具体如下：

步骤S301、GP算法中相关参数的设定，粒子的个数N,经过进化后的粒子个数M,变异概率P_m,交叉概率P_c,粒子群算法中粒子的最大速度V,惯性常数ω,学习因子c₁,c₂和迭代次数epoch,求解精度E；

步骤S302、种群的初始化，设置种群的规模N和粒子的维度n，采用实数随机编码，对粒子的速度和位置进行编码，利用适应度函数计算粒子群个体适应度值，更新粒子的个体极值和全局极值；

步骤S303、粒子群的迭代，更新粒子的速度和位置信息，并利用适应度函数计算每个粒子的适应度值，更新个体极值和种群的全局极值；

步骤S304、将N个粒子按照适应度函数值的大小排序，选取其中适应度值较小的N/3个粒子，由保留的N/3个粒子的位置值选择复制生成2N/3个GA个体。

步骤S305、对GA个体进行交叉和变异；

步骤S306、将GA算法生成的2N/3个个体与N/3个粒子合并组成新的N个粒子，再计算粒子群的适应度，并更新个体极值和全局极值；

步骤S307、算法结束的判断，判断粒子进化的迭代次数是否满足设定的最大进化代数，若是则算法结束，输出粒子群的全局极值，及最优解。

优选的，所述适应度函数为：

其中,l为BP神经网络的输出层个数，y_k表示第k个节点的期望输出值。

优选的，所述更新粒子的速度和位置信息，具体计算公式为：

v_i+1＝ω*v_i+c₁r₁(pbest_i-x_i)+c₂r₂(gbest_i-x_i) (7)

x_i+1＝x_i+v_i+1 (8)

式中：c₁、c₂为加速因子，ω为惯性系数，r₁、r₂为[0,1]之间的随机数,v_i是粒子的速度向量，v_i,v_i+1分别为粒子的当前速度和更新后的速度，x_i,x_i+1分别为粒子的当前位置和更新后的位置，pbest_i为粒子的当前最优位置即个体极值，gbest_i为粒子群当前的最优位置即全局最优极值。

优选的，对GA个体按照如下公式(10)和公式(11)进行交叉和变异，

交叉操作采用实数交叉法，第k个染色体a_k和第l个染色体a_l在j位的交叉操作方法为

其中，b是[0,1]区间的随机数；

第i个个体的第j个基因a_ij进行变异的操作方法为

其中，a_max是基因a_ij的上界；a_min是基因a_ij的下界；f(g)＝r₂(1-g/G_max)²,g是当前的迭代次数，G_max是最大进化次数，r₂为[0,1]区间的随机数。

附图说明

图1为神经网络的拓扑结构示意图；

图2为MIV算法流程图；

图3为GP-BP算法流程图；

图4为GP算法流程图；

图5为本发明一实施例中各个影响因素的MIV值；

图6为原始数据的平滑处理结果；

图7为本发明提出的预测方法与MIV-BP神经网络预测模型对照示意图；

图8为不同输入层的下沉系数预测模型预测值；

图9为不同输入层的水平移动系数预测模型预测值；

图10为基于不同算法的下沉系数预测模型的预测值；

图11为基于不同算法的水平移动系数预测模型的预测值。

具体实施方式

以下结合附图对本发明的具体实施方式作出详细说明。

BP神经网络的预测精度与输入层的个数密切相关，输入层个数越多，需要更为庞大的网络，才能有效的逼近正确的结果，这一定程度上降低其预测精度，因此有必要降低样本的维数，平均影响值法(MIV方法)是基于BP神经网络建立的数据降维的方法，目前广泛应用于数据分析领域。所以本文采用MIV方法引入到模型中，对地质采矿条件进行筛选分析，以简化输入层，降低神经网络的复杂性，提高预测精度。

BP神经网络由输入层、隐含层、输出层组成^[11]，隐含层可以有一层或者多层，其拓扑结构如图1所示。

设3层BP神经网络的输入节点有m个，输出参数有n个，训练样本有N个，则输入和输出的关系可以表示成^[12]：

式中：f(x)＝1/(1+e^-x)；k＝1,2,…,n,t＝1,2,…,N；x_i为网络的输入；

为第k个输出节点的输出值；w_ij为输入层i节点到输出层j节点的权值；v_jk为隐含层j节点到输出层k节点的权值；θ_j为隐含层j节点处的阈值；r_k为输出k节点处的阈值；f为激活函数。

传统的BP神经网络采用的是误差按照梯度下降的学习算法，使得网络的实际输出值和期望输出值之间的误差最小。误差定义为：

其中,l为BP神经网络的输出层个数，y_k表示第k个节点的期望输出值，可以看出，神经网络可以分为2个阶段：1是输入信息从输入层经隐含层并计算出输出值(正向过程)，2是根据输出误差E逐层向前求出隐含层各单元的误差，并根据误差来修正权值和阈值(误差的反向传播过程)。

为降低神经网络的拓扑结构，提高模型的预测精度，本文建立的模型均为多输入层单输出层神经网络预测模型。

MIV是建立在BP神经网络基础之上的，MIV算法可用来定量评价各自变量对于因变量影响的重要性大小，其算法具体步骤如下：

(1)在神经网络训练终止后，将将训练单一自变量样本在原值的基础上增加和减少一定的比例(调节率)，形成两组新的样本P₁、P₂。本文取调节率为10％，即将原始样本增加增加和减少到原来的10％。(2)利用步骤1已训练好的网络训练新样本P₁、P₂,得到各自的预测输出数据T₁、T₂。(3)求两组预测数据T₁、T₂之间的差值，可得到变动该自变量对输出产生的影响变化值IV(Impact Value)。(4)将获取的样本值的IV按照观测样本数取平均，即可得到该自变量对因变量网络输出的MIV值。MIV算法流程简图如图2所示。

依据上述步骤依次求出每个自变量的MIV值。获取的MIV值有正负之分，其符号代表影响相关方向。本文对训练样本数据进行多次实验求取MIV值，为提高计算效率，选取每组的运算次数为50次，剔除每组值中的异常值，将每组中同一自变量的MIV值取绝对值后进行相加取平均。根据最后获取的MIV值的大小进行排序，即可实现变量的筛选。

粒子群算法(PSO)是一种仿照鸟群觅食的生物智能算法，其基本思想是：粒子群算法把每一个需要寻优问题假象成鸟，称为“粒子”，所有的粒子都在一个特定的空间进行搜索，且所有的粒子均有一个适应度函数来判断目前位置的好坏。PSO算法搜索速度快、效率高，算法简单，应用广泛。

假设在一个D维的目标搜索空间中，由N个粒子组成一个群落，其中第i个粒子位置表示成一个D维向量：

X_i＝(x_i1,x_i2,…,x_iD),i＝1,2,...,N (3)

第i个粒子的速度也是一个D维向量记为

V_i＝(v_i1,v_i2,…,v_iD),i＝1,2,...,N (4)

根据适应度函数计算得到的第i个粒子搜索到的最优位置为个体极值，极值记为：

p_best＝(p_i1,p_i2,…,p_iD),i＝1,2,...,N (5)

粒子群搜索到的全局最优位置为全局极值，可以记为：

g_best＝(p_g1,p_g2,…,p_gD) (6)

找到两个最优值时粒子可以根据式(3)和式(4)来更新每个粒子的速度和位置，

v_i+1＝ω*v_i+c₁r₁(pbest_i-x_i)+c₂r₂(gbest_i-x_i) (7)

x_i+1＝x_i+v_i+1 (8)

式中：c₁、c₂为加速因子，ω为惯性系数，r₁、r₂为[0,1]之间的随机数,v_i是粒子的速度向量，v_i,v_i+1分别为粒子的当前速度和更新后的速度，x_i,x_i+1分别为粒子的当前位置和更新后的位置，pbest_i为粒子的当前最优位置即个体极值，gbest_i为粒子群当前的最优位置即全局最优极值。通过上述不断的迭代过程，最后得到粒子群算法全局最优解gbest。

遗传算法(GA)是一种模拟自然界生物进化的“优胜劣汰，适者生存”的一种智能优化算法，具有良好的全局搜索能力，按照所选择的适应度函数并通过遗传中的选择,交叉和变异对个体进行筛选，使适应值好的个体被保留，适应度差的个体被淘汰，新的群体继承了上一代的信息，又优于上一代。这样反复循环，直至满足条件。遗传算法具有高效启发式搜索、并行计算等特点，目前已经应用在函数优化、组合优化以及生产调度等方面。

首先要根据待优化的问题设计一个适应度函数，然后对待优化问题按照一定的规则进行编码得到初始种群，本文选择的方法为实数编码，然后对种群进行评价以及遗传操作，这样经过不断进化，得到适应度最好的个体作为问题的最优解。主要的遗传操作介绍如下：

选择操作：选择操作即为从旧种群中以一定的概率选出优良个体组成新的种群，以繁殖得到下一代个体，常见的选择操作算法有轮盘赌法、锦标赛法等多种方法，本文选择的是轮盘赌法，其方法中个体i被选中的概率为

其中，E_i为个体i的适应度值；N为种群个体数目。

交叉操作：交叉操作时指从种群中随机选择两个个体，通过染色体的交换，把父代优秀特征遗传给子代，本文个体的编码采用实数编码，所以交叉操作采用实数交叉法，第k个染色体a_k和第l个染色体a_l在j位的交叉操作方法为

其中，b是[0,1]区间的随机数。

变异操作：变异操作是从种群中随机选取一个个体，选择个体中一点进行变异以产生更优秀的个体。第i个个体的第j个基因a_ij进行变异的操作方法为

其中，a_max是基因a_ij的上界；a_min是基因a_ij的下界；f(g)＝r₂(1-g/G_max)²

g是当前的迭代次数，G_max是最大进化次数，r为[0,1]区间的随机数。

GP算法优化BP神经网络的过程是以最小化BP神经网络对学习样本的输出误差为目的，来优化BP神经网络的权值和阈值参数。

需要将BP神经网络的结构参数编码成粒子群的个体信息：设BP神经网络的输入层、隐含层、输出层的神经元的个数分别为x、y、z,那么隐含层每个神经元则包括x个权值和1个阈值信息，输出层每个神经元包括y个权值和1个阈值信息，则BP神经网络共需要优化I＝(x+1)y+(y+1)z个参数，将所有待优化的参数表示成一个D维的向量，并将其作为粒子群个体的编码信息。

GP-BP算法流程图如图3所示，优化主要过程如下：

(1)初始化神经网络的拓扑结构,即根据所研究的问题设定BP神经网络的输入层、隐含层、输出层节点的个数；

(2)初始化种群，将需要待优化的权值和阈值信息根据特定的编码规则进行编码；并按照设定的种群规模和初始化方法初始化种群；

(3)GP算法的迭代运算，对步骤(2)得到的种群按照GP算法规则进行迭代运算，直至算法满足结束条件时，最终得到全局最优个体，解码得到权值和阈值信息；

(4)BP神经网络权值和阈值的初始化，将解码得到的权值和阈值信息带入到BP神经网络中，得到网络的初始权值和阈值；

(5)GP-BP神经网络的运算，对神经网络进行反复学习训练，直至满足结束条件，最终得到优化后的BP神经网络的输出。

本文将GA算法的遗传操作引用到PSO算法当中，在粒子群的迭代过程中对粒子的位置和速度向量分别进行交叉和变异操作，该算法首先由PSO进化一定的代数后，按照适应度由大到小进行排序，排序后的然后将种群分成两份，保留适应度值较大的M个粒子,去掉剩余的N-M个粒子，以保留的M个粒子为基准，选择复制得到N-M个个体，并进行交叉变异等遗传算法算子运算。最后将PSO保留的M个粒子的位置值与GA算法进化得到的N-M合成新的粒子群，进行下一代运算。

GP算法描述如下:

(1)算法中相关参数的设定，粒子的个数N,经过进化后的粒子个数M,变异概率P_m,交叉概率P_c,粒子群算法中粒子的最大速度V,惯性常数ω,学因子习c₁,c₂和迭代次数epoch,求解精度E等。

(2)种群的初始化，设置种群的规模N和粒子的维度n，采用实数随机编码，对粒子的速度和位置进行编码，利用适应度函数计算粒子群个体适应度值，更新粒子的个体极值和全局极值，本文选择的适应度函数为公式(2)

(3)粒子群的迭代，根据公式(7)公式(8)更新粒子的速度和位置信息，根据公式(2)计算每个粒子的适应度值，更新个体极值和种群的全局极值。

(4)将N个粒子按照适应度函数值的大小排序，选取其中适应度值较小的N/3个粒子，由保留的N/3个粒子的位置值选择复制生成2N/3个GA个体。

(5)GA个体按照公式(10)和公式(11)进行交叉和变异。

(6)将GA算法生成的2N/3个个体与N/3个粒子合并组成新的N个粒子，再计算粒子群的适应度，并更新个体极值和全局极值。

(7)算法结束的判断，判断粒子进化的迭代次数是否满足设定的最大进化代数，若是则算法结束，输出粒子群的全局极值，及待优化问题的最优解。

根据本发明的实施例，本发明结合实际实验数据验证本发明模型的可用性，具体来说，

本文选取了50个工作面作为实验数据，其中前40个工作面数据作为训练样本来训练模型，后10个工作面数据测试样本，用于检验模型的预测精度。部分数据见表1所示，本文选取的用概率积分法常见的参数有：下沉系数q,水平移动系数b,主要影响角正切tanb,拐点偏移距s(可以用s/H表示，H为开采深度)，开采影响传播角θ。

地质采矿条件因素有：上覆岩层的岩性f,煤层采深H,开采厚度M,煤层倾角T，采动程度n，松散层厚度W,重复采动X(初次采动采用0作为输入变量，重复采动采用1作为输入变量)。

表1数据对比分析表

本文基于MATLAB程序编制MIV算法程序，把MIV算法的调节率设置为10％，对每个概率积分法参数进行50次MIV测算实验，对每次实验取得的MIV值取绝对值后，进行加权平均，则每个概率积分法参数对应的影响因子的MIV值如表2和图5所示。图5中的(a)、(b)、(c)、(d)、(e)分别对应参数q、b、tanβ、θ以及s/H，具体如下表2所示。

表2不同影响因素对应MIV值

通过求取各个影响因素的MIV值，并由大到小对MIV值进行了排序，结果见表3。

表3各影响因素的MIV值排序结果

可以根据表3的排序结果，选取MIV值较大的前五个的影响因子作为BP神经网络的输入层，从而达到简化神经网络输入提高预测精度的目。

由于由于观测环境的复杂，实验数据的获取也有一定的误差，且数据波动范围大，数据自身的误差也会引入到BP神经网络中，进一步扩大误差，所以要在预测前可以对数据进行去噪处理，降低实验数据的误差。

本文采用Savitzky-Golay算法对数据进行去噪处理，Savitzky-Golay算法是在时域内基于局部多项式的最小二乘拟合的滤波方法，它的优点是在去噪的过程中，保证信号的宽度和形状不变，使数据变的相对平滑。处理后的结果与实测结果对比如图6所示，根据数据处理结果，可以算出去噪后的数据和实测数据的相关系数R,如表4所示，

表4去噪后的数据与实测数据之间的相关系数

地质因素	f	H	M	T	W	n
							R	0.6722	0.8018	0.547	0.761	0.7064	0.7487

由图3以及表4可知，平滑后的相关系数均在0.547以上，相关系数高，平滑后的实验数据上下浮动较小，且曲线更趋向于圆滑。平滑一些波动大的点，同时用平滑后的数值代替，从而达到降低误差的效果。

本文相关算法均基于MATLAB程序。为降低神经网络的复杂结构，本文对每个概率积分法参数分别进行建立神经网络，即多对一的拓扑结构(多输入层单输出层)。

BP神经网络中各参数设置为:训练次数设置为3000，学习率设置为0.01，训练目标误差设置为0.0001，神经网络采用3层结构如图1所示，本文根据公式J＝2m+1确定隐含层个数，其中m为输入层神经元的个数，选择sigmoid函数作为输入层和隐含层之间的传递函数，purelin函数为隐含层与输出层之间的传递函数。PSO算法相关参数为:粒子种群数为20，最大允许迭代次数为20，加速因子c₁，c₂均为1.49445，最大限制速度为5。GA算法中：种群数量为40，交叉概率为0.4，变异概率为0.06，最大迭代次数为50。

对表1提供前40个工作面的实测数据作为训练样本，41～50号工作面作为测试样本，为更好的验证本文提出的MIV-GP-BP神经网络预测模型，同时采用MIV-BP神经网络预测模型作为对照，结果如图7所示：

由图7中可以看出，GP组合算法优化后BP神经网络对地质采矿条件和概率积分法参数之间有着较好的泛化能力，优化后的BP神经网络预测精度在多数点上高于未优化的BP神经网络。

为定性的分析优化后的BP神经网络预测模型和未优化的BP神经网络模型的预测性能差异，计算MIV-GP-BP预测模型和MIV-BP预测模型的预测值的精度评价指标，本文以预测结果的最大相对误差((maximum relative error,MaxRE)、平均相对误差(meanrelative error,MeaRE)和均方根误差(root mean square error,RMSE)作为精度评价指标：

式中,x′_i为第i个预测值；x_i为第i个实测值；n为预测样本数。精度指标计算结果见表5所示，

表5预测模型的精度

表5和图7可以看出，MIV-GP-BP预测模型在5个概率积分法参数预测中MaxRE值和MeaRE值比MIV-BP预测模型小的多，由于RMSE能够有效地反映模型预测值与真实值之间的偏离程度，可知具有最小RMSE值的MIV-GP-BP模型预测值更逼近真值。

考虑到部分预计参数值本身很小，微小的变化都会造成相对误差变化较大，但是其绝对误差较小，所以其精度还是很高的，可以满足工程需要.

为验证MIV算法的正确性，从影响因素中随机抽取5个因素作为神经网络的输入层建立GP-BP预测模型，然后与MIV算法筛选的5个因素作为神经网络的输入层建立的MIV-GP-BP预测模型进行预测对比，(5个随机因素中至少包含一个MIV算法未筛选的因素)，本文共随机抽取3组地质采矿因素。本文选取其中下沉系数预测模型和水平移动系数预测模型作为案例进行分析，分组方案如表6所示：

表6随机抽取输入层因素方案

对上述8组不同的输入因素组合，采用表1所示的数据分别建立GP-BP预测模型，预测结果如表7,表8，图8，图9所示：

表7基于不同输入层的下沉系数预测模型的精度指标

表8基于不同输入层的水平移动系数预测模型精度指标对比

从图8、图9中4组预测值和表7、表8所示的预测精度指标可知，在5个参数中，各参数的平均相对误差、最大相对误差和均方根误差均有不同程度的改善。MIV算法简化了输入层，降低神经网络的复杂性，提高预测精度。从而证明了MIV算法的可行性。

为验证本文建立的GP算法具有更好的运算性能，同时建立GA算法和PSO算法分别优化BP神经网络的预测模型(MIV-GA-BP预测模型和MIV-PSO-BP预测模型),其中输入层数据均来自MIV算法筛选获得(输入层数据相同)，训练数据和测试数据来源于表1。相关算法参数设置和上文所述相同，本文只建立下沉系数预测模型和水平移动系数模型的神经网络预测模型，其他模型预测结果类似。为了能更加直观地分析结果可靠性,根据以上模型对训练集、测试集进行预测对比分析，结果见图表9，表10，图7图8所示。

表9基于不同算法的下沉系数预测模型的精度指标

表10基于不同算法的水平移动系数预测模型的精度指标

从表7，表8，表9，表10，图7，图8所示的预测值和预测精度指标可知，采用MIV-GP-BP神经网络预测模型的进行预测的精度指标均优于MIV-GA-BP预测模型和PSO-BP预测模型，验证了GP-BP神经网络预测概率积分法参数具有较好的精度,预测性能优于GA-BP模型和PSO-BP预测模型，能满足工程技术的实际要求。

概率积分法参数的获取是煤矿地表变形监测数据处理中的一个热点和难点。针对传统BP神经网络预测概率积分法参数精度不高的问题，本文提出一种MIV-GP-BP预测模型。本模型综合采用了MIV算法和GP组合算法来优化BP神经网络，主要结论如下：

(1)以50个典型矿区的实测资料为例，同时采用去噪处理和MIV算法优化BP神经网络的输入。采用MIV算法对影响概率积分法参数的地质采矿因素进行排序，剔除影响因子较小的因素后作为BP神经网络的输入；采用平滑去噪的方式，剔除实测数据中可能含有的偶然误差，代替原有的输入层。通过分析预测精度得到了提升。

(2)采用粒子群算法和遗传算法的组合算法来优化BP神经网络的权值和阈值，并基于MIV算法降低神经网络的拓扑结构，建立MIV-GP-BP概率积分法预测模型，预测结果表明：在5个参数中，均方根误差均在0.0058～1.1575之间，q、tanβ、b、θ的最大相对误差不超过5.42％，平均相对中误差低于2.81％，s/H相对误差不超过9.66％，平均相对中误差低于4.31％，相对于BP模型、MIV-BP模型、MIV-GA模型、MIV-PSO模型精度得到一定程度提升。

最后应说明的是，以上实施方式仅用以说明本发明实施例的技术方案而非限制，尽管参照以上较佳实施方式对本发明实施例进行了详细说明，本领域的普通技术人员应当理解，可以对本发明实施例的技术方案进行修改或等同替换都不应脱离本发明实施例的技术方案的精神和范围。