CN113988220A

CN113988220A - 一种采煤机健康状态评估方法

Info

Publication number: CN113988220A
Application number: CN202111416994.1A
Authority: CN
Inventors: 曹现刚; 段雍; 赵友军; 吴可昕; 赵江滨; 王岩; 许欣; 叶煜; 明淞; 杨鑫
Original assignee: Xian University of Science and Technology
Current assignee: Xian University of Science and Technology
Priority date: 2021-11-25
Filing date: 2021-11-25
Publication date: 2022-01-28

Abstract

本发明提供一种采煤机健康状态评估方法，包括以下步骤：对采集的采煤机状态数据中各个监测参数间进行综合相关系数计算，将低于预设阈值的监测参数作为参与评估的指标；分别根据层次分析法与熵权法获得各个指标的静态权重向量，通过变权公式得到动态权重向量，并结合灰色聚类得出评估向量Q；将待评估监测参数数据输入到训练好的XGBoost模型，获得XGBoost模型采煤机状态的评估概率向量R；将评估向量Q和评估概率向量R进行加权融合，得到综合评估向量QR；根据综合评估向量QR获得每种采煤机状态对应的概率大小。该方法在评估过程中考虑了采煤机工况因素及运行数据的影响，将经验模型及人工智能模型相结合，相互弱化了两种算法的使用限制，增强了评估结果的合理性。

Description

一种采煤机健康状态评估方法

技术领域

本发明涉及设备维护技术领域，具体涉及一种采煤机健康状态评估方法。

背景技术

煤矿智能化是煤炭综合机械化发展的新阶段，其中煤炭智能化开采是煤矿智能化发展的关键一步。采煤机作为煤炭开采的核心设备，其工作的可靠性和安全性是综采工作正常进行、保障煤炭生产安全、提升煤炭企业经济效益的重要前提。采煤机工作环境复杂多变，重负荷运行、频繁启动、可操作空间狭窄等恶劣因素导致其状态监测困难、故障发生频繁。因此，紧密结合煤炭开采工况，开展采煤机状态的主动感知、研究采煤机数据处理、指标分析、健康状态评估等方法，是实现采煤机全生命周期跟踪健康管理与服务的重要手段，是实现煤炭安全、高效、绿色、智能开采的基本保证。

现有的采煤机健康状态评估方面主要存在以下4个问题：(1)采煤机异常数据检测难度高，评估指标选择不够合理。(2)基于经验的评估算法如层次分析法、模糊综合评判等受采煤机自身结构及工况条件影响，评估过程不可避免会有人为干预，同时评估指标构建、指标权重分配、健康状态等级划分等相关研究仍然不足。(3)常见的人工智能评估方法如支持向量机在解决多分类问题时存在困难，深度学习及神经网络等模型容易受到样本数据的限制，评估模型及结果难以有合理的解释、模型泛化能力差。(4)单独从经验模型或人工智能评估模型出发建立的评估模型难以兼顾采煤机工况因素及运行数据的影响，评估结果难以符合实际工况。经验模型考虑了大量的评估因素，但对于采煤机运行数据提供的信息深入研究不够，智能评估模型对采煤机运行数据所表达的深层含义进行了分析，但难以考虑实际经验及评估因素的影响。

为此，本发明提出了一种新的采煤机健康状态评估方法。

发明内容

为解决上述问题，本发明针对单一评估算法的局限性，提出一种融合变权模糊综合评判及XGBoost的采煤机健康状态评估方法，将VW-FCE及XGBoost两种方法结果进行融合，从多模型评估结果中得到最终结果。该方法在评估过程中考虑了采煤机工况因素及运行数据的影响，将经验模型及人工智能模型相结合，相互弱化了两种算法的使用限制，增强了评估结果的合理性。

为实现上述目的，本发明提供了如下的技术方案。

一种采煤机健康状态评估方法，包括以下步骤：

对采集的采煤机状态数据中各个监测参数间进行综合相关系数计算，将低于预设阈值的监测参数作为参与评估的指标；

分别根据层次分析法与熵权法获得各个指标的静态权重向量，将静态权重向量通过变权公式得到动态权重向量，将动态权重向量结合灰色聚类得出评估向量Q；

将待评估监测参数数据输入到训练好的XGBoost模型，计算采煤机每种状态对应的叶子节点分值，获得XGBoost模型采煤机状态的评估概率向量R；

将评估向量Q和评估概率向量R进行加权融合，得到综合评估向量QR；

根据综合评估向量QR获得每种采煤机状态对应的概率大小，并根据最大隶属度得出采煤机状态结果。

优选地，还包括：通过孤立森林算法对采集的采煤机状态数据进行异常数据检测，并进行异常数据剔除。

优选地，所述对采集的采煤机状态数据中各个监测参数间进行综合相关系数计算，包括以下步骤：

对采煤机的各个监测参数分别通过皮尔逊相关系数、斯皮尔曼相关系数和余弦距离进行相关性分析：

式中：ρ_p，ρ_s，ρ_c分别为参数间皮尔逊相关系数、斯皮尔曼相关系数、余弦距离；X，Y为样本向量，Cov(X,Y)为X与Y的协方差，Var(X)和Var(Y)代为X和Y的方差；a为样本数，N为样本总数，d_a表示两个变量分别排序后成对的变量位置差；

综合相关系数ρ_co为：

ρ_co＝α₁×ρ_s+α₂×ρ_p+α₃×ρ_c

式中，α₁，α₂，α₃为权重且α₁+α₂+α₃＝1；其中，三种相关系数具有同等重要性，即α₁＝α₂＝α₃＝1/3；

当综合相关系数大于或等于阈值TH时参数密切相关，小于阈值TH时参数不具有密切相关性；

根据相关系数ρ_co的计算结果，筛选出综合相关系数低于TH的监测参数，完成评估指标构建。

优选地，所述将静态权重向量通过变权公式得到动态权重向量，包括以下步骤：

确定参与评估的指标数m；

根据层次分析法与熵权法分别获得第j个指标权重向量u_j、v_j，将两种权重向量进行组合，得到第j个指标组合权重为：

获得组合权重向量为：

w＝(w₁,w₂,...,w_m)

确定变权公式为：

式中：

为第j个指标的变权系数，w_j为组合权重系数，x_j为第j个指标运行参数；

在变权公式中引入均衡函数，均衡函数为：

将均衡函数带入变权公式，则：

式中：ω_j为引入均衡函数后第j个指标的变权系数；根据引入均衡函数的变权公式，得到最终变权权重即动态权重向量为：

ω＝[ω₁,ω₂,...,ω_m]

其中，α为0.5。

优选地，所述将动态权重向量结合灰色聚类得出评估向量Q，包括以下步骤：

通过中心点型的三角白化权函数对采煤机进行健康状态评估，获得m个参与评估的指标，则其隶属度为：

式中：s为灰类个数，λ_t为第t个灰类的中心，x_j为某个指标的监测值；

获得x_j对s个灰类的符合度向量为：

计算所有指标的监测值对s个灰类的符合度向量，得到符合度矩阵为

F＝[F₁,F₂,...,F_m]

构造对s个灰类的符合度矩阵F，根据动态权重向量，得采煤机各状态的评估向量为：

Q^T＝Fω^T。

优选地，所述XGBoost模型采煤机状态的评估概率向量R的获取，包括以下步骤：

构建采煤机各状态下的监测参数的样本数据，采用XGBoost模型对样本数据进行训练；

将待评估监测参数数据输入到训练好的XGBoost模型，计算采煤机每种状态对应的叶子节点分值；

将每棵树下得到的某种状态的分值P相加，得到待评估样本对应各状态的总分值S_O为：

式中：k为树的个数，O为状态等级，P(O)_k为每棵树中不同状态对应的分值，则有评分矩阵S：

S＝[S₁,S₂,...,S_s]

对每个分值求sigmoid，获得每个状态对应的评估概率，最终得到XGBoost概率向量即评估概率向量R：

R＝[R₁,R₂,...,R_s]

式中：s为采煤机健康状态等级，R₁,R₂,...,R_s为该样本下评估结果，即为各状态的概率。

优选地，所述综合评估向量QR的获取，包括以下步骤：

将评估向量Q和评估概率向量R进行加权融合最终综合评估向量QR：

QR＝[QR₁,QR₂,...,QR_s]

其中

QR_O＝(β₁Q_O+β₂R_O)(O＝1,2,...,s)

式中：QR_O为各状态的综合评估概率，β₁,β₂分别表示两种算法概率权重；其中，β₁,β₂取0.5。

本发明有益效果：

(1)本方法采用孤立森林算法完成了采煤机异常数据的检测，可有效解决采煤机异常数据检测难度高的问题。

(2)本方法提出一种监测参数综合相关系数计算方法，完成了采煤机评价指标的构建，可解决采煤机评估指标选择不够合理的问题。

(3)本方法提出的变权模糊综合评判可以对指标权重分配、算法模型的建立及评价结果做出更好的解释，在主观因素和客观因素相结合下，当训练数据缺失时模型更具有适用性。

(4)针对采煤机工况因素及运行数据的影响，结合变权模糊综合评判法和XGBoost算法优点，将二者评估向量进行加权融合，得到综合评估向量，从经验模型及人工智能模型多模型评估结果中得到最终结果。该方法相互弱化了两种算法的使用限制，增强了评估结果的合理性。

附图说明

图1是本发明实施例的基于变权模糊综合评判及XGBoost方法评估流程图；

图2是本发明实施例的孤立森林异常数据检测结果图；

图3是本发明实施例的相关系数热力图；

图4是本发明实施例的指标动态权重变化曲线图；

图5是本发明实施例的不同参数模型评估准确度的关系图；

图6是本发明实施例的评估结果混淆矩阵；

图7是本发明实施例的采煤机健康状态变化曲线图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

实施例1

本发明提出一种采煤机健康状态评估方法，方法流程图如图1所示，具体包括以下步骤：

S1：通过孤立森林算法对采集的采煤机状态数据进行异常数据检测，并进行异常数据剔除。孤立森林算法专门适用于高维数据集，对全局异常点，突变性强、不确定性大的数据具有很好的检测精度。

S2：对采集的采煤机状态数据中各个监测参数间进行综合相关系数计算，将低于预设阈值的监测参数作为参与评估的指标。

具体的：

综合相关系数ρ_co为：

ρ_co＝α₁×ρ_s+α₂×ρ_p+α₃×ρ_c

S3：分别根据层次分析法与熵权法获得各个指标的静态权重向量，将静态权重向量通过变权公式得到动态权重向量，将动态权重向量结合灰色聚类得出评估向量Q。

S3.1：动态权重向量的获取：

确定参与评估的指标数m；

获得组合权重向量为：

w＝(w₁,w₂,...,w_m)

确定变权公式为：

式中：

在变权公式中引入均衡函数，均衡函数为：

将均衡函数带入变权公式，则：

ω＝[ω₁,ω₂,...,ω_m]

其中，α为0.5。

S3.2：评估向量Q的获取：

获得x_j对s个灰类的符合度向量为：

F＝[F₁,F₂,...,F_m]

Q^T＝Fω^T。

S4：将待评估监测参数数据输入到训练好的XGBoost模型，计算采煤机每种状态对应的叶子节点分值，获得XGBoost模型采煤机状态的评估概率向量R。

S4.1：预测模型构建：

XGBoost的预测模型为

式中：x_i为第i个样本的特征，f_k(x_i)为第k棵树预测值，

为模型的预测值。XGBoost算法从第1棵树开始按顺序优化，最后直到第K棵树完成优化。对于给定的x_i，则有模型初始化：

往模型中加入第K棵树：

XGBoost的目标函数由衡量训练误差的损失函数和控制复杂度的正则化项两部分组成，公式为：

式中：

为损失函数，用于衡量真实值和模型预测值之间的误差，在分类模型中常用的损失函数是均方误差MSE；而Ω是正则化项，用于控制模型的复杂度防止模型过拟合，Ω(f_k)代表第k棵树的复杂度，c为常数项。

将损失函数按照泰勒级数展开获取近似目标函数，常数项c可忽略不计。

式中：g_i为损失函数

的一阶导数，h_i表示

的二阶导数，其中：

在XGBoost分类模型中复杂度主要由叶子节点的个数和相应节点权重的平滑程度决定。

式中：γ和

均为人工设置参数，T是叶子节点数，P是每个叶子的权重即叶子节点分数，

是对于P权值参数的正则化惩罚项。

用I_r表示第r个叶子里的样本集合，设：

求得最优的叶子节点权重

和目标函数obj^*为：

S4.2：评估概率向量R的获取：

S＝[S₁,S₂,...,S_s]

R＝[R₁,R₂,...,R_s]

S5：将评估向量Q和评估概率向量R进行加权融合，得到综合评估向量QR。

具体的：

QR＝[QR₁,QR₂,...,QR_s]

其中

QR_O＝(β₁Q_O+β₂R_O)(O＝1,2,...,s)

S6：根据综合评估向量QR获得每种采煤机状态对应的概率大小，并根据最大隶属度得出采煤机状态结果。

实施例1：

1.1异常点检测

选取工况条件下测得的采煤机2个主要运行参数，主变频器电流、主变频器温度为例，采用孤立森林算法对采煤机参数异常值进行检测。2个参数的2000组测量数据，其中异常数据共50组，主要由采煤机起停、突变等异常信号组成。

根据孤立森林算法要求确定算法参数，设置样本数量n_samples＝2000，树的个数n_estimators为100；数据集的离群值分数outliers_fraction为0.025；数据集的异常值比例contamination为0.025。检测结果如图2所示。

图中，孤立森林将正常点划为高密度群体，异常点散落在高密度区域外部空间，通过将异常点进行孤立得到较高的检测精度。与常用的DBScan聚类、局部异常因子算法(LOF)两种基于密度的异常值剔除算法对比，结果如表1。

表1采煤机异常数据检测算法对比

由表1可知，孤立森林算法对采煤机异常数据识别精度更高、识别时间更短。

1.2评价指标构建

以复杂地质条件下生产运行采煤机监测数据为例，对采煤机监测参数相关性进行分析。结合实际工况确定采煤机主要监测参数如表2。

表2采煤机主要监测参数

选取采煤机3个月监测数据，考虑采煤机停机、突发情况等因素，提取可表征采煤机运行状态的2000个时刻点的数据，形成18×2000维的数据集。计算综合相关系数，得到相关系数热力图如图3所示。

由图3知，采煤机主变频器4个参数与从变频器4个参数密切相关，牵引电机温度与右截割电机温度密切相关，同时泵电机温度与左、右截割电机温度密切相关性。设阈值TH为0.9，根据综合相关系数筛选出相关系数低于0.9的监测指标，得到采煤机最终评估指标，结果如表3。

表3采煤机评估指标选取

2.1评估方法训练与实现

样本数据集建立

对工况下采煤机监测参数进行相关性分析，最终得到12维指标参与采煤机健康评估，结果如表3。依据确定的评估指标及部分实际监测数据，基于威布尔分布，得到采煤机运行状态仿真数据共2000条，其中训练数据1000条，健康、良好、一般、劣化、故障数据分别为300、380、250，50，20条；测试数据1000条，健康、良好、一般、劣化、故障数据分别为300、380、250，50，20条。

模型训练及验证

(1)变权模糊综合评判

根据层次分析法，由人工对采煤机12维评价指标(表3)进行两两比较并打分，确定判别矩阵，根据判断矩阵得出主观权重，并完成矩阵一致性检验。根据熵权法，基于训练数据，通过每个指标的信息熵得到客观权重。将主观权重与客观权重进行组合，得到组合权重即静态权重向量如表4。

表4采煤机指标权重向量

进而得到采煤机指标权重系数随监测时间变化规律，结果如图4所示。

由图7知，采煤机正常工作时，指标权重较为稳定，随着采煤机健康状况劣化，各指标权重均呈现不同的变化，在采煤机出现初步故障时，一些原有次要指标(如泵电机温度)占有权重逐步变大，逐步成为较为重要的指标。因此，动态权重比静态权重系数更能准确地反映采煤机各指标真实的运行状态。

根据前期研究及专家经验，将采煤机健康状态分为O＝{1，2，3，4，5}＝{健康，良好，一般，劣化，故障}，确定对应白化权函数范围，健康状态等级与对应白化权函数见表5。

表5健康状态等级与对应白化权函数

基于变权模糊综合评判法对采煤机健康状态进行评估，结果如表6。

表6变权模糊综合评判评估结果

根据结果统计可得，运用该方法对采煤机进行健康状态评估，总体评估准确率为92.4％。

(2)XGBoost实现

基于XGBoost算法，将经过处理后的采煤机数据作为特征量输入，采煤机的五种健康状态作为分类输出结果。设置XGBoost收缩步长eta为0.1，随机采样比例subsample为0.2，随机列数比例colsample_bytree为1，最小损失函数下降值gamma为0，分类类别数num_class为5。设置初始最小叶子节点权重和min_child_weight为5。选取最大树的深度max_depth为1、2、4、6，设置1、3、5、7、9为min_child_weight值进行模型训练，得到各参数与评估准确度之间的关系如图5的a、b、c、d。

由图5可知，模型max_depth为2时，比max_depth为1，4，6时更稳定，评估准确率更高；由图5(b)可知随着num_boost_round增大，模型min_child_weight不同，评估准确度变化也不同，当min_child_weight增大时，模型准确度均呈现先增大后减小或平缓的趋势，当min_child_weight＝7，num_boost_round＝80时，模型平均准确度最高。

以最优参数模型对采煤机健康状态进行评估，评估结果如表7。对健康、良好、一般、劣化、故障5种状态评估结果进行统计，如图6所示。

表7 XGBoost评估结果

由图6可知，基于XGBoost的采煤机状态评估模型对于样本分布不均的数据仍有较高的识别准确度，对于劣化、故障样本不足的情况下仍然具有一定的评估准确度，总体评估准确率为97.8％。

(3)VW-FCE-XGBoost评估模型验证

运用VW-FCE、XGBoost、VW-FCE-XGBoost三种方法计算每时刻下采煤机健康状态评估向量，得到采煤机运行时健康状态变化曲线如图7所示。

由图7可得，三种方法均可以较为准确的评估设备健康状态，同时可看出健康状态处于两种状态交替时(图中圈)为评估的难点。VW-FCE法在两种状态的概率值相同(交叉点处)表现了较好的模糊性，但难以对该时刻的状态做出明确判断，并且得到的结果可靠性不高。XGBoost在两状态交替期间及时做出了判断，但是忽略了过渡期间的健康状态变化，判断太过于绝对。从VW-FCE-XGBoost可看出，运用两种方法的综合结果，可以准确的对该时刻的状态做出判断，又能一定程度上表达健康状态的过渡过程，得到的结果更具有可解释性。

采用VW-FCE-XGBoost对采煤机健康状态进行评估，该方法对采煤机健康、良好、一般、劣化、故障5种健康状态的评估正确率分别为100％、98.7％、99.2％、100％、80％，模型总体评估准确度为98.9％。相比于变权模糊综合评判、XGBoost两种方法，VW-FCE-XGBoost模型评估准确度提高了6.5％及1.1％。

实施例2：

以某矿生产运行的MG400/930-WD型号采煤机为例，采煤机采用单电缆供电，电源电压为3300伏，总体结构为多电机横向布置，牵引方式为机载式交流变频调速-销轨式无链牵引。

选取采煤机3个月运行监测数据，基于孤立森林及综合相关系数对实验数据进行异常值剔除及指标相关性分析，确定评估指标如表3。采煤机退化趋势复杂，故障多为突变故障及偶然性故障，健康、故障数据界定不明显导致评估结果难以符合实际工况，同时判定故障、劣化标准不同也会导致评估结果的差异。对采煤机数据进行处理及分析，并结合采煤机点检记录，最终将采煤机健康状态划分为O＝{1，2，3}＝{健康，其它，故障}三种状态，得到训练、测试数据各1000条，健康、其它、故障数据比例为16：3：1。基于VW-FCE-XGBoost得到采煤机健康状态评估结果如表8。

表8采煤机健康状态评估结果

由表8可知，基于VW-FCE-XGBoost的采煤机健康状态评估方法对采煤机健康、其它、故障3种状态评估正确率分别为92.9％、83.3％、90.0％。实验中，各健康数据特征大致相同；故障数据特征具有多样性，但由于条件有限，本文选取故障数据较为单一；其它数据具有高度不确定性包含单指标劣化、多指标劣化、开停信号、待机信号等多种数据特征，因此，该类数据评估准确度最差。综上可得，实验所得结果满足真实情况，具有一定的准确性。

以上仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。