CN113988220A - 一种采煤机健康状态评估方法 - Google Patents

一种采煤机健康状态评估方法 Download PDF

Info

Publication number
CN113988220A
CN113988220A CN202111416994.1A CN202111416994A CN113988220A CN 113988220 A CN113988220 A CN 113988220A CN 202111416994 A CN202111416994 A CN 202111416994A CN 113988220 A CN113988220 A CN 113988220A
Authority
CN
China
Prior art keywords
evaluation
coal mining
mining machine
vector
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111416994.1A
Other languages
English (en)
Inventor
曹现刚
段雍
赵友军
吴可昕
赵江滨
王岩
许欣
叶煜
明淞
杨鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian University of Science and Technology
Original Assignee
Xian University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian University of Science and Technology filed Critical Xian University of Science and Technology
Priority to CN202111416994.1A priority Critical patent/CN113988220A/zh
Publication of CN113988220A publication Critical patent/CN113988220A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/02Computing arrangements based on specific mathematical models using fuzzy logic
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • General Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Analysis (AREA)
  • Automation & Control Theory (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • Molecular Biology (AREA)
  • Animal Husbandry (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Agronomy & Crop Science (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)

Abstract

本发明提供一种采煤机健康状态评估方法,包括以下步骤:对采集的采煤机状态数据中各个监测参数间进行综合相关系数计算,将低于预设阈值的监测参数作为参与评估的指标;分别根据层次分析法与熵权法获得各个指标的静态权重向量,通过变权公式得到动态权重向量,并结合灰色聚类得出评估向量Q;将待评估监测参数数据输入到训练好的XGBoost模型,获得XGBoost模型采煤机状态的评估概率向量R;将评估向量Q和评估概率向量R进行加权融合,得到综合评估向量QR;根据综合评估向量QR获得每种采煤机状态对应的概率大小。该方法在评估过程中考虑了采煤机工况因素及运行数据的影响,将经验模型及人工智能模型相结合,相互弱化了两种算法的使用限制,增强了评估结果的合理性。

Description

一种采煤机健康状态评估方法
技术领域
本发明涉及设备维护技术领域,具体涉及一种采煤机健康状态评估方法。
背景技术
煤矿智能化是煤炭综合机械化发展的新阶段,其中煤炭智能化开采是煤矿智能化发展的关键一步。采煤机作为煤炭开采的核心设备,其工作的可靠性和安全性是综采工作正常进行、保障煤炭生产安全、提升煤炭企业经济效益的重要前提。采煤机工作环境复杂多变,重负荷运行、频繁启动、可操作空间狭窄等恶劣因素导致其状态监测困难、故障发生频繁。因此,紧密结合煤炭开采工况,开展采煤机状态的主动感知、研究采煤机数据处理、指标分析、健康状态评估等方法,是实现采煤机全生命周期跟踪健康管理与服务的重要手段,是实现煤炭安全、高效、绿色、智能开采的基本保证。
现有的采煤机健康状态评估方面主要存在以下4个问题:(1)采煤机异常数据检测难度高,评估指标选择不够合理。(2)基于经验的评估算法如层次分析法、模糊综合评判等受采煤机自身结构及工况条件影响,评估过程不可避免会有人为干预,同时评估指标构建、指标权重分配、健康状态等级划分等相关研究仍然不足。(3)常见的人工智能评估方法如支持向量机在解决多分类问题时存在困难,深度学习及神经网络等模型容易受到样本数据的限制,评估模型及结果难以有合理的解释、模型泛化能力差。(4)单独从经验模型或人工智能评估模型出发建立的评估模型难以兼顾采煤机工况因素及运行数据的影响,评估结果难以符合实际工况。经验模型考虑了大量的评估因素,但对于采煤机运行数据提供的信息深入研究不够,智能评估模型对采煤机运行数据所表达的深层含义进行了分析,但难以考虑实际经验及评估因素的影响。
为此,本发明提出了一种新的采煤机健康状态评估方法。
发明内容
为解决上述问题,本发明针对单一评估算法的局限性,提出一种融合变权模糊综合评判及XGBoost的采煤机健康状态评估方法,将VW-FCE及XGBoost两种方法结果进行融合,从多模型评估结果中得到最终结果。该方法在评估过程中考虑了采煤机工况因素及运行数据的影响,将经验模型及人工智能模型相结合,相互弱化了两种算法的使用限制,增强了评估结果的合理性。
为实现上述目的,本发明提供了如下的技术方案。
一种采煤机健康状态评估方法,包括以下步骤:
对采集的采煤机状态数据中各个监测参数间进行综合相关系数计算,将低于预设阈值的监测参数作为参与评估的指标;
分别根据层次分析法与熵权法获得各个指标的静态权重向量,将静态权重向量通过变权公式得到动态权重向量,将动态权重向量结合灰色聚类得出评估向量Q;
将待评估监测参数数据输入到训练好的XGBoost模型,计算采煤机每种状态对应的叶子节点分值,获得XGBoost模型采煤机状态的评估概率向量R;
将评估向量Q和评估概率向量R进行加权融合,得到综合评估向量QR;
根据综合评估向量QR获得每种采煤机状态对应的概率大小,并根据最大隶属度得出采煤机状态结果。
优选地,还包括:通过孤立森林算法对采集的采煤机状态数据进行异常数据检测,并进行异常数据剔除。
优选地,所述对采集的采煤机状态数据中各个监测参数间进行综合相关系数计算,包括以下步骤:
对采煤机的各个监测参数分别通过皮尔逊相关系数、斯皮尔曼相关系数和余弦距离进行相关性分析:
Figure BDA0003375627550000031
Figure BDA0003375627550000032
Figure BDA0003375627550000033
式中:ρp,ρs,ρc分别为参数间皮尔逊相关系数、斯皮尔曼相关系数、余弦距离;X,Y为样本向量,Cov(X,Y)为X与Y的协方差,Var(X)和Var(Y)代为X和Y的方差;a为样本数,N为样本总数,da表示两个变量分别排序后成对的变量位置差;
综合相关系数ρco为:
ρco=α1×ρs2×ρp3×ρc
式中,α1,α2,α3为权重且α123=1;其中,三种相关系数具有同等重要性,即α1=α2=α3=1/3;
当综合相关系数大于或等于阈值TH时参数密切相关,小于阈值TH时参数不具有密切相关性;
根据相关系数ρco的计算结果,筛选出综合相关系数低于TH的监测参数,完成评估指标构建。
优选地,所述将静态权重向量通过变权公式得到动态权重向量,包括以下步骤:
确定参与评估的指标数m;
根据层次分析法与熵权法分别获得第j个指标权重向量uj、vj,将两种权重向量进行组合,得到第j个指标组合权重为:
Figure BDA0003375627550000041
获得组合权重向量为:
w=(w1,w2,...,wm)
确定变权公式为:
Figure BDA0003375627550000042
式中:
Figure BDA0003375627550000043
为第j个指标的变权系数,wj为组合权重系数,xj为第j个指标运行参数;
在变权公式中引入均衡函数,均衡函数为:
Figure BDA0003375627550000044
将均衡函数带入变权公式,则:
Figure BDA0003375627550000045
式中:ωj为引入均衡函数后第j个指标的变权系数;根据引入均衡函数的变权公式,得到最终变权权重即动态权重向量为:
ω=[ω12,...,ωm]
其中,α为0.5。
优选地,所述将动态权重向量结合灰色聚类得出评估向量Q,包括以下步骤:
通过中心点型的三角白化权函数对采煤机进行健康状态评估,获得m个参与评估的指标,则其隶属度为:
Figure BDA0003375627550000046
式中:s为灰类个数,λt为第t个灰类的中心,xj为某个指标的监测值;
获得xj对s个灰类的符合度向量为:
Figure BDA0003375627550000051
计算所有指标的监测值对s个灰类的符合度向量,得到符合度矩阵为
F=[F1,F2,...,Fm]
构造对s个灰类的符合度矩阵F,根据动态权重向量,得采煤机各状态的评估向量为:
QT=FωT
优选地,所述XGBoost模型采煤机状态的评估概率向量R的获取,包括以下步骤:
构建采煤机各状态下的监测参数的样本数据,采用XGBoost模型对样本数据进行训练;
将待评估监测参数数据输入到训练好的XGBoost模型,计算采煤机每种状态对应的叶子节点分值;
将每棵树下得到的某种状态的分值P相加,得到待评估样本对应各状态的总分值SO为:
Figure BDA0003375627550000052
式中:k为树的个数,O为状态等级,P(O)k为每棵树中不同状态对应的分值,则有评分矩阵S:
S=[S1,S2,...,Ss]
对每个分值求sigmoid,获得每个状态对应的评估概率,最终得到XGBoost概率向量即评估概率向量R:
R=[R1,R2,...,Rs]
式中:s为采煤机健康状态等级,R1,R2,...,Rs为该样本下评估结果,即为各状态的概率。
优选地,所述综合评估向量QR的获取,包括以下步骤:
将评估向量Q和评估概率向量R进行加权融合最终综合评估向量QR:
QR=[QR1,QR2,...,QRs]
其中
QRO=(β1QO2RO)(O=1,2,...,s)
式中:QRO为各状态的综合评估概率,β12分别表示两种算法概率权重;其中,β12取0.5。
本发明有益效果:
(1)本方法采用孤立森林算法完成了采煤机异常数据的检测,可有效解决采煤机异常数据检测难度高的问题。
(2)本方法提出一种监测参数综合相关系数计算方法,完成了采煤机评价指标的构建,可解决采煤机评估指标选择不够合理的问题。
(3)本方法提出的变权模糊综合评判可以对指标权重分配、算法模型的建立及评价结果做出更好的解释,在主观因素和客观因素相结合下,当训练数据缺失时模型更具有适用性。
(4)针对采煤机工况因素及运行数据的影响,结合变权模糊综合评判法和XGBoost算法优点,将二者评估向量进行加权融合,得到综合评估向量,从经验模型及人工智能模型多模型评估结果中得到最终结果。该方法相互弱化了两种算法的使用限制,增强了评估结果的合理性。
附图说明
图1是本发明实施例的基于变权模糊综合评判及XGBoost方法评估流程图;
图2是本发明实施例的孤立森林异常数据检测结果图;
图3是本发明实施例的相关系数热力图;
图4是本发明实施例的指标动态权重变化曲线图;
图5是本发明实施例的不同参数模型评估准确度的关系图;
图6是本发明实施例的评估结果混淆矩阵;
图7是本发明实施例的采煤机健康状态变化曲线图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例1
本发明提出一种采煤机健康状态评估方法,方法流程图如图1所示,具体包括以下步骤:
S1:通过孤立森林算法对采集的采煤机状态数据进行异常数据检测,并进行异常数据剔除。孤立森林算法专门适用于高维数据集,对全局异常点,突变性强、不确定性大的数据具有很好的检测精度。
S2:对采集的采煤机状态数据中各个监测参数间进行综合相关系数计算,将低于预设阈值的监测参数作为参与评估的指标。
具体的:
对采煤机的各个监测参数分别通过皮尔逊相关系数、斯皮尔曼相关系数和余弦距离进行相关性分析:
Figure BDA0003375627550000071
Figure BDA0003375627550000072
Figure BDA0003375627550000073
式中:ρp,ρs,ρc分别为参数间皮尔逊相关系数、斯皮尔曼相关系数、余弦距离;X,Y为样本向量,Cov(X,Y)为X与Y的协方差,Var(X)和Var(Y)代为X和Y的方差;a为样本数,N为样本总数,da表示两个变量分别排序后成对的变量位置差;
综合相关系数ρco为:
ρco=α1×ρs2×ρp3×ρc
式中,α1,α2,α3为权重且α123=1;其中,三种相关系数具有同等重要性,即α1=α2=α3=1/3;
当综合相关系数大于或等于阈值TH时参数密切相关,小于阈值TH时参数不具有密切相关性;
根据相关系数ρco的计算结果,筛选出综合相关系数低于TH的监测参数,完成评估指标构建。
S3:分别根据层次分析法与熵权法获得各个指标的静态权重向量,将静态权重向量通过变权公式得到动态权重向量,将动态权重向量结合灰色聚类得出评估向量Q。
S3.1:动态权重向量的获取:
确定参与评估的指标数m;
根据层次分析法与熵权法分别获得第j个指标权重向量uj、vj,将两种权重向量进行组合,得到第j个指标组合权重为:
Figure BDA0003375627550000081
获得组合权重向量为:
w=(w1,w2,...,wm)
确定变权公式为:
Figure BDA0003375627550000082
式中:
Figure BDA0003375627550000083
为第j个指标的变权系数,wj为组合权重系数,xj为第j个指标运行参数;
在变权公式中引入均衡函数,均衡函数为:
Figure BDA0003375627550000091
将均衡函数带入变权公式,则:
Figure BDA0003375627550000092
式中:ωj为引入均衡函数后第j个指标的变权系数;根据引入均衡函数的变权公式,得到最终变权权重即动态权重向量为:
ω=[ω12,...,ωm]
其中,α为0.5。
S3.2:评估向量Q的获取:
通过中心点型的三角白化权函数对采煤机进行健康状态评估,获得m个参与评估的指标,则其隶属度为:
Figure BDA0003375627550000093
式中:s为灰类个数,λt为第t个灰类的中心,xj为某个指标的监测值;
获得xj对s个灰类的符合度向量为:
Figure BDA0003375627550000094
计算所有指标的监测值对s个灰类的符合度向量,得到符合度矩阵为
F=[F1,F2,...,Fm]
构造对s个灰类的符合度矩阵F,根据动态权重向量,得采煤机各状态的评估向量为:
QT=FωT
S4:将待评估监测参数数据输入到训练好的XGBoost模型,计算采煤机每种状态对应的叶子节点分值,获得XGBoost模型采煤机状态的评估概率向量R。
S4.1:预测模型构建:
XGBoost的预测模型为
Figure BDA0003375627550000101
式中:xi为第i个样本的特征,fk(xi)为第k棵树预测值,
Figure BDA0003375627550000102
为模型的预测值。XGBoost算法从第1棵树开始按顺序优化,最后直到第K棵树完成优化。对于给定的xi,则有模型初始化:
Figure BDA0003375627550000103
往模型中加入第K棵树:
Figure BDA0003375627550000104
XGBoost的目标函数由衡量训练误差的损失函数和控制复杂度的正则化项两部分组成,公式为:
Figure BDA0003375627550000105
式中:
Figure BDA0003375627550000106
为损失函数,用于衡量真实值和模型预测值之间的误差,在分类模型中常用的损失函数是均方误差MSE;而Ω是正则化项,用于控制模型的复杂度防止模型过拟合,Ω(fk)代表第k棵树的复杂度,c为常数项。
将损失函数按照泰勒级数展开获取近似目标函数,常数项c可忽略不计。
Figure BDA0003375627550000107
式中:gi为损失函数
Figure BDA0003375627550000108
的一阶导数,hi表示
Figure BDA0003375627550000109
的二阶导数,其中:
Figure BDA00033756275500001010
Figure BDA00033756275500001011
在XGBoost分类模型中复杂度主要由叶子节点的个数和相应节点权重的平滑程度决定。
Figure BDA00033756275500001012
式中:γ和
Figure BDA0003375627550000111
均为人工设置参数,T是叶子节点数,P是每个叶子的权重即叶子节点分数,
Figure BDA0003375627550000112
是对于P权值参数的正则化惩罚项。
用Ir表示第r个叶子里的样本集合,设:
Figure BDA0003375627550000113
求得最优的叶子节点权重
Figure BDA0003375627550000114
和目标函数obj*为:
Figure BDA0003375627550000115
Figure BDA0003375627550000116
S4.2:评估概率向量R的获取:
构建采煤机各状态下的监测参数的样本数据,采用XGBoost模型对样本数据进行训练;
将待评估监测参数数据输入到训练好的XGBoost模型,计算采煤机每种状态对应的叶子节点分值;
将每棵树下得到的某种状态的分值P相加,得到待评估样本对应各状态的总分值SO为:
Figure BDA0003375627550000117
式中:k为树的个数,O为状态等级,P(O)k为每棵树中不同状态对应的分值,则有评分矩阵S:
S=[S1,S2,...,Ss]
对每个分值求sigmoid,获得每个状态对应的评估概率,最终得到XGBoost概率向量即评估概率向量R:
R=[R1,R2,...,Rs]
式中:s为采煤机健康状态等级,R1,R2,...,Rs为该样本下评估结果,即为各状态的概率。
S5:将评估向量Q和评估概率向量R进行加权融合,得到综合评估向量QR。
具体的:
将评估向量Q和评估概率向量R进行加权融合最终综合评估向量QR:
QR=[QR1,QR2,...,QRs]
其中
QRO=(β1QO2RO)(O=1,2,...,s)
式中:QRO为各状态的综合评估概率,β12分别表示两种算法概率权重;其中,β12取0.5。
S6:根据综合评估向量QR获得每种采煤机状态对应的概率大小,并根据最大隶属度得出采煤机状态结果。
实施例1:
1.1异常点检测
选取工况条件下测得的采煤机2个主要运行参数,主变频器电流、主变频器温度为例,采用孤立森林算法对采煤机参数异常值进行检测。2个参数的2000组测量数据,其中异常数据共50组,主要由采煤机起停、突变等异常信号组成。
根据孤立森林算法要求确定算法参数,设置样本数量n_samples=2000,树的个数n_estimators为100;数据集的离群值分数outliers_fraction为0.025;数据集的异常值比例contamination为0.025。检测结果如图2所示。
图中,孤立森林将正常点划为高密度群体,异常点散落在高密度区域外部空间,通过将异常点进行孤立得到较高的检测精度。与常用的DBScan聚类、局部异常因子算法(LOF)两种基于密度的异常值剔除算法对比,结果如表1。
表1采煤机异常数据检测算法对比
Figure BDA0003375627550000121
Figure BDA0003375627550000131
由表1可知,孤立森林算法对采煤机异常数据识别精度更高、识别时间更短。
1.2评价指标构建
以复杂地质条件下生产运行采煤机监测数据为例,对采煤机监测参数相关性进行分析。结合实际工况确定采煤机主要监测参数如表2。
表2采煤机主要监测参数
Figure BDA0003375627550000132
选取采煤机3个月监测数据,考虑采煤机停机、突发情况等因素,提取可表征采煤机运行状态的2000个时刻点的数据,形成18×2000维的数据集。计算综合相关系数,得到相关系数热力图如图3所示。
由图3知,采煤机主变频器4个参数与从变频器4个参数密切相关,牵引电机温度与右截割电机温度密切相关,同时泵电机温度与左、右截割电机温度密切相关性。设阈值TH为0.9,根据综合相关系数筛选出相关系数低于0.9的监测指标,得到采煤机最终评估指标,结果如表3。
表3采煤机评估指标选取
Figure BDA0003375627550000141
2.1评估方法训练与实现
样本数据集建立
对工况下采煤机监测参数进行相关性分析,最终得到12维指标参与采煤机健康评估,结果如表3。依据确定的评估指标及部分实际监测数据,基于威布尔分布,得到采煤机运行状态仿真数据共2000条,其中训练数据1000条,健康、良好、一般、劣化、故障数据分别为300、380、250,50,20条;测试数据1000条,健康、良好、一般、劣化、故障数据分别为300、380、250,50,20条。
模型训练及验证
(1)变权模糊综合评判
根据层次分析法,由人工对采煤机12维评价指标(表3)进行两两比较并打分,确定判别矩阵,根据判断矩阵得出主观权重,并完成矩阵一致性检验。根据熵权法,基于训练数据,通过每个指标的信息熵得到客观权重。将主观权重与客观权重进行组合,得到组合权重即静态权重向量如表4。
表4采煤机指标权重向量
Figure BDA0003375627550000142
进而得到采煤机指标权重系数随监测时间变化规律,结果如图4所示。
由图7知,采煤机正常工作时,指标权重较为稳定,随着采煤机健康状况劣化,各指标权重均呈现不同的变化,在采煤机出现初步故障时,一些原有次要指标(如泵电机温度)占有权重逐步变大,逐步成为较为重要的指标。因此,动态权重比静态权重系数更能准确地反映采煤机各指标真实的运行状态。
根据前期研究及专家经验,将采煤机健康状态分为O={1,2,3,4,5}={健康,良好,一般,劣化,故障},确定对应白化权函数范围,健康状态等级与对应白化权函数见表5。
表5健康状态等级与对应白化权函数
Figure BDA0003375627550000151
基于变权模糊综合评判法对采煤机健康状态进行评估,结果如表6。
表6变权模糊综合评判评估结果
Figure BDA0003375627550000152
Figure BDA0003375627550000161
根据结果统计可得,运用该方法对采煤机进行健康状态评估,总体评估准确率为92.4%。
(2)XGBoost实现
基于XGBoost算法,将经过处理后的采煤机数据作为特征量输入,采煤机的五种健康状态作为分类输出结果。设置XGBoost收缩步长eta为0.1,随机采样比例subsample为0.2,随机列数比例colsample_bytree为1,最小损失函数下降值gamma为0,分类类别数num_class为5。设置初始最小叶子节点权重和min_child_weight为5。选取最大树的深度max_depth为1、2、4、6,设置1、3、5、7、9为min_child_weight值进行模型训练,得到各参数与评估准确度之间的关系如图5的a、b、c、d。
由图5可知,模型max_depth为2时,比max_depth为1,4,6时更稳定,评估准确率更高;由图5(b)可知随着num_boost_round增大,模型min_child_weight不同,评估准确度变化也不同,当min_child_weight增大时,模型准确度均呈现先增大后减小或平缓的趋势,当min_child_weight=7,num_boost_round=80时,模型平均准确度最高。
以最优参数模型对采煤机健康状态进行评估,评估结果如表7。对健康、良好、一般、劣化、故障5种状态评估结果进行统计,如图6所示。
表7 XGBoost评估结果
Figure BDA0003375627550000162
由图6可知,基于XGBoost的采煤机状态评估模型对于样本分布不均的数据仍有较高的识别准确度,对于劣化、故障样本不足的情况下仍然具有一定的评估准确度,总体评估准确率为97.8%。
(3)VW-FCE-XGBoost评估模型验证
运用VW-FCE、XGBoost、VW-FCE-XGBoost三种方法计算每时刻下采煤机健康状态评估向量,得到采煤机运行时健康状态变化曲线如图7所示。
由图7可得,三种方法均可以较为准确的评估设备健康状态,同时可看出健康状态处于两种状态交替时(图中圈)为评估的难点。VW-FCE法在两种状态的概率值相同(交叉点处)表现了较好的模糊性,但难以对该时刻的状态做出明确判断,并且得到的结果可靠性不高。XGBoost在两状态交替期间及时做出了判断,但是忽略了过渡期间的健康状态变化,判断太过于绝对。从VW-FCE-XGBoost可看出,运用两种方法的综合结果,可以准确的对该时刻的状态做出判断,又能一定程度上表达健康状态的过渡过程,得到的结果更具有可解释性。
采用VW-FCE-XGBoost对采煤机健康状态进行评估,该方法对采煤机健康、良好、一般、劣化、故障5种健康状态的评估正确率分别为100%、98.7%、99.2%、100%、80%,模型总体评估准确度为98.9%。相比于变权模糊综合评判、XGBoost两种方法,VW-FCE-XGBoost模型评估准确度提高了6.5%及1.1%。
实施例2:
以某矿生产运行的MG400/930-WD型号采煤机为例,采煤机采用单电缆供电,电源电压为3300伏,总体结构为多电机横向布置,牵引方式为机载式交流变频调速-销轨式无链牵引。
选取采煤机3个月运行监测数据,基于孤立森林及综合相关系数对实验数据进行异常值剔除及指标相关性分析,确定评估指标如表3。采煤机退化趋势复杂,故障多为突变故障及偶然性故障,健康、故障数据界定不明显导致评估结果难以符合实际工况,同时判定故障、劣化标准不同也会导致评估结果的差异。对采煤机数据进行处理及分析,并结合采煤机点检记录,最终将采煤机健康状态划分为O={1,2,3}={健康,其它,故障}三种状态,得到训练、测试数据各1000条,健康、其它、故障数据比例为16:3:1。基于VW-FCE-XGBoost得到采煤机健康状态评估结果如表8。
表8采煤机健康状态评估结果
Figure BDA0003375627550000181
由表8可知,基于VW-FCE-XGBoost的采煤机健康状态评估方法对采煤机健康、其它、故障3种状态评估正确率分别为92.9%、83.3%、90.0%。实验中,各健康数据特征大致相同;故障数据特征具有多样性,但由于条件有限,本文选取故障数据较为单一;其它数据具有高度不确定性包含单指标劣化、多指标劣化、开停信号、待机信号等多种数据特征,因此,该类数据评估准确度最差。综上可得,实验所得结果满足真实情况,具有一定的准确性。
以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种采煤机健康状态评估方法,其特征在于,包括以下步骤:
对采集的采煤机状态数据中各个监测参数间进行综合相关系数计算,将低于预设阈值的监测参数作为参与评估的指标;
分别根据层次分析法与熵权法获得各个指标的静态权重向量,将静态权重向量通过变权公式得到动态权重向量,将动态权重向量结合灰色聚类得出评估向量Q;
将待评估监测参数数据输入到训练好的XGBoost模型,计算采煤机每种状态对应的叶子节点分值,获得XGBoost模型采煤机状态的评估概率向量R;
将评估向量Q和评估概率向量R进行加权融合,得到综合评估向量QR;
根据综合评估向量QR获得每种采煤机状态对应的概率大小,并根据最大隶属度得出采煤机状态结果。
2.根据权利要求1所述的采煤机健康状态评估方法,其特征在于,还包括:通过孤立森林算法对采集的采煤机状态数据进行异常数据检测,并进行异常数据剔除。
3.根据权利要求1所述的采煤机健康状态评估方法,其特征在于,所述对采集的采煤机状态数据中各个监测参数间进行综合相关系数计算,包括以下步骤:
对采煤机的各个监测参数分别通过皮尔逊相关系数、斯皮尔曼相关系数和余弦距离进行相关性分析:
Figure FDA0003375627540000011
Figure FDA0003375627540000012
Figure FDA0003375627540000021
式中:ρp,ρs,ρc分别为参数间皮尔逊相关系数、斯皮尔曼相关系数、余弦距离;X,Y为样本向量,Cov(X,Y)为X与Y的协方差,Var(X)和Var(Y)代为X和Y的方差;a为样本数,N为样本总数,da表示两个变量分别排序后成对的变量位置差;
综合相关系数ρco为:
ρco=α1×ρs2×ρp3×ρc
式中,α1,α2,α3为权重且α123=1;其中,三种相关系数具有同等重要性,即α1=α2=α3=1/3;
当综合相关系数大于或等于阈值TH时参数密切相关,小于阈值TH时参数不具有密切相关性;
根据相关系数ρco的计算结果,筛选出综合相关系数低于TH的监测参数,完成评估指标构建。
4.根据权利要求1所述的采煤机健康状态评估方法,其特征在于,所述将静态权重向量通过变权公式得到动态权重向量,包括以下步骤:
确定参与评估的指标数m;
根据层次分析法与熵权法分别获得第j个指标权重向量uj、vj,将两种权重向量进行组合,得到第j个指标组合权重为:
Figure FDA0003375627540000022
获得组合权重向量为:
w=(w1,w2,...,wm)
确定变权公式为:
Figure FDA0003375627540000023
式中:
Figure FDA0003375627540000031
为第j个指标的变权系数,wj为组合权重系数,xj为第j个指标运行参数;
在变权公式中引入均衡函数,均衡函数为:
Figure FDA0003375627540000032
将均衡函数带入变权公式,则:
Figure FDA0003375627540000033
式中:ωj为引入均衡函数后第j个指标的变权系数;根据引入均衡函数的变权公式,得到最终变权权重即动态权重向量为:
ω=[ω12,...,ωm]
其中,α为0.5。
5.根据权利要求4所述的采煤机健康状态评估方法,其特征在于,所述将动态权重向量结合灰色聚类得出评估向量Q,包括以下步骤:
通过中心点型的三角白化权函数对采煤机进行健康状态评估,获得m个参与评估的指标,则其隶属度为:
Figure FDA0003375627540000034
式中:s为灰类个数,λt为第t个灰类的中心,xj为某个指标的监测值;
获得xj对s个灰类的符合度向量为:
Figure FDA0003375627540000035
计算所有指标的监测值对s个灰类的符合度向量,得到符合度矩阵为
F=[F1,F2,...,Fm]
构造对s个灰类的符合度矩阵F,根据动态权重向量,得采煤机各状态的评估向量为:
QT=FωT
6.根据权利要求5所述的采煤机健康状态评估方法,其特征在于,所述XGBoost模型采煤机状态的评估概率向量R的获取,包括以下步骤:
构建采煤机各状态下的监测参数的样本数据,采用XGBoost模型对样本数据进行训练;
将待评估监测参数数据输入到训练好的XGBoost模型,计算采煤机每种状态对应的叶子节点分值;
将每棵树下得到的某种状态的分值P相加,得到待评估样本对应各状态的总分值SO为:
Figure FDA0003375627540000041
式中:k为树的个数,O为状态等级,P(O)k为每棵树中不同状态对应的分值,则有评分矩阵S:
S=[S1,S2,...,Ss]
对每个分值求sigmoid,获得每个状态对应的评估概率,最终得到XGBoost概率向量即评估概率向量R:
R=[R1,R2,...,Rs]
式中:s为采煤机健康状态等级,R1,R2,...,Rs为该样本下评估结果,即为各状态的概率。
7.根据权利要求6所述的采煤机健康状态评估方法,其特征在于,所述综合评估向量QR的获取,包括以下步骤:
将评估向量Q和评估概率向量R进行加权融合最终综合评估向量QR:
QR=[QR1,QR2,...,QRs]
其中
QRO=(β1QO2RO)(O=1,2,...,s)
式中:QRO为各状态的综合评估概率,β12分别表示两种算法概率权重;其中,β12取0.5。
CN202111416994.1A 2021-11-25 2021-11-25 一种采煤机健康状态评估方法 Pending CN113988220A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111416994.1A CN113988220A (zh) 2021-11-25 2021-11-25 一种采煤机健康状态评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111416994.1A CN113988220A (zh) 2021-11-25 2021-11-25 一种采煤机健康状态评估方法

Publications (1)

Publication Number Publication Date
CN113988220A true CN113988220A (zh) 2022-01-28

Family

ID=79731943

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111416994.1A Pending CN113988220A (zh) 2021-11-25 2021-11-25 一种采煤机健康状态评估方法

Country Status (1)

Country Link
CN (1) CN113988220A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114548739A (zh) * 2022-02-15 2022-05-27 国网河南省电力公司电力科学研究院 一种变电站防汛风险组合评估方法
CN114595581A (zh) * 2022-03-11 2022-06-07 重庆地质矿产研究院 基于影响因素动态权重的区域地质灾害危险性概率模型

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114548739A (zh) * 2022-02-15 2022-05-27 国网河南省电力公司电力科学研究院 一种变电站防汛风险组合评估方法
CN114595581A (zh) * 2022-03-11 2022-06-07 重庆地质矿产研究院 基于影响因素动态权重的区域地质灾害危险性概率模型

Similar Documents

Publication Publication Date Title
CN111222549B (zh) 一种基于深度神经网络的无人机故障预测方法
CN108960303B (zh) 一种基于lstm的无人机飞行数据异常检测方法
CN110807257A (zh) 航空发动机剩余寿命预测方法
CN116757534B (zh) 一种基于神经训练网络的智能冰箱可靠性分析方法
CN113988220A (zh) 一种采煤机健康状态评估方法
CN111079348B (zh) 一种缓变信号检测方法和装置
CN114818313A (zh) 一种基于合成少数类过采样技术的隐蔽窃电行为辨识方法
CN114819102A (zh) 基于gru的空调设备故障诊断方法
CN112149884A (zh) 一种面向大规模学员的学业预警监测方法
CN113782113B (zh) 一种基于深度残差网络下的变压器油中气体故障识别方法
CN117312972A (zh) 一种刮板输送机减速器健康状态识别方法
CN114460481A (zh) 基于Bi-LSTM和注意力机制的储能电池热失控预警方法
CN113742983A (zh) 基于深度自编码器神经网络的长跨结构损伤识别方法
CN117556347A (zh) 一种基于工业大数据的电力设备故障预测与健康管理方法
CN117171702A (zh) 一种基于深度学习的多模态电网故障检测方法和***
CN117232809A (zh) 基于dematel-anp-critic组合赋权的风机主轴故障预诊断方法
Kim et al. Anomaly pattern detection in streaming data based on the transformation to multiple binary-valued data streams
CN110889186A (zh) 基于等退化增量时间间隔灰关联分析的加速贮存与自然贮存退化数据一致性检验法
CN115545342A (zh) 一种企业电费回收的风险预测方法与***
CN115423370A (zh) 一种继电保护设备健康状态评估方法及装置
Li et al. Social network change detection using a genetic algorithm based back propagation neural network model
CN114046816A (zh) 基于轻量级梯度提升决策树的传感器信号故障诊断方法
CN113849479A (zh) 基于即时学习和自适应阈值的综合能源供应站油罐泄漏检测方法
CN112560252A (zh) 一种航空发动机剩余寿命预测方法
Atamuradov et al. Evaluation of Features with Changing Effectiveness for Prognostics

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination