CN111401785A - 一种基于模糊关联规则的电力***设备故障预警方法 - Google Patents

一种基于模糊关联规则的电力***设备故障预警方法 Download PDF

Info

Publication number
CN111401785A
CN111401785A CN202010274132.9A CN202010274132A CN111401785A CN 111401785 A CN111401785 A CN 111401785A CN 202010274132 A CN202010274132 A CN 202010274132A CN 111401785 A CN111401785 A CN 111401785A
Authority
CN
China
Prior art keywords
fuzzy
data
algorithm
clustering
early warning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010274132.9A
Other languages
English (en)
Inventor
马强
王勇
李磊
管荑
李慧聪
田大伟
耿玉杰
刘勇
林琳
娄建楼
李燕
李建坡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Shandong Electric Power Co Ltd
Northeast Electric Power University
Original Assignee
State Grid Shandong Electric Power Co Ltd
Northeast Dianli University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Shandong Electric Power Co Ltd, Northeast Dianli University filed Critical State Grid Shandong Electric Power Co Ltd
Priority to CN202010274132.9A priority Critical patent/CN111401785A/zh
Publication of CN111401785A publication Critical patent/CN111401785A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于模糊关联规则的电力***设备故障预警方法,涉及故障预警方法,包括以下步骤:由K均值和信息熵混合迭代确定电力设备数据的最佳分区数,以实现动态自适应边界划分;引入模糊集以软化属性边界划分,使用模糊C均值进行模糊区间划分;使用Apriori算法,选取一组最佳的最小支持度和信任度作为挖掘算法的主参数,以此参数挖掘出关联规则构建规则库,以分析预测电力设备的故障状态。本发明的方法能够定量地得到属性离散化时的最佳分区数,实现动态自适应属性边界划分;相较传统的关联规则方法能够快速准确地检测到设备的故障状态。

Description

一种基于模糊关联规则的电力***设备故障预警方法
技术领域
本发明涉及故障预警方法,具体涉及一种基于模糊关联规则的电力***设备故障预警方法。
背景技术
目前,随着智能电网的不断发展,电网规模的不断扩大,对电力***运行安全的要求也越来越高。为了保证电力***设备的安全运行,降低其故障突发率,减少设备的检修成本,对电力***设备的状态检测和安全维护是至关重要的。
国内外对于电力***故障预警方面的研究有的采用了基于密度的DBSCAN聚类算法计算采样数据和历史故障数据簇的相对邻近度,完成对数据的类别划分;有的采用了三种不同的归一化方法处理数据样本,将其作为模糊C均值算法的输入,通过求隶属度确定样本的故障类型;有的对变压器的不同短路匝数、轴向位移和径向变形进行聚类,聚类结果用于解释频率响应分析来诊断设备的故障;有的采用了模糊c均值的隶属度函数的指数形式来获取距离的判断指标,得到的隶属度矩阵实现对变压器故障数据的划分。目前电力设备的故障预警方法大多是通过简单的聚类算法实现,无法挖掘分析出数据间的隐含的相关关系,且无法尽快地检测到故障趋势,不能为运维人员争取更多的维修时间,从而造成严重的损失。
若要对电力***设备的故障状态做出及时有效的预警,必须深度挖掘数据间隐含的关联关系。由于电力***在线监测数据每天都是呈现指数增长趋势,而关联规则算法正好具备能从大量的数据集中挖掘出无法直观感受的规则的优势,往往能给出意想不到的规则组合,因此被广泛应用在电力***故障诊断、火电厂优化、网络安全等诸多领域。
发明内容
本发明的主要目的在于提供一种基于模糊关联规则的电力***设备故障预警方法。
本发明采用的技术方案是:一种基于模糊关联规则的电力***设备故障预警方法,包括以下步骤:
由K均值和信息熵混合迭代确定电力设备数据的最佳分区数,以实现动态自适应边界划分;
引入模糊集以软化属性边界划分,使用模糊C均值进行模糊区间划分;
使用Apriori算法,选取一组最佳的最小支持度和信任度作为挖掘算法的主参数,以此参数挖掘出关联规则构建规则库,以分析预测电力设备的故障状态。
进一步地,包括以下步骤:
由改进的K均值和信息熵混合迭代求出初始类个数以及初始类中心,由FCM聚类求出最终聚类结果;
设待聚类的样本集为
Figure 55372DEST_PATH_IMAGE001
,基于模糊关联规则的电力***设备故障预警方法的具体步骤为:
S1:确定初始聚类个数的范围
Figure 37585DEST_PATH_IMAGE002
S2:在聚类个数逐渐增加的过程中,每对应一个聚类数j,利用改进的K-means算法求出聚类中心,再在计算数据偏离度的基础上求出信息熵的跃迁差值;
S3:在已求得的
Figure 643010DEST_PATH_IMAGE003
序列中,得到的
Figure 780730DEST_PATH_IMAGE003
达到最小值时的聚类个数k及此时的聚类中心
Figure 757782DEST_PATH_IMAGE004
S4:将最佳聚类个数k及类中心
Figure 715374DEST_PATH_IMAGE005
作为初始化参数,对FCM算法进行初始化;
S5:更新模糊聚类的隶属度矩阵
Figure 186806DEST_PATH_IMAGE006
S6:如果
Figure 975771DEST_PATH_IMAGE007
,则聚类算法停止并输出隶属度矩阵
Figure 608878DEST_PATH_IMAGE006
和类中心
Figure 568612DEST_PATH_IMAGE005
,否则转向S5继续迭代;
S8:获取最终的隶属度矩阵
Figure 312577DEST_PATH_IMAGE006
和类中心
Figure 956048DEST_PATH_IMAGE005
,将数据集中的数据划分到对应的类中。
本发明的优点:
(1)能够定量地得到属性离散化时的最佳分区数,实现动态自适应属性边界划分。
(2)KEFCM算法的使用和最小支持度、最小置信度的选取能够有效地保留数据边缘信息,避免在挖掘关联规则的过程中忽略有研究价值的规则,KEFCM算法分类准确度高。
(3)相较传统的关联规则方法能够快速准确地检测到设备的故障状态。
除了上面所描述的目的、特征和优点之外,本发明还有其它的目的、特征和优点。下面将参照图,对本发明作进一步详细的说明。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1是本发明实施例的方法流程图;
图2是本发明实施例的信息熵跃迁差值变化图;
图3 是本发明实施例的三种聚类算法对比结果图;
图4是本发明实施例的获得频繁1-项集流程图;
图5是本发明实施例的获得频繁k-项集流程图;
图6是本发明实施例的不同支持度下,匹配率均值与信任度的关系图;
图7是本发明实施例的不同支持度下,匹配率方差与信任度的关系图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供了一种基于模糊关联规则的电力***设备故障预警方法。
聚类算法
K均值聚类:
K均值(K-means)是聚类分析中使用最广泛的方法之一,是一种简单的迭代型聚类算法,其目的是达到类内数据距离最小化,类间数据距离最大化。对于给定数据集
Figure 25635DEST_PATH_IMAGE001
,其中n为数据个数,d为数据维度。x 中的每个数据根据各自属性划分为
Figure 957819DEST_PATH_IMAGE002
个不同的类,每个类都有一个聚类中心,对于第j个类的类别空间
Figure 754743DEST_PATH_IMAGE008
,由类中所有数据的均值表示,计算公式如下:
Figure 721562DEST_PATH_IMAGE009
(1)
给定一个聚类中心为
Figure 493209DEST_PATH_IMAGE010
,数据间采用欧式距离作为划分指标,计算公式如下:
Figure 178268DEST_PATH_IMAGE011
(2)
K-means算法的基本步骤:
S1:选取数据空间中的 k个数据作为初始聚类中心;
S2:对于数据集 x中的每个数据,根据它们与这些聚类中心的欧氏距离dij,按距离最近的准则将它们分到最近的聚类中心所对应的类;
S3:将每个类中所有数据所对应的均值作为该类别的聚类中心,更新聚类中心;
S4:判断聚类中心是否发生改变,若不变,则输出结果;反之,返回S2继续。
K-means算法使所获得的聚类满足同一类中的数据对象相似度较高,而不同类的数据对象相似度较低。但是K-means算法是根据初始聚类中心来确定一个初始的划分,然后再对初始划分进行优化。这个初始聚类中心的选择对聚类结果有很大的影响,一旦初始值选择地不好,就可能无法得到有效的聚类结果,这也成为K-means算法的一个主要问题。因此,改进K-means算法选取聚类中心的方法以保证初始聚类中心间的相互距离尽可能的远。聚类中心初始化算法流程如下:
S1:从输入的数据点集合 x 中随机选择一个点作为第一个聚类中心;
S2:对于 x 中的每一个数据:
(1)计算它们与已选择的聚类中心的距离
Figure 264036DEST_PATH_IMAGE012
(2)计算每个数据被选为下一个聚类中心的概率p(xi);
Figure 337558DEST_PATH_IMAGE013
(3)
(3)在[0,1]间取一个随机数r,用r减去第一个数据的概率,如果减去的结果小于等于0,则选其成为下一个聚类中心;反之,若结果大于0,则继续减去下一个数据的概率值,重复该过程,直到减去后的结果小于等于0为止;最后减去的概率值所对应的数据被选做下一个聚类中心;
S3:重复S2直到 k个聚类中心全部被选出。
信息熵:
1948年,C.E.Shannon 将熵(Entropy)概念引入信息学领域,用信息熵来度量数据所含的信息量。对于划分为k个类集合的数据集x,用Pij表示第i个样本点对于第j个类聚类中心的偏离度,其值越小表示第i个样本属于第j个类的可能性越小,离j类越远。其中,偏离度Pij的计算公式如下:
Figure 483369DEST_PATH_IMAGE014
(4)
类的总体信息熵计算公式如下:
Figure 186883DEST_PATH_IMAGE015
(5)
从第j-1个状态跳跃到第j个状态的信息熵差称为信息熵跳变值,计算公式如下:
Figure 76341DEST_PATH_IMAGE016
(6)
从第j-1个到第j个状态熵跳变值与从第j个到第j+1个状态熵跳变值的差值称为信息熵跃迁差值,计算公式如下:
Figure 752173DEST_PATH_IMAGE017
(7)
随着聚类个数的增加,每个类中的数据量减少,每个数据属于一个类的概率增大,该类总体的信息熵就变大。在类个数由少增多的过程中,类划分按无序到有序再到无序的顺序进行,最初的无序是因为聚类太笼统,不能了解数据集的整体特征,而最后的无序是聚类太细碎,缺乏对数据集整体的认识。因此,可以用数据集信息熵跃迁差值
Figure 131202DEST_PATH_IMAGE018
来确定最佳聚类数,即在聚类数量从(k-1个类→k个类)到(k个类→k+1个类)的
Figure 774542DEST_PATH_IMAGE018
最低时,表示已经没有将数据集从k个类增加到k+1个类的必要,此时k为最佳聚类数。
模糊C均值聚类:
模糊C均值(fuzzy c-means algorithm,FCM)是一种无监督的模糊聚类算法,用于将高维空间分布的数据划分成特定的类别。它通过优化目标函数得到每个样本点对所有类中心的隶属度,从而决定样本点以达到自动对样本数据进行分类的目的。FCM算法的基本思想是将给定的样本集
Figure 202112DEST_PATH_IMAGE019
划分成k个模糊簇
Figure 998030DEST_PATH_IMAGE020
,使给定的目标函数J最小。目标函数J定义如下:
Figure 751222DEST_PATH_IMAGE021
(8)
式中:
Figure 163749DEST_PATH_IMAGE022
为模糊指数,
Figure 909857DEST_PATH_IMAGE023
为第i个数据属于第j类的隶属度矩阵。
在每次迭代中,使用隶属度函数计算隶属度值,并更新聚类中心
Figure 294702DEST_PATH_IMAGE024
和隶属度矩阵
Figure 218796DEST_PATH_IMAGE025
,该算法的基本步骤为:
S1:初始化聚类个数k,模糊加权指数m,迭代终止阈值
Figure 587460DEST_PATH_IMAGE026
,迭代次数
Figure 419150DEST_PATH_IMAGE027
,以及隶属度矩阵
Figure 173348DEST_PATH_IMAGE025
S2:计算模糊聚类中心:
Figure 2764DEST_PATH_IMAGE028
(9)
S3:更新模糊聚类的隶属度矩阵
Figure 593145DEST_PATH_IMAGE025
Figure 431788DEST_PATH_IMAGE029
(10)
S4:如果满足迭代终止条件
Figure 303142DEST_PATH_IMAGE030
,则说明目标函数已达到极小值,迭代终止,并输出隶属度矩阵
Figure 365776DEST_PATH_IMAGE025
和类中心,否则转向S2继续运算,直到满足条件。
KEFCM算法的实现:
整体算法分为两个阶段,第一阶段由改进的K均值和信息熵混合迭代求出初始类个数以及初始类中心,第二阶段由FCM聚类求出最终聚类结果。
参考图1,如图1所示,已知待聚类的样本集为
Figure 443454DEST_PATH_IMAGE001
,KEFCM( Fuzzy c-means algorithm based on K-means and Entropy)算法的整体步骤为:
S1:确定初始聚类个数的范围
Figure 820209DEST_PATH_IMAGE002
S2:在聚类个数逐渐增加的过程中,每对应一个聚类数j,利用改进的K-means算法求出聚类中心,再在计算数据偏离度的基础上求出信息熵的跃迁差值
Figure 299731DEST_PATH_IMAGE003
S3:在已求得的
Figure 720217DEST_PATH_IMAGE003
序列中,得到的
Figure 285191DEST_PATH_IMAGE003
达到最小值时的聚类个数k及此时的聚类中心
Figure 465636DEST_PATH_IMAGE004
S4:将最佳聚类个数k及类中心
Figure 861983DEST_PATH_IMAGE005
作为初始化参数,对FCM算法进行初始化;
S5:更新模糊聚类的隶属度矩阵
Figure 469682DEST_PATH_IMAGE006
S6:如果
Figure 240060DEST_PATH_IMAGE007
,即隶属度矩阵
Figure 224197DEST_PATH_IMAGE031
相对于上次的隶属度矩阵
Figure 678312DEST_PATH_IMAGE032
的更新值小于迭代终止阈值,则聚类算法停止并输出隶属度矩阵
Figure 253650DEST_PATH_IMAGE006
和类中心
Figure 527636DEST_PATH_IMAGE005
,否则转向S5继续迭代;
S8:获取最终的隶属度矩阵
Figure 33573DEST_PATH_IMAGE006
和类中心
Figure 342194DEST_PATH_IMAGE005
,将数据集中的数据划分到对应的类中。
本发明能够定量地得到属性离散化时的最佳分区数,实现动态自适应属性边界划分;
KEFCM算法的使用和最小支持度、最小置信度的选取能够有效地保留数据边缘信息,避免在挖掘关联规则的过程中忽略有研究价值的规则,KEFCM算法分类准确度高;
相较传统的关联规则方法能够快速准确地检测到设备的故障状态。
算例验证:
采用测试数据集验证本文所提算法的有效性,选取UCI Wine数据集作为测试数据,该数据集共有178个样本,13个特征(Alcohol、Malic acid、Ash等),总共分为3类,数据集的部分样本数据如表1所示。
表1Wine部分样本数据
Figure 88434DEST_PATH_IMAGE033
由信息熵结合K均值迭代计算求得熵跃迁差值如图2所示,由图可知,跃迁状况为2时,***的跃迁差值最小,故该数据集的最佳分类数为3,此值与测试数据集的实际分类数相符。
实际上,Wine数据集的三类样本分别含有59、 71、 48个样本,分别用k-means、FCM和KEFCM这三种算法对Wine数据集进行分类,结果如图3所示,可见本文提出的KEFCM算法分类准确度最高。
Apriori算法的基本理论:
Apriori算法是一种发现频繁项集的布尔型管理规则算法,该算法使用逐层迭代法进行计算,并基于候选项集来生成频繁项集,即使用(k-1)-项集L k-1产生k-项集L k。频繁1-项集及频繁k-项集的计算过程如图4和图5所示。通过扫描数据库,累计每个项的计数,获取满足最小支持度的项,找出频繁1-项集的集合,记为L1,之后通过频繁1-项集的集合L1寻找频繁2-项集的集合L2,以此类推,直到无法获取满足条件的项集,此时得到的项集称为最大频繁项集。
从L k-1项集获取L k项集时需要执行连接步与剪枝步操作。连接步:将L k-1与自身连接产生候选k-项集的集合,记为Ck。剪枝步:若候选k-项集的任意一个(k-1)项子集不存在于L k-1中,则将该候选项集删除。
关联规则的有效性是由支持度和信任度来决定的。根据关联规则的定义,对于数据库
Figure 115295DEST_PATH_IMAGE034
,假如A和B是
Figure 910076DEST_PATH_IMAGE034
的子集事务,则满足
Figure 590981DEST_PATH_IMAGE035
Figure 711383DEST_PATH_IMAGE036
,且
Figure 756700DEST_PATH_IMAGE037
为空集,则
Figure 355171DEST_PATH_IMAGE038
的式子为关联规则,A和B为关联规则的前件和后件。支持度是数据库
Figure 638385DEST_PATH_IMAGE034
Figure 726427DEST_PATH_IMAGE039
的百分比,如式(12)所示。
Figure 711569DEST_PATH_IMAGE040
(11)
式中:A为关联规则的前件; B为关联规则的后件。
信任度是数据库
Figure 113732DEST_PATH_IMAGE034
中表示A出现时B的概率,如式(13)所示。
Figure 251452DEST_PATH_IMAGE041
(12)
实验分析:
数据准备:
变压器发生的故障不同主要产生的故障特征气体就不同。国内现有的GB/T7252-2001《变压器油中溶解气体分析与判断导则》中表明影响变压器故障产生的特征气体主要为H2、CH4、C2H2、C2H4、C2H6五个属性如表2所示,提取其 2017年1000组气体组分历史正常数据以及2018年5月发生的一次故障记录点前后共600组数据进行分析。
表2变压器属性
Figure 510395DEST_PATH_IMAGE042
采用KEFCM聚类算法对五个连续属性的1000组数据进行离散化处理,获得各属性最佳分类数后的离散化区间如表3所示(保留两位有效小数)。
表3变压器属性离散化区间
Figure 733566DEST_PATH_IMAGE044
鉴于数据挖掘的需要,属于不同属性的区间要加以区分,以免重复,故需对待挖掘数据编号。例如,某一组数据中H2值为14.88,即该值落在x0属性的第五个区间,故将该数据记为05,以此类推。最终得到的待挖掘数据库形式如表4所示。
表4待挖掘数据库
Figure 188687DEST_PATH_IMAGE046
4.2 关联规则库的建立
为了使挖掘出的关联规则准确地表达变压器各属性之间的关系,最小支持度minSup与最小信任度minConf的选取也是最关键的一步。本文采用“匹配率”这一指标,并结合其均值与方差,作为评价在某一组minSup与minConf下所挖掘出的关联规则的准确性指标,并通过多组实验,找到一组最佳的minSup与minConf,以此参数下挖掘出的规则组成关联规则库。匹配率的计算公式如下:
Figure 180914DEST_PATH_IMAGE047
(13)
式中:
Figure 610758DEST_PATH_IMAGE048
为当前数据所符合的规则数,
Figure 321225DEST_PATH_IMAGE049
为只符合规则前件而不符合规则后件的规则数,
Figure 65190DEST_PATH_IMAGE050
为该组数据与规则库的匹配程度。
Figure 161191DEST_PATH_IMAGE050
越大,表示规则更准确地反映了该组数据各属性的内在联系。用所有匹配数据的匹配率均值来表示规则库与训练数据的平均匹配程度,匹配率方差来表示规则库适用于训练数据的稳定程度。
在不同minSup与minConf下建立规则库,比较匹配率均值与方差在不同规则库中的变化,确定一组最佳的minSup与minConf,作为挖掘算法的参数来建立规则库。实验分析结果如下图6和图7所示。
总体而言支持度数值越大、信任度越高,那么均值越小、方差越大,但支持度和信任度过大都会导致均值骤然降低、方差骤然升高。这是由于支持度和信任度过大导致规则数骤减,降低了规则库的覆盖率,即大量数据找不到与之匹配的规则。由图6和图7可知,当
Figure 27516DEST_PATH_IMAGE051
Figure 959700DEST_PATH_IMAGE052
时为Apriori算法最佳的一组最小支持度和信任度。在此基础上挖掘出的频繁属性集共2781条,关联规则共5546条,部分频繁属性集及关联规则的形式如表5和表6所示。
表5部分频繁属性集
Figure 507356DEST_PATH_IMAGE053
表6部分关联规则
Figure DEST_PATH_IMAGE054
以表8中第一条关联规则(11, 23→02)为例,其代表的含义为:
若给CH4值在第一个区间([11.53, 12.61]),C2H2的值在第三个区间([2.29, 3.43]),那么H2的值落在第二个区间([5.51, 8.35])的概率为95.14%。
预警效果验证:
为进一步验证该故障预警方法的实用性,选取2018年5月发生的一次故障记录点前后共600组数据进行有效性验证(其中第300组数据为初始故障点)。该方法下的预警结果和传统关联规则下的预警结果如表7所示。
表7变压器故障诊断结果
Figure DEST_PATH_IMAGE056
关联规则是设备在正常状态下各属性之间关系的一种体现,在故障前期,各属性间现有的关联关系正在逐渐被打破,不断恶化。原本的关联规则对当前运行数据的适用性逐渐降低,从而发生报警。由表8可得,模糊关联规则的诊断结果在第276组数据时即已检测出存在故障趋势,而传统关联规则方法在第293组数据才识别出故障趋势,说明本文方法能够较为准确地诊断变压器的故障状态。综述,该实验结果验证了模糊关联规则在故障预警过程中的有效性和高效性。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (2)

1.一种基于模糊关联规则的电力***设备故障预警方法,其特征在于,
包括以下步骤:
由K均值和信息熵混合迭代确定电力设备数据的最佳分区数,以实现动态自适应边界划分;
引入模糊集以软化属性边界划分,使用模糊C均值进行模糊区间划分;
使用Apriori算法,选取一组最佳的最小支持度和信任度作为挖掘算法的主参数,以此参数挖掘出关联规则构建规则库,以分析预测电力设备的故障状态。
2.根据权利要求1所述的基于模糊关联规则的电力***设备故障预警
方法,其特征在于,包括以下步骤:
由改进的K均值和信息熵混合迭代求出初始类个数以及初始类中心,由FCM聚类求出最终聚类结果;
设待聚类的样本集为
Figure 709893DEST_PATH_IMAGE002
,基于模糊关联规则的电力***设备故障预警方法的具体步骤为:
S1:确定初始聚类个数的范围
Figure 616669DEST_PATH_IMAGE004
S2:在聚类个数逐渐增加的过程中,每对应一个聚类数j,利用改进的K-means算法求出聚类中心,再在计算数据偏离度的基础上求出信息熵的跃迁差值;
S3:在已求得的
Figure 506128DEST_PATH_IMAGE006
序列中,得到的
Figure 181960DEST_PATH_IMAGE006
达到最小值时的聚类个数k及此时的聚类中心
Figure DEST_PATH_IMAGE008
S4:将最佳聚类个数k及类中心
Figure DEST_PATH_IMAGE010
作为初始化参数,对FCM算法进行初始化;
S5:更新模糊聚类的隶属度矩阵
Figure DEST_PATH_IMAGE012
S6:如果
Figure DEST_PATH_IMAGE014
,则聚类算法停止并输出隶属度矩阵
Figure 99670DEST_PATH_IMAGE012
和类中心
Figure 493742DEST_PATH_IMAGE010
,否则转向S5继续迭代;
S8:获取最终的隶属度矩阵
Figure 186892DEST_PATH_IMAGE012
和类中心
Figure 202383DEST_PATH_IMAGE010
,将数据集中的数据划分到对应的类中。
CN202010274132.9A 2020-04-09 2020-04-09 一种基于模糊关联规则的电力***设备故障预警方法 Pending CN111401785A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010274132.9A CN111401785A (zh) 2020-04-09 2020-04-09 一种基于模糊关联规则的电力***设备故障预警方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010274132.9A CN111401785A (zh) 2020-04-09 2020-04-09 一种基于模糊关联规则的电力***设备故障预警方法

Publications (1)

Publication Number Publication Date
CN111401785A true CN111401785A (zh) 2020-07-10

Family

ID=71436892

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010274132.9A Pending CN111401785A (zh) 2020-04-09 2020-04-09 一种基于模糊关联规则的电力***设备故障预警方法

Country Status (1)

Country Link
CN (1) CN111401785A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112163682A (zh) * 2020-10-19 2021-01-01 北京邮电大学 一种基于信息差异图模型的电力调度自动化***故障溯源方法
CN112333147A (zh) * 2020-09-30 2021-02-05 中国核动力研究设计院 一种核电厂dcs平台网络运行态势感知方法及***
CN112488181A (zh) * 2020-11-26 2021-03-12 哈尔滨工程大学 一种基于MIDS-Tree的服务故障高响应匹配方法
CN112885462A (zh) * 2021-03-02 2021-06-01 南京邮电大学 一种面向多源信息融合的智慧健康关联分析方法
CN113010597A (zh) * 2021-04-06 2021-06-22 东北大学 一种面向海洋大数据的并行关联规则挖掘方法
CN117401578A (zh) * 2023-12-15 2024-01-16 常州欧普莱机械制造有限公司 一种起重量称量信号智能管理***
CN117572159A (zh) * 2024-01-17 2024-02-20 成都英华科技有限公司 基于大数据分析的电力故障检测方法及***

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107907783A (zh) * 2017-12-19 2018-04-13 西安交通大学 基于模糊关联规则的变压器故障综合诊断***及诊断方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107907783A (zh) * 2017-12-19 2018-04-13 西安交通大学 基于模糊关联规则的变压器故障综合诊断***及诊断方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
王奔: "关联规则挖掘及其在火电机组运行优化中的应用", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 *
顾慧等: "一种基于EKFCM算法的电站脱硫***目标工况库的建立方法", 《中国电机工程学报》 *
高瑜: "基于数据挖掘的火电厂风机故障预警研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112333147A (zh) * 2020-09-30 2021-02-05 中国核动力研究设计院 一种核电厂dcs平台网络运行态势感知方法及***
CN112163682A (zh) * 2020-10-19 2021-01-01 北京邮电大学 一种基于信息差异图模型的电力调度自动化***故障溯源方法
CN112163682B (zh) * 2020-10-19 2022-05-17 北京邮电大学 一种基于信息差异图模型的电力调度自动化***故障溯源方法
CN112488181A (zh) * 2020-11-26 2021-03-12 哈尔滨工程大学 一种基于MIDS-Tree的服务故障高响应匹配方法
CN112488181B (zh) * 2020-11-26 2022-10-18 哈尔滨工程大学 一种基于MIDS-Tree的服务故障高响应匹配方法
CN112885462A (zh) * 2021-03-02 2021-06-01 南京邮电大学 一种面向多源信息融合的智慧健康关联分析方法
CN113010597A (zh) * 2021-04-06 2021-06-22 东北大学 一种面向海洋大数据的并行关联规则挖掘方法
CN113010597B (zh) * 2021-04-06 2023-08-01 东北大学 一种面向海洋大数据的并行关联规则挖掘方法
CN117401578A (zh) * 2023-12-15 2024-01-16 常州欧普莱机械制造有限公司 一种起重量称量信号智能管理***
CN117401578B (zh) * 2023-12-15 2024-04-19 姜文涛 一种起重量称量信号智能管理***
CN117572159A (zh) * 2024-01-17 2024-02-20 成都英华科技有限公司 基于大数据分析的电力故障检测方法及***
CN117572159B (zh) * 2024-01-17 2024-03-26 成都英华科技有限公司 基于大数据分析的电力故障检测方法及***

Similar Documents

Publication Publication Date Title
CN111401785A (zh) 一种基于模糊关联规则的电力***设备故障预警方法
WO2022110557A1 (zh) 一种台区户变关系异常诊断方法及装置
CN107301296B (zh) 基于数据的断路器故障影响因素定性分析方法
Charrad et al. NbClust: an R package for determining the relevant number of clusters in a data set
CN110213222B (zh) 基于机器学习的网络入侵检测方法
CN105930862A (zh) 一种基于密度自适应距离的密度峰聚类算法
CN106022477A (zh) 智能分析决策***及方法
CN106503086A (zh) 分布式局部离群点的检测方法
CN113987033B (zh) 主变在线监测数据群体偏差识别与校准方法
CN111291822B (zh) 基于模糊聚类最优k值选择算法的设备运行状态判断方法
CN111046930A (zh) 一种基于决策树算法的供电服务满意度影响因素识别方法
CN112633337A (zh) 一种基于聚类和边界点的不平衡数据处理方法
CN110503133A (zh) 一种基于深度学习的离心式压缩机故障预测方法
CN112001788A (zh) 一种基于rf-dbscan算法的***违约欺诈识别方法
CN109308411A (zh) 基于人工智能决策树的分层检测软件行为缺陷的方法和***
CN110544047A (zh) 一种不良数据辨识方法
CN116796271A (zh) 一种居民用能异常识别方法
CN114611604A (zh) 一种基于电驱总成载荷特征融合与聚类的用户筛选方法
CN114722947A (zh) 一种基于近邻搜索分簇的电力调度监控数据异常检测方法
CN114384423A (zh) 一种基于典型运行参数的燃料电池健康状态识别方法
CN117407732A (zh) 一种基于对抗神经网络的非常规储层气井产量预测方法
KR102358357B1 (ko) 시장규모추정장치 및 그 동작 방법
KR102158049B1 (ko) Cf 트리를 활용한 범위 질의 기반의 데이터 클러스터링 장치 및 방법
CN111488903A (zh) 基于特征权重的决策树特征选择方法
CN111507878B (zh) 一种基于用户画像的网络犯罪嫌疑人侦查方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200710