CN110794360A - 一种基于机器学习预测智能电能表故障的方法及*** - Google Patents

一种基于机器学习预测智能电能表故障的方法及*** Download PDF

Info

Publication number
CN110794360A
CN110794360A CN201911006007.3A CN201911006007A CN110794360A CN 110794360 A CN110794360 A CN 110794360A CN 201911006007 A CN201911006007 A CN 201911006007A CN 110794360 A CN110794360 A CN 110794360A
Authority
CN
China
Prior art keywords
fault
energy meter
electric energy
intelligent electric
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911006007.3A
Other languages
English (en)
Inventor
李贺龙
于海波
王春雨
刘佳
王兴媛
袁金帅
王春妍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electric Power Research Institute of State Grid Chongqing Electric Power Co Ltd
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
Original Assignee
Electric Power Research Institute of State Grid Chongqing Electric Power Co Ltd
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electric Power Research Institute of State Grid Chongqing Electric Power Co Ltd, State Grid Corp of China SGCC, China Electric Power Research Institute Co Ltd CEPRI filed Critical Electric Power Research Institute of State Grid Chongqing Electric Power Co Ltd
Priority to CN201911006007.3A priority Critical patent/CN110794360A/zh
Publication of CN110794360A publication Critical patent/CN110794360A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R35/00Testing or calibrating of apparatus covered by the other groups of this subclass
    • G01R35/04Testing or calibrating of apparatus covered by the other groups of this subclass of instruments for measuring time integral of power or current
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于机器学习预测智能电能表故障的方法及***,属于机器学习技术领域。本发明方法包括:确定故障智能电能表的故障类型;删除重复数据和与故障智能电能表故障无关的数据,补全故障智能电能表故障退运数据缺失值,获取预测数据;确定与故障有关的特征数据;获取智能电能表故障预测模型;获取智能电能表与故障有关的特征数据;根据智能电能表故障预测模型,对智能电能表故障进行预测,确定智能电能表预测故障类型。本发明结合机器学习和神经网络的方法对智能电表故障数据进行分析,可以有效的预测出智能电表的故障类型。

Description

一种基于机器学习预测智能电能表故障的方法及***
技术领域
本发明涉及机器学习技术领域,并且更具体地,涉及一种基于机器学习预测智能电能表故障的方法及***。
背景技术
随着智能电表智能化和普及程度提高,用电信息采集***覆盖范围也不断扩展,智能电表的故障日益呈现出突发性、复杂性、多面性等特点。仅依靠检修人员发现电表的故障势必有人员投入不均匀,故障检修不及时的问题。本文通过分析智能电表正常运行数据和故障数据,基于统计、预处理、聚类和预测等方法,分析故障类型与出现问题现象及原因之间的关系,建立智能电表故障预测模型。在电表发生故障时,有效的预测其故障类型,并以此配备相应的维修人员,从而达到降低人力资源成本和节省维修时间的目的。
目前预测智能的故障主要通过故障机理分析,目前故障机理分析存在几个问题:
1.智能运行过程中不可避免产生损伤和出现早期故障,它具有潜在性和动态响应的微弱性;复合故障和***故障由于多因素共同耦合,通过单一的机理方法难以溯源故障成因。
2.智能电表的故障机理是指通过理论或大量的试验分析,得到智能电表故障状态信号与输出参数之间的规律,根据研究对象的物理特点,建立相应数学的模型,通过统计检验的方式验证其正确性。然而智能电表的机理模型中存在多参数可靠度模型难以有效拟合的问题。
发明内容
针对上述问题,本发明提出了一种基于机器学习预测智能电能表故障的方法,包括:
确定故障智能电能表的故障类型;
获取故障智能电能表故障退运数据,对故障智能电能表故障退运数据进行预处理,删除重复数据和与故障智能电能表故障无关的数据,补全故障智能电能表故障退运数据缺失值,获取预测数据;
根据预测数据,对故障智能电能表的故障类型进行故障特征选择,确定与故障有关的特征数据;
根据所述故障智能电能表的故障类型及故障有关的特征关系及智能电能表预测评价标准,获取智能电能表故障预测模型;
获取智能电能表与故障有关的特征数据,根据智能电能表故障预测模型,对智能电能表故障进行预测,确定智能电能表预测故障类型。
可选的,故障退运数据,包括:故障智能电能表的厂家信息、批次信息、有功准确度等级、安装地点、库存时间、运行时间、安装时间、异常类别、异常现象、异常时间、故障部位、故障时间、安装地点气候环境信息和安装地点电应力的电气环境信息。
可选的,预处理为对故障智能电能表故障退运数据进行线性函数归一化处理或零均值归一化处理。
可选的,故障特征,包括:离散型特征和连续型特征。
本发明还提供了一种基于机器学习预测智能电能表故障的***,所述***包括:
确定故障类型模块,确定故障智能电能表的故障类型;
数据获取模块,获取故障智能电能表故障退运数据,对故障智能电能表故障退运数据进行预处理,删除重复数据和与故障智能电能表故障无关的数据,补全故障智能电能表故障退运数据缺失值,获取预测数据;
指标确定模块,根据预测数据,对故障智能电能表的故障类型进行故障特征选择,确定与故障有关的特征数据;
模型生成模块,根据所述故障智能电能表的故障类型及故障有关的特征关系及智能电能表预测评价标准,获取智能电能表故障预测模型;
预测模块,获取智能电能表数据,根据智能电能表故障预测模型,对智能电能表故障进行预测,确定智能电能表预测故障类型。
可选的,故障退运数据,包括:智能电能表的厂家信息、批次信息、有功准确度等级、安装地点、库存时间、运行时间、安装时间、异常类别、异常现象、异常时间、故障部位、故障时间、安装地点气候环境信息和安装地点电应力的电气环境信息。
可选的,预处理为对故障智能电能表故障退运数据进行线性函数归一化处理或零均值归一化处理。
可选的,故障特征,包括:离散型特征和连续型特征。
本发明结合机器学习和神经网络的方法对智能电表故障数据进行分析,可以有效的预测出智能电表的故障类型。
附图说明
图1为本发明一种基于机器学习预测智能电能表故障的方法流程图;
图2为本发明一种基于机器学习预测智能电能表故障的方法数据缺失情况图;
图3为本发明一种基于机器学习预测智能电能表故障的***结构图。
具体实施方式
现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。
除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。
本发明提出了一种基于机器学习预测智能电能表故障的方法,如图1所示,包括:
确定故障智能电能表的故障类型及故障类型的发生频率,不同故障类型及发生频率如表1所示。
表1不同故障类型发生频率
Figure BDA0002242793130000041
Figure BDA0002242793130000051
上述统计了故障智能电表可能出现的所有故障及数量,得到故障退回主要是由电池故障造成,除此之外,外观故障、通信单元、软件故障、显示单元也是主要故障退回的次要原因。同时这也为后续智能电表运行状态的评价中运行风险计算提供了依据;
获取故障智能电能表故障退运数据,对故障智能电能表故障退运数据进行预处理,删除重复数据和与故障智能电能表故障无关的数据,补全故障智能电能表故障退运数据缺失值,获取预测数据;
智能电表的故障退运数据是由运行***数据库导出,故障退运数据,包括:智能电能表的厂家信息、批次信息、有功准确度等级、安装地点、库存时间、运行时间、安装时间、异常类别、异常现象、异常时间、故障部位、故障时间、安装地点气候环境信息和安装地点电应力的电气环境信息。
故障电能表退运数据中部分数据与智能电表的故障无关,而且包含一些重复数据,会降低算法的效率,从表中看出一场类别和异常现象是都是一一对应的关系,所以取其中一格即可。
由于退运数据在采集的过程中由于***本身或者环境的原因,会存在一定的缺失值,如图2所示,因此补全这些缺省值可以为后续机器学习提供支持,同时可以提高数据质量,提高分类和预测算法的准确性。
数据的标准化是将数据按照比例进行缩放,使数据落在一个特定的小范围内,其中最为典型的是数据的归一化,即将数据同一映射到[0,1]区间内,其目的在于去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权,进而加快模型的收敛速度和提升模型精度。
常见的归一化方法有线性函数归一化和零均值归一化。
(1)线性函数归一化;
它对原始数据进行先行变换,使结果映射到[0,1]的范围内,实现对原始数据的等比例缩放,线性归一化公式如下:
Figure BDA0002242793130000061
其中X为原始数据,、Xmax和Xmin分别为数据的最大值和最小值。
(2)零均值归一化;
它会将原始数据映射到均值为0、标准差为1的分布上。具体来说,假设原始特征的均值为μ,标准差为σ,那么归一化公式定义为:
Figure BDA0002242793130000062
由于故障智能电表连续数据本身服从正态分布,零均值归一化在能够进行缩放的基础上比线性归一化有更好的效果。
对于厂家信息、安装地点、异常类别、故障部位等以字符串形式输入,此外批次信息和条形码由于没有高低的排序关系,所以也当作字符串处理,对于以字符串形式输入的类别特征,除了决策树等少数模型能直接处理字符串形式的输入外,对于神经网络、支持向量机等分类模型来说,类别型特征必须经过转化为数值型才能有效工作。
特征选择独立于任何机器学习算法,特征选择是根据各种统计检验中的分数确定的特征之间的相关性选择特征,不同的类型数据相关系数可以根据下表2来定义,表2如下:
表1
Figure BDA0002242793130000063
其中离散型的故障类型与其余离散型属性相关性通过线性判别分析进行特征选取,而离散型的故障类型与其余离散型属性相关性通过卡方分析进行特征选取。
(1)线性判别分析(LDA)
线性判别分析是一种有监督的学习算法,同时经常用于特征选择,LDA的基本原理是找到一个投影方向ω使得投影后的样本尽可能按照原始类别分开。也就是最大化类间距离和最小化类那距离。LDA将整个数据集的类内方差定义为各个类分别的方差之和,将目标函数定义为类间距离和类内距离的比值。
设X为包括k个类别数据的矩阵[X1,X2,...,Xk],每个Xi包括含有Ni个样本,则每类样本的均值和所有样本的均值为:
Figure BDA0002242793130000072
由此可计算样本的类内散度矩阵Sw为:
Figure BDA0002242793130000073
定义一个新的矩阵St来表示全局整体的散度,称为全局散度矩阵,如下所示:
全局散度为类间散度与类内散度之和,即St=Sb+Sw,那么类间散度矩阵可表示为:
其中mj是第j个类别中的样本个数,N是总的类别个数,从上式可以看出,类间散度表示的就是每个类别中心到全局中心的一种加权距离,我们最大化类间散度实际上优化的是每个类别的中心经过投影后离全局中心的投影足够远。
根据LDA的原理,可以将最大化的目标定义为:
Figure BDA0002242793130000076
其中W是需要求解的投影超平面,WTW=I。
由此最大化J(W)对应了以下广义特征值求解的问题,公式如下:
Sbω=λSwω
求解最佳投影平面W={ω12,...,ωd},即求解
Figure BDA0002242793130000081
矩阵特征值前d大对应的特征向量组成的矩阵,这就将原始的特征空间投影到了新的d维空间中。特征值大的对应的特征向量分割性能最好。
(2)卡方
卡方检验可以用于测定两个分类变量之间的相关程度。若用f0表示观察值频数,用fe表示期望值频数,则χ2统计量可以写为:
Figure BDA0002242793130000082
两个分类变量越接近,即f0-fe的绝对值越小,计算出的χ2值就越小;反之,f0-fe的绝对值越小,计算出的χ2值也就越小,χ2检验是通过对χ2的计算结果与χ2分布中的临界值进行比较,做出是否拒绝原假设的统计决策。在实际的操作中,一般通过计算列联表进行预备计算。
故障类型作为目标标签属于离散型数据,其余的属性可以分为离散数据(库存时间、运行时间、平均误差、基本误差等)和连续数据(厂家信息、批次信息、安装时间、全检、抽检、运行抽检、地点、出现问题的现象和原因、异常类别),故特征属性的选择主要分为属于离散型的故障类型与其余离散型属性相关性和属于离散型的故障类型与其余离散型属性相关性。
其中离散型的故障类型与其余离散型属性相关性通过线性判别分析进行特征选取。利用线性判别分析进行分析并将结果汇总于,表3所示:
表2
Figure BDA0002242793130000083
根据特征值大的对应的特征向量分割性能最好的原则,四个连续型属性均与故障部位相关性较大。
而离散型的故障类型与其余离散型属性相关性通过卡方分析进行特征选取。
本部分对智能电表数据进行了预处理工作,首先对智能电表的整体进行了统计分析,对不同故障类型发生频率进行了统计分析,然后做了数据筛洗、缺失值处理、连续数据归一化和离散数据归一化等工作,为后续数据输入到机器学***均误差和基本误差等主要的属性。
评价标准包括:准确率、召回率和F1分数,是针对同样的数据,输入不同的算法,或者输入相同的算法但参数不同而给出这个算法或者参数好坏的定量指标。
(1)准确率
准确率是指分类正确的样本样本占总样本个数的比例,即
Figure BDA0002242793130000091
其中ncorrect为被正确分类的样本个数,ntotal为总样本的个数。
准确率是分类问题中最简单也是最直观的评价指标,但存在缺陷。比如,当负样本占99%时,分类器把所有样本都预测为负样本也可以获得99%的准确率。所以当不同类别的样本比例非常不均衡时,占比大的类别往往成为影响准确率的最主要的因素。
(2)精确率和召回率
在介绍精准率和召回率,首先解释混淆矩阵,二分类问题的混淆矩阵由4个数构成。首先我们将二分类问题中,我们关心的,少数的那一部分数据,我们称之为正例(positive),就如同预测癌症,癌症患者就定义为正例。那么剩下的就定义为负例(negative)。于是,我们定义:
TN:算法预测为负例(N),实际上也是负例(N)的个数,即算法预测对了(True);
FP:算法预测为正例(P),实际上是负例(N)的个数,即算法预测错了(False);
FN:算法预测为负例(N),实际上是正例(P)的个数,即算法预测错了(False);
TP:算法预测为正例(P),实际上也是正例(P)的个数,即算法预测对了(True)。
这4个定义由两个字母组成,第1个字母表示算法预测正确或者错误,第2个字母表示算法预测的结果。用混淆矩阵定义如下
预测值0 预测值1
真实值0 TN FP
真实值1 TF TP
精准率(precision)的定义:
Figure BDA0002242793130000101
所以,精准率就是“预测为正例的那些数据里预测正确的数据个数”。
召回率(recall)的定义:
Figure BDA0002242793130000102
所以,召回率就是“真实为正例的那些数据里预测正确的数据个数”。
(3)F1分数
在一些场景下要兼顾精准率和召回率,就有F1 score。F1 score是精准率和召回率的兼顾指标,定义如下:
Figure BDA0002242793130000111
整理一下:
Figure BDA0002242793130000112
其实F1分数是精准率和召回率的调和平均数。调和平均数是当精准率和召回率二者都非常高的时候,它们的调和平均才会高。如果其中之一很低,调和平均就会被拉得接近于那个很低的数。
获取智能电能表故障预测类型,主要根据:决策树、贝叶斯、人工神经网络、K-近邻、支持向量机SVM和基于关联规则的分类等进行获取,本发明采用支持向量机、朴素贝叶斯、逻辑回归进行获取
(1)SVM;
支持向量机(support vector machines)是一个二分类的分类模型(或者叫做分类器)。
支持向量的机分类的思想是,给定给一个包含正例和反例的样本集合,SVM的目的是寻找一个超平面来对样本根据正例和反例进行分割。SVM在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。
在样本空间中,划分超平面可通过如下线性方程来描述:
g(x)=wTx+b=0
假设它已经完成了对样本的分隔,且两种样本的标签分别是{+1,-1},那么对于一个分类器来说,g(x)>0和g(x)<0就可以分别代表两个不同的类别,+1和-1。
SVM的核心思想是尽最大努力使分开的两个类别有最大间隔,这样才使得分隔具有更高的可信度。而且对于未知的新样本才有很好的分类预测能力。
要想让不同类别的数据具有最大的间隔,就是让让离分隔面最近的数据点具有最大的距离。为了描述离分隔超平面最近的数据点,需要找到两个和这个超平面平行和距离相等的超平面:H1:y=wTx+b=+1和H2:y=wTx+b=-1在这两个超平面上的样本点也就是理论上离分隔超平面最近的点,是它们的存在决定了H1和H2的位置,支撑起了分界线,有了这两个超平面就可以定义上面提到的间隔,二维情况下ax+by=c1和ax+by=c2两条平行线的距离公式为:
Figure BDA0002242793130000121
可以推出H1和H2两个超平面的间隔为2/||w||,即现在的目的是要最大化这个间隔。为了之后的求导和计算方便,进一步等价于最小化
Figure BDA0002242793130000122
假设超平面能将样本正确分类,则可令:
wTxi+b≥+1,yi=+1
wTxi+b≤-1,yi=-1
综合两个式子可得:
yi(wTxi+b)≥1
这就是目标函数的约束条件。现在这个问题就变成了一个最优化问题:
Figure BDA0002242793130000123
s.t.yi(wTxi+b)≥1,i=0,1,2....
(2)朴素贝叶斯;
朴素贝叶斯模型通过预测指定样本属于特定类别的概率P(yi|x)来预测该样本的所属的类别,即
y=maxP(yi|x)
P(yi|x)可以写成
Figure BDA0002242793130000124
其中x=(x1,x2,...,xn)为样本对应的特征向量,P(x)为样本的先验概率。对于特定的样本x和任意类型yi,P(x)的取值均相同,并不会影响P(yi|x)取值的相对大小,因此在计算中可以被忽略。假设特征x1,x2,...,xn相互独立,可以得到:
P(yi|x)∝P(x|yi)P(yi)
=P(x1|y1)P(y1)P(x2|y2)...P(xn|yi)P(yi)
其中P(x1|y1)和(y1)P(x2|y2)...P(xn|yi),以及P(yi)可以通过训练样本统计得到。
(3)逻辑回归;
多分类逻辑回归是基于逻辑回归(Logistic Regression)来做的,逻辑回归的基本表示如下:
Figure BDA0002242793130000131
将上述逻辑回归的公式进行整理,我们可以得到
Figure BDA0002242793130000132
其中p=P(y=1|x),也就是将给定输入x预测为正样本的概率。逻辑回归中可以通过下面极大似然函数的学习,得到最佳的参数θ。
Figure BDA0002242793130000133
接下来处理多分类问题。首先,如果一个样本只对应一个标签,我们可以假设每个样本属于不同标签的概率服从几何分布,使用多项逻辑回归(Softmax Regression)来进行分类
其中θ12,...,θK∈>>n为模型的参数,而
Figure BDA0002242793130000135
可以看作是对概率的归一化。为了方便起见,我们将{θ12,...,θK}这k个列向量按照顺序排列成n×k维矩阵,写成θ,表示整个参数集。一般来说,多项逻辑回归具有参数冗余的特点,即将θ12,...,θK同时加减一个向量后预测结果不变,特别地,当类别为2时,
Figure BDA0002242793130000141
利用参数冗余的特点,我们将所有的参数减去θ1,上式变为
Figure BDA0002242793130000142
其中,θ=θ21。而整理后的式子与逻辑回归一致。因此,多项逻辑回归实际上是二分类逻辑回归在多标签分类下的一种拓展。
获取智能电能表数据,根据智能电能表故障预测模型,对智能电能表故障进行预测,确定智能电能表预测故障类型。
下面结合实施例对本发明进行进一步说明。
选择2016年某地区经过预处理之后的数据有24586条,有厂家信息、批次信息、条码号、库存时间、运行时间、故障次数、故障时间、地点、出现问题的现象和原因、异常类别、异常现象、异常时间、有功准确度等级、基本误差等14个属性,其中75%作为训练数据对模型进行训练,使用剩余的25%故障数据用作测试,评价模型效果,如下所示:
Figure BDA0002242793130000143
以上是三种分类算法的结果,其中逻辑回归表现的比较差,而支持向量和朴素贝叶斯表现较好。从准确率来看,朴素贝叶斯效果最好,其次是是支持向量机,但其差距与朴素贝叶斯相差不大,逻辑回归的效果最差,同样召回率中支持向量机、朴素贝叶斯也是较高,逻辑回归的效果最差,结合F1分数的定义,准确率与召回率高的分类方法,其F1的分数也较高,从表10中的结果也可以印证这一点。因此,在测试的样本相同的情况下,朴素贝叶斯分类效果最好。
本发明还提出了一种基于机器学习预测智能电能表故障的***200,如图3所示,包括:
确定故障类型模块201,确定故障智能电能表的故障类型;
数据获取模块202,获取故障智能电能表故障退运数据,对故障智能电能表故障退运数据进行预处理,删除重复数据和与故障智能电能表故障无关的数据,补全故障智能电能表故障退运数据缺失值,获取预测数据;
指标确定模块203,根据预测数据,对故障智能电能表的故障类型进行故障特征选择,确定与故障有关的特征数据;
模型生成模块204,根据所述故障智能电能表的故障类型及故障有关的特征关系及智能电能表预测评价标准,获取智能电能表故障预测模型;
预测模块205,获取智能电能表数据,根据智能电能表故障预测模型,对智能电能表故障进行预测,确定智能电能表预测故障类型。
故障退运数据,包括:智能电能表的厂家信息、批次信息、有功准确度等级、安装地点、库存时间、运行时间、安装时间、异常类别、异常现象、异常时间、故障部位、故障时间、安装地点气候环境信息和安装地点电应力的电气环境信息。
预处理为对故障智能电能表故障退运数据进行线性函数归一化处理或零均值归一化处理。
故障特征,包括:离散型特征和连续型特征。
本发明结合机器学习和神经网络的方法对智能电表故障数据进行分析,可以有效的预测出智能电表的故障类型。

Claims (8)

1.一种基于机器学习预测智能电能表故障的方法,所述方法包括:
确定故障智能电能表的故障类型;
获取故障智能电能表故障退运数据,对故障智能电能表故障退运数据进行预处理,删除重复数据和与故障智能电能表故障无关的数据,补全故障智能电能表故障退运数据缺失值,获取预测数据;
根据预测数据,对故障智能电能表的故障类型进行故障特征选择,确定与故障有关的特征数据;
根据所述故障智能电能表的故障类型及故障有关的特征关系及智能电能表预测评价标准,获取智能电能表故障预测模型;
获取智能电能表与故障有关的特征数据,根据智能电能表故障预测模型,对智能电能表故障进行预测,确定智能电能表预测故障类型。
2.根据权利要求1所述的方法,所述的故障退运数据,包括:故障智能电能表的厂家信息、批次信息、有功准确度等级、安装地点、库存时间、运行时间、安装时间、异常类别、异常现象、异常时间、故障部位、故障时间、安装地点气候环境信息和安装地点电应力的电气环境信息。
3.根据权利要求1所述的方法,所述的预处理为对故障智能电能表故障退运数据进行线性函数归一化处理或零均值归一化处理。
4.根据权利要求1所述的方法,所述的故障特征,包括:离散型特征和连续型特征。
5.一种基于机器学习预测智能电能表故障的***,所述***包括:
确定故障类型模块,确定故障智能电能表的故障类型;
数据获取模块,获取故障智能电能表故障退运数据,对故障智能电能表故障退运数据进行预处理,删除重复数据和与故障智能电能表故障无关的数据,补全故障智能电能表故障退运数据缺失值,获取预测数据;
指标确定模块,根据预测数据,对故障智能电能表的故障类型进行故障特征选择,确定与故障有关的特征数据;
模型生成模块,根据所述故障智能电能表的故障类型及故障有关的特征关系及智能电能表预测评价标准,获取智能电能表故障预测模型;
预测模块,获取智能电能表数据,根据智能电能表故障预测模型,对智能电能表故障进行预测,确定智能电能表预测故障类型。
6.根据权利要求5所述的***,所述的故障退运数据,包括:智能电能表的厂家信息、批次信息、有功准确度等级、安装地点、库存时间、运行时间、安装时间、异常类别、异常现象、异常时间、故障部位、故障时间、安装地点气候环境信息和安装地点电应力的电气环境信息。
7.根据权利要求5所述的***,所述的预处理为对故障智能电能表故障退运数据进行线性函数归一化处理或零均值归一化处理。
8.根据权利要求5所述的***,所述的故障特征,包括:离散型特征和连续型特征。
CN201911006007.3A 2019-10-22 2019-10-22 一种基于机器学习预测智能电能表故障的方法及*** Pending CN110794360A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911006007.3A CN110794360A (zh) 2019-10-22 2019-10-22 一种基于机器学习预测智能电能表故障的方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911006007.3A CN110794360A (zh) 2019-10-22 2019-10-22 一种基于机器学习预测智能电能表故障的方法及***

Publications (1)

Publication Number Publication Date
CN110794360A true CN110794360A (zh) 2020-02-14

Family

ID=69440574

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911006007.3A Pending CN110794360A (zh) 2019-10-22 2019-10-22 一种基于机器学习预测智能电能表故障的方法及***

Country Status (1)

Country Link
CN (1) CN110794360A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111612019A (zh) * 2020-05-15 2020-09-01 国网河北省电力有限公司电力科学研究院 一种基于大数据模型对智能电表故障异常辨识分析的方法
CN113011530A (zh) * 2021-04-29 2021-06-22 国网新疆电力有限公司营销服务中心(资金集约中心、计量中心) 一种基于多分类器融合的智能电表故障预测方法
CN113033642A (zh) * 2021-03-17 2021-06-25 广东电网有限责任公司计量中心 一种基于告警事件的智能电能表状态判断方法及***
CN113359037A (zh) * 2021-06-11 2021-09-07 国网新疆电力有限公司营销服务中心(资金集约中心、计量中心) 基于bp神经网络的燃料电池故障诊断方法
CN114002643A (zh) * 2021-11-25 2022-02-01 国网北京市电力公司 电能表检测方法、装置、电子设备与计算机可读存储介质
CN114089257A (zh) * 2021-10-27 2022-02-25 国网湖南省电力有限公司 一种电能表烧表在线监测方法、***及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108320040A (zh) * 2017-01-17 2018-07-24 国网重庆市电力公司 基于贝叶斯网络优化算法的采集终端故障预测方法及***
CN109409620A (zh) * 2018-12-29 2019-03-01 国网福建省电力有限公司 一种基于大数据平台的智能电表故障分析和预测***
US20190121337A1 (en) * 2016-04-12 2019-04-25 Grid4C A method and system for hvac malfunction and inefficiency detection over smart meters data
CN110059357A (zh) * 2019-03-19 2019-07-26 中国电力科学研究院有限公司 一种基于自编码网络的智能电能表故障分类检测方法及***
CN110244256A (zh) * 2019-07-22 2019-09-17 广东工业大学 一种智能电能表故障识别方法、装置及设备
CN110297207A (zh) * 2019-07-08 2019-10-01 国网上海市电力公司 智能电表的故障诊断方法、***及电子装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190121337A1 (en) * 2016-04-12 2019-04-25 Grid4C A method and system for hvac malfunction and inefficiency detection over smart meters data
CN108320040A (zh) * 2017-01-17 2018-07-24 国网重庆市电力公司 基于贝叶斯网络优化算法的采集终端故障预测方法及***
CN109409620A (zh) * 2018-12-29 2019-03-01 国网福建省电力有限公司 一种基于大数据平台的智能电表故障分析和预测***
CN110059357A (zh) * 2019-03-19 2019-07-26 中国电力科学研究院有限公司 一种基于自编码网络的智能电能表故障分类检测方法及***
CN110297207A (zh) * 2019-07-08 2019-10-01 国网上海市电力公司 智能电表的故障诊断方法、***及电子装置
CN110244256A (zh) * 2019-07-22 2019-09-17 广东工业大学 一种智能电能表故障识别方法、装置及设备

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111612019A (zh) * 2020-05-15 2020-09-01 国网河北省电力有限公司电力科学研究院 一种基于大数据模型对智能电表故障异常辨识分析的方法
CN113033642A (zh) * 2021-03-17 2021-06-25 广东电网有限责任公司计量中心 一种基于告警事件的智能电能表状态判断方法及***
CN113011530A (zh) * 2021-04-29 2021-06-22 国网新疆电力有限公司营销服务中心(资金集约中心、计量中心) 一种基于多分类器融合的智能电表故障预测方法
CN113359037A (zh) * 2021-06-11 2021-09-07 国网新疆电力有限公司营销服务中心(资金集约中心、计量中心) 基于bp神经网络的燃料电池故障诊断方法
CN114089257A (zh) * 2021-10-27 2022-02-25 国网湖南省电力有限公司 一种电能表烧表在线监测方法、***及介质
CN114089257B (zh) * 2021-10-27 2023-08-18 国网湖南省电力有限公司 一种电能表烧表在线监测方法、***及介质
CN114002643A (zh) * 2021-11-25 2022-02-01 国网北京市电力公司 电能表检测方法、装置、电子设备与计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN110794360A (zh) 一种基于机器学习预测智能电能表故障的方法及***
CN107301296B (zh) 基于数据的断路器故障影响因素定性分析方法
CN111882446B (zh) 一种基于图卷积网络的异常账户检测方法
CN110866819A (zh) 一种基于元学习的自动化信贷评分卡生成方法
CN111832647A (zh) 异常流量检测***及方法
Hsu et al. Ensemble convolutional neural networks with weighted majority for wafer bin map pattern classification
CN108304567B (zh) 高压变压器工况模式识别与数据分类方法及***
US20220383322A1 (en) Clustering-based data selection for optimization of risk predictive machine learning models
CN111751714A (zh) 一种基于svm和hmm的射频模拟电路故障诊断方法
CN113778894B (zh) 测试用例的构建方法、装置、设备及存储介质
CN111126820A (zh) 反窃电方法及***
CN111325410A (zh) 基于样本分布的通用故障预警***及其预警方法
CN115858794B (zh) 用于网络运行安全监测的异常日志数据识别方法
CN113408548A (zh) 变压器异常数据检测方法、装置、计算机设备和存储介质
CN112395168A (zh) 一种基于Stacking的边缘侧业务行为识别方法
CN115112372A (zh) 轴承故障诊断方法、装置、电子设备及存储介质
CN115984158A (zh) 缺陷分析方法、装置、电子设备及计算机可读存储介质
CN111737993A (zh) 一种配电网设备的故障缺陷文本提取设备健康状态方法
CN111209955A (zh) 基于深度神经网络和随机森林的飞机电源***故障识别方法
CN116520154A (zh) 锂电池极片检测的性能评估方法及其***
CN112148605B (zh) 一种基于谱聚类的半监督学习的软件缺陷预测方法
CN115034762A (zh) 一种岗位推荐方法、装置、存储介质、电子设备及产品
Yang et al. An evidential reasoning rule-based ensemble learning approach for evaluating credit risks with customer heterogeneity
Yang et al. Deep ensemble siamese network for incremental signal classification
CN103984756B (zh) 基于半监督概率潜在语义分析的软件变更日志分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200214

RJ01 Rejection of invention patent application after publication