CN110222991A - 基于rf-gbdt的计量装置故障诊断方法 - Google Patents

基于rf-gbdt的计量装置故障诊断方法 Download PDF

Info

Publication number
CN110222991A
CN110222991A CN201910500766.9A CN201910500766A CN110222991A CN 110222991 A CN110222991 A CN 110222991A CN 201910500766 A CN201910500766 A CN 201910500766A CN 110222991 A CN110222991 A CN 110222991A
Authority
CN
China
Prior art keywords
model
electric energy
gbdt
electricity
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910500766.9A
Other languages
English (en)
Other versions
CN110222991B (zh
Inventor
殷新博
陆芸
王数
杜健
杨汉新
马凯
殷萍
张馨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changzhou Power Supply Branch Jiangsu Electric Power Co Ltd
State Grid Corp of China SGCC
State Grid Jiangsu Electric Power Co Ltd
Original Assignee
Changzhou Power Supply Branch Jiangsu Electric Power Co Ltd
State Grid Corp of China SGCC
State Grid Jiangsu Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changzhou Power Supply Branch Jiangsu Electric Power Co Ltd, State Grid Corp of China SGCC, State Grid Jiangsu Electric Power Co Ltd filed Critical Changzhou Power Supply Branch Jiangsu Electric Power Co Ltd
Priority to CN201910500766.9A priority Critical patent/CN110222991B/zh
Publication of CN110222991A publication Critical patent/CN110222991A/zh
Application granted granted Critical
Publication of CN110222991B publication Critical patent/CN110222991B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于RF‑GBDT的计量装置故障诊断方法,其具体方法是:基于计量装置属性数据、历史电量数据、气象数据、计量异常记录数据等相关数据,对异常发现时间前15天的数据提取电量特征、天气特征等相关指标,构建RF‑GBDT模型,对计量装置是否故障进行识别诊断。RF‑GBDT模型可应用于计量装置故障诊断中,输出计量装置故障疑似清单,根据疑似清单开展计量装置故障特征分析,全面了解疑似故障计量装置的特征规律,实现有针对性地实施计量装置精准抢修服务,提高计量装置故障管理水平,提升用户服务满意度。

Description

基于RF-GBDT的计量装置故障诊断方法
技术领域
本发明涉及信息技术领域,特别涉及一种智能故障诊断技术。
背景技术
随着经济发展的加快和人们生活质量的提高,对电力需求不断加剧,计量装置能否健康稳定的运行直接影响着电力公司生产发展的状况,关系着电力公司的经济效益;同时,也是确保电量贸易结算公正与公平,保证用户安全用电的关键所在。计量装置主要由计量柜、电能表等构成,其分布广、数量大,并且由于窃电行为、***干扰、外部环境等因素的影响导致了计量装置容易出现各种故障问题。为了保障计量装置的可靠性,依据现有的国家相关检定规程以及电力公司相关计量技术标准,对计量装置进行定期检定或校准,以发现和排除故障问题。这种传统方法主要通过人工的信息处理和判断分析,其自学习能力很差,故障诊断准确率也不高,极易发生漏判和误判,从而导致现场检验工作量大和工作效率低下。基层计量专业班组主要通过人工的信息处理判断计量装置异常、故障情况,同时存在现场检验工作量大,工作效率低下,安全风险高等问题,故障时间判别周期较长,容易引起客户投诉,无法实现计量装置故障的在线诊断和提前预判。
近几年,人工智能技术不断发展,智能故障诊断技术对故障信息有了一定的智能分析和自学习能力,可提升故障诊断准确率,降低现场检验的工作量。该技术逐渐得到了广泛的应用,例如:2013年,陈忱等人提出一种BP-AdaBoost复合神经网络故障预测方法应用于电子式电能表的典型故障,但BP神经网络本身存在过拟合、泛化能力差、隐藏节点个数难以确定的问题;2017年,李梦宇等人提出了基于CART算法的电能表故障概率决策树分析,CART算法具有较高的精确度、抗噪能力。随机森林(RF)和梯度提升决策树(GBDT)相对于传统的CART算法具有更强的泛化能力和分类效果,并且具有调节参数时间少的优点。若将RF和GBDT按权重组合成RF-GBDT算法,其分类准确率比单个RF算法和GBDT算法还要高。但是,截至目前为止,将RF-GBDT算法应用于计量装置故障诊断上的研究还较稀少。
发明内容
本发明要解决的技术问题是提供一种可提高故障诊断的准确率和降低现场检验工作量的基于RF-GBDT的计量装置故障诊断方法。
实现本发明目的的技术方案是提供一种基于RF-GBDT的计量装置故障诊断方法,包括如下步骤:
步骤一、数据收集;
以电能表为研究对象,梳理数据关系,实现采集数据贯通;从营销业务***、用电采集***、天气网站着手,抽取电能表属性数据、测量点日冻结电能示值数据、计量异常事件数据、气象数据数据;
步骤二、数据预处理;
对数据进行数据清洗、数据变换、数据规约数据处理形成数据宽表;
步骤三、提取特征指标;
提取时间特征、电量特征、天气特征这三个维度的特征指标;
步骤四、模型构建;
假定{(ui,vi)},i=1,2,...,n为样本,n为样本的数量,其中ui=(ui1,ui2,...uiq)为模型的第i个样本输入变量,q为模型的特征数量,uij为第j个特征指标第i个样本,vi为模型的第i个样本目标变量即是否故障;采用随机划分方法选取80%的样本作为训练集,20%的样本作为测试集,构建RF-GBDT模型;RF-GBDT模型是在单一的RF模型和GBDT模型的基础上按权重线性组合两算法集成的;下面先利用训练集分别构建RF模型和GBDT模型;训练集的样本量为0.8n,0.8n不管是整数还是小数,这里都先这样表示;当0.8n为小数时,计算时将会四舍五入为整数;
RF模型构建过程如下:选取天气特征、电量特征这两个维度指标作为输入变量,利用训练集构建RF模型,RF模型的输出结果为预测值、预测概率;这里设第i个样本的RF模型预测值为wi,RF模型预测概率为xi,则RF模型的预测概率向量为X=(x1,x2,…,x0.8n);RF模型的结果样例如下表2;
表2RF模型的结果样例表
样本序号 输入变量 目标变量 预测值 预测概率
1 u<sub>1</sub> v<sub>1</sub> w<sub>1</sub> x<sub>1</sub>
2 u<sub>2</sub> v<sub>2</sub> w<sub>2</sub> x<sub>2</sub>
... ... ... ... ...
为了评价RF模型的识别效果的优劣,选用将精准率和召回率组合的综合评价指标(F1)作为识别准确率;综合评价指标(F1)定义如下:
其中T为被预测为正的正样本分类数,P为被预测为正的负样本分类数,Q为被预测为负的正样本分类数;
利用公式(1)可计算出RF模型的识别准确率为a,其中a为RF模型的识别准确率,是一个数值;
同样地构建GBDT模型如下:选取时间特征、电量特征这两个维度指标作为输入变量,利用训练集构建GBDT模型,GBDT模型的输出结果为预测值、预测概率;这里设第i个样本的GBDT模型预测值为Wi,预测概率为yi,则GBDT模型的预测概率向量为Y=(y1,y2,…,y0.8n);利用公式(1)可计算出GBDT模型的识别准确率为b,其中b为GBDT模型的识别准确率,是一个数值,这里b与前面a是两个不同的数值;
RF-GBDT模型的构建过程如下:假定RF模型的权重为a/(a+b),GBDT模型的权重为b/(a+b),这里的权重是根据识别准确率组合获得的;那么将RF模型的预测概率向量X和GBDT模型的预测概率Y按权重线性组合的预测概率向量Z如下:
假设向量Z为RF-GBDT模型的预测概率向量,RF-GBDT模型的阈值为ε,则第i个样本的RF-GBDT模型预测值为gi,gi定义如公式(3)所示:
若RF-GBDT模型预测值gi为1,则代表发生故障,否则未发生故障;因此,RF-GBDT模型预测值向量G如下:
G=(g1,g2,…,g0.8n) (4)
向量Z和向量G是RF-GBDT模型的故障预测概率向量和预测值向量;
步骤五、模型评价;
将训练好的RF-GBDT模型应用到测试集上,利用综合评价指标(F1)评价模型的优劣;若F1大于0.8,则输出最佳的RF-GBDT模型;否则重新执行步骤四进行参数优化;若一直达不到,可以重新执行步骤三,重新选取特征指标,重新构建模型;注意的是本次所选案例的RF-GBDT模型识别准确率达到90%以上,RF-GBDT模型达到可以接受的范围。
进一步的,步骤一中,其中计量异常事件包括电能表总与各费率之和不一致、电能表飞走、电能表倒走、电能表停走、电能表反向潜动或者电能表时钟电池故障、电能表开表盖异常事件;计量异常事件数据是来源于营销***中申请计量异常处理的任务记录数据,包括异常发现时间、异常处理结果记录;电能表属性数据是某市供电公司低压用户的电能表的电能表标识、安装日期相关属性数据;测量点日冻结电能示值数据包括异常发现时间前15天的正向有功总电能示值、正向有功尖电能示值、正向有功峰电能示值、正向有功平电能示值、正向有功谷电能示值相关数据。
更进一步的,步骤二中,数据变换包括:从测量点日冻结电能示值数据中获取了正向有功总电能示值、正向有功尖电能示值、正向有功峰电能示值、正向有功平电能示值、正向有功谷电能示值字段;通过当天的正向有功总电能示值减去前一天的正向有功总电能再乘以综合倍率获得当天的电量;同理,获得了当天的尖电量、峰电量、平电量、谷电量;电量差分是通过当天的电量减去前一天的电量获得当天的电量差分;天气等级是根据不同天气对电能表故障的影响程度分为0-7级;运行年限是异常发现时间与安装日期相差的年限;带病运行时长是指异常处理时间与异常发现时间相差的天数。
更更进一步的,提取时间特征、电量特征、天气特征这三个维度的特征指标的具体内容如下表1所示;针对电量特征,分别按15天提取电量空值时长、电量零值时长、电量负值时长、电量均值、电量标准差、电量差分均值统计量;针对天气特征,对最高气温、最低气温、天气等级分别按15天取均值;
表1特征指标情况表
进一步的,所述基于RF-GBDT的计量装置故障诊断方法还包括步骤六,将训练好的RF-GBDT模型进行后续的应用,实现计量装置提取预判与精准抢修,应用如下:
建立协调联动工作机制,实现异动问题闭环管控;加强与营销部、运检部的合作,建立协同工作机制;定期应用RF-GBDT模型进行在线故障识别,提前判断疑似故障电能表,将故障预测概率较高的电能表清单输出;根据疑似清单,开展计量装置故障特征分析;从用户类型、供电单位、生产厂家、异常发现日期、故障原因、天气角度分析电能表数量分布特征,全面了解疑似故障电能表的特征规律,实现有针对性地实施电能表精准抢修服务。
本发明具有积极的效果:(1)本发明基于计量装置属性数据、历史电量数据、气象数据、计量异常记录数据等相关数据,利用了RF-GBDT算法构建计量装置故障诊断模型,识别诊断计量装置是否故障。RF-GBDT模型是在单一的随机森林RF和梯度提升决策树GBDT的基础上按权重线性组合两算法集成了RF-GBDT模型。RF-GBDT模型的分类准确率比单个RF模型和GBDT模型都要高。RF-GBDT模型可应用于计量装置异常检测中,能够实现计量装置故障的在线诊断和提前预判,具有一定的智能分析和自学习能力,可提高故障诊断的准确率和降低现场检验的工作量。
(2)本发明能缩小故障查处范围,提升计量装置管理水平。通过该发明的应用,改变了营销部门传统定期检定或校准的方式,实现了计量装置故障的在线诊断与提前预判,缩小了查处范围,极大地提高了查处计量装置故障的效率和精准度,为营销计量装置质量管控提供了有力工具。
(3)本发明能促进电力公司降本增效。较好地发挥了监测作用,提高了故障诊断效率,降低故障诊断和维护的人力、物力、财力等综合成本,有效降低了公司运营成本,防范潜在故障损失风险。
(4)本发明能提升电力公司的精准服务水平,降低客户投诉率。利用计量装置故障疑似清单,转被动为主动,有预见性、有针对性地采取措施来减少突发性的损失,降低客户投诉率。
附图说明
图1为本发明的电能表故障诊断模型的挖掘建模流程图;
图2为训练RF-GBDT模型的流程图。
具体实施方式
(实施例1)
本实施的基于RF-GBDT的计量装置故障诊断方法,基于计量装置属性数据、历史电量数据、气象数据、计量异常记录数据等相关数据,对异常发现时间前15天的数据提取电量特征、天气特征等相关指标,构建RF-GBDT模型,对计量装置是否故障进行识别诊断。RF-GBDT模型可应用于计量装置故障诊断中,输出计量装置故障疑似清单,根据疑似清单开展计量装置故障特征分析,全面了解疑似故障计量装置的特征规律,实现有针对性地实施计量装置精准抢修服务,提高计量装置故障管理水平,提升用户服务满意度。以电能表为研究对象,采用RF-GBDT算法构建电能表故障诊断模型。电能表故障诊断模型的挖掘建模流程图如图1所示。
为了构建RF-GBDT模型,实现对计量装置是否故障进行识别诊断,首先需要训练RF-GBDT模型,训练RF-GBDT模型流程图如下图2所示。
根据图2,本实施例的基于RF-GBDT的计量装置故障诊断方法包括如下步骤:
步骤一、数据收集:梳理数据关系,提取特征指标。
以电能表为研究对象,梳理数据关系,实现采集数据贯通。从营销业务***、用电采集***、天气网站着手,抽取电能表属性数据、历史电量数据(测量点日冻结电能示值数据)、计量异常事件数据、气象数据数据,其中计量异常事件包括电能表总与各费率之和不一致、电能表飞走、电能表倒走、电能表停走、电能表反向潜动或者电能表时钟电池故障、电能表开表盖异常事件。计量异常事件数据是来源于营销***中申请计量异常处理的任务记录数据,包括异常发现时间、异常处理结果(是否故障)等记录。电能表属性数据是某市供电公司低压用户的电能表的电能表标识、安装日期等相关属性数据。测量点日冻结电能示值数据包括异常发现时间前15天的正向有功总电能示值、正向有功尖电能示值、正向有功峰电能示值、正向有功平电能示值、正向有功谷电能示值相关数据。
步骤二、数据预处理。
对数据进行数据清洗、数据变换、数据规约等数据处理形成数据宽表。主要说明一下数据变换,数据变换包括:从测量点日冻结电能示值数据中获取了正向有功总电能示值、正向有功尖电能示值、正向有功峰电能示值、正向有功平电能示值、正向有功谷电能示值等字段。通过当天的正向有功总电能示值减去前一天的正向有功总电能再乘以综合倍率获得当天的电量。同理,获得了当天的尖电量、峰电量、平电量、谷电量。电量差分是通过当天的电量减去前一天的电量获得当天的电量差分。天气等级是根据不同天气对电能表故障的影响程度分为0-7级。运行年限是异常发现时间与安装日期相差的年限。带病运行时长是指异常处理时间与异常发现时间相差的天数。
步骤三、提取特征指标。
提取时间特征、电量特征、天气特征这三个维度的特征指标,如下表1。针对电量特征,分别按15天提取电量空值时长、电量零值时长、电量负值时长、电量均值、电量标准差、电量差分均值等统计量。针对天气特征,对最高气温、最低气温、天气等级分别按15天取均值。
表1特征指标情况表
步骤四、模型构建。
假定{(ui,vi)},i=1,2,...,n为样本,n为样本的数量,其中ui=(ui1,ui2,...uiq)为模型的第i个样本输入变量,q为模型的特征数量,uij为第j个特征指标第i个样本,vi为模型的第i个样本目标变量(是否故障)。采用随机划分方法选取80%的样本作为训练集,20%的样本作为测试集,构建RF-GBDT模型。RF-GBDT模型是在单一的RF模型和GBDT模型的基础上按权重线性组合两算法集成的。下面先利用训练集分别构建RF模型和GBDT模型。训练集的样本量为0.8n,0.8n不管是整数还是小数,这里都先这样表示。当0.8n为小数时,计算时将会四舍五入为整数。
RF模型构建过程如下:选取天气特征、电量特征这两个维度指标作为输入变量(此时模型的特征数量q为23),利用训练集构建RF模型(随机森林RF算法是已有的算法,这里就不再赘述),RF模型的输出结果为预测值、预测概率。这里设第i个样本的RF模型预测值为wi,RF模型预测概率为xi,则RF模型的预测概率向量为X=(x1,x2,…,x0.8n)。RF模型的结果样例如下表2。
表2 RF模型的结果样例表
样本序号 输入变量 目标变量 预测值 预测概率
1 u<sub>1</sub> v<sub>1</sub> w<sub>1</sub> x<sub>1</sub>
2 u<sub>2</sub> v<sub>2</sub> w<sub>2</sub> x<sub>2</sub>
... ... ... ... ...
为了评价RF模型的识别效果的优劣,选用将精准率和召回率组合的综合评价指标(F1)作为识别准确率。综合评价指标(F1)定义如下:
其中T为被预测为正的正样本分类数,P为被预测为正的负样本分类数,Q为被预测为负的正样本分类数。
利用公式(1)可计算出RF模型的识别准确率为a,其中a为RF模型的识别准确率,是一个数值。
同样地构建GBDT模型如下:选取时间特征、电量特征这两个维度指标作为输入变量(此时模型的特征数量q为24),利用训练集构建GBDT模型(梯度提升决策树GBDT算法是已有的算法,这里就不再赘述),GBDT模型的输出结果为预测值、预测概率。这里设第i个样本的GBDT模型预测值为Wi,预测概率为yi,则GBDT模型的预测概率向量为Y=(y1,y2,…,y0.8n)。利用公式(1)可计算出GBDT模型的识别准确率为b,其中b为GBDT模型的识别准确率,是一个数值,这里b与前面a是两个不同的数值。
RF-GBDT模型的构建过程如下:假定RF模型的权重为a/(a+b),GBDT模型的权重为b/(a+b),这里的权重是根据识别准确率组合获得的。那么将RF模型的预测概率向量X和GBDT模型的预测概率Y按权重线性组合的预测概率向量Z如下:
假设向量Z为RF-GBDT模型的预测概率向量,RF-GBDT模型的阈值为ε,则第i个样本的RF-GBDT模型预测值为gi,gi定义如公式(3)所示:
若RF-GBDT模型预测值gi为1,则代表发生故障,否则未发生故障。因此,RF-GBDT模型预测值向量G如下:
G=(g1,g2,…,g0.8n) (4)
向量Z和向量G是RF-GBDT模型的故障预测概率向量和预测值向量。
步骤五、模型评价。
将训练好的RF-GBDT模型应用到测试集上,利用综合评价指标(F1)评价模型的优劣。若F1大于0.8,则输出最佳的RF-GBDT模型;否则重新执行步骤四进行参数优化。若一直达不到,可以重新执行步骤三,重新选取特征指标,重新构建模型。注意的是本次所选案例的RF-GBDT模型识别准确率达到90%以上,RF-GBDT模型达到可以接受的范围。
上述是RF-GBDT模型训练过程,将训练好的RF-GBDT模型进行后续的应用,实现计量装置提取预判与精准抢修,应用如下:
建立协调联动工作机制,实现异动问题闭环管控。加强与营销部、运检部的合作,建立协同工作机制。定期应用RF-GBDT模型进行在线故障识别,提前判断疑似故障电能表,将故障预测概率较高的电能表清单输出。根据疑似清单,开展计量装置故障特征分析。从用户类型、供电单位、生产厂家、异常发现日期、故障原因、天气等角度分析电能表数量分布特征,全面了解疑似故障电能表的特征规律,实现有针对性地实施电能表精准抢修服务,提高电能表故障处理效率,提升用户服务满意度。
显然,上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而这些属于本发明的精神所引伸出的显而易见的变化或变动仍处于本发明的保护范围之中。

Claims (5)

1.一种基于RF-GBDT的计量装置故障诊断方法,其特征在于包括如下步骤:
步骤一、数据收集;
以电能表为研究对象,梳理数据关系,实现采集数据贯通;从营销业务***、用电采集***、天气网站着手,抽取电能表属性数据、测量点日冻结电能示值数据、计量异常事件数据、气象数据数据;
步骤二、数据预处理;
对数据进行数据清洗、数据变换、数据规约数据处理形成数据宽表;
步骤三、提取特征指标;
提取时间特征、电量特征、天气特征这三个维度的特征指标;
步骤四、模型构建;
假定{(ui,vi)},i=1,2,...,n为样本,n为样本的数量,其中ui=(ui1,ui2,...uiq)为模型的第i个样本输入变量,q为模型的特征数量,uij为第j个特征指标第i个样本,vi为模型的第i个样本目标变量即是否故障;采用随机划分方法选取80%的样本作为训练集,20%的样本作为测试集,构建RF-GBDT模型;RF-GBDT模型是在单一的RF模型和GBDT模型的基础上按权重线性组合两算法集成的;下面先利用训练集分别构建RF模型和GBDT模型;训练集的样本量为0.8n,0.8n不管是整数还是小数,这里都先这样表示;当0.8n为小数时,计算时将会四舍五入为整数;
RF模型构建过程如下:选取天气特征、电量特征这两个维度指标作为输入变量,利用训练集构建RF模型,RF模型的输出结果为预测值、预测概率;这里设第i个样本的RF模型预测值为wi,RF模型预测概率为xi,则RF模型的预测概率向量为X=(x1,x2,…,x0.8n);RF模型的结果样例如下表2;
表2 RF模型的结果样例表
样本序号 输入变量 目标变量 预测值 预测概率 1 u<sub>1</sub> v<sub>1</sub> w<sub>1</sub> x<sub>1</sub> 2 u<sub>2</sub> v<sub>2</sub> w<sub>2</sub> x<sub>2</sub> ... ... ... ... ...
为了评价RF模型的识别效果的优劣,选用将精准率和召回率组合的综合评价指标(F1)作为识别准确率;综合评价指标(F1)定义如下:
其中T为被预测为正的正样本分类数,P为被预测为正的负样本分类数,Q为被预测为负的正样本分类数;
利用公式(1)可计算出RF模型的识别准确率为a,其中a为RF模型的识别准确率,是一个数值;
同样地构建GBDT模型如下:选取时间特征、电量特征这两个维度指标作为输入变量,利用训练集构建GBDT模型,GBDT模型的输出结果为预测值、预测概率;这里设第i个样本的GBDT模型预测值为Wi,预测概率为yi,则GBDT模型的预测概率向量为Y=(y1,y2,…,y0.8n);利用公式(1)可计算出GBDT模型的识别准确率为b,其中b为GBDT模型的识别准确率,是一个数值,这里b与前面a是两个不同的数值;
RF-GBDT模型的构建过程如下:假定RF模型的权重为a/(a+b),GBDT模型的权重为b/(a+b),这里的权重是根据识别准确率组合获得的;那么将RF模型的预测概率向量X和GBDT模型的预测概率Y按权重线性组合的预测概率向量Z如下:
假设向量Z为RF-GBDT模型的预测概率向量,RF-GBDT模型的阈值为ε,则第i个样本的RF-GBDT模型预测值为gi,gi定义如公式(3)所示:
若RF-GBDT模型预测值gi为1,则代表发生故障,否则未发生故障;因此,RF-GBDT模型预测值向量G如下:
G=(g1,g2,…,g0.8n) (4)
向量Z和向量G是RF-GBDT模型的故障预测概率向量和预测值向量;
步骤五、模型评价;
将训练好的RF-GBDT模型应用到测试集上,利用综合评价指标(F1)评价模型的优劣;若F1大于0.8,则输出最佳的RF-GBDT模型;否则重新执行步骤四进行参数优化;若一直达不到,可以重新执行步骤三,重新选取特征指标,重新构建模型。
2.根据权利要求1所述的基于RF-GBDT的计量装置故障诊断方法,其特征在于:步骤一中,其中计量异常事件包括电能表总与各费率之和不一致、电能表飞走、电能表倒走、电能表停走、电能表反向潜动或者电能表时钟电池故障、电能表开表盖异常事件;计量异常事件数据是来源于营销***中申请计量异常处理的任务记录数据,包括异常发现时间、异常处理结果记录;电能表属性数据是某市供电公司低压用户的电能表的电能表标识、安装日期相关属性数据;测量点日冻结电能示值数据包括异常发现时间前15天的正向有功总电能示值、正向有功尖电能示值、正向有功峰电能示值、正向有功平电能示值、正向有功谷电能示值数据。
3.根据权利要求2所述的基于RF-GBDT的计量装置故障诊断方法,其特征在于:步骤二中,数据变换包括:从测量点日冻结电能示值数据中获取了正向有功总电能示值、正向有功尖电能示值、正向有功峰电能示值、正向有功平电能示值、正向有功谷电能示值字段;通过当天的正向有功总电能示值减去前一天的正向有功总电能再乘以综合倍率获得当天的电量;同理,获得了当天的尖电量、峰电量、平电量、谷电量;电量差分是通过当天的电量减去前一天的电量获得当天的电量差分;天气等级是根据不同天气对电能表故障的影响程度分为0-7级;运行年限是异常发现时间与安装日期相差的年限;带病运行时长是指异常处理时间与异常发现时间相差的天数。
4.根据权利要求3所述的基于RF-GBDT的计量装置故障诊断方法,其特征在于:提取时间特征、电量特征、天气特征这三个维度的特征指标的具体内容如下表1所示;针对电量特征,分别按15天提取电量空值时长、电量零值时长、电量负值时长、电量均值、电量标准差、电量差分均值统计量;针对天气特征,对最高气温、最低气温、天气等级分别按15天取均值;
表1特征指标情况表
5.根据权利要求1所述的基于RF-GBDT的计量装置故障诊断方法,其特征在于:还包括步骤六,将训练好的RF-GBDT模型进行后续的应用,实现计量装置提取预判与精准抢修,应用如下:
建立协调联动工作机制,实现异动问题闭环管控;加强与营销部、运检部的合作,建立协同工作机制;定期应用RF-GBDT模型进行在线故障识别,提前判断疑似故障电能表,将故障预测概率较高的电能表清单输出;根据疑似清单,开展计量装置故障特征分析;从用户类型、供电单位、生产厂家、异常发现日期、故障原因、天气角度分析电能表数量分布特征,全面了解疑似故障电能表的特征规律,实现有针对性地实施电能表精准抢修服务。
CN201910500766.9A 2019-06-10 2019-06-10 基于rf-gbdt的计量装置故障诊断方法 Active CN110222991B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910500766.9A CN110222991B (zh) 2019-06-10 2019-06-10 基于rf-gbdt的计量装置故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910500766.9A CN110222991B (zh) 2019-06-10 2019-06-10 基于rf-gbdt的计量装置故障诊断方法

Publications (2)

Publication Number Publication Date
CN110222991A true CN110222991A (zh) 2019-09-10
CN110222991B CN110222991B (zh) 2022-08-30

Family

ID=67816445

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910500766.9A Active CN110222991B (zh) 2019-06-10 2019-06-10 基于rf-gbdt的计量装置故障诊断方法

Country Status (1)

Country Link
CN (1) CN110222991B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110956091A (zh) * 2019-11-05 2020-04-03 广州供电局有限公司 电能表识别方法、装置、计算机设备及存储介质
CN111738462A (zh) * 2020-06-08 2020-10-02 国网江苏省电力有限公司常州供电分公司 电力计量装置故障抢修主动服务预警方法
CN112036725A (zh) * 2020-08-24 2020-12-04 国网河北省电力有限公司营销服务中心 一种电能表故障识别方法
CN113296011A (zh) * 2021-04-15 2021-08-24 汇智道晟(舟山)科技有限公司 一种电路传导信号主动探测分析***
CN114062812A (zh) * 2021-11-15 2022-02-18 国网四川省电力公司营销服务中心 一种计量柜故障诊断方法及***
CN114089257A (zh) * 2021-10-27 2022-02-25 国网湖南省电力有限公司 一种电能表烧表在线监测方法、***及介质
CN115600695A (zh) * 2022-09-06 2023-01-13 北京航天计量测试技术研究所(Cn) 一种计量设备的故障诊断方法
CN116524415A (zh) * 2023-06-29 2023-08-01 成都考拉悠然科技有限公司 一种基于深度学习的计量管状态的检测方法及***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103605103A (zh) * 2013-06-26 2014-02-26 广东电网公司东莞供电局 基于s型曲线函数的电能计量故障智能诊断方法
CN106154209A (zh) * 2016-07-29 2016-11-23 国电南瑞科技股份有限公司 基于决策树算法的电能表故障预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103605103A (zh) * 2013-06-26 2014-02-26 广东电网公司东莞供电局 基于s型曲线函数的电能计量故障智能诊断方法
CN106154209A (zh) * 2016-07-29 2016-11-23 国电南瑞科技股份有限公司 基于决策树算法的电能表故障预测方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110956091B (zh) * 2019-11-05 2022-07-01 广东电网有限责任公司广州供电局 电能表识别方法、装置、计算机设备及存储介质
CN110956091A (zh) * 2019-11-05 2020-04-03 广州供电局有限公司 电能表识别方法、装置、计算机设备及存储介质
CN111738462A (zh) * 2020-06-08 2020-10-02 国网江苏省电力有限公司常州供电分公司 电力计量装置故障抢修主动服务预警方法
CN111738462B (zh) * 2020-06-08 2022-08-30 国网江苏省电力有限公司常州供电分公司 电力计量装置故障抢修主动服务预警方法
CN112036725A (zh) * 2020-08-24 2020-12-04 国网河北省电力有限公司营销服务中心 一种电能表故障识别方法
CN112036725B (zh) * 2020-08-24 2024-04-30 国网河北省电力有限公司营销服务中心 一种电能表故障识别方法
CN113296011A (zh) * 2021-04-15 2021-08-24 汇智道晟(舟山)科技有限公司 一种电路传导信号主动探测分析***
CN114089257A (zh) * 2021-10-27 2022-02-25 国网湖南省电力有限公司 一种电能表烧表在线监测方法、***及介质
CN114089257B (zh) * 2021-10-27 2023-08-18 国网湖南省电力有限公司 一种电能表烧表在线监测方法、***及介质
CN114062812A (zh) * 2021-11-15 2022-02-18 国网四川省电力公司营销服务中心 一种计量柜故障诊断方法及***
CN114062812B (zh) * 2021-11-15 2024-05-07 国网四川省电力公司营销服务中心 一种计量柜故障诊断方法及***
CN115600695A (zh) * 2022-09-06 2023-01-13 北京航天计量测试技术研究所(Cn) 一种计量设备的故障诊断方法
CN115600695B (zh) * 2022-09-06 2023-10-17 北京航天计量测试技术研究所 一种计量设备的故障诊断方法
CN116524415A (zh) * 2023-06-29 2023-08-01 成都考拉悠然科技有限公司 一种基于深度学习的计量管状态的检测方法及***
CN116524415B (zh) * 2023-06-29 2023-11-24 成都考拉悠然科技有限公司 一种基于深度学习的计量管状态的检测方法及***

Also Published As

Publication number Publication date
CN110222991B (zh) 2022-08-30

Similar Documents

Publication Publication Date Title
CN110222991A (zh) 基于rf-gbdt的计量装置故障诊断方法
Messinis et al. Review of non-technical loss detection methods
CN110097297B (zh) 一种多维度窃电态势智能感知方法、***、设备及介质
Yan et al. Performance analysis of electricity theft detection for the smart grid: An overview
Xia et al. Detection methods in smart meters for electricity thefts: A survey
Lin et al. A privacy-preserving federated learning method for probabilistic community-level behind-the-meter solar generation disaggregation
Faisal et al. Data-stream-based intrusion detection system for advanced metering infrastructure in smart grid: A feasibility study
CN107742127A (zh) 一种改进的防窃电智能预警***及方法
CN110223196A (zh) 基于典型行业特征库和反窃电样本库的反窃电分析方法
Jindal et al. Tackling energy theft in smart grids through data-driven analysis
Micheli et al. Big data analytics: an aid to detection of non-technical losses in power utilities
Feng et al. Data mining for abnormal power consumption pattern detection based on local matrix reconstruction
CN111507013A (zh) 一种面向电力***线损故障定位实现方法
Singh et al. Energy theft detection in advanced metering infrastructure
Botev et al. Detecting non-technical energy losses through structural periodic patterns in AMI data
Tehrani et al. Decision tree based electricity theft detection in smart grid
Monedero et al. An approach to detection of tampering in water meters
Momtazpour et al. Analyzing invariants in cyber-physical systems using latent factor regression
Hartmann et al. Suspicious electric consumption detection based on multi-profiling using live machine learning
Saad et al. Data analytics-based anomaly detection in smart distribution network
Gao et al. Electricity theft detection based on contrastive learning and non-intrusive load monitoring
CN115049410A (zh) 窃电行为识别方法、装置、电子设备及计算机可读存储介质
Na et al. Fake data injection attack detection in AMI system using a hybrid method
Nizar et al. Detection rules for non technical losses analysis in power utilities
Saeed et al. Electricity theft detection in power utilities using bagged CHAID-based classification trees

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant