CN111738462A - 电力计量装置故障抢修主动服务预警方法 - Google Patents

电力计量装置故障抢修主动服务预警方法 Download PDF

Info

Publication number
CN111738462A
CN111738462A CN202010511520.4A CN202010511520A CN111738462A CN 111738462 A CN111738462 A CN 111738462A CN 202010511520 A CN202010511520 A CN 202010511520A CN 111738462 A CN111738462 A CN 111738462A
Authority
CN
China
Prior art keywords
metering device
fault
data
power
risk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010511520.4A
Other languages
English (en)
Other versions
CN111738462B (zh
Inventor
殷新博
王数
陆芸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Jiangsu Electric Power Co Ltd
Changzhou Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Jiangsu Electric Power Co Ltd
Changzhou Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Jiangsu Electric Power Co Ltd, Changzhou Power Supply Co of State Grid Jiangsu Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202010511520.4A priority Critical patent/CN111738462B/zh
Publication of CN111738462A publication Critical patent/CN111738462A/zh
Application granted granted Critical
Publication of CN111738462B publication Critical patent/CN111738462B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Probability & Statistics with Applications (AREA)
  • Public Health (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明提供一种电力计量装置故障抢修主动服务预警方法,包括步骤:一、基于电力计量装置大数据,对电力用户进行画像分析,将电力用户依重要性由高到低划分为关键用户、重要用户和普通用户三大类;二、构建电力计量装置故障识别模型,利用训练好的故障识别模型对电力计量装置进行高风险、中风险或低风险的故障风险预测,并将故障风险预测结果为高风险和中风险的电能计量装置作为疑似故障电能计量装置输出;三、结合第一步确定的电力用户重要性类别以及第二步输出的风险预测级别,相应确定各电力用户的电力计量装置故障抢修主动服务优先等级:由高到低划分为一至六级预警。本发明能提高供电部门电力计量装置抢修的预见性、针对性和工作效率。

Description

电力计量装置故障抢修主动服务预警方法
技术领域
本发明涉及供电部门计量装置故障抢修技术领域,具体涉及电力计量装置故障抢修主动服务预警方法。
背景技术
随着经济发展的加快和人们生活质量的提高,对电力需求不断加剧,电力计量装置故障抢修是供电相关部门一项重要的业务,也是用户体验供电服务质量的一个重要方面。但由于窃电行为、***干扰、外部环境等种种因素的影响导致计量装置容易出现各种故障问题。针对电力计量装置故障,供电部门传统做法是采用被动抢修方式处理,即接收到故障反馈后,才会安排相关运维人员上门查看故障情况和抢修,具体流程为:业务受理、勘察派工、现场勘查、计量装置故障处理、信息归档。传统的电力计量装置故障抢修模式,维修人员事先不知故障情况,现场查看再实施维修大大延长了维修时间,而且在抢修力量不足时也会造成电力用户停电时间过长。因而,研究更为高效的电力计量装置故障抢修和处理方法,显得必要。
发明内容
本发明的目的是:针对现有技术中存在的问题,提供一种电力计量装置故障抢修主动服务预警方法,该方法从智能化预测计量装置故障风险角度入手,结合用户画像技术,为供电部门构建一个电力计量装置故障抢修主动服务预警模型,实现对电力计量装置故障提前预警和精准抢修,提高电力计量装置故障抢修效率。
本发明的技术方案是:本发明的电力计量装置故障抢修主动服务预警方法,包括以下步骤:
第一步,基于供电部门的电力计量装置大数据,对电力用户进行画像分析,将电力用户依重要性由高到低划分为关键用户、重要用户和普通用户三大类;
第二步,构建电力计量装置故障识别模型,利用训练好的故障识别模型对电力计量装置进行高风险、中风险或低风险的故障风险预测,并将故障风险预测结果为高风险和中风险的电能计量装置作为疑似故障电能计量装置输出;
第三步,结合第一步确定的电力用户重要性类别以及第二步输出的风险预测级别,相应确定各电力用户的电力计量装置故障抢修主动服务优先等级:由高到低划分为一至六级预警。
进一步的方案是:上述第一步包括以下具体步骤:
①数据收集:从供电部门营销业务***获取各电力用户的用户基本信息、用电行为、缴费行为、诉求行为共4个维度的信息数据表,并相应确定每个维度对应的指标变量;
②数据预处理:基于用户基本信息、用电行为、缴费行为、诉求行为四个维度分别对每张表格进行数据预处理,对源数据中的异常值、缺失值相应进行删除和填充操作;
③建立电力用户标签库:
对经上述步骤②预处理后的用户基本信息、用电行为、缴费行为、诉求行为四个维度基础数据,采用包括数据的频数分析、集中趋势分析、离散程度分析、可视化分析在内的传统统计分析方法,提取出电力用户价值较高的电力特征,并以上述四个维度作为用户标签库的维度框架,建立电力用户的标签库;
④基于K-Means算法对电力用户画像,按重要性由高到低的顺序将电力用户划分为关键用户、重要用户和普通用户:
对上述步骤③建立的标签库中的基本信息、用电行为、缴费行为、诉求行为四个维度数据,采用包括相关性分析、剔除不平衡指标、剔除离散型变量在内的操作,筛选出用电年限、运行容量、年均结算电量、峰谷电量系数、年均缴费次数、年均缴费金额六个聚类指标;然后利用拉依达准则拆分出由较大值数据组成的数据集,单独作为一类用户群体类型,定义为关键用户,剩下的数据集利用K-Means聚类算法聚为四类,并根据聚类中心特征分别定义为:重要用户、消费型-普通用户、忠诚型-普通用户、峰期型-普通用户;并将消费型-普通用户、忠诚型-普通用户、峰期型-普通用户归类统称为普通用户。
进一步的方案是:上述第一步的步骤①中,用户基本信息包含的指标变量有:城乡类别、用户分类、用电类别、供电电压、运行容量、用电年限、电源类型;用电行为包含的指标变量有:结算电量、结算电费、峰电量、平电量、谷电量、峰电费、平电费、谷电费、是否执行峰谷标志;缴费行为包含的指标变量有:缴费方式、缴费次数、缴费金额、逾期次数、欠费次数、欠费金额;诉求行为包含的指标变量有:诉求次数、诉求类型。
进一步的方案是:上述第二步包括以下具体步骤:
⑤收集建模所需数据:以第一步所涉及的所有电力用户的电力计量装置为对象,从供电部门的营销业务***和用电信息采集***以及气象***相应获取电力计量装置属性特征、电量特征、功率特征、天气特征4个维度的相关信息数据表;
⑥对获取的建模所需数据进行预处理:对步骤⑤收集的建模所需数据进行包括数据清洗、数据变换和数据规约在内的数据处理,形成数据宽表;
⑦基于随机森林RF算法提取核心指标;
⑧基于XGBoost算法进行故障风险等级预测,并将预测的高风险与中风险的电力计量装置作为疑似故障电力计量装置输出。
进一步的方案是:上述第二步的步骤⑥中:
数据清洗包括数据表的空格处理、剔除无效字段和异常数据、缺失值处理、字符类型转换、日期格式统一在内的处理操作;
上述数据变换和数据规约包括:
Ⅰ、运行年限为拆表日期或当时日期与装表日期相差年限;
Ⅱ、根据不同的天气状况对电力计量装置故障影响程度天气等级从低到高划分为0-7级;
Ⅲ、计算电量特征维度的[建玲1] ;
Ⅳ、计算功率特征维度的[建玲2] 。
进一步的方案是:上述第二步的步骤⑦基于随机森林RF算法提取核心指标的具体方法为:
Ⅴ、利用数据包括属性特征、集中趋势、离散程度在内的描述性统计量,从电力计量装置属性特征、天气特征、电量特征、功率特征四个维度提取初步指标体系;
Ⅵ、利用随机森林内嵌的特征选择算法提取核心指标,包括步骤:
a、以初步指标体系作为模型输入,将是否故障作为模型输出,构建随机森林RF算法模型;
b、将备选特征指标随机分配至若干棵决策树,由每棵决策树分别对训练集进行判定,然后利用基于袋外数据分类准确率的变量重要性度量计算出备选特征重要性;
c、设置特征重要性阈值,筛选出特征重要性大于该阈值的所有指标作为提取的核心指标。
进一步的方案是:上述第二步的步骤包括以下具体步骤:
Ⅶ、基于设定好的训练集和测试集,以上述步骤⑦确定的核心指标为输入变量,以是否故障为输出变量,构建XGBoost模型;采用网格搜索算法对模型的决策树最大深度和决策树棵数两个参数进行优化;通过网格搜索算法获得最优参数的同时,获得最优参数下的XGBoost模型;
Ⅷ、将训练好的XGBoost模型应用到测试集上,预判出电力计量装置故障风险预测概率,并将其划分为高风险、中风险、低风险三个故障风险等级,将高风险与中风险的电力计量装置数据作为疑似故障电力计量装置输出。
本发明具有积极的效果:(1)本发明的电力计量装置故障抢修主动服务预警方法,通过建立的电力计量装置故障抢修主动服务预警模型,能够提前预警电力计量装置故障并确定抢修等级,从而使得供电部门能够根据故障类型和故障预警等级制定有针对性的抢修方案,提高故障抢修效率。(2)本发明的电力计量装置故障抢修主动服务预警方法,构建了用户标签库,能够实现对电力用户全方位精细画像,使用时能够根据计量装置故障疑似清单,结合电力用户的全方位画像,给出电力计量装置故障主动服务预警等级,从而使得供电部门能够根据预警等级,有预见性、有针对性地采取措施实施抢修,改变现有技术中被动式抢修安排为主动式抢修服务,[建玲3] 和用户满意度。
附图说明
图1为本发明的方法流程示意图;
图2为本发明方法步骤中所建立的电力用户标签库体系示意图;
图3为为本发明方法步骤中建立的基于波士顿矩阵的故障抢修主动服务预警等级示意图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步详细的说明。
(实施例1)
参见图1,本实施例的电力计量装置故障抢修主动服务预警方法,以电能表作为电力计量装置为例进行说明,对于其它计量装置实施方式类似。电力计量装置故障抢修主动服务预警方法是根据电力用户类型和故障风险等级相应确定故障抢修等级,其主要实现步骤包括电力用户画像分析、构建电力计量装置故障识别模型、构建电力计量装置故障抢修主动服务预警模型,本发明的主要实施步骤具体说明如下:
第一步,基于电力计量装置大数据,对电力用户进行画像分析,将电力用户依重要性由高到低划分为关键用户、重要用户和普通用户三大类,具体步骤如下:
①数据收集:从供电部门营销业务***获取各电力用户的用户基本信息、用电行为、缴费行为、诉求行为共4个维度的信息数据表,并相应确定每个维度对应的指标变量。
其中,用户基本信息包含的指标变量有:城乡类别、用户分类、用电类别、供电电压、运行容量、用电年限、电源类型;用电行为包含的指标变量有:结算电量、结算电费、峰电量、平电量、谷电量、峰电费、平电费、谷电费、是否执行峰谷标志;缴费行为包含的指标变量有:缴费方式、缴费次数、缴费金额、逾期次数、欠费次数、欠费金额;诉求行为包含的指标变量有:诉求次数、诉求类型。
②数据预处理:基于用户基本信息、用电行为、缴费行为、诉求行为四个维度分别对每张表格进行数据预处理,对源数据中的异常值、缺失值相应进行删除和填充操作。通过数据预处理得到的基础数据指标汇总在表1中。
Figure DEST_PATH_IMAGE001
③建立电力用户标签库:
对前述步骤②预处理后的用户基本信息、用电行为、缴费行为、诉求行为四个维度基础数据,采用包括数据的频数分析、集中趋势分析、离散程度分析、可视化分析在内的传统统计分析方法,提取出电力用户价值较高的电力特征,并以上述四个维度作为用户标签库的维度框架,建立电力用户完整的标签库体系,标签库体系以所属维度-标签名称-标签示例的形式展示,如图2所示。其中峰谷系数的作用是区分用户在不同电价时期的峰-谷-平用电行为,当峰期电量或电费最大时,系数大于等于1;当谷电量或电费最大时,系数小于等于-1;当平电量或电费最大时,系数居于-1到1之间,且峰电量或电费次大时为正,谷电量或电费次大时为负。
④基于K-Means算法对电力用户画像,按重要性由高到低的顺序将电力用户划分为关键用户、重要用户和普通用户:
对前述步骤③建立的标签库中的基本信息、用电行为、缴费行为、诉求行为四个维度数据,采用包括相关性分析、剔除不平衡指标、剔除离散型变量在内的操作,筛选出用电年限、运行容量、年均结算电量、峰谷电量系数、年均缴费次数、年均缴费金额六个聚类指标;然后利用拉依达准则拆分出由较大值数据组成的数据集,单独作为一类用户群体类型,定义为关键用户,剩下的数据集利用K-Means聚类算法聚为四类,并根据聚类中心特征分别定义为:重要用户、消费型-普通用户、忠诚型-普通用户、峰期型-普通用户,从而将电力用户划分为五个用户群体类型,五类用户群体各自特征汇总如表2所示。
Figure 366436DEST_PATH_IMAGE002
基于业务习惯,将消费型-普通用户、忠诚型-普通用户、峰期型-普通用户归类统称为普通用户,最终,根据用户重要性由高到低的顺序将电力用户划分为关键用户、重要用户、普通用户三大类。
第二步,构建电力计量装置故障识别模型,利用训练好的故障识别模型对电力计量装置进行高风险、中风险或低风险的故障风险预测,并将故障风险预测结果为高风险和中风险的电能计量装置作为疑似故障电能计量装置输出,具体步骤如下:
⑤收集建模所需数据:以第一步所涉及的所有电力用户的电能表为对象,从供电部门的营销业务***和用电信息采集***以及气象***相应获取电能表属性特征、电量特征、功率特征、天气特征4个维度的相关信息数据表。
⑥对获取的建模所需数据进行预处理:对步骤⑤收集的建模所需数据进行包括数据清洗、数据变换和数据规约在内的数据处理,形成数据宽表。其中:
数据清洗主要包括数据表的空格处理、剔除无效字段和异常数据、缺失值处理(向前/后填充、均值填充等)、字符类型转换、日期格式统一在内的处理操作;
数据变换和数据规约主要包括:
Ⅰ、运行年限为拆表日期或当时日期与装表日期相差年限;
Ⅱ、根据不同的天气状况对电力计量装置故障影响程度天气等级从低到高划分为0-7级;
Ⅲ、计算电量特征维度的指标:获取正向有功总电能示值、正向有功峰电能示值、正向有功平电能示值、正向有功谷电能示值等数据,日电量表示当天的正向有功总电能示值减去前一天的正向有功总电能再乘以综合倍率;同理,获得了日峰电量、日平电量、日谷电量,日电量差分表示当天的日电量减去前一天的日电量,日峰谷电量差表示当天的日峰电量减去日谷电量。
Ⅳ、计算功率特征维度的指标:获取日负荷曲线数据的有功功率、A相有功功率、B相有功功率、C相有功功率,将日负荷曲线数据均归集到24点。日平均负荷、日功率标准差、日最大负荷、日最小负荷分别表示当天的24点有功功率平均值、标准差、最大值、最小值。日峰谷差率表示当天的日最大负荷减去日最小负荷再除以日最大负荷。日负荷率、最小负荷率分别表示当天的日平均负荷、日最小负荷除以日最大负荷。日平均负荷三相均值、最大相日平均负荷、最小相日平均负荷分别表示当天的24点A相、B相、C相有功功率求均值,再求三相平均值、最大值、最小值。日功率标准差三相均值、最大相日功率标准差、最小相日功率标准差分别表示24点A相、B相、C相有功功率求标准差,再求三相平均值、最大值、最小值。通过数据预处理得到的基础数据指标变量如表3所示。
Figure DEST_PATH_IMAGE003
⑦基于随机森林RF算法提取核心指标:
为避免维度灾难,本发明采用基于随机森林RF算法从步骤⑥所得的基础数据指标中提取核心指标,基于随机森林的特征提取过程分为初步指标设计与核心指标筛选两个步骤。
Ⅴ、利用数据包括属性特征、集中趋势、离散程度在内的描述性统计量,从电能表属性特征、天气特征、电量特征、功率特征四个维度提取初步指标体系。与电能表属性特征相关的初始指标包括用户类型、用电类型、运行年限、电压等级,共4个;与天气特征相关的初始指标通过计算表3中的所有天气特征指标的前2周均值得到,共2个;与电量特征相关的初始指标通过计算表3中的所有电量特征指标的前两周或前一周的均值、标准差、最大值、最小值得到,共48个;与功率特征相关的初始指标通过计算表3中的所有功率特征指标的前两周的均值、标准差、最大值、最小值得到,共52个。最终获得初步指标体系共包括106个指标。
Ⅵ、利用随机森林内嵌的特征选择算法提取核心指标,具体步骤如下:一、以初步指标体系作为模型输入,将是否故障作为模型输出,构建随机森林RF模型;二、将备选特征指标随机分配至若干棵决策树,由每棵决策树分别对训练集进行判定,然后利用基于袋外数据分类准确率的变量重要性度量计算出备选特征重要性;三、设置特征重要性阈值,筛选出特征重要性大于该阈值的所有指标作为后续使用的核心指标。
⑧基于XGBoost算法进行故障风险等级预测:
Ⅶ、基于设定好的训练集和测试集,以前述步骤⑦的步骤Ⅵ确定的核心指标为输入变量,以是否故障为输出变量,构建XGBoost模型;采用网格搜索算法对模型的决策树最大深度和决策树棵数两个参数进行优化;通过网格搜索算法获得最优参数的同时,获得最优参数下的XGBoost模型;
Ⅷ、将训练好的XGBoost模型应用到测试集上,预判出电能表故障风险预测概率,并将其划分为高风险、中风险、低风险三个故障风险等级,将高风险与中风险的电能表数据作为疑似故障清单输出。
为评价XGBoost模型性能,引入正确率、精准率、召回率、综合评价指标等分类效果评价指标,分类效果评价指标的计算方式如表4所示,其中TN为负样本正判数、FP为负样本错判数、FN为正样本错判数、TP为正样本正判数。通过对比不同模型的评价指标值,验证了XGBoost模型的可靠性。
Figure 939369DEST_PATH_IMAGE004
第三步,结合第一步确定的电力用户重要性类别以及第二步输出的风险预测级别,相应确定各电力用户的电力计量装置故障抢修主动服务优先等级:由高到低划分为一至六级预警:
利用前述第一步的步骤④确定的关键用户、重要用户和普通用户的用户类型数据和第二步的步骤⑧确定的电能表故障高风险和中风险的风险等级数据,基于转换后的波士顿矩阵,以用户类型为横坐标,故障风险等级为纵坐标,矩阵的分割线为两个维度的分类交叉,最终确定一级预警至六级预警共6个预警等级,预警等级由一级到六级对应的抢修优先级由高到低,从而使得供电部门故障抢修主动服务预警更加合理,主动服务的实操性更强。如图3所示,当电能表发生故障时,通过用户类型和故障风险等级,能够快速确定故障抢修等级,提高抢修效率。
附:本实施例中涉及的相关算法的简要说明:
1、K-Means算法:
K-Means算法的主要思想是:首先随机选取K个对象作为初始聚类中心,然后通过相似度度量把每个样本点划分到最近的类别中,计算新聚类结果的聚类中心作为下一次聚类的初始聚类中心,循环往复,当评价聚类性能的准则函数达到最优时停止迭代,此时同一个类中的对象相似度极高,不同类之间的对象相似度极小。
2、随机森林RF算法:随机森林RF算法由Leo Breiman于2001年提出,它通过自助法bootstrap重采样技术,从原始训练样本集n中有放回地重复随机抽取m轮,然后根据自助样本集生成m个分类树组成随机森林,新数据的分类结果按分类树投票多少形成的分数而定。基于随机森林内嵌的特征选择算法是Breiman提出的一种隐式的特征选择方法,可以进行特征变量筛选,删除其冗余不相关的特征属性。
3、XGBoost算法由陈天奇博士于2014年提出,具备高精度和高效率双重优点,基本思想是选择部分样本和特征生成一个简单模型作为基分类器,基分类器一般选择决策树或线性分类器,生成新模型的核心是新模型在相应损失函数梯度方向建立,修正“残差”的同时控制复杂度,进行循环迭代,最终产生成百上千个线性或树模型。当训练完成得到t棵树,要预测一个样本的分数,其实根据这个样本的特征,在每棵树中会落到对应的一个叶子节点,每个叶子节点就对应一个分数,最后只需要将每棵树对应的分数加起来就是该样本的预测值。
(应用验证例)
本应用验证例通过取某一供电部门所辖167345个三相智能表用户近三年的有效数据,对前述实施例的电力计量装置故障抢修主动服务预警方法有效性进行验证。
所取167345个三相智能表用户经前述本发明方法第一步处理后的五类用户的聚类中心如表5所示。
Figure DEST_PATH_IMAGE005
最终根据用户重要性将用户划分为关键用户、重要用户、普通用户三大类,各类用户类型分布情况如表6所示。
Figure 250264DEST_PATH_IMAGE006
按照本发明方法第二步,获取167345个三相智能表用户的智能表属性特征、天气特征、电量特征、功率特征等信息的数据表,并选取6227条样本数据为训练集,2669条样本数据为测试集,8033条样本数据为验证集。
首先,基于随机森林提取核心指标。利用训练集,构建初步指标体系。以初步指标体系中的106个指标为输入变量,利用随机森林RF特征选择算法计算各指标的特征重要性,并设置特征重要性阈值为0.01,提取了23个核心指标用于后续模型分析,如表7所示。
Figure DEST_PATH_IMAGE007
其次,构建XGBoost模型。利用训练集数据,以RF模型筛选出的23个核心指标为输入变量,是否故障为输出变量,构建XGBoost模型。并利用网格搜索算法对模型调参,最优模型的决策树最大深度和决策树棵数分别为6、90,将最优模型应用到测试集上。XGBoost模型在训练集和测试集上的分类评价指标,如表8所示。综合评价指标F1是将精准率P和召回率R调和平均获得的,更能评估分类模型的性能,将F1作为模型的主要识别准确率。利用训练集和测试集构建XGBoost模型的识别准确率均达到90%以上。
Figure 307125DEST_PATH_IMAGE008
然后,对比分析模型的可靠性。基于训练集和测试集,以RF模型筛选出的23个核心指标为输入变量,是否故障为输出变量,分别构建逻辑回归(LR)模型、决策树(DT)模型、神经网络(MLP)模型、梯度提升决策树(GBDT)模型、XGBoost模型。5个算法在测试集上的精准率(P)、召回率(R)、综合评价指标(F1)、训练时间等指标如表9所示。
Figure DEST_PATH_IMAGE009
XGBoost模型相比其他模型在故障识别的精准率(P)、召回率(R)、综合评价指标(F1)、训练时间上具有较大的优势,所以选用XGBoost模型预测故障风险概率具有可靠性。
基于8033条样本的验证集,以RF模型筛选出的23个核心指标为输入变量,采用训练好的XGBoost模型进行故障预判,预测结果样例如表10所示。
Figure 449394DEST_PATH_IMAGE010
其中预测值和实际核查是否故障中取值'1'代表智能表会发生故障,'0'代表智能表不会发生故障,故障风险预测概率是预测智能表发生故障的概率。根据故障风险预测概率在[0.8,1]、(0.5,0.8)、[0,0.5]范围内将智能表分为三种故障风险等级:高风险、中风险、低风险。当故障风险等级为中风险或高风险时,都会预判该智能表发生故障,即预测值为1;故障风险等级为低风险时,预判该智能表未发生故障,即预测值为0。
本次验证集数据实际包含了153只故障智能表和7880只非故障智能表,模型正确预判出132只故障智能表,7766只非故障智能表。智能表故障识别模型在该验证集上的准确率A为98.31%,精准率P为53.66%,召回率R为86.27%,综合指标F1为66.16%。故障风险等级为中风险或高风险的疑似故障清单有246只智能表,其中高风险智能表148只,中风险智能表98只,即模型预判246只智能表发生故障。
按照本发明方法第三步,对246个疑似故障智能表确定故障抢修预警等级,如表11所示。可以发现处于比较优先的预警等级(一级预警、二级预警、三级预警)的智能表故障核查准确率均在50%以上,说明该模型的建立具有一定的指导意义。
Figure DEST_PATH_IMAGE011
以上实施例和应用例是对本发明的具体实施方式的说明,而非对本发明的限制,有关技术领域的技术人员在不脱离本发明的精神和范围的情况下,还可以做出各种变换和变化而得到相对应的等同的技术方案,因此所有等同的技术方案均应该归入本发明的专利保护范围。

Claims (7)

1.一种电力计量装置故障抢修主动服务预警方法,其特征在于,包括以下步骤:
第一步,基于供电部门的电力计量装置大数据,对电力用户进行画像分析,将电力用户依重要性由高到低划分为关键用户、重要用户和普通用户三大类;
第二步,构建电力计量装置故障识别模型,利用训练好的故障识别模型对电力计量装置进行高风险、中风险或低风险的故障风险预测,并将故障风险预测结果为高风险和中风险的电能计量装置作为疑似故障电能计量装置输出;
第三步,结合第一步确定的电力用户重要性类别以及第二步输出的风险预测级别,相应确定各电力用户的电力计量装置故障抢修主动服务优先等级:由高到低划分为一至六级预警。
2.根据权利要求1所述的电力计量装置故障抢修主动服务预警方法,其特征在于,所述第一步包括以下具体步骤:
①数据收集:从供电部门营销业务***获取各电力用户的用户基本信息、用电行为、缴费行为、诉求行为共4个维度的信息数据表,并相应确定每个维度对应的指标变量;
②数据预处理:基于用户基本信息、用电行为、缴费行为、诉求行为四个维度分别对每张表格进行数据预处理,对源数据中的异常值、缺失值相应进行删除和填充操作;
③建立电力用户标签库:
对经所述步骤②预处理后的用户基本信息、用电行为、缴费行为、诉求行为四个维度基础数据,采用包括数据的频数分析、集中趋势分析、离散程度分析、可视化分析在内的传统统计分析方法,提取出电力用户价值较高的电力特征,并以所述四个维度作为用户标签库的维度框架,建立电力用户的标签库;
④基于K-Means算法对电力用户画像,按重要性由高到低的顺序将电力用户划分为关键用户、重要用户和普通用户:
对所述步骤③建立的标签库中的基本信息、用电行为、缴费行为、诉求行为四个维度数据,采用包括相关性分析、剔除不平衡指标、剔除离散型变量在内的操作,筛选出用电年限、运行容量、年均结算电量、峰谷电量系数、年均缴费次数、年均缴费金额六个聚类指标;然后利用拉依达准则拆分出由较大值数据组成的数据集,单独作为一类用户群体类型,定义为关键用户,剩下的数据集利用K-Means聚类算法聚为四类,并根据聚类中心特征分别定义为:重要用户、消费型-普通用户、忠诚型-普通用户、峰期型-普通用户;并将消费型-普通用户、忠诚型-普通用户、峰期型-普通用户归类统称为普通用户。
3.根据权利要求2所述的电力计量装置故障抢修主动服务预警方法,其特征在于,所述第一步的步骤①中,用户基本信息包含的指标变量有:城乡类别、用户分类、用电类别、供电电压、运行容量、用电年限、电源类型;用电行为包含的指标变量有:结算电量、结算电费、峰电量、平电量、谷电量、峰电费、平电费、谷电费、是否执行峰谷标志;缴费行为包含的指标变量有:缴费方式、缴费次数、缴费金额、逾期次数、欠费次数、欠费金额;诉求行为包含的指标变量有:诉求次数、诉求类型。
4.根据权利要求1所述的电力计量装置故障抢修主动服务预警方法,其特征在于,所述第二步包括以下具体步骤:
⑤收集建模所需数据:以第一步所涉及的所有电力用户的电力计量装置为对象,从供电部门的营销业务***和用电信息采集***以及气象***相应获取电力计量装置属性特征、电量特征、功率特征、天气特征4个维度的相关信息数据表;
⑥对获取的建模所需数据进行预处理:利用包括数据清洗、数据变换和数据规约在内的数据处理方法对步骤⑤收集的建模所需数据进行数据预处理,形成数据宽表;
⑦基于随机森林RF算法提取核心指标;
⑧基于XGBoost算法进行故障风险等级预测,并将预测的高风险与中风险的电力计量装置作为疑似故障电力计量装置输出。
5.根据权利要求4所述的电力计量装置故障抢修主动服务预警方法,其特征在于,所述第二步的步骤⑥中:
数据清洗包括数据表的空格处理、剔除无效字段和异常数据、缺失值处理、字符类型转换、日期格式统一在内的处理操作;
所述数据变换和数据规约包括:
Ⅰ、运行年限为拆表日期或当时日期与装表日期相差年限;
Ⅱ、根据不同的天气状况对电力计量装置故障影响程度天气等级从低到高划分为0-7级;
Ⅲ、计算电量特征维度的指标;
Ⅳ、计算功率特征维度的指标。
6.根据权利要求4所述的电力计量装置故障抢修主动服务预警方法,其特征在于,所述第二步的步骤⑦基于随机森林RF算法提取核心指标的具体方法为:
Ⅴ、利用包括属性特征、集中趋势、离散程度在内的描述性统计量,从电力计量装置属性特征、天气特征、电量特征、功率特征四个维度提取初步指标体系;
Ⅵ、利用随机森林内嵌的特征选择算法提取核心指标,包括步骤:
a、以初步指标体系作为模型输入,将是否故障作为模型输出,构建随机森林RF算法模型;
b、将备选特征指标随机分配至若干棵决策树,由每棵决策树分别对训练集进行判定,然后利用基于袋外数据分类准确率的变量重要性度量计算出备选特征重要性;
c、设置特征重要性阈值,筛选出特征重要性大于该阈值的所有指标作为提取的核心指标。
7.根据权利要求4所述的电力计量装置故障抢修主动服务预警方法,其特征在于,所述第二步的步骤包括以下具体步骤:
Ⅶ、基于设定好的训练集和测试集,以所述步骤⑦确定的核心指标为输入变量,以是否故障为输出变量,构建XGBoost模型;采用网格搜索算法对模型的决策树最大深度和决策树棵数两个参数进行优化;通过网格搜索算法获得最优参数的同时,获得最优参数下的XGBoost模型;
Ⅷ、将训练好的XGBoost模型应用到测试集上,预判出电力计量装置故障风险预测概率,并将其划分为高风险、中风险、低风险三个故障风险等级,将高风险与中风险的电力计量装置数据作为疑似故障电力计量装置输出。
CN202010511520.4A 2020-06-08 2020-06-08 电力计量装置故障抢修主动服务预警方法 Active CN111738462B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010511520.4A CN111738462B (zh) 2020-06-08 2020-06-08 电力计量装置故障抢修主动服务预警方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010511520.4A CN111738462B (zh) 2020-06-08 2020-06-08 电力计量装置故障抢修主动服务预警方法

Publications (2)

Publication Number Publication Date
CN111738462A true CN111738462A (zh) 2020-10-02
CN111738462B CN111738462B (zh) 2022-08-30

Family

ID=72648556

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010511520.4A Active CN111738462B (zh) 2020-06-08 2020-06-08 电力计量装置故障抢修主动服务预警方法

Country Status (1)

Country Link
CN (1) CN111738462B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112308462A (zh) * 2020-11-23 2021-02-02 国网北京市电力公司 电力用户分类方法及装置
CN112685461A (zh) * 2020-12-15 2021-04-20 国网吉林省电力有限公司电力科学研究院 一种基于预判模型的窃电用户判断方法
CN112800036A (zh) * 2020-12-30 2021-05-14 银盛通信有限公司 一种报表分析图自动生成及展示方法及***
CN113095391A (zh) * 2021-04-06 2021-07-09 国网上海市电力公司市北供电公司 一种用户窃电行为检测方法、***、终端及介质
CN113313407A (zh) * 2021-06-16 2021-08-27 上海交通大学 一种企业用电行为识别方法及设备
CN114035468A (zh) * 2021-11-08 2022-02-11 山东理工大学 基于XGBoost算法的风机检修流程预测性监控方法与***
CN114236448A (zh) * 2021-11-23 2022-03-25 国网山东省电力公司日照供电公司 一种基于大数据的计量装置故障检修***
CN117391458A (zh) * 2023-12-08 2024-01-12 四川省寰宇众恒科技有限公司 基于数据分析的安全生产风险检测预警方法及***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105809373A (zh) * 2016-04-27 2016-07-27 国网山东省电力公司济南市长清区供电公司 一种配网故障信息综合采集管理平台
CN106651424A (zh) * 2016-09-28 2017-05-10 国网山东省电力公司电力科学研究院 基于大数据技术的电力用户画像建立与分析方法
CN109697574A (zh) * 2018-12-31 2019-04-30 国网浙江省电力有限公司杭州供电公司 一种电力中小客户用电风险识别方法
CN110222991A (zh) * 2019-06-10 2019-09-10 国网江苏省电力有限公司常州供电分公司 基于rf-gbdt的计量装置故障诊断方法
CN111178382A (zh) * 2019-11-26 2020-05-19 国网浙江省电力有限公司湖州供电公司 一种基于工单数据挖掘的抢修服务预测分析方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105809373A (zh) * 2016-04-27 2016-07-27 国网山东省电力公司济南市长清区供电公司 一种配网故障信息综合采集管理平台
CN106651424A (zh) * 2016-09-28 2017-05-10 国网山东省电力公司电力科学研究院 基于大数据技术的电力用户画像建立与分析方法
CN109697574A (zh) * 2018-12-31 2019-04-30 国网浙江省电力有限公司杭州供电公司 一种电力中小客户用电风险识别方法
CN110222991A (zh) * 2019-06-10 2019-09-10 国网江苏省电力有限公司常州供电分公司 基于rf-gbdt的计量装置故障诊断方法
CN111178382A (zh) * 2019-11-26 2020-05-19 国网浙江省电力有限公司湖州供电公司 一种基于工单数据挖掘的抢修服务预测分析方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112308462A (zh) * 2020-11-23 2021-02-02 国网北京市电力公司 电力用户分类方法及装置
CN112685461A (zh) * 2020-12-15 2021-04-20 国网吉林省电力有限公司电力科学研究院 一种基于预判模型的窃电用户判断方法
CN112800036A (zh) * 2020-12-30 2021-05-14 银盛通信有限公司 一种报表分析图自动生成及展示方法及***
CN113095391A (zh) * 2021-04-06 2021-07-09 国网上海市电力公司市北供电公司 一种用户窃电行为检测方法、***、终端及介质
CN113313407A (zh) * 2021-06-16 2021-08-27 上海交通大学 一种企业用电行为识别方法及设备
CN114035468A (zh) * 2021-11-08 2022-02-11 山东理工大学 基于XGBoost算法的风机检修流程预测性监控方法与***
CN114035468B (zh) * 2021-11-08 2024-05-28 山东理工大学 基于XGBoost算法的风机检修流程预测性监控方法与***
CN114236448A (zh) * 2021-11-23 2022-03-25 国网山东省电力公司日照供电公司 一种基于大数据的计量装置故障检修***
CN117391458A (zh) * 2023-12-08 2024-01-12 四川省寰宇众恒科技有限公司 基于数据分析的安全生产风险检测预警方法及***
CN117391458B (zh) * 2023-12-08 2024-02-27 四川省寰宇众恒科技有限公司 基于数据分析的安全生产风险检测预警方法及***

Also Published As

Publication number Publication date
CN111738462B (zh) 2022-08-30

Similar Documents

Publication Publication Date Title
CN111738462B (zh) 电力计量装置故障抢修主动服务预警方法
CN106909933B (zh) 一种三阶段多视角特征融合的窃电分类预测方法
CN106780121B (zh) 一种基于用电负荷模式分析的用电异常识别方法
CN103324980B (zh) 一种风电场风速预测方法
CN109308571B (zh) 配电线路线变关系检测方法
CN110097297A (zh) 一种多维度窃电态势智能感知方法、***、设备及介质
CN112859822B (zh) 基于人工智能的设备健康分析及故障诊断的方法及***
CN110222991B (zh) 基于rf-gbdt的计量装置故障诊断方法
CN109409444B (zh) 一种基于先验概率的多元电网故障类型的判别方法
CN104022552A (zh) 一种用于电动汽车充电控制的智能检测方法
CN109800995A (zh) 一种电网设备故障识别方法及***
CN114862139A (zh) 一种基于数据驱动的台区线损率异常诊断方法
CN114118588A (zh) 聚类欠采样下基于博弈特征提取的迎峰度夏停电预测方法
CN111798333A (zh) 一种用能评估与用电安全分析方法和***
CN113450031B (zh) 居民智慧用能服务潜在台区选取方法及装置
CN113327047B (zh) 基于模糊综合模型的电力营销服务渠道决策方法及***
CN114493238A (zh) 供电服务风险预测方法、***、存储介质及计算机设备
CN112734274B (zh) 一种低碳电网运营主导影响因素挖掘及综合评估方法
CN115879915B (zh) 一种用于发电厂的跨平台标准化检修方法
CN113837486B (zh) 一种基于rnn-rbm的配网馈线长期负荷预测方法
CN114626433A (zh) 一种智能电能表故障预测并分类方法、装置及***
CN114662589A (zh) 一种电表故障研判方法、装置、设备和可读存储介质
CN113866562A (zh) 一种电力***台区线损识别方法
CN115146715A (zh) 用电安全隐患诊断方法、装置、设备及存储介质
CN114219245A (zh) 基于大数据的乡村电力指数评价方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant