CN106650797B

CN106650797B - 一种基于集成elm的配电网窃电嫌疑用户智能识别方法

Info

Publication number: CN106650797B
Application number: CN201611116284.6A
Authority: CN
Inventors: 方国卫; 孙金武; 胡国平; 邝朝炼; 黄耀廉; 段然; 李培; 莫景源
Original assignee: Jiangmen Power Supply Bureau of Guangdong Power Grid Co Ltd
Current assignee: Jiangmen Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority date: 2016-12-07
Filing date: 2016-12-07
Publication date: 2020-12-04
Anticipated expiration: 2036-12-07
Also published as: CN106650797A

Abstract

本发明涉及一种基于集成ELM的配电网窃电嫌疑用户智能识别方法，包括以下步骤：首先获取学***。

Description

一种基于集成ELM的配电网窃电嫌疑用户智能识别方法

技术领域

本发明涉及配电网反窃电技术领域，具体涉及一种基于集成ELM的配电网窃电嫌疑用户智能识别方法。

技术背景

因用电用户有意或无意的非法用电行为，导致营销***不能正常计费收费，给电力***在运行过程中造成一定的损失，为了避免和减少这些损失，需要对用户的用电使用情况实时监测，防止和减少窃电和漏电的情况出现。

传统的防窃电措施通常是定期巡检线路、定期校验电表、用户举报窃电等手段，这些手段效率低、对人的依赖大，目标也不明确，需要一个智能的分析手段来判定用户的用电是否正常，再对重点监控的用户实时告警，为现场勘察是否偷电提供依据，即采用大数据分析与挖掘技术对窃电嫌疑用户进行智能识别。

目前，BP神经网络算法凭借强大的自学***。

发明内容

本发明涉及一种基于集成ELM的配电网窃电嫌疑用户智能识别方法，主要包括以下步骤：

步骤1：获取学习数据和预测数据并进行数据清洗；

步骤2：构建窃电评价指标体系：告警特征、电量特征及负荷特征，形成学习样本和预测样本；

步骤3：将所述的学习样本划分为训练集和测试集，利用所述的训练集学习集成ELM窃电嫌疑用户识别模型，并基于所述的测试集评估模型效果。

步骤4：将预测样本作为所述的集成ELM窃电嫌疑用户识别模型输入量，输出每一用户的窃电嫌疑系数，锁定窃电嫌疑用户。

所述的基于集成ELM的配电网窃电嫌疑用户智能识别方法，其特征在于，所述的学习数据和预测数据，包含用户档案、告警、行度及负荷四种类型；所述的学习数据中必须包含正常用户样本与窃电用户样本，所述的测试数据仅包含窃电嫌疑线路下的部分用户，而窃电嫌疑线路通过线损进行定位。

所述的基于集成ELM的配电网窃电嫌疑用户智能识别方法，其特征在于，所述的窃电评价指标体系，包含告警、电量及负荷三大特征，所述的告警特征为窃电告警系数

，

所述的电量特征包括

斜率及

截距，所述的负荷特征包括

斜率及

截距，

为当前时间往前推移的天数。

所述的基于集成ELM的配电网窃电嫌疑用户智能识别方法，其特征在于，所述的窃电告警系数

的计算公式为：

其中，

表示所有窃电告警组合（包括单个的）的权重之和，

表示

天内出现的所有告警组合的最大子集的权重，而告警及其组合的权重将根据其对窃电的影响程度的大小有专业人员设定。

所述的基于集成ELM的配电网窃电嫌疑用户智能识别方法，其特征在于，所述的

斜率、

截距、

斜率及

截距将通过构建一元线性回归方程得到，具体模型为：

，

其中，

，

，

，

为用电量，

为时间编号（以天为单位），

为负荷，故

、

分别表示在第

天的前

天的用电量及负荷，有

，

，

，

。

所述的集成ELM窃电嫌疑用户识别模型，包含如下几个步骤：

(1)初始化ELM模型参数，包括：极限学习机隐含层神经元个数

,训练极限学习机个数

，基于准确率集成极限学习机分类器的个数

，基于差异度集成的极限学习机的个数

；

(2)基于不同

，用训练样本（

矩阵）训练生成

个极限学习机

；

(3)用每个极限学习机

识别测试集样本，计算每一个极限学习机分类器的确率

：

(4)根据识别率

大小，选择

个识别效果较好的极限学习机。

(5)对于筛选出的

个极限学习机，采用Q统计法计算任何

，

(

)间的差异度

，计算公式为：

其中，

与

表示极限学习机

，

均预测正确与均预测错误的样本数，

表示

预测错误而

预测正确的样本数，相反，

表示

预测正确而

预测错误的样本数。

(6)将

个极限学习机组合为

个分类器集，计算每个分类器集的差异度

：

表示第

个分类器集中极限学习机

(

)间的差异度。

(7)比较所有极限学习机分类器集的差异度

，最大

对应的极限学习机集合则为集成ELM模型。

(8)当利用上述集成ELM模型进行预测时，采用投票法得到综合判断结果。

本发明提出的集成ELM窃电嫌疑用户识别模型，综合考虑了单一ELM的高学***均电量及其变化趋势、平均负荷及其变化趋势多个维度分析用户窃电的可能性，能有效识别用户窃电行为，将反窃电管理模式提升至“事前预防、事中控制”的管理水平。

附图说明

图1 基于集成ELM的配电网窃电嫌疑用户智能识别方法的主要流程图；

图2 集成ELM模型的主要流程图；

图3 单一ELM模型的示意图；

图4 本发明模型的ROC曲线与传统单一LM模型的比较图。

具体实施方式

下面结合附图和实施例对本发明的技术方案进行详细的说明。

本实施例为基于本发明集成ELM窃电嫌疑用户智能识别模型对广东电网江门供电局蓬江窃电嫌疑用户做出预测，结合图1的模型建立与求解过程，具体步骤如下：

步骤1：获取学习数据和预测数据并进行数据清洗；

所述的步骤1具体说明如下：

本实施例涉及的数据来源于2016年1月至2016年10月广东省江门市蓬江区内配网用户档案（用户编号、用电类型）、窃电告警（用户编号、告警名称、告警时间）、行度（用户编号、日期、日走字）、负荷（用户编号，日期，负荷）数据，其中行度及告警数据的时间间隔为1小时。其中2016年1月份至9月份的窃电用户及部分正常用户组数据为学习数据，2016年10月份部分用户数据为预测数据。本过程可以描述为：

S1.1：学习数据抽取。从江门供电局计量自动化***抽取蓬江供电局2016年1月至2016年9月窃电用户及部分正常用户上述四种类型数据。

S1.2：预测数据抽取，具体包含以下3个子步骤：

1)筛选10月份月线损超出正常范围线路为窃电嫌疑线路；

2)针对窃电嫌疑线路下用户，结合用电类型，排除路灯专变、学校用电等窃电嫌疑微小用户，并定义工业用电、商业用电等其余用电户为待预测用户。

3)针对待预测用户，从江门供电局计量自动化***抽取2016年10月份数据组成测试数据。

S1.3：数据清洗，具体包括：缺失数据的插补与异常数据的处理。

所述的步骤2具体说明如下：

S2.1：针对清洗后的学习与预测数据，计算每个用户每天的总电量及总负荷，整理其告警组合；

S2.2：计算每一个用户每一天的窃电告警系数

：

其中，

表示所有窃电告警组合（包括单个的）的权重之和，

表示

S2.3：利用一元回归模型计算每一个用户每一天的电量特征，即

斜率、

截距：

其中，

，

，

为用电量，

为时间编号（以天为单位），

表示在第

天的前

天的用电量，有

，

，此处有

的取值为5。

S2.4：利用一元回归模型计算每一个用户每一天的电量特征，即

斜率、

截距：

其中，

，

，

为负荷，

为时间编号（以天为单位），

表示在第

天的前

天的负荷，有

，

，此处有

的取值为5。

S2.5：形成学习样本和预测样本。对于学习样本，需根据用户在某一日期是否窃电为每一条记录打标签，1表示窃电，0表示未窃电，最终形成学习样本和预测样本如表1，表2示例所示：

表1学习样本示例

表2测试样本示例

结合附图2，所述的步骤3具体说明如下：

S3.1：划分训练集与测试集，比例为7:3；

S3.2：利用训练集学习集成ELM模型；

S3.3：利用测试集评估集成ELM模型。

S3.2子步骤：

1)S3.1：初始化ELM模型参数，包括：极限学习机隐含层神经元个数

,训练极限学习机个数

，基于准确率集成极限学习机分类器的个数

，基于差异度集成的极限学习机的个数

，本实施例中，

、

、

、

的取值分别为：

、100、60、30。

2)S3.2：基于不同

，用训练样本（

矩阵）训练生成

个极限学习机

，具体包括：

a.判断生成的极限学习机的个数是否满足

，否，转b，是，结束S3.2。

b.基于

的取值范围，随机产生

的具体数值；

c.基于

和样本特征个数

（本模型为5），随机生成极限学习机输入层到隐含层连接权重矩阵（

ⅹ

）；

d.计算隐含层与输出层间连接权重，得到单一极限学习机模型。返回a。

3)用每个极限学习机

识别测试集样本，计算每一个极限学习机分类器的确率

：

4)根据识别率

大小，选择

个识别效果较好的极限学习机。

5)对于筛选出的

个极限学习机，采用Q统计法计算任何

，

(

)间的差异度

，计算公式为：

其中，

与

表示极限学习机

，

均预测正确与均预测错误的样本数，

表示

预测错误而

预测正确的样本数，相反，

表示

预测正确而

预测错误的样本数。

6)将

个极限学习机组合为

个分类器集，计算每个分类器集的差异度

：

表示第

个分类器集中极限学习机

(

)间的差异度。

7)比较所有极限学习机分类器集的差异度

，最大

对应的极限学习机集合则为集成ELM模型。

8)当利用上述集成ELM模型进行预测时，采用投票法得到综合判断结果。

所述的S3.3的具体过程描述如下：

将测试集作为上述集成ELM模型的输入，预测测试集中每一用户在某一天的窃电嫌疑概率，并将0.5作为划分是否窃电的阈值，并将结果绘制为ROC曲线。

ROC曲线是衡量一个分类模型分类效果高低的标准，一般情况下，ROC曲线包含的面积越大。图3中本发明算法所代表的ROC曲线位于传统单一ELM模型的上方，证明了集成ELM模型的识别效果优于传统单一ELM。

所述的步骤4具体说明如下：

将预测样本作为所述的集成ELM窃电嫌疑用户识别模型输入量，输出每一用户的窃电嫌疑系数，锁定窃电嫌疑用户，后续可继续监测嫌疑用户的用电行为再进行现场取证。

综合以上分析，本发明提出的集成ELM窃电嫌疑用户识别模型，综合考虑了单一ELM的高学***均电量及其变化趋势、平均负荷及其变化趋势多个维度分析用户窃电的可能性，能有效识别用户窃电行为，将反窃电管理模式提升至“事前预防、事中控制”的管理水平。

Claims

1.一种基于集成ELM的配电网窃电嫌疑用户智能识别方法，其特征在于，包括以下步骤：

步骤1：获取学习数据和预测数据并进行数据清洗；

步骤3：将所述的学习样本划分为训练集和测试集，利用所述的训练集学习集成ELM窃电嫌疑用户识别模型，并基于所述的测试集评估模型效果；

步骤4：将预测样本作为所述的集成ELM窃电嫌疑用户识别模型输入量，输出每一用户的窃电嫌疑系数，锁定窃电嫌疑用户；

所述的窃电评价指标体系，包含告警、电量及负荷三大特征，所述的告警特征为窃电告警系数coeAlarm，所述的电量特征包括nE斜率及nE截距，所述的负荷特征包括nL斜率及nL截距，n为当前时间往前推移的天数；

所述的窃电告警系数coeAlarm的计算公式为：

其中，sum表示所有窃电告警组合包括单个的权重之和，subSum表示n天内出现的所有告警组合的最大子集的权重，而告警及其组合的权重将根据其对窃电的影响程度的大小由专业人员设定；

所述的集成ELM窃电嫌疑用户识别模型，包含如下几个步骤：

(1)初始化ELM模型参数，包括：极限学习机隐含层神经元个数K，其中N<K<M，训练极限学习机个数L，基于准确率集成极限学习机分类器的个数M，基于差异度集成的极限学习机的个数N；

(2)基于不同K，用训练样本M×N矩阵训练生成L个极限学习机C_i,其中i＝1,2…,L；

(3)用每个极限学习机C_i,其中i＝1,2…,L，识别测试集样本，计算每一个极限学习机分类器的确率R_i，其中i＝1,2…,L：

(4)根据识别率R_i大小，选择出M，N<M<L个识别效果较好的极限学习机；

(5)对于筛选出的M个极限学习机，采用Q统计法计算任何，C_i,C_j,i,j＝1，2…，M，i≠j间的差异度Q_ij，计算公式为：

其中，N¹¹与N⁰⁰表示极限学习机C_i，C_j均预测正确与均预测错误的样本数，N⁰¹表示C_i预测错误而C_j预测正确的样本数，相反，N¹⁰表示C_i预测正确而C_j预测错误的样本数；

(6)将M个极限学习机组合为

个分类器集，计算每个分类器集的差异度Q^p,

表示第P个分类器集中极限学习机C_i,C_j,i,j＝1,2…,N,i≠j间的差异度；

(7)比较所有极限学习机分类器集的差异度Q^p，最大Q^p对应的极限学习机集合则为集成ELM模型；

2.根据权利要求1所述的基于集成ELM的配电网窃电嫌疑用户智能识别方法，其特征在于，所述的学习数据和预测数据，包含用户档案、告警、行度及负荷四种类型；所述的学习数据中必须包含正常用户样本与窃电用户样本，所述的预测数据中包含窃电嫌疑线路下的部分用户，而窃电嫌疑线路通过线损进行定位。

3.根据权利要求1所述的基于集成ELM的配电网窃电嫌疑用户智能识别方法，其特征在于，所述的nE斜率、nE截距、nL斜率及nL截距将通过构建一元线性回归方程得到，具体模型为：

E＝I₁+K₁T，F＝I₂+K₂T

其中，E＝[e_t-n,e_t-n-1,…,e_t]，T＝[t-n,t-n-1,…,t]，F＝[l_t-n,l_t-n-1,…,l_t]，E为用电量，T为时间编号，T以天为单位，F为负荷，故e_t-n、l_t-n分别表示在第t天的前n天的用电量及负荷，有nE斜率＝K_I，nL斜率＝K₂，nE截距＝I₁，nL截距＝I₂。