CN110991477A - 一种识别电力***异常行业用户和异常用电行为的方法和*** - Google Patents

一种识别电力***异常行业用户和异常用电行为的方法和*** Download PDF

Info

Publication number
CN110991477A
CN110991477A CN201911037248.4A CN201911037248A CN110991477A CN 110991477 A CN110991477 A CN 110991477A CN 201911037248 A CN201911037248 A CN 201911037248A CN 110991477 A CN110991477 A CN 110991477A
Authority
CN
China
Prior art keywords
peak
electricity consumption
power consumption
valley
period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911037248.4A
Other languages
English (en)
Inventor
刘厦
杨艺宁
薛阳
王子龙
杨恒
徐英辉
赵震宇
邓高峰
黄荣国
张志�
董贤光
陈祉如
朱红霞
张鹏
王聪
杨柳
杜章华
金晟
苏盛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Jiangxi Electric Power Co ltd
State Grid Corp of China SGCC
State Grid Zhejiang Electric Power Co Ltd
China Electric Power Research Institute Co Ltd CEPRI
State Grid Shandong Electric Power Co Ltd
Changsha University of Science and Technology
Henan Xuji Instrument Co Ltd
Original Assignee
State Grid Jiangxi Electric Power Co ltd
State Grid Corp of China SGCC
State Grid Zhejiang Electric Power Co Ltd
China Electric Power Research Institute Co Ltd CEPRI
State Grid Shandong Electric Power Co Ltd
Changsha University of Science and Technology
Henan Xuji Instrument Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Jiangxi Electric Power Co ltd, State Grid Corp of China SGCC, State Grid Zhejiang Electric Power Co Ltd, China Electric Power Research Institute Co Ltd CEPRI, State Grid Shandong Electric Power Co Ltd, Changsha University of Science and Technology, Henan Xuji Instrument Co Ltd filed Critical State Grid Jiangxi Electric Power Co ltd
Priority to CN201911037248.4A priority Critical patent/CN110991477A/zh
Publication of CN110991477A publication Critical patent/CN110991477A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种识别电力***异常行业用户和异常用电行为的方法和***。所述方法和***采集各行业的用电量数据,基于行业特性建立能准确描述行业特征的用电特征指标项,所述用电特征指标项包括峰时段,谷时段,谷时段用电量、峰时段用电量,并通过所述用电特征指标项确定用户特征指标低谷、高峰负荷比值,以及负荷高峰时段和低谷时段的功率累积波动率,在建立用电特征指标项的基础上,采用AP聚类算法按行业进行用电行为的聚类分析,通过聚类结果识别用电行业属性标识错误的异常用户,以及本行业中的异常用电行为用户。所述方法和***显著减少了用户聚类数量,相应降低了用电异常检测难度和窃电检测误报率,有效提高了供电企业的运营效益。

Description

一种识别电力***异常行业用户和异常用电行为的方法和 ***
技术领域
本发明涉及电力分析领域,并且更具体地,涉及一种识别电力***异常行业用户和异常用电行为的方法和***。
背景技术
市场经济条件下,部分不法经营者为谋取暴利,不择手段地窃取电能,扰乱了正常的供用电秩序,并直接造成供电企业收益损失。传统上,窃电检测主要依靠人工筛查。智能电能表的应用显著丰富了用户用电信息,近年来,工程应用中主要根据用检人员经验总结的规则,监测电表失流、欠压等指标识别窃电行为。此类方法有确切的物理意义,能准确标识用电异常行为,在反窃电防治中起到了重要作用,但适用范围有限,不能有效监测绕越电表等不会造成电表监测指标异常的窃电方式。近年来,研究人员提出采用用电行为聚类分析来识别电表监测指标有无异常。这类方法从用户的月用电量数据中提取行为特征,如负荷曲线的波动区间、用户的变动性、波动性、趋势等多项指标,然后根据各种数据挖掘算法对用户进行聚类分析,识别异常用户。
需要指出的是,既有基于聚类分析的异常用电行为检测方法多以异常用户用电量存在突变为前提,所用指标项尽管表现形式不同,但大多将用电量及功率曲线的突变作为关键指标。工程实际中,大量干扰因素均可导致用电量和负荷突变,以用电量突变作为关键指标进行聚类分析识别异常用电行为,往往存在准确率不高、难以满足应用需求的问题。
不同行业用户的用电行为特征往往具有显著的差异性,将不同类型用户一起进行聚类分析时,多样化的用户类型将会显著扩大用户可能分布的状态空间,从而提高用户聚类识别异常用电的难度。因此,需要一种技术降低电力***用户聚类识别异常用电的难度。
发明内容
为了解决现有技术中电力***用户聚类识别异常用电的难度,本发明提供了一种识别电力***异常行业用户和异常用电行为的方法,所述方法包括:
基于用电用户档案采集用户行业信息,并按照预先确定的时间间隔采集用户的用电量数据,按照行业信息对用电数据分类,确定第t个行业中用电用户的用电量数据原始样本集Xt={xijk},其中,xijk是第i个用户第j天的第k个用电量数据,1≤k≤N;
对第t个行业的用电量数据原始样本集Xt中的缺失值和异常值进行处理,生成第t个行业的用电量数据有效样本集X't={x'ijk},其中,所述缺失值是原始样本集中缺失的用电量数据,所述异常值是在预先确定的正常用电量区间以外的用电量数据,x'ijk是对原始样本集Xt中的用电量数据进行处理后的第i个用户第j天的第k个用电量数据,1≤k≤N;
根据有效样本集X't中的用电量数据确定第i个用户第j天的峰时段、谷时段、峰时段用电量peakij和谷时段用电量valleyij
根据所述峰时段用电量peakij和谷时段用电量valleyij确定第i个用户第j天的低谷高峰负荷比值ratioij,以及根据峰时段用电量数据确定第i个用户第j天的峰时段用电量累积波动率
Figure BDA0002251854910000021
根据谷时段用电量数据确定谷时段用电量累积波动率
Figure BDA0002251854910000022
基于预先确定的AP聚类算法参数,根据所述第t个行业中用户的低谷高峰负荷比值ratioij、高峰时段用电量累积波动率
Figure BDA0002251854910000023
和低谷时段用电量累积波动率
Figure BDA0002251854910000024
对用户进行聚类分析;
根据所述聚类分析结果确定第t个行业中的异常用户,以及所述行业中有异常用电行为的用户。
进一步地,所述对第t个行业的用电量数据原始样本集Xt中的缺失值和异常值进行处理,生成第t个行业的用电数据有效样本集X't是指当第t个行业的用电量数据原始样本集Xt中存在的缺失值和/或异常值时,采用邻近均值法替代所述样本中的缺失值和/或异常值。
进一步地,所述根据有效样本集X't中的用电量数据确定第i个用户第j天的峰时段用电量peakij和谷时段用电量valleyij,并根据所述峰时段用电量peakij和谷时段用电量valleyij确定第i个用户第j天的低谷高峰负荷比值ratioij包括:
在有效样本集X't中,对第i个用户第j天的连续时间段的n个用电量数据进行求和,6≤n≤N;
将所述第i个用户第j天的用电量数据求和值按照升序排列,确定用电量数据求和值最大的连续时段为峰时段,用电量数据求和值最小的连续时段为谷时段,所述峰时段的用电量数据求和值为峰时段用电量peakij,所述谷时段用电量数据求和值为谷时段用电量valleyij
进一步地,根据所述峰时段用电量peakij和谷时段用电量valleyij确定第i个用户第j天的低谷高峰负荷比值ratioij,以及根据峰时段用电量数据确定第i个用户第j天的峰时段用电量累积波动率
Figure BDA0002251854910000031
根据谷时段用电量数据确定第i个用户第j天的谷时段用电量累积波动率
Figure BDA0002251854910000032
包括:
根据所述峰时段用电量peakij和谷时段用电量valleyij确定第i个用户第j天的低谷高峰负荷比值ratioij,其计算公式为:
ratioij=valleyij/peakij
根据峰时段用电量数据确定第i个用户第j天的峰时段用电量累积波动率
Figure BDA0002251854910000033
其计算公式为:
Figure BDA0002251854910000034
Figure BDA0002251854910000035
Figure BDA0002251854910000036
式中,
Figure BDA0002251854910000037
是第i个用户第j天的峰时段用电量波动累计值,
Figure BDA0002251854910000038
是第i个用户第j天的峰时段用电量平均值,
Figure BDA0002251854910000039
是第i个用户第j天峰时段的第k个用电量数据,n是第i个用户第j天的峰时段用电量数据的个数;
根据谷时段用电量数据确定第i个用户第j天的谷时段用电量累积波动率
Figure BDA0002251854910000041
其计算公式为:
Figure BDA0002251854910000042
Figure BDA0002251854910000043
Figure BDA0002251854910000044
式中,
Figure BDA0002251854910000045
是第i个用户第j天的谷时段用电量波动累计值,
Figure BDA0002251854910000046
是第i个用户第j天的谷时段用电量平均值,
Figure BDA0002251854910000047
是第i个用户第j天谷时段的第k个用电量数据,n是第i个用户第j天的谷时段用电量数据的个数。
进一步地,基于预先确定的AP聚类算法参数,根据所述第t个行业中用户的低谷高峰负荷比值ratioij、高峰时段用电量累积波动率
Figure BDA0002251854910000048
和低谷时段用电量累积波动率
Figure BDA0002251854910000049
对用户进行聚类分析,并根据所述聚类分析结果确定第t个行业中有异常用电行为的用户包括:
设置AP聚类算法的参数,所述参数包括衰减系数λ,最大迭代次数T,聚类中心最大迭代不发生改变的次数T';
根据低谷高峰负荷比值ratioij、高峰时段用电量累积波动率
Figure BDA00022518549100000410
和低谷时段用电量累积波动率
Figure BDA00022518549100000411
计算有效样本集X't中用户xi与用户xk之间的欧氏距离di,k,其计算公式为:
di,k=-||xi-xk||
根据所述欧氏距离di,k确定用户xi与用户xk之间相似度s(i,k),其计算公式为:
s(i,k)=-di,k
将s(i,k)作为相似度矩阵对应位置的元素,并将所有得到的相似度元素的中位数作为相似度矩阵的对角线元素以生成相似度矩阵;
当有效样本集X't中一共有n个用户的用电量数据时,初始化吸引度矩阵R和归属度矩阵A为n×n的零矩阵,所述吸引度矩阵R矩阵的元素r0(i,k)和归属度矩阵A的元素a0(i,k)为0,并计算吸引度矩阵R的元素r1(i,k)和归属度矩阵A的元素a1(i,k),所述计算公式为:
Figure BDA0002251854910000051
Figure BDA0002251854910000052
迭代更新rt+1(i,k)和at+1(i,k),所述计算公式如下:
rt+1(i,k)=λ*rt-1(i,k)+(1-λ)*rt(i,k)
at+1(i,k)=λ*at-1(i,k)+(1-λ)*at(i,k)
式中,λ为预先设置的衰减系数,1≤t≤T;
对各个数据点的归属度和吸引度进行求和,确定聚类中心,其中,对于数据点i,当a(i,k)+r(i,k)取得最大值时,若i=k,则确定数据点i为一个聚类中心,若i≠k,则确定数据点k为聚类中心;
当聚类中心在进行迭代的次数t等于预先设置的聚类中心最大迭代不发生改变的次数T'时,聚类中心仍不发生变化或者迭代次数t等于预先设置的最大迭代次数T时,AP聚类算法结束。
根据本发明的另一方面,本发明提供一种识别电力***异常行业用户和异常用电行为的***,所述***包括:
数据采集单元,其用于基于用电用户档案采集用户行业信息,并按照预先确定的时间间隔采集用户的用电量数据,按照行业信息对用电数据分类,确定第t个行业中用电用户的用电量数据原始样本集Xt={xijk},其中,xijk是第i个用户第j天的第k个用电量数据,1≤k≤N;
有效样本单元,其用于对第t个行业的用电量数据原始样本集Xt中的缺失值和异常值进行处理,生成第t个行业的用电量数据有效样本集X't={x'ijk},其中,所述缺失值是原始样本集中缺失的用电量数据,所述异常值是在预先确定的正常用电量区间以外的用电量数据,x'ijk是对原始样本集Xt中的用电量数据进行处理后的第i个用户第j天的第k个用电量数据,1≤k≤N;
用电特征指标单元,其用于根据有效样本集X't中的用电量数据确定第i个用户第j天的峰时段、谷时段、峰时段用电量peakij和谷时段用电量valleyij,以及根据所述峰时段用电量peakij和谷时段用电量valleyij确定第i个用户第j天的低谷高峰负荷比值ratioij,以及根据峰时段用电量数据确定第i个用户第j天的峰时段用电量累积波动率
Figure BDA0002251854910000061
根据谷时段用电量数据确定谷时段用电量累积波动率
Figure BDA0002251854910000062
聚类分析单元,其用于基于预先确定的AP聚类算法参数,根据所述第t个行业中用户的低谷高峰负荷比值ratioij、高峰时段用电量累积波动率
Figure BDA0002251854910000063
和低谷时段用电量累积波动率
Figure BDA0002251854910000064
对用户进行聚类分析;
结果输出单元,其用于根据所述聚类分析结果确定第t个行业中的异常用户,以及所述行业中有异常用电行为的用户。
进一步地,所述有效样本单元对第t个行业的用电量数据原始样本集Xt中的缺失值和异常值进行处理,生成第t个行业的用电数据有效样本集X't是指当第t个行业的用电量数据原始样本集Xt中存在的缺失值和/或异常值时,采用邻近均值法替代所述样本中的缺失值和/或异常值。
进一步地,所述用电特征指标单元根据有效样本集X't中的用电量数据确定第i个用户第j天的峰时段用电量peakij和谷时段用电量valleyij,并根据所述峰时段用电量peakij和谷时段用电量valleyij确定第i个用户第j天的低谷高峰负荷比值ratioij包括:
在有效样本集X't中,对第i个用户第j天的连续时间段的n个用电量数据进行求和,6≤n≤N;
将所述第i个用户第j天的用电量数据求和值按照升序排列,确定用电量数据求和值最大的连续时段为峰时段,用电量数据求和值最小的连续时段为谷时段,所述峰时段的用电量数据求和值为峰时段用电量peakij,所述谷时段用电量数据求和值为谷时段用电量valleyij
进一步地,所述用电特征指标单元根据所述峰时段用电量peakij和谷时段用电量valleyij确定第i个用户第j天的低谷高峰负荷比值ratioij,以及根据峰时段用电量数据确定第i个用户第j天的峰时段用电量累积波动率
Figure BDA0002251854910000071
根据谷时段用电量数据确定第i个用户第j天的谷时段用电量累积波动率
Figure BDA0002251854910000072
包括:
根据所述峰时段用电量peakij和谷时段用电量valleyij确定第i个用户第j天的低谷高峰负荷比值ratioij,其计算公式为:
ratioij=valleyij/peakij
根据峰时段用电量数据确定第i个用户第j天的峰时段用电量累积波动率
Figure BDA0002251854910000073
其计算公式为:
Figure BDA0002251854910000074
Figure BDA0002251854910000075
Figure BDA0002251854910000076
式中,
Figure BDA0002251854910000077
是第i个用户第j天的峰时段用电量波动累计值,
Figure BDA0002251854910000078
是第i个用户第j天的峰时段用电量平均值,
Figure BDA0002251854910000079
是第i个用户第j天峰时段的第k个用电量数据,n是第i个用户第j天的峰时段用电量数据的个数;
根据谷时段用电量数据确定第i个用户第j天的谷时段用电量累积波动率
Figure BDA00022518549100000710
其计算公式为:
Figure BDA00022518549100000711
Figure BDA00022518549100000712
Figure BDA00022518549100000713
式中,
Figure BDA00022518549100000714
是第i个用户第j天的谷时段用电量波动累计值,
Figure BDA00022518549100000715
是第i个用户第j天的谷时段用电量平均值,
Figure BDA00022518549100000716
是第i个用户第j天谷时段的第k个用电量数据,n是第i个用户第j天的谷时段用电量数据的个数。
进一步地,所述聚类分析单元基于预先确定的AP聚类算法参数,根据所述第t个行业中用户的低谷高峰负荷比值ratioij、高峰时段用电量累积波动率
Figure BDA0002251854910000081
和低谷时段用电量累积波动率
Figure BDA0002251854910000082
对用户进行聚类分析,并根据所述聚类分析结果确定第t个行业中有异常用电行为的用户包括:
设置AP聚类算法的参数,所述参数包括衰减系数λ,最大迭代次数T,聚类中心最大迭代不发生改变的次数T';
根据低谷高峰负荷比值ratioij、高峰时段用电量累积波动率
Figure BDA0002251854910000083
和低谷时段用电量累积波动率
Figure BDA0002251854910000084
计算有效样本集X't中用户xi与用户xk之间的欧氏距离di,k,其计算公式为:
di,k=-||xi-xk||
根据所述欧氏距离di,k确定用户xi与用户xk之间相似度s(i,k),其计算公式为:
s(i,k)=-di,k
将s(i,k)作为相似度矩阵对应位置的元素,并将所有得到的相似度元素的中位数作为相似度矩阵的对角线元素以生成相似度矩阵;
当有效样本集X't中一共有n个用户的用电量数据时,初始化吸引度矩阵R和归属度矩阵A为n×n的零矩阵,所述吸引度矩阵R矩阵的元素r0(i,k)和归属度矩阵A的元素a0(i,k)为0,并计算吸引度矩阵R的元素r1(i,k)和归属度矩阵A的元素a1(i,k),所述计算公式为:
Figure BDA0002251854910000085
Figure BDA0002251854910000086
迭代更新rt+1(i,k)和at+1(i,k),所述计算公式如下:
rt+1(i,k)=λ*rt-1(i,k)+(1-λ)*rt(i,k)
at+1(i,k)=λ*at-1(i,k)+(1-λ)*at(i,k)
式中,λ为预先设置的衰减系数,1≤t≤T;
对各个数据点的归属度和吸引度进行求和,确定聚类中心,其中,对于数据点i,当a(i,k)+r(i,k)取得最大值时,若i=k,则确定数据点i为一个聚类中心,若i≠k,则确定数据点k为聚类中心;
当聚类中心在进行迭代的次数t等于预先设置的聚类中心最大迭代不发生改变的次数T'时,聚类中心仍不发生变化或者迭代次数t等于预先设置的最大迭代次数T时,AP聚类算法结束。
本发明技术方案提供的识别电力***异常行业用户和异常用电行为的方法和***取不同行业用电用户一段时间内分时段用电量数据,分析不同行业用电模式,然后基于行业特性的统计分析建立能准确描述行业特征的用电特征指标项,所述用电特征指标项包括谷时段用电量、峰时段用电量,基于所述用电特征指标项确定用电特征指标低谷、高峰负荷比值,以及负荷高峰时段和低谷时段的功率累积波动率,在建立用电特征指标的基础上,采用Affinity propagation聚类算法对电力用户按行业细分后进行用电行为的聚类分析,通过聚类结果识别用电行业属性标识错误的异常用户,以及本行业中的异常用电行为用户,所述识别电力***异常行业用户和异常用电行为的方法和***通过行业聚类来识别异常用电行为,实现了根据行业用户共同特性提炼表征用电行为特性的指标项,规避用电量突变指标的干扰,并且按行业聚类可显著减少用户聚类数量,从而有效降低聚类对象在状态空间的分布范围,相应降低用电异常检测难度和窃电检测误报率,有效提高了供电企业的运营效益。
附图说明
通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:
图1为根据本发明优选实施方式的识别电力***异常行业用户和异常用电行为的方法的流程图;
图2为根据本发明优选实施方式的识别电力***异常行业用户和异常用电行为的***的结构示意图。
具体实施方式
现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。
除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。
图1为根据本发明优选实施方式的识别电力***异常行业用户和异常用电行为的方法的流程图。如图1所示,本优选实施方式所述的识别电力***异常行业用户和异常用电行为的方法100从步骤101开始。
在步骤101,基于用电用户档案采集用户行业信息,并按照预先确定的时间间隔采集用户的用电量数据,按照行业信息对用电数据分类,确定第t个行业中用电用户的用电量数据原始样本集Xt={xijk},其中,xijk是第i个用户第j天的第k个用电量数据,1≤k≤N。一般设置获取分行业用户的用电量数据的采样间隔为30分钟,所述采样间隔时间既能保证采样数据的多样性,又能使采样频率不会太高,提高了效率。
在步骤102,对第t个行业的用电量数据原始样本集Xt中的缺失值和异常值进行处理,生成第t个行业的用电量数据有效样本集X't={x'ijk},其中,所述缺失值是原始样本集中缺失的用电量数据,所述异常值是在预先确定的正常用电量区间以外的用电量数据,x'ijk是对原始样本集Xt中的用电量数据进行处理后的第i个用户第j天的第k个用电量数据,1≤k≤N。对采集的原始样本集中的数据进行分析处理,充分保证的分析样本的数据的完整性、合理性和准确性。
在步骤103,根据有效样本集X't中的用电量数据确定第i个用户第j天的峰时段、谷时段、峰时段用电量peakij和谷时段用电量valleyij。由于行业用户通常在生产期的用电负荷显著高于其它时段,而非生产期的用电量低趋势较为平稳,另外考虑到某些行业存在生产排班和生活起居引起的日高峰和日低谷,当完成生产周期时才会出现明显负荷波动,也不存在昼夜导致的日周期,因此,采用峰时段、谷时段、峰时段用电量peakij和谷时段用电量valleyij作为识别异常用户和异常用电行为的指标特征项能较好地体现所述行业特征。
在步骤104,根据所述峰时段用电量peakij和谷时段用电量valleyij确定第i个用户第j天的低谷高峰负荷比值ratioij,以及根据峰时段用电量数据确定第i个用户第j天的峰时段用电量累积波动率
Figure BDA0002251854910000111
根据谷时段用电量数据确定谷时段用电量累积波动率
Figure BDA0002251854910000112
在步骤105,基于预先确定的AP聚类算法参数,根据所述第t个行业中用户的低谷高峰负荷比值ratioij、高峰时段用电量累积波动率
Figure BDA0002251854910000113
和低谷时段用电量累积波动率
Figure BDA0002251854910000114
对用户进行聚类分析。
在步骤106,根据所述聚类分析结果确定第t个行业中的异常用户,以及所述行业中有异常用电行为的用户。
优选地,所述对第t个行业的用电量数据原始样本集Xt中的缺失值和异常值进行处理,生成第t个行业的用电数据有效样本集X't是指当第t个行业的用电量数据原始样本集Xt中存在的缺失值和/或异常值时,采用邻近均值法替代所述样本中的缺失值和/或异常值。
优选地,所述根据有效样本集X't中的用电量数据确定第i个用户第j天的峰时段用电量peakij和谷时段用电量valleyij,并根据所述峰时段用电量peakij和谷时段用电量valleyij确定第i个用户第j天的低谷高峰负荷比值ratioij包括:
在有效样本集X't中,对第i个用户第j天的连续时间段的n个用电量数据进行求和,6≤n≤N。当确定的采样间隔为30分钟时,一般取连续6个小时的12个用电量数据求和。
将所述第i个用户第j天的用电量数据求和值按照升序排列,确定用电量数据求和值最大的连续时段为峰时段,用电量数据求和值最小的连续时段为谷时段,所述峰时段的用电量数据求和值为峰时段用电量peakij,所述谷时段用电量数据求和值为谷时段用电量valleyij
优选地,根据所述峰时段用电量peakij和谷时段用电量valleyij确定第i个用户第j天的低谷高峰负荷比值ratioij,以及根据峰时段用电量数据确定第i个用户第j天的峰时段用电量累积波动率
Figure BDA0002251854910000121
根据谷时段用电量数据确定第i个用户第j天的谷时段用电量累积波动率
Figure BDA0002251854910000122
包括:
根据所述峰时段用电量peakij和谷时段用电量valleyij确定第i个用户第j天的低谷高峰负荷比值ratioij,其计算公式为:
ratioij=valleyij/peakij
所述低谷高峰负荷值ratioij体现了行业用户谷时段和峰时段用电量的差异,结果越小,差异越大。
根据峰时段用电量数据确定第i个用户第j天的峰时段用电量累积波动率
Figure BDA0002251854910000123
其计算公式为:
Figure BDA0002251854910000124
Figure BDA0002251854910000125
Figure BDA0002251854910000126
式中,
Figure BDA0002251854910000127
是第i个用户第j天的峰时段用电量波动累计值,
Figure BDA0002251854910000128
是第i个用户第j天的峰时段用电量平均值,
Figure BDA0002251854910000129
是第i个用户第j天峰时段的第k个用电量数据,n是第i个用户第j天的峰时段用电量数据的个数;
根据谷时段用电量数据确定第i个用户第j天的谷时段用电量累积波动率
Figure BDA00022518549100001210
其计算公式为:
Figure BDA00022518549100001211
Figure BDA0002251854910000131
Figure BDA0002251854910000132
式中,
Figure BDA0002251854910000133
是第i个用户第j天的谷时段用电量波动累计值,
Figure BDA0002251854910000134
是第i个用户第j天的谷时段用电量平均值,
Figure BDA0002251854910000135
是第i个用户第j天谷时段的第k个用电量数据,n是第i个用户第j天的谷时段用电量数据的个数。
峰时段用电量累积波动率
Figure BDA0002251854910000136
和谷时段用电量累积波动率
Figure BDA0002251854910000137
的设置方便了不同用电水平用户之间进行比较。
优选地,基于预先确定的AP聚类算法参数,根据所述第t个行业中用户的低谷高峰负荷比值ratioij、高峰时段用电量累积波动率
Figure BDA0002251854910000138
和低谷时段用电量累积波动率
Figure BDA0002251854910000139
对用户进行聚类分析,并根据所述聚类分析结果确定第t个行业中有异常用电行为的用户包括:
设置AP聚类算法的参数,所述参数包括衰减系数λ,最大迭代次数T,聚类中心最大迭代不发生改变的次数T';
根据低谷高峰负荷比值ratioij、高峰时段用电量累积波动率
Figure BDA00022518549100001310
和低谷时段用电量累积波动率
Figure BDA00022518549100001311
计算有效样本集X't中用户xi与用户xk之间的欧氏距离di,k,其计算公式为:
di,k=-||xi-xk||
根据所述欧氏距离di,k确定用户xi与用户xk之间相似度s(i,k),其计算公式为:
s(i,k)=-di,k
将s(i,k)作为相似度矩阵对应位置的元素,并将所有得到的相似度元素的中位数作为相似度矩阵的对角线元素以生成相似度矩阵;
当有效样本集X't中一共有n个用户的用电量数据时,初始化吸引度矩阵R和归属度矩阵A为n×n的零矩阵,所述吸引度矩阵R矩阵的元素r0(i,k)和归属度矩阵A的元素a0(i,k)为0,并计算吸引度矩阵R的元素r1(i,k)和归属度矩阵A的元素a1(i,k),所述计算公式为:
Figure BDA0002251854910000141
Figure BDA0002251854910000142
迭代更新rt+1(i,k)和at+1(i,k),所述计算公式如下:
rt+1(i,k)=λ*rt-1(i,k)+(1-λ)*rt(i,k)
at+1(i,k)=λ*at-1(i,k)+(1-λ)*at(i,k)
式中,λ为预先设置的衰减系数,1≤t≤T;
对各个数据点的归属度和吸引度进行求和,确定聚类中心,其中,对于数据点i,当a(i,k)+r(i,k)取得最大值时,若i=k,则确定数据点i为一个聚类中心,若i≠k,则确定数据点k为聚类中心;
当聚类中心在进行迭代的次数t等于预先设置的聚类中心最大迭代不发生改变的次数T'时,聚类中心仍不发生变化或者迭代次数t等于预先设置的最大迭代次数T时,AP聚类算法结束。
在本优选实施方式中,以烤用户为例。烤烟用户在烟叶成熟季的用电负荷显著高于其它时段,烟叶未成熟季节的用电量低且趋势较为平稳;此外,烘焙烟叶一次需要7天左右,期间负荷不会发生剧烈变化,也没有因昼夜导致的日周期,具有非常典型的用电特征指标。
选取某地区200家烤烟专变用户、4家砖厂和16个农村台区公变,为充分刻画烤烟用户在烟叶成熟季节的用电量特征与趋势,用电量数据均选取2016年6月1日至6月30日共30天的30min间隔数据,对各个用户数据进行预处理并计算出各个指标特征项,采用AP聚类算法对烤烟用户进行聚类分析。AP聚类算法参数设置为:衰减系数λ为0.5,最大迭代次数T为500次,聚类中心最大迭代不发生改变的次数T'为50次,参考度设置为相似度矩阵中所有值的中位数。聚类中心,聚类簇包含用户及划分正确率分别如表1和表2所示。
表1 聚类中心特征项30日均值
Figure BDA0002251854910000151
如表1所示,除了类簇1中心以外的其他4个类簇中心的峰时段用电量累积波动率和谷时段用电量累积波动率中至少一个的数据值远远大于1,说明所述用户为非本行业中的用户或者为本行业中具有异常用电行为的用户。
聚类簇包含用户及划分正确率如下表2所示。
Figure BDA0002251854910000152
如表2所示,聚类簇1中的烤烟专变用户为197户,而聚类簇2则准确识别出了非烤烟用户的16个台区公变,聚类簇3更是准确识别出了全部非烤烟用户的4家砖厂,而聚类簇4和5则准确识别出了200家烤烟用户中的2家异常烤烟用户,较好地实现了烤烟行业中非本行业异常用户的识别以及本行业中异常用电行为地用户地识别,而且识别正确率高,大大降低了用户分类维度,提高了窃电检测误报率。
工程实际中,大量干扰因素均可导致用电量和负荷突变,因此以异常用户用电量存在突变为前提,将用电量及功率曲线的突变作为关键指标进行聚类分析识别异常用电行为,往往存在准确率不高、难以满足应用需求的问题。而且不同行业用户的用电行为特征往往具有显著的差异性,将不同类型用户一起进行聚类分析时,多样化的用户类型将会显著扩大用户可能分布的状态空间,从而提高用户聚类识别异常用电的难度。本发明所述的识别电力***异常用户和异常用电行为的方法通过分析不同行业用电模式,然后基于行业特性的统计分析建立用电指标特征项,在此基础上,可采用Affinity propagation聚类算法对将电力用户按行业细分后进行用电行为的聚类分析,识别每个行业中用户行业属性标识错误的用户,还能准确识别本行业中的异常用户行为,从而结合行业用电行为特性准确刻画了用户行为特征,还通过降低用户分类维度和窃电检测误报率,推进了数据驱动窃电检测实用化的发展方向。
图2为根据本发明优选实施方式的识别电力***异常行业用户和异常用电行为的***的结构示意图。如图2所示,本优选实施方式所述的识别电力***异常行业用户和异常用电行为的***200包括:
数据采集单元201,其用于基于用电用户档案采集用户行业信息,并按照预先确定的时间间隔采集用户的用电量数据,按照行业信息对用电数据分类,确定第t个行业中用电用户的用电量数据原始样本集Xt={xijk},其中,xijk是第i个用户第j天的第k个用电量数据,1≤k≤N;
有效样本单元202,其用于对第t个行业的用电量数据原始样本集Xt中的缺失值和异常值进行处理,生成第t个行业的用电量数据有效样本集X't={x'ijk},其中,所述缺失值是原始样本集中缺失的用电量数据,所述异常值是在预先确定的正常用电量区间以外的用电量数据,x'ijk是对原始样本集Xt中的用电量数据进行处理后的第i个用户第j天的第k个用电量数据,1≤k≤N;
用电特征指标单元203,其用于根据有效样本集X't中的用电量数据确定第i个用户第j天的峰时段、谷时段、峰时段用电量peakij和谷时段用电量valleyij,以及根据所述峰时段用电量peakij和谷时段用电量valleyij确定第i个用户第j天的低谷高峰负荷比值ratioij,以及根据峰时段用电量数据确定第i个用户第j天的峰时段用电量累积波动率
Figure BDA0002251854910000171
根据谷时段用电量数据确定谷时段用电量累积波动率
Figure BDA0002251854910000172
聚类分析单元204,其用于基于预先确定的AP聚类算法参数,根据所述第t个行业中用户的低谷高峰负荷比值ratioij、高峰时段用电量累积波动率
Figure BDA0002251854910000173
和低谷时段用电量累积波动率
Figure BDA0002251854910000174
对用户进行聚类分析;
结果输出单元205,其用于根据所述聚类分析结果确定第t个行业中的异常用户,以及所述行业中有异常用电行为的用户。
优选地,所述有效样本单元202对第t个行业的用电量数据原始样本集Xt中的缺失值和异常值进行处理,生成第t个行业的用电数据有效样本集X't是指当第t个行业的用电量数据原始样本集Xt中存在的缺失值和/或异常值时,采用邻近均值法替代所述样本中的缺失值和/或异常值。
优选地,所述用电特征指标单元203根据有效样本集X't中的用电量数据确定第i个用户第j天的峰时段用电量peakij和谷时段用电量valleyij,并根据所述峰时段用电量peakij和谷时段用电量valleyij确定第i个用户第j天的低谷高峰负荷比值ratioij包括:
在有效样本集X't中,对第i个用户第j天的连续时间段的n个用电量数据进行求和,6≤n≤N;
将所述第i个用户第j天的用电量数据求和值按照升序排列,确定用电量数据求和值最大的连续时段为峰时段,用电量数据求和值最小的连续时段为谷时段,所述峰时段的用电量数据求和值为峰时段用电量peakij,所述谷时段用电量数据求和值为谷时段用电量valleyij
优选地,所述用电特征指标单元203根据所述峰时段用电量peakij和谷时段用电量valleyij确定第i个用户第j天的低谷高峰负荷比值ratioij,以及根据峰时段用电量数据确定第i个用户第j天的峰时段用电量累积波动率
Figure BDA0002251854910000181
根据谷时段用电量数据确定第i个用户第j天的谷时段用电量累积波动率
Figure BDA0002251854910000182
包括:
根据所述峰时段用电量peakij和谷时段用电量valleyij确定第i个用户第j天的低谷高峰负荷比值ratioij,其计算公式为:
ratioij=valleyij/peakij
根据峰时段用电量数据确定第i个用户第j天的峰时段用电量累积波动率
Figure BDA0002251854910000183
其计算公式为:
Figure BDA0002251854910000184
Figure BDA0002251854910000185
Figure BDA0002251854910000186
式中,
Figure BDA0002251854910000187
是第i个用户第j天的峰时段用电量波动累计值,
Figure BDA0002251854910000188
是第i个用户第j天的峰时段用电量平均值,
Figure BDA0002251854910000189
是第i个用户第j天峰时段的第k个用电量数据,n是第i个用户第j天的峰时段用电量数据的个数;
根据谷时段用电量数据确定第i个用户第j天的谷时段用电量累积波动率
Figure BDA00022518549100001810
其计算公式为:
Figure BDA00022518549100001811
Figure BDA00022518549100001812
Figure BDA00022518549100001813
式中,
Figure BDA00022518549100001814
是第i个用户第j天的谷时段用电量波动累计值,
Figure BDA00022518549100001815
是第i个用户第j天的谷时段用电量平均值,
Figure BDA00022518549100001816
是第i个用户第j天谷时段的第k个用电量数据,n是第i个用户第j天的谷时段用电量数据的个数。
优选地,所述聚类分析单元204基于预先确定的AP聚类算法参数,根据所述第t个行业中用户的低谷高峰负荷比值ratioij、高峰时段用电量累积波动率
Figure BDA00022518549100001817
和低谷时段用电量累积波动率
Figure BDA00022518549100001818
对用户进行聚类分析,并根据所述聚类分析结果确定第t个行业中有异常用电行为的用户包括:
设置AP聚类算法的参数,所述参数包括衰减系数λ,最大迭代次数T,聚类中心最大迭代不发生改变的次数T';
根据低谷高峰负荷比值ratioij、高峰时段用电量累积波动率
Figure BDA0002251854910000191
和低谷时段用电量累积波动率
Figure BDA0002251854910000192
计算有效样本集X't中用户xi与用户xk之间的欧氏距离di,k,其计算公式为:
di,k=-||xi-xk||
根据所述欧氏距离di,k确定用户xi与用户xk之间相似度s(i,k),其计算公式为:
s(i,k)=-di,k
将s(i,k)作为相似度矩阵对应位置的元素,并将所有得到的相似度元素的中位数作为相似度矩阵的对角线元素以生成相似度矩阵;
当有效样本集X't中一共有n个用户的用电量数据时,初始化吸引度矩阵R和归属度矩阵A为n×n的零矩阵,所述吸引度矩阵R矩阵的元素r0(i,k)和归属度矩阵A的元素a0(i,k)为0,并计算吸引度矩阵R的元素r1(i,k)和归属度矩阵A的元素a1(i,k),所述计算公式为:
Figure BDA0002251854910000193
Figure BDA0002251854910000194
迭代更新rt+1(i,k)和at+1(i,k),所述计算公式如下:
rt+1(i,k)=λ*rt-1(i,k)+(1-λ)*rt(i,k)
at+1(i,k)=λ*at-1(i,k)+(1-λ)*at(i,k)
式中,λ为预先设置的衰减系数,1≤t≤T;
对各个数据点的归属度和吸引度进行求和,确定聚类中心,其中,对于数据点i,当a(i,k)+r(i,k)取得最大值时,若i=k,则确定数据点i为一个聚类中心,若i≠k,则确定数据点k为聚类中心;
当聚类中心在进行迭代的次数t等于预先设置的聚类中心最大迭代不发生改变的次数T'时,聚类中心仍不发生变化或者迭代次数t等于预先设置的最大迭代次数T时,AP聚类算法结束。
本发明所述识别电力***异常行业用户和异常用电行为的***识别电力***异常行业用户和异常用电行为的步骤与本发明所述识别电力***异常行业用户和异常用电行为的方法的步骤相同,并且达到的技术效果也相同,此处不再赘述。
已经通过参考少量实施方式描述了本发明。然而,本领域技术人员所公知的,正如附带的专利权利要求所限定的,除了本发明以上公开的其他的实施例等同地落在本发明的范围内。
通常地,在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释,除非在其中被另外明确地定义。所有的参考“一个/所述/该[装置、组件等]”都被开放地解释为所述装置、组件等中的至少一个实例,除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行,除非明确地说明。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (10)

1.一种识别电力***异常行业用户和异常用电行为的方法,其特征在于,所述方法包括:
基于用电用户档案采集用户行业信息,并按照预先确定的时间间隔采集用户的用电量数据,按照行业信息对用电量数据分类,确定第t个行业中用电用户的用电量数据原始样本集Xt={xijk},其中,xijk是第i个用户第j天的第k个用电量数据,1≤k≤N;
对第t个行业的用电量数据原始样本集Xt中的缺失值和异常值进行处理,生成第t个行业的用电量数据有效样本集X′t={x′ijk},其中,所述缺失值是原始样本集中缺失的用电量数据,所述异常值是在预先确定的正常用电量区间以外的用电量数据,x′ijk是对原始样本集Xt中的用电量数据进行处理后的第i个用户第j天的第k个用电量数据,1≤k≤N;
根据有效样本集X′t中的用电量数据确定第i个用户第j天的峰时段、谷时段、峰时段用电量peakij和谷时段用电量valleyij
根据所述峰时段用电量peakij和谷时段用电量valleyij确定第i个用户第j天的低谷高峰负荷比值ratioij,以及根据峰时段用电量数据确定第i个用户第j天的峰时段用电量累积波动率
Figure FDA0002251854900000011
根据谷时段用电量数据确定谷时段用电量累积波动率
Figure FDA0002251854900000012
基于预先确定的AP聚类算法参数,根据所述第t个行业中用户的低谷高峰负荷比值ratioij、高峰时段用电量累积波动率
Figure FDA0002251854900000013
和低谷时段用电量累积波动率
Figure FDA0002251854900000014
对用户进行聚类分析;
根据所述聚类分析结果确定第t个行业中的异常用户,以及所述行业中有异常用电行为的用户。
2.根据权利要求1所述的方法,其特征在于,所述对第t个行业的用电量数据原始样本集Xt中的缺失值和异常值进行处理,生成第t个行业的用电数据有效样本集X′t是指当第t个行业的用电量数据原始样本集Xt中存在的缺失值和/或异常值时,采用邻近均值法替代所述样本中的缺失值和/或异常值。
3.根据权利要求1所述的方法,其特征在于,所述根据有效样本集X′t中的用电量数据确定第i个用户第j天的峰时段用电量peakij和谷时段用电量valleyij,并根据所述峰时段用电量peakij和谷时段用电量valleyij确定第i个用户第j天的低谷高峰负荷比值ratioij包括:
在有效样本集X′t中,对第i个用户第j天的连续时间段的n个用电量数据进行求和,6≤n≤N;
将所述第i个用户第j天的用电量数据求和值按照升序排列,确定用电量数据求和值最大的连续时段为峰时段,用电量数据求和值最小的连续时段为谷时段,所述峰时段的用电量数据求和值为峰时段用电量peakij,所述谷时段用电量数据求和值为谷时段用电量valleyij
4.根据权利要求3所述的方法,其特征在于,根据所述峰时段用电量peakij和谷时段用电量valleyij确定第i个用户第j天的低谷高峰负荷比值ratioij,以及根据峰时段用电量数据确定第i个用户第j天的峰时段用电量累积波动率
Figure FDA0002251854900000021
根据谷时段用电量数据确定第i个用户第j天的谷时段用电量累积波动率
Figure FDA0002251854900000022
包括:
根据所述峰时段用电量peakij和谷时段用电量valleyij确定第i个用户第j天的低谷高峰负荷比值ratioij,其计算公式为:
ratioij=valleyij/peakij
根据峰时段用电量数据确定第i个用户第j天的峰时段用电量累积波动率
Figure FDA0002251854900000023
其计算公式为:
Figure FDA0002251854900000024
Figure FDA0002251854900000025
Figure FDA0002251854900000026
式中,
Figure FDA0002251854900000027
是第i个用户第j天的峰时段用电量波动累计值,
Figure FDA0002251854900000028
是第i个用户第j天的峰时段用电量平均值,
Figure FDA0002251854900000031
是第i个用户第j天峰时段的第k个用电量数据,n是第i个用户第j天的峰时段用电量数据的个数;
根据谷时段用电量数据确定第i个用户第j天的谷时段用电量累积波动率
Figure FDA0002251854900000032
其计算公式为:
Figure FDA0002251854900000033
Figure FDA0002251854900000034
Figure FDA0002251854900000035
式中,
Figure FDA0002251854900000036
是第i个用户第j天的谷时段用电量波动累计值,
Figure FDA0002251854900000037
是第i个用户第j天的谷时段用电量平均值,
Figure FDA0002251854900000038
是第i个用户第j天谷时段的第k个用电量数据,n是第i个用户第j天的谷时段用电量数据的个数。
5.根据权利要求4所述的方法,其特征在于,基于预先确定的AP聚类算法参数,根据所述第t个行业中用户的低谷高峰负荷比值ratioij、高峰时段用电量累积波动率
Figure FDA0002251854900000039
和低谷时段用电量累积波动率
Figure FDA00022518549000000310
对用户进行聚类分析,并根据所述聚类分析结果确定第t个行业中有异常用电行为的用户包括:
设置AP聚类算法的参数,所述参数包括衰减系数λ,最大迭代次数T,聚类中心最大迭代不发生改变的次数T′;
根据低谷高峰负荷比值ratioij、高峰时段用电量累积波动率
Figure FDA00022518549000000311
和低谷时段用电量累积波动率
Figure FDA00022518549000000312
计算有效样本集X′t中用户xi与用户xk之间的欧氏距离di,k,其计算公式为:
di,k=-||xi-xk||
根据所述欧氏距离di,k确定用户xi与用户xk之间相似度s(i,k),其计算公式为:
s(i,k)=-di,k
将s(i,k)作为相似度矩阵对应位置的元素,并将所有得到的相似度元素的中位数作为相似度矩阵的对角线元素以生成相似度矩阵;
当有效样本集X′t中一共有n个用户的用电量数据时,初始化吸引度矩阵R和归属度矩阵A为n×n的零矩阵,所述吸引度矩阵R矩阵的元素r0(i,k)和归属度矩阵A的元素a0(i,k)为0,并计算吸引度矩阵R的元素r1(i,k)和归属度矩阵A的元素a1(i,k),所述计算公式为:
Figure FDA0002251854900000041
Figure FDA0002251854900000042
迭代更新rt+1(i,k)和at+1(i,k),所述计算公式如下:
rt+1(i,k)=λ*rt-1(i,k)+(1-λ)*rt(i,k)
at+1(i,k)=λ*at-1(i,k)+(1-λ)*at(i,k)
式中,λ为预先设置的衰减系数,1≤t≤T;
对各个数据点的归属度和吸引度进行求和,确定聚类中心,其中,对于数据点i,当a(i,k)+r(i,k)取得最大值时,若i=k,则确定数据点i为一个聚类中心,若i≠k,则确定数据点k为聚类中心;
当聚类中心在进行迭代的次数t等于预先设置的聚类中心最大迭代不发生改变的次数T′时,聚类中心仍不发生变化或者迭代次数t等于预先设置的最大迭代次数T时,AP聚类算法结束。
6.一种识别电力***异常行业用户和异常用电行为的***,其特征在于,所述***包括:
数据采集单元,其用于基于用电用户档案采集用户行业信息,并按照预先确定的时间间隔采集用户的用电量数据,按照行业信息对用电量数据分类,确定第t个行业中用电用户的用电量数据原始样本集Xt={xijk},其中,xijk是第i个用户第j天的第k个用电量数据,1≤k≤N;
有效样本单元,其用于对第t个行业的用电量数据原始样本集Xt中的缺失值和异常值进行处理,生成第t个行业的用电量数据有效样本集X′t={x′ijk},其中,所述缺失值是原始样本集中缺失的用电量数据,所述异常值是在预先确定的正常用电量区间以外的用电量数据,x′ijk是对原始样本集Xt中的用电量数据进行处理后的第i个用户第j天的第k个用电量数据,1≤k≤N;
用电特征指标单元,其用于根据有效样本集X′t中的用电量数据确定第i个用户第j天的峰时段、谷时段、峰时段用电量peakij和谷时段用电量valleyij,以及根据所述峰时段用电量peakij和谷时段用电量valleyij确定第i个用户第j天的低谷高峰负荷比值ratioij,以及根据峰时段用电量数据确定第i个用户第j天的峰时段用电量累积波动率
Figure FDA0002251854900000051
根据谷时段用电量数据确定谷时段用电量累积波动率
Figure FDA0002251854900000052
聚类分析单元,其用于基于预先确定的AP聚类算法参数,根据所述第t个行业中用户的低谷高峰负荷比值ratioij、高峰时段用电量累积波动率
Figure FDA0002251854900000053
和低谷时段用电量累积波动率
Figure FDA0002251854900000054
对用户进行聚类分析;
结果输出单元,其用于根据所述聚类分析结果确定第t个行业中的异常用户,以及所述行业中有异常用电行为的用户。
7.根据权利要求6所述的***,其特征在于,所述有效样本单元对第t个行业的用电量数据原始样本集Xt中的缺失值和异常值进行处理,生成第t个行业的用电数据有效样本集X′t是指当第t个行业的用电量数据原始样本集Xt中存在的缺失值和/或异常值时,采用邻近均值法替代所述样本中的缺失值和/或异常值。
8.根据权利要求6所述的***,其特征在于,所述用电特征指标单元根据有效样本集X′t中的用电量数据确定第i个用户第j天的峰时段用电量peakij和谷时段用电量valleyij,并根据所述峰时段用电量peakij和谷时段用电量valleyij确定第i个用户第j天的低谷高峰负荷比值ratioij包括:
在有效样本集X′t中,对第i个用户第j天的连续时间段的n个用电量数据进行求和,6≤n≤N;
将所述第i个用户第j天的用电量数据求和值按照升序排列,确定用电量数据求和值最大的连续时段为峰时段,用电量数据求和值最小的连续时段为谷时段,所述峰时段的用电量数据求和值为峰时段用电量peakij,所述谷时段用电量数据求和值为谷时段用电量valleyij
9.根据权利要求8所述的***,其特征在于,所述用电特征指标单元根据所述峰时段用电量peakij和谷时段用电量valleyij确定第i个用户第j天的低谷高峰负荷比值ratioij,以及根据峰时段用电量数据确定第i个用户第j天的峰时段用电量累积波动率
Figure FDA0002251854900000061
根据谷时段用电量数据确定第i个用户第j天的谷时段用电量累积波动率
Figure FDA0002251854900000062
包括:
根据所述峰时段用电量peakij和谷时段用电量valleyij确定第i个用户第j天的低谷高峰负荷比值ratioij,其计算公式为:
ratioij=valleyij/peakij
根据峰时段用电量数据确定第i个用户第j天的峰时段用电量累积波动率
Figure FDA0002251854900000063
其计算公式为:
Figure FDA0002251854900000064
Figure FDA0002251854900000065
Figure FDA0002251854900000066
式中,
Figure FDA0002251854900000067
是第i个用户第j天的峰时段用电量波动累计值,
Figure FDA0002251854900000068
是第i个用户第j天的峰时段用电量平均值,
Figure FDA0002251854900000069
是第i个用户第j天峰时段的第k个用电量数据,n是第i个用户第j天的峰时段用电量数据的个数;
根据谷时段用电量数据确定第i个用户第j天的谷时段用电量累积波动率
Figure FDA0002251854900000071
其计算公式为:
Figure FDA0002251854900000072
Figure FDA0002251854900000073
Figure FDA0002251854900000074
式中,
Figure FDA0002251854900000075
是第i个用户第j天的谷时段用电量波动累计值,
Figure FDA0002251854900000076
是第i个用户第j天的谷时段用电量平均值,
Figure FDA0002251854900000077
是第i个用户第j天谷时段的第k个用电量数据,n是第i个用户第j天的谷时段用电量数据的个数。
10.根据权利要求6所述的***,其特征在于,所述聚类分析单元基于预先确定的AP聚类算法参数,根据所述第t个行业中用户的低谷高峰负荷比值ratioij、高峰时段用电量累积波动率
Figure FDA0002251854900000078
和低谷时段用电量累积波动率
Figure FDA0002251854900000079
对用户进行聚类分析,并根据所述聚类分析结果确定第t个行业中有异常用电行为的用户包括:
设置AP聚类算法的参数,所述参数包括衰减系数λ,最大迭代次数T,聚类中心最大迭代不发生改变的次数T′;
根据低谷高峰负荷比值ratioij、高峰时段用电量累积波动率
Figure FDA00022518549000000710
和低谷时段用电量累积波动率
Figure FDA00022518549000000711
计算有效样本集X′t中用户xi与用户xk之间的欧氏距离di,k,其计算公式为:
di,k=-||xi-xk||
根据所述欧氏距离di,k确定用户xi与用户xk之间相似度s(i,k),其计算公式为:
s(i,k)=-di,k
将s(i,k)作为相似度矩阵对应位置的元素,并将所有得到的相似度元素的中位数作为相似度矩阵的对角线元素以生成相似度矩阵;
当有效样本集X′t中一共有n个用户的用电量数据时,初始化吸引度矩阵R和归属度矩阵A为n×n的零矩阵,所述吸引度矩阵R矩阵的元素r0(i,k)和归属度矩阵A的元素a0(i,k)为0,并计算吸引度矩阵R的元素r1(i,k)和归属度矩阵A的元素a1(i,k),所述计算公式为:
Figure FDA0002251854900000081
Figure FDA0002251854900000082
迭代更新rt+1(i,k)和at+1(i,k),所述计算公式如下:
rt+1(i,k)=λ*rt-1(i,k)+(1-λ)*rt(i,k)
at+1(i,k)=λ*at-1(i,k)+(1-λ)*at(i,k)
式中,λ为预先设置的衰减系数,1≤t≤T;
对各个数据点的归属度和吸引度进行求和,确定聚类中心,其中,对于数据点i,当a(i,k)+r(i,k)取得最大值时,若i=k,则确定数据点i为一个聚类中心,若i≠k,则确定数据点k为聚类中心;
当聚类中心在进行迭代的次数t等于预先设置的聚类中心最大迭代不发生改变的次数T′时,聚类中心仍不发生变化或者迭代次数t等于预先设置的最大迭代次数T时,AP聚类算法结束。
CN201911037248.4A 2019-10-29 2019-10-29 一种识别电力***异常行业用户和异常用电行为的方法和*** Pending CN110991477A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911037248.4A CN110991477A (zh) 2019-10-29 2019-10-29 一种识别电力***异常行业用户和异常用电行为的方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911037248.4A CN110991477A (zh) 2019-10-29 2019-10-29 一种识别电力***异常行业用户和异常用电行为的方法和***

Publications (1)

Publication Number Publication Date
CN110991477A true CN110991477A (zh) 2020-04-10

Family

ID=70082701

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911037248.4A Pending CN110991477A (zh) 2019-10-29 2019-10-29 一种识别电力***异常行业用户和异常用电行为的方法和***

Country Status (1)

Country Link
CN (1) CN110991477A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111680933A (zh) * 2020-06-29 2020-09-18 北京中电普华信息技术有限公司 用电行为的分析方法、装置、可读介质以及设备
CN112365174A (zh) * 2020-11-16 2021-02-12 深圳供电局有限公司 一种基于用电行为偏好的居民用电分配决策方法及***
CN112714368A (zh) * 2020-12-07 2021-04-27 南方电网数字电网研究院有限公司 用电量异常提示方法、装置、计算机设备和存储介质
CN112765826A (zh) * 2021-01-27 2021-05-07 长沙理工大学 基于用电功率频率分布相对熵的室内***种植居民用户识别方法
CN112949700A (zh) * 2021-02-19 2021-06-11 国网北京市电力公司 企业限产政策执行力度的识别方法及装置
CN115659228A (zh) * 2022-12-26 2023-01-31 国网浙江省电力有限公司宁波供电公司 一种用户用电激励方法、***及可读存储介质
CN117787572A (zh) * 2024-02-27 2024-03-29 国网山西省电力公司临汾供电公司 一种异常用电用户识别方法、装置、存储介质及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105825298A (zh) * 2016-03-14 2016-08-03 梁海东 一种基于负荷特性预估的电网计量预警***及方法
CN109947815A (zh) * 2018-09-30 2019-06-28 国网浙江长兴县供电有限公司 一种基于离群点算法的窃电辨识方法
CN110097297A (zh) * 2019-05-21 2019-08-06 国网湖南省电力有限公司 一种多维度窃电态势智能感知方法、***、设备及介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105825298A (zh) * 2016-03-14 2016-08-03 梁海东 一种基于负荷特性预估的电网计量预警***及方法
CN109947815A (zh) * 2018-09-30 2019-06-28 国网浙江长兴县供电有限公司 一种基于离群点算法的窃电辨识方法
CN110097297A (zh) * 2019-05-21 2019-08-06 国网湖南省电力有限公司 一种多维度窃电态势智能感知方法、***、设备及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杨卫红;赖清平;兰宇;王丹;胡庆娥;王旭阳;刘艳茹;: "基于调节潜力指标的用户用电行为聚类分析算法研究" *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111680933A (zh) * 2020-06-29 2020-09-18 北京中电普华信息技术有限公司 用电行为的分析方法、装置、可读介质以及设备
CN111680933B (zh) * 2020-06-29 2023-04-18 北京中电普华信息技术有限公司 用电行为的分析方法、装置、可读介质以及设备
CN112365174A (zh) * 2020-11-16 2021-02-12 深圳供电局有限公司 一种基于用电行为偏好的居民用电分配决策方法及***
CN112365174B (zh) * 2020-11-16 2023-08-25 深圳供电局有限公司 一种基于用电行为偏好的居民用电分配决策方法及***
CN112714368A (zh) * 2020-12-07 2021-04-27 南方电网数字电网研究院有限公司 用电量异常提示方法、装置、计算机设备和存储介质
CN112714368B (zh) * 2020-12-07 2023-03-31 南方电网数字电网研究院有限公司 用电量异常提示方法、装置、计算机设备和存储介质
CN112765826A (zh) * 2021-01-27 2021-05-07 长沙理工大学 基于用电功率频率分布相对熵的室内***种植居民用户识别方法
CN112949700A (zh) * 2021-02-19 2021-06-11 国网北京市电力公司 企业限产政策执行力度的识别方法及装置
CN115659228A (zh) * 2022-12-26 2023-01-31 国网浙江省电力有限公司宁波供电公司 一种用户用电激励方法、***及可读存储介质
CN117787572A (zh) * 2024-02-27 2024-03-29 国网山西省电力公司临汾供电公司 一种异常用电用户识别方法、装置、存储介质及电子设备
CN117787572B (zh) * 2024-02-27 2024-05-17 国网山西省电力公司临汾供电公司 一种异常用电用户识别方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN110991477A (zh) 一种识别电力***异常行业用户和异常用电行为的方法和***
CN110097297B (zh) 一种多维度窃电态势智能感知方法、***、设备及介质
CN110223196B (zh) 基于典型行业特征库和反窃电样本库的反窃电分析方法
CN107742127B (zh) 一种改进的防窃电智能预警***及方法
Chicco et al. Emergent electricity customer classification
CN111860600A (zh) 一种基于最大相关最小冗余判据的用户用电特征选择方法
CN107248086A (zh) 基于用户用电行为分析的广告投放辅助分析方法
CN110109971A (zh) 一种低压台区用户用电负荷特性分析方法
CN110264107B (zh) 一种基于大数据技术的台区线损率异常诊断方法
CN114004296A (zh) 一种基于电力负荷特征反向提取监测点的方法及***
CN110321934A (zh) 一种检测用户用电异常数据的方法及***
CN110866841A (zh) 基于双聚类法的电力用户行业维度用电模式辨识分析方法及***
CN115660225A (zh) 一种基于电表通信模块的用电负荷预测管理方法及***
CN112581012A (zh) 参与需求响应的用电客户分类方法
CN114611738A (zh) 一种基于用户用电行为分析的负荷预测方法
CN112614004A (zh) 用电信息的处理方法及装置
CN115049410A (zh) 窃电行为识别方法、装置、电子设备及计算机可读存储介质
CN112116205A (zh) 针对台区用电特征的画像方法、装置和存储介质
CN107274025B (zh) 一种实现用电模式智能识别与管理的***和方法
CN113902181A (zh) 公变重过载的短期预测方法及设备
CN111612054A (zh) 一种基于非负矩阵分解和密度聚类的用户窃电行为识别方法
CN111915116A (zh) 一种基于K-means聚类的电力居民用户分类方法
CN111368257B (zh) 煤改电负荷特性的分析预测方法及装置
CN114997470A (zh) 基于lstm神经网络的短期用电负荷预测方法
CN114638284A (zh) 一种考虑外部影响因素的用电行为刻画方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200410