CN113362199A - 基于用户采集电量与台区线损相关性的窃电用户核查方法 - Google Patents

基于用户采集电量与台区线损相关性的窃电用户核查方法 Download PDF

Info

Publication number
CN113362199A
CN113362199A CN202110661125.9A CN202110661125A CN113362199A CN 113362199 A CN113362199 A CN 113362199A CN 202110661125 A CN202110661125 A CN 202110661125A CN 113362199 A CN113362199 A CN 113362199A
Authority
CN
China
Prior art keywords
user
line loss
data
value
change
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110661125.9A
Other languages
English (en)
Other versions
CN113362199B (zh
Inventor
刘晗
许珂
李琦
韦会召
胡海昕
宋晓龙
顾亚奇
杨军霞
蒋康琪
骆奕汐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Henan Electric Power Co Xuchang Jian'an Power Supply Co
Original Assignee
State Grid Henan Electric Power Co Xuchang Jian'an Power Supply Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Henan Electric Power Co Xuchang Jian'an Power Supply Co filed Critical State Grid Henan Electric Power Co Xuchang Jian'an Power Supply Co
Priority to CN202110661125.9A priority Critical patent/CN113362199B/zh
Publication of CN113362199A publication Critical patent/CN113362199A/zh
Application granted granted Critical
Publication of CN113362199B publication Critical patent/CN113362199B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/12Timing analysis or timing optimisation

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Geometry (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Computer Hardware Design (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于用户采集电量与台区线损相关性的窃电用户核查方法,先分析和确定用户采集电量与台区线损相关性的算法模型,后选取样本并依据算法模型对样本中线损存在异常的日期进行标记,再在算法模型的基础上结合95%置信区间和多次权重评价方法,对选取样本中被标记日期对应的数据进行用户采集电量与台区线损相关性的计算,最后根据计算结果将筛选出用户的窃电嫌疑度确定为大、中、小三类并核查大的用户;本发明可以对台区下所有用户的采集电量与台区线损率进行相关性分析,精准锁定导致台区线损偏高的罪魁祸首,解决低压台区线损治理工作的痛点,助力反窃查违工作,高效提升线损管理水平,切实降低低压台区线损,为电力企业提质增效。

Description

基于用户采集电量与台区线损相关性的窃电用户核查方法
技术领域
本发明属于供电企业线损管理技术领域,具体涉及一种基于用户采集电量与台区线损相关性的窃电用户核查方法。
背景技术
线损是电力企业经营管理过程中的一项重要的经济技术指标,而低压台区线损是供电企业线损管理的基础,低压台区线损值的高低反映了供电企业的营销管理水平,降低低压台区线损是电力企业提质增效的关键所在。
影响低压台区线损的因素错综复杂,想要查出对台区线损造成影响的异常用户更是如同抽丝剥茧;对线损异常台区进行分析治理的传统方法有现场逐户排查、用户电量比对、后台数据逐项核查等,都存在着诸多的不便;为解决上述问题,开发一种基于用户采集电量与台区线损相关性的窃电用户核查方法很有必要。
发明内容
本发明的目的是为了克服现有技术的不足,而提供一种基于用户采集电量与台区线损相关性的窃电用户核查方法,通过该方法可以对台区下所有用户的采集电量与台区线损率进行相关性分析,精准锁定导致台区线损偏高的罪魁祸首,解决低压台区线损治理工作的痛点,助力反窃查违工作,高效提升线损管理水平,切实降低低压台区线损,为电力企业提质增效。
本发明的目的是这样实现的:一种基于用户采集电量与台区线损相关性的窃电用户核查方法,包括如下步骤:
S1:分析和确定用户采集电量与台区线损相关性的算法模型;
S2:选取样本并依据算法模型对样本中线损存在异常的日期进行标记;
S3:在算法模型的基础上,对选取样本中被标记日期对应的数据进行用户采集电量与台区线损相关性的计算,计算过程中结合统计学原理置信区间,以减少正常用户的干扰,再结合多次权重评价方法,以增加计算结果的真实可靠性,最后根据计算结果将筛选出用户的窃电嫌疑度确定为大、中、小三类;
S4:按比例对窃电嫌疑度排名靠前的用户进行现场排查处理,若该台区下没有窃电嫌疑度为大的用户,且所选比例的排名靠前用户经现场排查都没有问题,则说明该台区下用户的窃电方式可能为无表计窃电或窃电表计采集电量非常接近0或等于0,工作人员需要重点排查台区的入户线与采集电量在大部分时间都非常接近或等于0的用户。
优选的基于用户采集电量与台区线损相关性的窃电用户核查方法,所述步骤S1包括如下步骤:
线损分为理论线损和管理线损,管理线损的成因复杂多样,而理论线损是可以进行计算的,在理想环境下,台区线损量等同于理论线损值,且不会因用户电量的变化而改变;
在这个理想环境下,且不考虑分布式电源的影响,则供电量-售电量=台区线损量=理论线损值,其中售电量为台区所有用户采集电量之和,供电量为台区关口表的采集电量;
引入1个窃电用户进行讨论,则窃电用户采集电量=窃电用户实际电量-窃电量,台区线损量=理论线损值+窃电量=供电量*理论线损率+窃电量,可见窃电量的变化会引起台区线损量的变化,且两者正相关;
一般情况下能被采集示数的窃电用户,采集电量通常是实际电量的某个百分比值,把它称作窃电系数k,则窃电用户采集电量=E-Ek=E(1-k),台区线损量=理论线损值+Ek;
画出y=E和y=Ek的函数图像进行定性分析;
定性分析后得出的相关性结论表为:
Figure 100002_RE-RE-DEST_PATH_IMAGE001
上表的窃电用户实际电量、用户窃电系数和窃电用户采集电量列中,“
Figure RE-747227DEST_PATH_IMAGE002
Figure RE-687546DEST_PATH_IMAGE002
”表示对应数值增加幅度较大,“
Figure RE-319515DEST_PATH_IMAGE002
”表示对应数值增加幅度较小,“-”表示对应数值不变,“
Figure RE-892448DEST_PATH_IMAGE003
Figure RE-360601DEST_PATH_IMAGE003
”表示对应数值减少幅度较大,“
Figure RE-896755DEST_PATH_IMAGE003
”表示对应数值减少幅度较小;可见,随着E和k的变化,台区线损量变化时,窃电用户的采集电量也会发生有相关性的不同幅度的变化,包括增加、减少或极小概率不变,略微类似正弦函数曲线,但台区线损量和窃电用户采集电量不是单纯的正相关和负相关,属于较为复杂的非线性相关,难以直接对台区线损量和窃电用户采集电量进行相关性分析,可以根据其变化率进行分析;
由此,确定用户采集电量与台区线损相关性的算法模型为:
存在窃电量时,台区线损量变化才会和窃电用户采集电量变化有非线性相关关系,且台区线损率变化较大时的相关性更高,尤其是当用户刚开始或终止窃电、明显增加或减少用电系数时,窃电用户采集电量与台区线损量呈负相关且此时台区线损率变化幅度一般较大;
将用户采集电量与台区线损相关性分析转化为各用户采集电量变化率绝对值和台区线损率变化率绝对值的接近程度分析,若其越接近,则说明变化的相关性越强,最接近值对应的用户最有可能是窃电用户;
当用户持续稳定窃电时,窃电用户采集电量与台区线损量呈正相关,由于一般情况下窃电用户的实际用电量也比较稳定,此时台区线损率变化幅度一般较小。
进一步优选的基于用户采集电量与台区线损相关性的窃电用户核查方法,所述步骤S2包括如下步骤:
S21:在电力用户用电信息采集***中,提取最近z天中每天的台区下所有用户表计的数据日期、用户编号、用户名称和采集电量作为用户电量表,以数据日期和用户编号作为主键,先按照用户编号升序,再按照数据日期升序,对用户电量表进行排序;
S22:在电力用户用电信息采集***中,提取最近z天中每天的数据日期、台区编号、台区名称、理论线损率、供电量、售电量、线损量、线损率作为台区线损率表,以数据日期作为主键,按照数据日期升序,对台区线损率表进行排序;
其中,用户电量表和台区线损率表通过主键数据日期进行连接;
S23:依据算法模型中的“存在窃电量时,台区线损量变化才会和窃电用户采集电量变化有非线性相关关系”选取第一批样本;
将台区线损率表中线损率>理论线损率+3%的数据日期认定为存在用户窃电行为,为台区线损率表添加一列记为样本选取标记a,在该列中,当对应数据日期的线损率>理论线损率+3%时,为其赋值a;
S24:依据算法模型中的“台区线损率变化较大时的相关性更高”选取第二批样本;
对台区线损率表中线损率变化值的绝对值大小进行比较,当数据日期为t时,线损率变化值的公式为:
Figure RE-163658DEST_PATH_IMAGE004
,其中
Figure RE-143377DEST_PATH_IMAGE005
指数据日期为t时的台区线损率,
Figure RE-269465DEST_PATH_IMAGE006
指数据日期为t-1时的台区线损率;
为台区线损率表添加一列记为台区线损率变化值,当日期为t时,为该列数据赋值
Figure RE-671628DEST_PATH_IMAGE007
,若t-1不存在则为空;
采用箱线图原理,认定台区线损率变化值处于上四分位数和上边缘之间的数据为相对离群值,即存在窃电行为且台区线损率变化较大;为台区线损率表添加一列记为样本选取标记b,在该列中,当对应数据日期的台区线损率变化值大于相对离群值中的某一值时,为其赋值b。
更进一步优选的基于用户采集电量与台区线损相关性的窃电用户核查方法,所述步骤S24中采用箱线图原理选取样本标记b具体为:箱线图共由五个数值点构成,从下到上依次是下边缘、下四分位数Q1,中位数、上四分位数Q3和上边缘;
下边缘的取值可以为最小值或最小观察值,最小观察值=Q1-1.5(Q3-Q1);
上边缘的取值可以为最大值或最大观察值,最大观察值=Q3+1.5(Q3-Q1);
箱线图中,大于最大观察值或小于最小观察值的数值被定义为离群值;
当台区线损率变化值大于上四分位数又小于最大值时,可以称其为相对离群值e,即数值e的取值范围是
Figure RE-966605DEST_PATH_IMAGE008
,其中
Figure RE-350182DEST_PATH_IMAGE009
为线损率变化值数组的上四分位数,
Figure RE-42194DEST_PATH_IMAGE010
为线损率变化值数组的最大值;
第二组样本的选取规则为
Figure RE-733201DEST_PATH_IMAGE011
>e,在样品选取标记b一列中,当对应行
Figure RE-646799DEST_PATH_IMAGE011
>e时,为其赋值b。
进一步优选的基于用户采集电量与台区线损相关性的窃电用户核查方法,所述步骤S3包括如下步骤:
S31;依据算法模型中的“将用户电量与台区线损相关性分析转化为台区线损率变化率绝对值和各用户采集电量变化率绝对值的接近程度分析,若其越接近,则说明变化的相关性越强,最接近值对应的用户最有可能是窃电用户”计算台区线损率变化率和用户采集电量变化率;
S311:以已计算出的台区线损率变化值
Figure RE-279906DEST_PATH_IMAGE012
为基础,为保证变化率在1以内方便比较,取
Figure RE-678788DEST_PATH_IMAGE013
Figure RE-344125DEST_PATH_IMAGE014
中的最大值作为分母,则数据日期为t时的台区线损率变化率为:
Figure RE-190858DEST_PATH_IMAGE015
,其中
Figure RE-417702DEST_PATH_IMAGE012
指台区线损率变化值的绝对值,
Figure RE-349886DEST_PATH_IMAGE013
指数据日期为t时的台区线损率,
Figure RE-615651DEST_PATH_IMAGE014
指数据日期为t-1时的台区线损率,
Figure RE-5307DEST_PATH_IMAGE016
为取
Figure RE-980216DEST_PATH_IMAGE013
Figure RE-321067DEST_PATH_IMAGE014
的最大值;
为台区线损率表添加一列记为台区线损率变化率,在该列中数据日期t对应的行赋值为
Figure RE-406835DEST_PATH_IMAGE017
S312:根据台区线损率变化值的绝对值
Figure RE-662716DEST_PATH_IMAGE012
的计算方式,用户i在数据日期为t时的采集电量变化值的绝对值为
Figure RE-261056DEST_PATH_IMAGE018
,其中
Figure RE-325089DEST_PATH_IMAGE019
指用户i在数据日期为t时的采集电量,
Figure RE-401499DEST_PATH_IMAGE020
指用户i在数据日期为t-1时的采集电量;
为用户电量表添加一列记为用户采集电量变化值,在该列中为用户i且数据日期t对应的行赋值为
Figure RE-811751DEST_PATH_IMAGE021
,若t-1不存在则为空;
则用户i在数据日期为t时的用户采集电量变化率为:
Figure RE-879196DEST_PATH_IMAGE022
,其中
Figure RE-742109DEST_PATH_IMAGE021
指用户i在数据日期为t时的采集电量变化值的绝对值,
Figure RE-153368DEST_PATH_IMAGE019
指用户i在数据日期为t时的采集电量,
Figure RE-355810DEST_PATH_IMAGE020
指用户i在数据日期为t-1时的采集电量,
Figure RE-328577DEST_PATH_IMAGE023
为取
Figure RE-944366DEST_PATH_IMAGE019
Figure RE-159315DEST_PATH_IMAGE020
的最大值;
为用户电量表添加一列记为用户采集电量变化率,在该列中为用户i且数据日期t对应的行赋值
Figure RE-278581DEST_PATH_IMAGE024
S32:减少正常用户的干扰;
采用统计学原理置信区间,找出正常用户采集电量变化值的高置信度范围,在计算采集电量变化率
Figure RE-359932DEST_PATH_IMAGE025
的过程中,当用户采集电量变化值
Figure RE-712285DEST_PATH_IMAGE026
小于正常用户采集电量变化值的高置信度范围内的某个值n时,将
Figure RE-216078DEST_PATH_IMAGE025
置为0,即只筛查
Figure RE-409424DEST_PATH_IMAGE026
≥n的数据;当正常用户采集电量变化值的高置信度范围为(-p,p)时,n的取值范围是(0,p);
S321:对标记为a的第一批样本数据,从(0,p)中选取一个值q,0<q<p,取n1=q;
在计算第一批样本数据时,用户i在数据日期为t时的采集电量变化率重新定义为:
Figure RE-707682DEST_PATH_IMAGE027
<q时,
Figure RE-547331DEST_PATH_IMAGE028
=0;
Figure RE-74389DEST_PATH_IMAGE027
≥q时,
Figure RE-105930DEST_PATH_IMAGE029
其中
Figure RE-89936DEST_PATH_IMAGE027
指用户i在数据日期为t时的采集电量变化值的绝对值,
Figure RE-902034DEST_PATH_IMAGE030
指用户i在数据日期为t时的采集电量,
Figure RE-763942DEST_PATH_IMAGE031
指用户i在数据日期为t-1时的采集电量,
Figure RE-164836DEST_PATH_IMAGE032
为取
Figure RE-70475DEST_PATH_IMAGE030
Figure RE-108883DEST_PATH_IMAGE031
的最大值;
S322:对标记为b的第二批样本数据,取n2=p;
在计算第二批样本数据时,用户i在数据日期为t时的采集电量变化率重新定义为:
Figure RE-961433DEST_PATH_IMAGE027
<p时,
Figure RE-13571DEST_PATH_IMAGE033
=0;
Figure RE-355691DEST_PATH_IMAGE027
≥p时,
Figure RE-830797DEST_PATH_IMAGE034
其中
Figure RE-533042DEST_PATH_IMAGE027
指用户i在数据日期为t时的采集电量变化值的绝对值,
Figure RE-924841DEST_PATH_IMAGE030
指用户i在数据日期为t时的采集电量,
Figure RE-126277DEST_PATH_IMAGE031
指用户i在数据日期为t-1时的采集电量,
Figure RE-383952DEST_PATH_IMAGE032
为取
Figure RE-640621DEST_PATH_IMAGE030
Figure RE-168817DEST_PATH_IMAGE031
的最大值;
S323:为用户电量表分别添加采集电量变化率a列与采集电量变化率b列,在采集电量变化率a列中为用户i且数据日期t对应的行赋值为
Figure RE-790422DEST_PATH_IMAGE035
,在采集电量变化率b列中为用户i且数据日期t对应的行赋值为
Figure RE-269814DEST_PATH_IMAGE036
S33:依据算法模型中的“将用户电量与台区线损相关性分析转化为台区线损率变化率绝对值和各用户采集电量变化率绝对值的接近程度分析,若其越接近,则说明变化的相关性越强,最接近值对应的用户最有可能是窃电用户”计算台区线损率变化率和用户采集电量变化率的相关程度;
用户i的采集电量变化率
Figure RE-64594DEST_PATH_IMAGE037
与台区线损率变化率
Figure RE-712876DEST_PATH_IMAGE038
的相关程度为:
Figure RE-302120DEST_PATH_IMAGE039
;若r越小则用户的采集电量变化率与台区线损率变化率越接近,对应用户越可能是窃电用户;
S331:用标记为a的第一批样本数据作为数据日期选取依据,则用户i的采集电量变化率
Figure RE-737649DEST_PATH_IMAGE040
与台区线损率变化率
Figure RE-86853DEST_PATH_IMAGE041
的相关程度为:
Figure RE-776592DEST_PATH_IMAGE042
;其中
Figure RE-51584DEST_PATH_IMAGE043
指第一批样本数据对应的数据日期为t时,用户i的采集电量变化率,
Figure RE-256301DEST_PATH_IMAGE041
指当数据日期为t时的台区线损率变化率,
Figure RE-409195DEST_PATH_IMAGE044
表示对样本选取标记a中所有对应值为a的数据日期对应的
Figure RE-750178DEST_PATH_IMAGE045
进行求和;
S332:用标记为b的第二批样本数据作为数据日期选取依据,则用户i的采集电量变化率
Figure RE-399334DEST_PATH_IMAGE046
与台区线损率变化率
Figure RE-842079DEST_PATH_IMAGE047
的相关程度为:
Figure RE-703725DEST_PATH_IMAGE048
;其中
Figure RE-164793DEST_PATH_IMAGE049
指第二批样本数据对应的数据日期为t时,用户i的采集电量变化率,
Figure RE-372851DEST_PATH_IMAGE050
指当数据日期为t时的台区线损率变化率,
Figure RE-489842DEST_PATH_IMAGE051
表示对样本选取标记b中所有对应值为b的数据日期对应的
Figure RE-483075DEST_PATH_IMAGE052
进行求和;
S34:数据加权;
S341:创建数据表数据加权a,数据列分别为用户编号、用户名称、相关程度a,以用户编号作为主键;
将从数组
Figure RE-752645DEST_PATH_IMAGE053
中提取最小的w个数据置入相关程度a列,并在用户编号与用户名称填入对应的信息;
将对数据加权a表按照相关程度a升序进行排列;
新增加权计算1列,将数组{m1,m2,m3,……,mw}作为第一次加权计算的得分赋值到加权计算1列,其中m1>m2>m3>……>mw>0;
S342:创建数据表数据加权b,数据列分别为用户编号、用户名称、相关程度b,以用户编号作为主键;
将从数组
Figure RE-25494DEST_PATH_IMAGE054
中提取最小的w个数据置入相关程度b列,并在用户编号与用户名称填入对应的信息;
将数据加权b表按照相关程度b升序进行排列;
新增加权计算I列,将数组{s1,s2,s3,……,sw}作为第一次加权计算的得分赋值到加权计算I列,其中s1>s2>s3>……>sw>0,又由于第二批样本数据相关程度最高的用户窃电可能性最高,s1>m1>s2≥m2>s3≥m3……>sw≥mw;
S35:依据算法模型中的“当用户持续稳定窃电时,窃电用户采集电量与台区线损量呈正相关,由于一般情况下窃电用户的实际用电量也比较稳定,此时台区线损率变化幅度一般较小”,对数据再次加权;
S351:为台区线损率表添加一列记为样本选取标记c,在该列中,为符合选取条件的数据日期对应的行赋值c;
为数据日期对应行赋值c的条件为:当某一数据日期对应样本选取标记a列的数据为a,且对应样本选取标记b列的数据不为b,则在样本选取标记c列的对应行赋值c;
S352:为用户电量表添加一列记为变化趋势;
用户i在数据日期为t时,若
Figure RE-941366DEST_PATH_IMAGE055
<0,则为变化趋势列中的对应行赋值“反向”;若
Figure RE-911859DEST_PATH_IMAGE055
=0,则为变化趋势列中的对应行赋值“不变”;若
Figure RE-347519DEST_PATH_IMAGE055
>0,则为变化趋势列中的对应行赋值“同向”;其中
Figure RE-40538DEST_PATH_IMAGE056
指用户i在数据日期为t时的采集电量,
Figure RE-460018DEST_PATH_IMAGE057
指用户i在数据日期为t-1时的采集电量,
Figure RE-30939DEST_PATH_IMAGE058
指数据日期为t时的台区线损率,
Figure RE-524368DEST_PATH_IMAGE059
指数据日期为t-1时的台区线损率;
S353:在台区存在用户窃电行为,且台区线损率变化率较小时,用户i的采集电量与台区线损率变化趋势不同的比率为:
Figure RE-653867DEST_PATH_IMAGE060
;其中
Figure RE-29485DEST_PATH_IMAGE061
指所有样本选取标记c中所有c的数量之和,即台区存在用户窃电行为,且台区线损率变化率较小的总天数,
Figure RE-404096DEST_PATH_IMAGE062
指即台区存在用户窃电行为,且台区线损率变化率较小时,用户i的采集电量与台区线损率变化趋势为反向天数之和;
Figure RE-814349DEST_PATH_IMAGE063
简称为用户i的变化趋势不同率,创建变化趋势表,数据列分别为用户编号、用户名称、变化趋势不同率,以用户编号作为主键;
变化趋势表中用户编号列中的数据为用户电量表中所有的去重后的用户编号,用户名称列为对应的用户名称,将变化趋势不同率的值D赋值到变化趋势表中变化趋势不同率列中对应用户编号的行;
S354:再次加权计算;
对数据加权a表新增加权计算2列,该列的数值X有以下约束规则:当用户i对应的相关程度a的值等于所有第一批样本的总天数时,其对应的
Figure RE-849170DEST_PATH_IMAGE064
置为0;当用户i对应的变化趋势不同率的值
Figure RE-712084DEST_PATH_IMAGE063
大于d时,即用户i是窃电用户的可能很小,将其对应的
Figure RE-828070DEST_PATH_IMAGE064
置为m0,其中0<d<1,0<m0<mw;当用户i不满足上述两个条件时,将其对应的
Figure RE-607676DEST_PATH_IMAGE064
置为对应加权计算1列的值;
对数据加权b表新增加权计算II列,该列的数值Y有以下约束规则:当用户i对应的相关程度b的值等于所有第一批样本的总天数时,其对应的
Figure RE-829710DEST_PATH_IMAGE065
置为0;当用户i对应的变化趋势不同率的值
Figure RE-133914DEST_PATH_IMAGE063
大于d时,即用户i是窃电用户的可能很小,将其对应的
Figure RE-834017DEST_PATH_IMAGE065
置为s0,其中0<d<1,s0=m0;当用户i不满足上述两个条件时,将其对应的
Figure RE-202550DEST_PATH_IMAGE065
置为对应加权计算1列的值;
S36:最终结果;
将数据加权a表中的用户编号、用户名称、加权计算2列与数据加权b表中的用户编号、用户名称、加权计算II列合并统计,并将对应用户在加权计算2与加权计算II的值求和,和记为最终结果;
创建数据表最终结果,包含用户编号、用户名称、最终结果、窃电嫌疑度列,以用户编号为主键;
最终结果中用户编号列中的数据为数据加权a和数据加权b表中所有汇总去重后的用户编号,用户名称列为对应的用户名称;
将加权计算2与加权计算II求和的值X+Y赋值到最终结果表中最终结果列中对应用户编号的行;
按照最终结果列,降序排列;
S37:确定窃电嫌疑度;
当最终结果列的值大于等于m1时,为窃电嫌疑度列中其对应行赋值大;当最终结果列的值小于等于mw时,为窃电嫌疑度列中其对应行赋值小;当最终结果列的值大于mw且小于m1时,为窃电嫌疑度列中其对应行赋值中。
由于采用了上述技术方案,本发明的有益效果是:
(1)本发明能够对台区下所有用户的采集电量与台区线损率进行相关性分析,精准锁定导致台区线损偏高的罪魁祸首,解决低压台区线损治理工作的痛点,助力反窃查违工作,高效提升线损管理水平,切实降低低压台区线损,为电力企业提质增效;
(2)本发明首先分析和确定算法模型,然后在算法模型的基础上,结合统计学原理95%置信区间,减少正常用户的干扰,再结合多次权重评价方法,增加计算结果的真实可靠性,从而使得最后能够根据相关性计算结果较为精准地筛选出嫌疑窃电用户;
(3)本发明还能够在核查电量异常用户过程中,也暴露处台区的变压器过载、末端低电压等技术线损问题,促使工作人员采取技术降损措施,有效降低低压台区电量的真实损耗,提高低压台区的经济运行率,为节能减排做出贡献。
附图说明
图1是本发明的y=E和y=Ek的函数图像图。
图2是本发明的箱线图。
图3是本发明的置信区间分析图。
图4是本发明的用户p的采集电量曲线与台区线损曲线对比图。
具体实施方式
下面通过实施例,对本发明的技术方案做进一步具体的说明。
本发明提供了一种基于用户采集电量与台区线损相关性的窃电用户核查方法,包括如下步骤:
S1:分析和确定用户采集电量与台区线损相关性的算法模型;
S2:选取样本并依据算法模型对样本中线损存在异常的日期进行标记;
S3:在算法模型的基础上,对选取样本中被标记日期对应的数据进行用户采集电量与台区线损相关性的计算,计算过程中结合统计学原理置信区间,以减少正常用户的干扰,再结合多次权重评价方法,以增加计算结果的真实可靠性,最后根据计算结果将筛选出用户的窃电嫌疑度确定为大、中、小三类;
S4:按比例对窃电嫌疑度排名靠前的用户进行现场排查处理,一般按1‰取前5~10名,若该台区下没有窃电嫌疑度为大的用户,且所选比例的排名靠前用户经现场排查都没有问题,则说明该台区下用户的窃电方式可能为无表计窃电或窃电表计采集电量非常接近0或等于0,工作人员需要重点排查台区的入户线与采集电量在大部分时间都非常接近或等于0的用户。
其中,步骤S1包括如下步骤:
线损分为理论线损和管理线损,管理线损的成因复杂多样,而理论线损是可以进行计算的,在理想环境下,台区线损量等同于理论线损值,且不会因用户电量的变化而改变。
在这个理想环境下,且不考虑分布式电源的影响,则供电量-售电量=台区线损量=理论线损值,其中售电量为台区所有用户采集电量之和,供电量为台区关口表的采集电量。
引入1个窃电用户进行讨论,则窃电用户采集电量=窃电用户实际电量-窃电量,台区线损量=理论线损值+窃电量=供电量*理论线损率+窃电量,可见窃电量的变化会引起台区线损量的变化,且两者正相关。
一般情况下能被采集示数的窃电用户,采集电量通常是实际电量的某个百分比值,把它称作窃电系数k,则窃电用户采集电量=E-Ek=E(1-k),台区线损量=理论线损值+Ek。
如图1所示,画出y=E和y=Ek的函数图像进行定性分析;
定性分析后得出的相关性结论表为:
Figure RE-861065DEST_PATH_IMAGE001
上表的窃电用户实际电量、用户窃电系数和窃电用户采集电量列中,“
Figure RE-449303DEST_PATH_IMAGE002
Figure RE-405627DEST_PATH_IMAGE002
”表示对应数值增加幅度较大,“
Figure RE-379399DEST_PATH_IMAGE002
”表示对应数值增加幅度较小,“-”表示对应数值不变,“
Figure RE-947828DEST_PATH_IMAGE003
Figure RE-272631DEST_PATH_IMAGE003
”表示对应数值减少幅度较大,“
Figure RE-563803DEST_PATH_IMAGE003
”表示对应数值减少幅度较小;可见,随着E和k的变化,台区线损量变化时,窃电用户的采集电量也会发生有相关性的不同幅度的变化,包括增加、减少或极小概率不变,略微类似正弦函数曲线,但台区线损量和窃电用户采集电量不是单纯的正相关和负相关,属于较为复杂的非线性相关,难以直接对台区线损量和窃电用户采集电量进行相关性分析,可以根据其变化率进行分析。
由此,确定用户采集电量与台区线损相关性的算法模型为:
存在窃电量时,台区线损量变化才会和窃电用户采集电量变化有非线性相关关系,且台区线损率变化较大时的相关性更高,尤其是当用户刚开始或终止窃电、明显增加或减少用电系数时,窃电用户采集电量与台区线损量呈负相关且此时台区线损率变化幅度一般较大;
将用户采集电量与台区线损相关性分析转化为各用户采集电量变化率绝对值和台区线损率变化率绝对值的接近程度分析,若其越接近,则说明变化的相关性越强,最接近值对应的用户最有可能是窃电用户;
当用户持续稳定窃电时,窃电用户采集电量与台区线损量呈正相关,由于一般情况下窃电用户的实际用电量也比较稳定,此时台区线损率变化幅度一般较小。
其中,步骤S2包括如下步骤:
S21:在电力用户用电信息采集***中,提取最近z天中每天的台区下所有用户表计的数据日期、用户编号、用户名称和采集电量作为用户电量表,以数据日期和用户编号作为主键,先按照用户编号升序,再按照数据日期升序,对用户电量表进行排序。
S22:在电力用户用电信息采集***中,提取最近z天中每天的数据日期、台区编号、台区名称、理论线损率、供电量、售电量、线损量、线损率作为台区线损率表,以数据日期作为主键,按照数据日期升序,对台区线损率表进行排序。
其中,选取样本天数z天一般为最近30天,时间近,数据更加有核查力,样本天数可结合实际增减。
其中,用户电量表和台区线损率表通过主键数据日期进行连接,即在后面的当对台区线损率表进行样本选取标记a和b后,通过连接,用户电量表上相同数据日期的数据行也会被标记为a和b。
S23:依据算法模型中的“存在窃电量时,台区线损量变化才会和窃电用户采集电量变化有非线性相关关系”选取第一批样本;
将台区线损率表中线损率>理论线损率+3%的数据日期认定为存在用户窃电行为,为台区线损率表添加一列记为样本选取标记a,在该列中,当对应数据日期的线损率>理论线损率+3%时,为其赋值a。
S24:依据算法模型中的“台区线损率变化较大时的相关性更高”选取第二批样本;
对台区线损率表中线损率变化值的绝对值大小进行比较,当数据日期为t时,线损率变化值的公式为:
Figure RE-860924DEST_PATH_IMAGE004
,其中
Figure RE-611973DEST_PATH_IMAGE005
指数据日期为t时的台区线损率,
Figure RE-158492DEST_PATH_IMAGE006
指数据日期为t-1时的台区线损率;
为台区线损率表添加一列记为台区线损率变化值,当日期为t时,为该列数据赋值
Figure RE-722198DEST_PATH_IMAGE007
,若t-1不存在则为空;
采用箱线图原理,认定台区线损率变化值处于上四分位数和上边缘之间的数据为相对离群值,即存在窃电行为且台区线损率变化较大;为台区线损率表添加一列记为样本选取标记b,在该列中,当对应数据日期的台区线损率变化值大于相对离群值中的某一值时,为其赋值b。
箱线图一般有两种用途:一是直观地识别数据中的异常值;二是判断数据离散分布的情况,了解数据分布状态。
如图2所示,步骤S24中采用箱线图原理选取样本标记b具体为:箱线图共由五个数值点构成,从下到上依次是下边缘、下四分位数(也称25%分位数)Q1,中位数、上四分位数(也称75%分位数)Q3和上边缘;
下边缘的取值可以为最小值或最小观察值,最小观察值=Q1-1.5(Q3-Q1);
上边缘的取值可以为最大值或最大观察值,最大观察值=Q3+1.5(Q3-Q1);
箱线图中,大于最大观察值或小于最小观察值的数值被定义为离群值。
当台区线损率变化值大于上四分位数又小于最大值时,可以称其为相对离群值e,即数值e的取值范围是
Figure RE-686874DEST_PATH_IMAGE008
,其中
Figure RE-795775DEST_PATH_IMAGE009
为线损率变化值数组的上四分位数,
Figure RE-78858DEST_PATH_IMAGE010
为线损率变化值数组的最大值;
第二组样本的选取规则为
Figure RE-728145DEST_PATH_IMAGE011
>e,在样品选取标记b一列中,当对应行
Figure RE-547327DEST_PATH_IMAGE011
>e时,为其赋值b。
其中,将最大值
Figure RE-76398DEST_PATH_IMAGE010
作为箱线图的上边缘是为了保证能够选取到第二批样本数据;其中,将数值e的取值范围定义为
Figure RE-597509DEST_PATH_IMAGE008
是为了使该范围的数据更符合“台区线损率变化较大”这一概念,具体实施时e的取值一般取箱线图中上四分位数与最大值连线的中点即
Figure RE-801219DEST_PATH_IMAGE066
进行样本标记b的选取。
其中,步骤S3包括如下步骤:
S31;依据算法模型中的“将用户电量与台区线损相关性分析转化为台区线损率变化率绝对值和各用户采集电量变化率绝对值的接近程度分析,若其越接近,则说明变化的相关性越强,最接近值对应的用户最有可能是窃电用户”计算台区线损率变化率和用户采集电量变化率。
S311:以已计算出的台区线损率变化值
Figure RE-724176DEST_PATH_IMAGE012
为基础,为保证变化率在1以内方便比较,取
Figure RE-220885DEST_PATH_IMAGE013
Figure RE-432555DEST_PATH_IMAGE014
中的最大值作为分母,则数据日期为t时的台区线损率变化率为:
Figure RE-174377DEST_PATH_IMAGE015
,其中
Figure RE-217420DEST_PATH_IMAGE012
指台区线损率变化值的绝对值,
Figure RE-88292DEST_PATH_IMAGE013
指数据日期为t时的台区线损率,
Figure RE-334728DEST_PATH_IMAGE014
指数据日期为t-1时的台区线损率,
Figure RE-332771DEST_PATH_IMAGE016
为取
Figure RE-214009DEST_PATH_IMAGE013
Figure RE-803253DEST_PATH_IMAGE014
的最大值;
为台区线损率表添加一列记为台区线损率变化率,在该列中数据日期t对应的行赋值为
Figure RE-536985DEST_PATH_IMAGE017
S312:根据台区线损率变化值的绝对值
Figure RE-135456DEST_PATH_IMAGE012
的计算方式,用户i在数据日期为t时的采集电量变化值的绝对值为
Figure RE-871200DEST_PATH_IMAGE018
,其中
Figure RE-896925DEST_PATH_IMAGE019
指用户i在数据日期为t时的采集电量,
Figure RE-864092DEST_PATH_IMAGE020
指用户i在数据日期为t-1时的采集电量;
为用户电量表添加一列记为用户采集电量变化值,在该列中为用户i且数据日期t对应的行赋值为
Figure RE-187626DEST_PATH_IMAGE021
,若t-1不存在则为空。
则用户i在数据日期为t时的用户采集电量变化率为:
Figure RE-794188DEST_PATH_IMAGE022
,其中
Figure RE-741547DEST_PATH_IMAGE021
指用户i在数据日期为t时的采集电量变化值的绝对值,
Figure RE-433559DEST_PATH_IMAGE019
指用户i在数据日期为t时的采集电量,
Figure RE-826363DEST_PATH_IMAGE020
指用户i在数据日期为t-1时的采集电量,
Figure RE-553011DEST_PATH_IMAGE023
为取
Figure RE-608954DEST_PATH_IMAGE019
Figure RE-37530DEST_PATH_IMAGE020
的最大值;
为用户电量表添加一列记为用户采集电量变化率,在该列中为用户i且数据日期t对应的行赋值
Figure RE-515916DEST_PATH_IMAGE024
S32:减少正常用户的干扰。
由于正常用户的采集电量可能会不断变化,且用户采集电量较小时,其对应的变化率可能很小也可能很大,影响对窃电嫌疑用户的判断,因此需要找到正常用户采集电量变化值的高置信度范围。
采用统计学原理置信区间,找出正常用户采集电量变化值的高置信度范围,在计算采集电量变化率
Figure RE-847802DEST_PATH_IMAGE025
的过程中,当用户采集电量变化值
Figure RE-386231DEST_PATH_IMAGE026
小于正常用户采集电量变化值的高置信度范围内的某个值n时,将
Figure RE-239786DEST_PATH_IMAGE025
置为0,即只筛查
Figure RE-521863DEST_PATH_IMAGE026
≥n的数据;当正常用户采集电量变化值的高置信度范围为(-p,p)时,n的取值范围是(0,p)。
S321:对标记为a的第一批样本数据,从(0,p)中选取一个值q,0<q<p,取n1=q;
在计算第一批样本数据时,用户i在数据日期为t时的采集电量变化率重新定义为:
Figure RE-708256DEST_PATH_IMAGE027
<q时,
Figure RE-417586DEST_PATH_IMAGE028
=0;
Figure RE-820755DEST_PATH_IMAGE027
≥q时,
Figure RE-640943DEST_PATH_IMAGE029
其中
Figure RE-681843DEST_PATH_IMAGE027
指用户i在数据日期为t时的采集电量变化值的绝对值,
Figure RE-749025DEST_PATH_IMAGE030
指用户i在数据日期为t时的采集电量,
Figure RE-124642DEST_PATH_IMAGE031
指用户i在数据日期为t-1时的采集电量,
Figure RE-764833DEST_PATH_IMAGE032
为取
Figure RE-909507DEST_PATH_IMAGE030
Figure RE-209907DEST_PATH_IMAGE031
的最大值。
S322:对标记为b的第二批样本数据,取n2=p;
在计算第二批样本数据时,用户i在数据日期为t时的采集电量变化率重新定义为:
Figure RE-72821DEST_PATH_IMAGE027
<p时,
Figure RE-188807DEST_PATH_IMAGE033
=0;
Figure RE-453566DEST_PATH_IMAGE027
≥p时,
Figure RE-924867DEST_PATH_IMAGE034
其中
Figure RE-275077DEST_PATH_IMAGE027
指用户i在数据日期为t时的采集电量变化值的绝对值,
Figure RE-979773DEST_PATH_IMAGE030
指用户i在数据日期为t时的采集电量,
Figure RE-551568DEST_PATH_IMAGE031
指用户i在数据日期为t-1时的采集电量,
Figure RE-944504DEST_PATH_IMAGE032
为取
Figure RE-532742DEST_PATH_IMAGE030
Figure RE-223486DEST_PATH_IMAGE031
的最大值。
S323:为用户电量表分别添加采集电量变化率a列与采集电量变化率b列,在采集电量变化率a列中为用户i且数据日期t对应的行赋值为
Figure RE-197259DEST_PATH_IMAGE035
,在采集电量变化率b列中为用户i且数据日期t对应的行赋值为
Figure RE-777407DEST_PATH_IMAGE036
下面是本发明提供的一个确定正常用户采集电量变化值的高置信度范围以及确定样本a和样本b选取时对应n取值的实施例。
如图3所示,从电力用户用电信息采集***线损率基本等于理论线损率的台区中,提取大约5000个正常样本用户,分析得出结论为:其采集电量变化值的95%置信区间约为正负7.5,则n的取值范围是0<n<7.5;
由于窃电用户的采集电量变化值也可能较小,在计算第一批样本数据,即样本选取标记a列数值a的对应数据日期时,可以适量取n1=2;即计算第一批样本数据时,用户i在数据日期为t时的采集电量变化率重新定义为:
Figure RE-836630DEST_PATH_IMAGE027
<2时,
Figure RE-393382DEST_PATH_IMAGE028
=0;
Figure RE-487240DEST_PATH_IMAGE027
≥2时,
Figure RE-441552DEST_PATH_IMAGE029
为更多地减少正常用户干扰,在计算第二批样本数据即样本选取标记b列数值b的对应数据日期时,可以取n2=7.5;即在计算第二批样本数据时,用户i在数据日期为t时的采集电量变化率重新定义为:
Figure RE-440600DEST_PATH_IMAGE027
<7.5时,
Figure RE-286197DEST_PATH_IMAGE037
=0;
Figure RE-250873DEST_PATH_IMAGE027
≥7.5时,
Figure RE-156512DEST_PATH_IMAGE034
S33:依据算法模型中的“将用户电量与台区线损相关性分析转化为台区线损率变化率绝对值和各用户采集电量变化率绝对值的接近程度分析,若其越接近,则说明变化的相关性越强,最接近值对应的用户最有可能是窃电用户”计算台区线损率变化率和用户采集电量变化率的相关程度;
用户i的采集电量变化率
Figure RE-439595DEST_PATH_IMAGE037
与台区线损率变化率
Figure RE-88882DEST_PATH_IMAGE038
的相关程度为:
Figure RE-111327DEST_PATH_IMAGE039
;若r越小则用户的采集电量变化率与台区线损率变化率越接近,对应用户越可能是窃电用户。
S331:用标记为a的第一批样本数据作为数据日期选取依据,则用户i的采集电量变化率
Figure RE-187867DEST_PATH_IMAGE040
与台区线损率变化率
Figure RE-692667DEST_PATH_IMAGE041
的相关程度为:
Figure RE-145645DEST_PATH_IMAGE042
;其中
Figure RE-819334DEST_PATH_IMAGE043
指第一批样本数据对应的数据日期为t时,用户i的采集电量变化率,
Figure RE-66775DEST_PATH_IMAGE041
指当数据日期为t时的台区线损率变化率,
Figure RE-58871DEST_PATH_IMAGE044
表示对样本选取标记a中所有对应值为a的数据日期对应的
Figure RE-49961DEST_PATH_IMAGE045
进行求和。
S332:用标记为b的第二批样本数据作为数据日期选取依据,则用户i的采集电量变化率
Figure RE-578156DEST_PATH_IMAGE046
与台区线损率变化率
Figure RE-262079DEST_PATH_IMAGE047
的相关程度为:
Figure RE-7050DEST_PATH_IMAGE048
;其中
Figure RE-536251DEST_PATH_IMAGE049
指第二批样本数据对应的数据日期为t时,用户i的采集电量变化率,
Figure RE-399513DEST_PATH_IMAGE050
指当数据日期为t时的台区线损率变化率,
Figure RE-238025DEST_PATH_IMAGE051
表示对样本选取标记b中所有对应值为b的数据日期对应的
Figure RE-955446DEST_PATH_IMAGE052
进行求和。
S34:数据加权。
S341:创建数据表数据加权a,数据列分别为用户编号、用户名称、相关程度a,以用户编号作为主键;
将从数组
Figure RE-304650DEST_PATH_IMAGE053
中提取最小的w个数据置入相关程度a列,并在用户编号与用户名称填入对应的信息;
将对数据加权a表按照相关程度a升序进行排列;
新增加权计算1列,将数组{m1,m2,m3,……,mw}作为第一次加权计算的得分赋值到加权计算1列,其中m1>m2>m3>……>mw>0。
下面是本发明提供的一个已创建好的数据加权表a的排名靠前部分:
Figure RE-56705DEST_PATH_IMAGE067
表中,相关程度a按升序进行排列后,将数组{100,10,9,8,7,6,5,4,3,2}作为第一次加权计算的得分赋值到“加权计算1”列。
S342:创建数据表数据加权b,数据列分别为用户编号、用户名称、相关程度b,以用户编号作为主键;
将从数组
Figure RE-66118DEST_PATH_IMAGE054
中提取最小的w个数据置入相关程度b列,并在用户编号与用户名称填入对应的信息;
将数据加权b表按照相关程度b升序进行排列;
新增加权计算I列,将数组{s1,s2,s3,……,sw}作为第一次加权计算的得分赋值到加权计算I列,其中s1>s2>s3>……>sw>0,又由于第二批样本数据相关程度最高的用户窃电可能性最高,s1>m1>s2≥m2>s3≥m3……>sw≥mw。
下面是本发明提供的一个已创建好的数据加权表b的排名考前部分:
Figure RE-474097DEST_PATH_IMAGE068
表中,相关程度b按升序进行排列后,将数组{1000,10,9,8,7,6,5,4,3,2}作为第一次加权计算的得分赋值到“加权计算I”列,由于第二批样本数据相关程度最高的用户窃电可能性最高,将其赋予1000的得分。
S35:依据算法模型中的“当用户持续稳定窃电时,窃电用户采集电量与台区线损量呈正相关,由于一般情况下窃电用户的实际用电量也比较稳定,此时台区线损率变化幅度一般较小”,对数据再次加权。
S351:为台区线损率表添加一列记为样本选取标记c,在该列中,为符合选取条件的数据日期对应的行赋值c;
为数据日期对应行赋值c的条件为:当某一数据日期对应样本选取标记a列的数据为a,且对应样本选取标记b列的数据不为b,则在样本选取标记c列的对应行赋值c。
S352:为用户电量表添加一列记为变化趋势;
用户i在数据日期为t时,若
Figure RE-626992DEST_PATH_IMAGE055
<0,则为变化趋势列中的对应行赋值“反向”;若
Figure RE-686083DEST_PATH_IMAGE055
=0,则为变化趋势列中的对应行赋值“不变”;若
Figure RE-882710DEST_PATH_IMAGE055
>0,则为变化趋势列中的对应行赋值“同向”;其中
Figure RE-325455DEST_PATH_IMAGE056
指用户i在数据日期为t时的采集电量,
Figure RE-468991DEST_PATH_IMAGE057
指用户i在数据日期为t-1时的采集电量,
Figure RE-179327DEST_PATH_IMAGE058
指数据日期为t时的台区线损率,
Figure RE-281275DEST_PATH_IMAGE059
指数据日期为t-1时的台区线损率。
S353:在台区存在用户窃电行为,且台区线损率变化率较小时,用户i的采集电量与台区线损率变化趋势不同的比率为:
Figure RE-211316DEST_PATH_IMAGE060
;其中
Figure RE-689702DEST_PATH_IMAGE061
指所有样本选取标记c中所有c的数量之和,即台区存在用户窃电行为,且台区线损率变化率较小的总天数,
Figure RE-254544DEST_PATH_IMAGE062
指即台区存在用户窃电行为,且台区线损率变化率较小时,用户i的采集电量与台区线损率变化趋势为反向天数之和;
Figure RE-792973DEST_PATH_IMAGE063
简称为用户i的变化趋势不同率,创建变化趋势表,数据列分别为用户编号、用户名称、变化趋势不同率,以用户编号作为主键;
变化趋势表中用户编号列中的数据为用户电量表中所有的去重后的用户编号,用户名称列为对应的用户名称,将变化趋势不同率的值D赋值到变化趋势表中变化趋势不同率列中对应用户编号的行。
S354:再次加权计算。
对数据加权a表新增加权计算2列,该列的数值X有以下约束规则:当用户i对应的相关程度a的值等于所有第一批样本的总天数时,其对应的
Figure RE-944731DEST_PATH_IMAGE064
置为0;当用户i对应的变化趋势不同率的值
Figure RE-226808DEST_PATH_IMAGE063
大于d时,即用户i是窃电用户的可能很小,将其对应的
Figure RE-646157DEST_PATH_IMAGE064
置为m0,其中0<d<1,0<m0<mw;当用户i不满足上述两个条件时,将其对应的
Figure RE-621066DEST_PATH_IMAGE064
置为对应加权计算1列的值。
下面是本发明提供的一个已创建好的再次加权计算后的数据加权表a的排名考前部分:
Figure RE-260120DEST_PATH_IMAGE069
表中,由于台区线线损率可能不止受单一窃电用户影响,在所有“台区存在用户窃电行为,且台区线损率变化率较小”的数据日期中,当某用户的采集电量变化方向与台区线损率的变化方向不同的天数占比大于30%时即取d=30%时,可以认为该用户是窃电用户的可能非常小,那么对应取m0=1(m0<mw=2)。
对数据加权b表新增加权计算II列,该列的数值Y有以下约束规则:当用户i对应的相关程度b的值等于所有第一批样本的总天数时,其对应的
Figure RE-80308DEST_PATH_IMAGE065
置为0;当用户i对应的变化趋势不同率的值
Figure RE-619743DEST_PATH_IMAGE063
大于d时,即用户i是窃电用户的可能很小,将其对应的
Figure RE-499974DEST_PATH_IMAGE065
置为s0,其中0<d<1,s0=m0;当用户i不满足上述两个条件时,将其对应的
Figure RE-626324DEST_PATH_IMAGE065
置为对应加权计算1列的值。
下面是本发明提供的一个已创建好的再次加权计算后的数据加权表b的排名考前部分:
Figure RE-DEST_PATH_IMAGE070
表中,同理数据加权表a的再次加权,取d=30%,取s0=m0=1。
S36:最终结果。
将数据加权a表中的用户编号、用户名称、加权计算2列与数据加权b表中的用户编号、用户名称、加权计算II列合并统计,并将对应用户在加权计算2与加权计算II的值求和,和记为最终结果。
创建数据表最终结果,包含用户编号、用户名称、最终结果、窃电嫌疑度列,以用户编号为主键;
最终结果中用户编号列中的数据为数据加权a和数据加权b表中所有汇总去重后的用户编号,用户名称列为对应的用户名称;
将加权计算2与加权计算II求和的值X+Y赋值到最终结果表中最终结果列中对应用户编号的行;
按照最终结果列,降序排列。
S37:确定窃电嫌疑度;
当最终结果列的值大于等于m1时,为窃电嫌疑度列中其对应行赋值大;当最终结果列的值小于等于mw时,为窃电嫌疑度列中其对应行赋值小;当最终结果列的值大于mw且小于m1时,为窃电嫌疑度列中其对应行赋值中。
下面是本发明提供的一个已创建好的最终结果表的排名考前部分:
Figure RE-640417DEST_PATH_IMAGE071
表中,最终结果≥m1=100时,该用户的窃电嫌疑度赋值为“大”;最终结果≤mw=2时,该用户的窃电嫌疑度赋值为“小”;2=mw<最终结果<m1=100时,该用户的窃电嫌疑度赋值为“中”。
S38:最终结果展示。
为缩小排查范围,向工作人员展示“最终结果”列中最大的5个数据对应的用户信息及其窃电嫌疑度,并绘制对应的采集电量曲线与台区线损曲线,方便工作人员查看并前往现场针对性处理,从而高效解决窃电、串户等电量异常问题。
下面是本发明提供的用户p的采集电量曲线与台区线损曲线对比分析。
如图4所示,两条曲线吻合度极高,后经工作人员现场排查,用户p确实存在存在窃电行为;同时,两条曲线吻合度极高,也说明采用本发明的方法后,可以对数据进行量化分析,既克服了原有传统方法存在的不便,又极大地减轻了工作人员的工作量,并精准锁定嫌疑用户。
若该台区下不存在窃电嫌疑度为“大”的用户,且展示的5名用户经现场排查都没有问题,则说明该台区下用户的窃电方式可能为无表计窃电或窃电表计采集电量一直小于0,工作人员需要重点排查台区的入户线与采集电量在大部分时间都小于0的用户。
最后应说明的是,以上实施例仅用以说明本发明的技术方案,而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解,依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求范围当中。

Claims (5)

1.一种基于用户采集电量与台区线损相关性的窃电用户核查方法,其特征在于包括如下步骤:
S1:分析和确定用户采集电量与台区线损相关性的算法模型;
S2:选取样本并依据算法模型对样本中线损存在异常的日期进行标记;
S3:在算法模型的基础上,对选取样本中被标记日期对应的数据进行用户采集电量与台区线损相关性的计算,计算过程中结合统计学原理置信区间,以减少正常用户的干扰,再结合多次权重评价方法,以增加计算结果的真实可靠性,最后根据计算结果将筛选出用户的窃电嫌疑度确定为大、中、小三类;
S4:按比例对窃电嫌疑度排名靠前的用户进行现场排查处理,若该台区下没有窃电嫌疑度为大的用户,且所选比例的排名靠前用户经现场排查都没有问题,则说明该台区下用户的窃电方式可能为无表计窃电或窃电表计采集电量非常接近0或等于0,工作人员需要重点排查台区的入户线与采集电量在大部分时间都非常接近或等于0的用户。
2.根据权利要求1所述的基于用户采集电量与台区线损相关性的窃电用户核查方法,其特征在于,所述步骤S1包括如下步骤:
线损分为理论线损和管理线损,管理线损的成因复杂多样,而理论线损是可以进行计算的,在理想环境下,台区线损量等同于理论线损值,且不会因用户电量的变化而改变;
在这个理想环境下,且不考虑分布式电源的影响,则供电量-售电量=台区线损量=理论线损值,其中售电量为台区所有用户采集电量之和,供电量为台区关口表的采集电量;
引入1个窃电用户进行讨论,则窃电用户采集电量=窃电用户实际电量-窃电量,台区线损量=理论线损值+窃电量=供电量*理论线损率+窃电量,可见窃电量的变化会引起台区线损量的变化,且两者正相关;
一般情况下能被采集示数的窃电用户,采集电量通常是实际电量的某个百分比值,把它称作窃电系数k,则窃电用户采集电量=E-Ek=E(1-k),台区线损量=理论线损值+Ek;
画出y=E和y=Ek的函数图像进行定性分析;
定性分析后得出:随着E和k的变化,台区线损量变化时,窃电用户的采集电量也会发生有相关性的不同幅度的变化,包括增加、减少或极小概率不变,略微类似正弦函数曲线,但台区线损量和窃电用户采集电量不是单纯的正相关和负相关,属于较为复杂的非线性相关,难以直接对台区线损量和窃电用户采集电量进行相关性分析,可以根据其变化率进行分析;
由此,确定用户采集电量与台区线损相关性的算法模型为:
存在窃电量时,台区线损量变化才会和窃电用户采集电量变化有非线性相关关系,且台区线损率变化较大时的相关性更高,尤其是当用户刚开始或终止窃电、明显增加或减少用电系数时,窃电用户采集电量与台区线损量呈负相关且此时台区线损率变化幅度一般较大;
将用户采集电量与台区线损相关性分析转化为各用户采集电量变化率绝对值和台区线损率变化率绝对值的接近程度分析,若其越接近,则说明变化的相关性越强,最接近值对应的用户最有可能是窃电用户;
当用户持续稳定窃电时,窃电用户采集电量与台区线损量呈正相关,由于一般情况下窃电用户的实际用电量也比较稳定,此时台区线损率变化幅度一般较小。
3.根据权利要求2所述的基于用户采集电量与台区线损相关性的窃电用户核查方法,其特征在于,所述步骤S2包括如下步骤:
S21:在电力用户用电信息采集***中,提取最近z天中每天的台区下所有用户表计的数据日期、用户编号、用户名称和采集电量作为用户电量表,以数据日期和用户编号作为主键,先按照用户编号升序,再按照数据日期升序,对用户电量表进行排序;
S22:在电力用户用电信息采集***中,提取最近z天中每天的数据日期、台区编号、台区名称、理论线损率、供电量、售电量、线损量、线损率作为台区线损率表,以数据日期作为主键,按照数据日期升序,对台区线损率表进行排序;
其中,用户电量表和台区线损率表通过主键数据日期进行连接;
S23:依据算法模型中的“存在窃电量时,台区线损量变化才会和窃电用户采集电量变化有非线性相关关系”选取第一批样本;
将台区线损率表中线损率>理论线损率+3%的数据日期认定为存在用户窃电行为,为台区线损率表添加一列记为样本选取标记a,在该列中,当对应数据日期的线损率>理论线损率+3%时,为其赋值a;
S24:依据算法模型中的“台区线损率变化较大时的相关性更高”选取第二批样本;
对台区线损率表中线损率变化值的绝对值大小进行比较,当数据日期为t时,线损率变化值的公式为:
Figure RE-RE-DEST_PATH_IMAGE001
,其中
Figure RE-808152DEST_PATH_IMAGE002
指数据日期为t时的台区线损率,
Figure RE-RE-DEST_PATH_IMAGE003
指数据日期为t-1时的台区线损率;
为台区线损率表添加一列记为台区线损率变化值,当日期为t时,为该列数据赋值
Figure RE-914911DEST_PATH_IMAGE004
,若t-1不存在则为空;
采用箱线图原理,认定台区线损率变化值处于上四分位数和上边缘之间的数据为相对离群值,即存在窃电行为且台区线损率变化较大;为台区线损率表添加一列记为样本选取标记b,在该列中,当对应数据日期的台区线损率变化值大于相对离群值中的某一值时,为其赋值b。
4.根据权利要求3所述的基于用户采集电量与台区线损相关性的窃电用户核查方法,其特征在于,所述步骤S24中采用箱线图原理选取样本标记b具体为:箱线图共由五个数值点构成,从下到上依次是下边缘、下四分位数Q1,中位数、上四分位数Q3和上边缘;
下边缘的取值可以为最小值或最小观察值,最小观察值=Q1-1.5(Q3-Q1);
上边缘的取值可以为最大值或最大观察值,最大观察值=Q3+1.5(Q3-Q1);
箱线图中,大于最大观察值或小于最小观察值的数值被定义为离群值;
当台区线损率变化值大于上四分位数又小于最大值时,可以称其为相对离群值e,即数值e的取值范围是
Figure RE-RE-DEST_PATH_IMAGE005
,其中
Figure RE-597565DEST_PATH_IMAGE006
为线损率变化值数组的上四分位数,
Figure RE-RE-DEST_PATH_IMAGE007
为线损率变化值数组的最大值;
第二组样本的选取规则为
Figure RE-267712DEST_PATH_IMAGE008
>e,在样品选取标记b一列中,当对应行
Figure RE-430840DEST_PATH_IMAGE008
>e时,为其赋值b。
5.根据权利要求2所述的基于用户采集电量与台区线损相关性的窃电用户核查方法,其特征在于,所述步骤S3包括如下步骤:
S31;依据算法模型中的“将用户电量与台区线损相关性分析转化为台区线损率变化率绝对值和各用户采集电量变化率绝对值的接近程度分析,若其越接近,则说明变化的相关性越强,最接近值对应的用户最有可能是窃电用户”计算台区线损率变化率和用户采集电量变化率;
S311:以已计算出的台区线损率变化值
Figure RE-RE-DEST_PATH_IMAGE009
为基础,为保证变化率在1以内方便比较,取
Figure RE-708500DEST_PATH_IMAGE010
Figure RE-RE-DEST_PATH_IMAGE011
中的最大值作为分母,则数据日期为t时的台区线损率变化率为:
Figure RE-816133DEST_PATH_IMAGE012
,其中
Figure RE-888039DEST_PATH_IMAGE009
指台区线损率变化值的绝对值,
Figure RE-905673DEST_PATH_IMAGE010
指数据日期为t时的台区线损率,
Figure RE-915087DEST_PATH_IMAGE011
指数据日期为t-1时的台区线损率,
Figure RE-RE-DEST_PATH_IMAGE013
为取
Figure RE-808219DEST_PATH_IMAGE010
Figure RE-397332DEST_PATH_IMAGE011
的最大值;
为台区线损率表添加一列记为台区线损率变化率,在该列中数据日期t对应的行赋值为
Figure RE-3894DEST_PATH_IMAGE014
S312:根据台区线损率变化值的绝对值
Figure RE-951252DEST_PATH_IMAGE009
的计算方式,用户i在数据日期为t时的采集电量变化值的绝对值为
Figure RE-RE-DEST_PATH_IMAGE015
,其中
Figure RE-830215DEST_PATH_IMAGE016
指用户i在数据日期为t时的采集电量,
Figure RE-RE-DEST_PATH_IMAGE017
指用户i在数据日期为t-1时的采集电量;
为用户电量表添加一列记为用户采集电量变化值,在该列中为用户i且数据日期t对应的行赋值为
Figure RE-662167DEST_PATH_IMAGE018
,若t-1不存在则为空;
则用户i在数据日期为t时的用户采集电量变化率为:
Figure RE-RE-DEST_PATH_IMAGE019
,其中
Figure RE-575766DEST_PATH_IMAGE018
指用户i在数据日期为t时的采集电量变化值的绝对值,
Figure RE-677714DEST_PATH_IMAGE016
指用户i在数据日期为t时的采集电量,
Figure RE-811017DEST_PATH_IMAGE017
指用户i在数据日期为t-1时的采集电量,
Figure RE-538671DEST_PATH_IMAGE020
为取
Figure RE-854245DEST_PATH_IMAGE016
Figure RE-143407DEST_PATH_IMAGE017
的最大值;
为用户电量表添加一列记为用户采集电量变化率,在该列中为用户i且数据日期t对应的行赋值
Figure RE-RE-DEST_PATH_IMAGE021
S32:减少正常用户的干扰;
采用统计学原理置信区间,找出正常用户采集电量变化值的高置信度范围,在计算采集电量变化率
Figure RE-996962DEST_PATH_IMAGE022
的过程中,当用户采集电量变化值
Figure RE-RE-DEST_PATH_IMAGE023
小于正常用户采集电量变化值的高置信度范围内的某个值n时,将
Figure RE-967454DEST_PATH_IMAGE022
置为0,即只筛查
Figure RE-340798DEST_PATH_IMAGE023
≥n的数据;当正常用户采集电量变化值的高置信度范围为(-p,p)时,n的取值范围是(0,p);
S321:对标记为a的第一批样本数据,从(0,p)中选取一个值q,0<q<p,取n1=q;
在计算第一批样本数据时,用户i在数据日期为t时的采集电量变化率重新定义为:
Figure RE-299395DEST_PATH_IMAGE024
<q时,
Figure RE-RE-DEST_PATH_IMAGE025
=0;
Figure RE-141712DEST_PATH_IMAGE024
≥q时,
Figure RE-961900DEST_PATH_IMAGE026
其中
Figure RE-501335DEST_PATH_IMAGE024
指用户i在数据日期为t时的采集电量变化值的绝对值,
Figure RE-RE-DEST_PATH_IMAGE027
指用户i在数据日期为t时的采集电量,
Figure RE-284963DEST_PATH_IMAGE028
指用户i在数据日期为t-1时的采集电量,
Figure RE-RE-DEST_PATH_IMAGE029
为取
Figure RE-113110DEST_PATH_IMAGE027
Figure RE-487722DEST_PATH_IMAGE028
的最大值;
S322:对标记为b的第二批样本数据,取n2=p;
在计算第二批样本数据时,用户i在数据日期为t时的采集电量变化率重新定义为:
Figure RE-632396DEST_PATH_IMAGE024
<p时,
Figure RE-136058DEST_PATH_IMAGE030
=0;
Figure RE-998972DEST_PATH_IMAGE024
≥p时,
Figure RE-RE-DEST_PATH_IMAGE031
其中
Figure RE-114958DEST_PATH_IMAGE024
指用户i在数据日期为t时的采集电量变化值的绝对值,
Figure RE-628985DEST_PATH_IMAGE027
指用户i在数据日期为t时的采集电量,
Figure RE-585439DEST_PATH_IMAGE028
指用户i在数据日期为t-1时的采集电量,
Figure RE-889644DEST_PATH_IMAGE029
为取
Figure RE-370173DEST_PATH_IMAGE027
Figure RE-489438DEST_PATH_IMAGE028
的最大值;
S323:为用户电量表分别添加采集电量变化率a列与采集电量变化率b列,在采集电量变化率a列中为用户i且数据日期t对应的行赋值为
Figure RE-633106DEST_PATH_IMAGE032
,在采集电量变化率b列中为用户i且数据日期t对应的行赋值为
Figure RE-RE-DEST_PATH_IMAGE033
S33:依据算法模型中的“将用户电量与台区线损相关性分析转化为台区线损率变化率绝对值和各用户采集电量变化率绝对值的接近程度分析,若其越接近,则说明变化的相关性越强,最接近值对应的用户最有可能是窃电用户”计算台区线损率变化率和用户采集电量变化率的相关程度;
用户i的采集电量变化率
Figure RE-595246DEST_PATH_IMAGE034
与台区线损率变化率
Figure RE-RE-DEST_PATH_IMAGE035
的相关程度为:
Figure RE-53034DEST_PATH_IMAGE036
;若r越小则用户的采集电量变化率与台区线损率变化率越接近,对应用户越可能是窃电用户;
S331:用标记为a的第一批样本数据作为数据日期选取依据,则用户i的采集电量变化率
Figure RE-RE-DEST_PATH_IMAGE037
与台区线损率变化率
Figure RE-479336DEST_PATH_IMAGE038
的相关程度为:
Figure RE-RE-DEST_PATH_IMAGE039
;其中
Figure RE-731588DEST_PATH_IMAGE040
指第一批样本数据对应的数据日期为t时,用户i的采集电量变化率,
Figure RE-243341DEST_PATH_IMAGE038
指当数据日期为t时的台区线损率变化率,
Figure RE-DEST_PATH_IMAGE041
表示对样本选取标记a中所有对应值为a的数据日期对应的
Figure RE-239241DEST_PATH_IMAGE042
进行求和;
S332:用标记为b的第二批样本数据作为数据日期选取依据,则用户i的采集电量变化率
Figure RE-DEST_PATH_IMAGE043
与台区线损率变化率
Figure RE-520050DEST_PATH_IMAGE044
的相关程度为:
Figure RE-DEST_PATH_IMAGE045
;其中
Figure RE-931485DEST_PATH_IMAGE046
指第二批样本数据对应的数据日期为t时,用户i的采集电量变化率,
Figure RE-DEST_PATH_IMAGE047
指当数据日期为t时的台区线损率变化率,
Figure RE-930533DEST_PATH_IMAGE048
表示对样本选取标记b中所有对应值为b的数据日期对应的
Figure RE-DEST_PATH_IMAGE049
进行求和;
S34:数据加权;
S341:创建数据表数据加权a,数据列分别为用户编号、用户名称、相关程度a,以用户编号作为主键;
将从数组
Figure RE-464545DEST_PATH_IMAGE050
中提取最小的w个数据置入相关程度a列,并在用户编号与用户名称填入对应的信息;
将对数据加权a表按照相关程度a升序进行排列;
新增加权计算1列,将数组{m1,m2,m3,……,mw}作为第一次加权计算的得分赋值到加权计算1列,其中m1>m2>m3>……>mw>0;
S342:创建数据表数据加权b,数据列分别为用户编号、用户名称、相关程度b,以用户编号作为主键;
将从数组
Figure RE-DEST_PATH_IMAGE051
中提取最小的w个数据置入相关程度b列,并在用户编号与用户名称填入对应的信息;
将数据加权b表按照相关程度b升序进行排列;
新增加权计算I列,将数组{s1,s2,s3,……,sw}作为第一次加权计算的得分赋值到加权计算I列,其中s1>s2>s3>……>sw>0,又由于第二批样本数据相关程度最高的用户窃电可能性最高,s1>m1>s2≥m2>s3≥m3……>sw≥mw;
S35:依据算法模型中的“当用户持续稳定窃电时,窃电用户采集电量与台区线损量呈正相关,由于一般情况下窃电用户的实际用电量也比较稳定,此时台区线损率变化幅度一般较小”,对数据再次加权;
S351:为台区线损率表添加一列记为样本选取标记c,在该列中,为符合选取条件的数据日期对应的行赋值c;
为数据日期对应行赋值c的条件为:当某一数据日期对应样本选取标记a列的数据为a,且对应样本选取标记b列的数据不为b,则在样本选取标记c列的对应行赋值c;
S352:为用户电量表添加一列记为变化趋势;
用户i在数据日期为t时,若
Figure RE-803123DEST_PATH_IMAGE052
<0,则为变化趋势列中的对应行赋值“反向”;若
Figure RE-708762DEST_PATH_IMAGE052
=0,则为变化趋势列中的对应行赋值“不变”;若
Figure RE-493309DEST_PATH_IMAGE052
>0,则为变化趋势列中的对应行赋值“同向”;其中
Figure RE-DEST_PATH_IMAGE053
指用户i在数据日期为t时的采集电量,
Figure RE-595126DEST_PATH_IMAGE054
指用户i在数据日期为t-1时的采集电量,
Figure RE-DEST_PATH_IMAGE055
指数据日期为t时的台区线损率,
Figure RE-86413DEST_PATH_IMAGE056
指数据日期为t-1时的台区线损率;
S353:在台区存在用户窃电行为,且台区线损率变化率较小时,用户i的采集电量与台区线损率变化趋势不同的比率为:
Figure RE-DEST_PATH_IMAGE057
;其中
Figure RE-553166DEST_PATH_IMAGE058
指所有样本选取标记c中所有c的数量之和,即台区存在用户窃电行为,且台区线损率变化率较小的总天数,
Figure RE-DEST_PATH_IMAGE059
指即台区存在用户窃电行为,且台区线损率变化率较小时,用户i的采集电量与台区线损率变化趋势为反向天数之和;
Figure RE-762693DEST_PATH_IMAGE060
简称为用户i的变化趋势不同率,创建变化趋势表,数据列分别为用户编号、用户名称、变化趋势不同率,以用户编号作为主键;
变化趋势表中用户编号列中的数据为用户电量表中所有的去重后的用户编号,用户名称列为对应的用户名称,将变化趋势不同率的值D赋值到变化趋势表中变化趋势不同率列中对应用户编号的行;
S354:再次加权计算;
对数据加权a表新增加权计算2列,该列的数值X有以下约束规则:当用户i对应的相关程度a的值等于所有第一批样本的总天数时,其对应的
Figure RE-DEST_PATH_IMAGE061
置为0;当用户i对应的变化趋势不同率的值
Figure RE-668201DEST_PATH_IMAGE060
大于d时,即用户i是窃电用户的可能很小,将其对应的
Figure RE-76311DEST_PATH_IMAGE061
置为m0,其中0<d<1,0<m0<mw;当用户i不满足上述两个条件时,将其对应的
Figure RE-527015DEST_PATH_IMAGE061
置为对应加权计算1列的值;
对数据加权b表新增加权计算II列,该列的数值Y有以下约束规则:当用户i对应的相关程度b的值等于所有第一批样本的总天数时,其对应的
Figure RE-50269DEST_PATH_IMAGE062
置为0;当用户i对应的变化趋势不同率的值
Figure RE-41359DEST_PATH_IMAGE060
大于d时,即用户i是窃电用户的可能很小,将其对应的
Figure RE-569554DEST_PATH_IMAGE062
置为s0,其中0<d<1,s0=m0;当用户i不满足上述两个条件时,将其对应的
Figure RE-987897DEST_PATH_IMAGE062
置为对应加权计算1列的值;
S36:最终结果;
将数据加权a表中的用户编号、用户名称、加权计算2列与数据加权b表中的用户编号、用户名称、加权计算II列合并统计,并将对应用户在加权计算2与加权计算II的值求和,和记为最终结果;
创建数据表最终结果,包含用户编号、用户名称、最终结果、窃电嫌疑度列,以用户编号为主键;
最终结果中用户编号列中的数据为数据加权a和数据加权b表中所有汇总去重后的用户编号,用户名称列为对应的用户名称;
将加权计算2与加权计算II求和的值X+Y赋值到最终结果表中最终结果列中对应用户编号的行;
按照最终结果列,降序排列;
S37:确定窃电嫌疑度;
当最终结果列的值大于等于m1时,为窃电嫌疑度列中其对应行赋值大;当最终结果列的值小于等于mw时,为窃电嫌疑度列中其对应行赋值小;当最终结果列的值大于mw且小于m1时,为窃电嫌疑度列中其对应行赋值中。
CN202110661125.9A 2021-06-15 2021-06-15 基于用户采集电量与台区线损相关性的窃电用户核查方法 Active CN113362199B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110661125.9A CN113362199B (zh) 2021-06-15 2021-06-15 基于用户采集电量与台区线损相关性的窃电用户核查方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110661125.9A CN113362199B (zh) 2021-06-15 2021-06-15 基于用户采集电量与台区线损相关性的窃电用户核查方法

Publications (2)

Publication Number Publication Date
CN113362199A true CN113362199A (zh) 2021-09-07
CN113362199B CN113362199B (zh) 2022-12-02

Family

ID=77534455

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110661125.9A Active CN113362199B (zh) 2021-06-15 2021-06-15 基于用户采集电量与台区线损相关性的窃电用户核查方法

Country Status (1)

Country Link
CN (1) CN113362199B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113947504A (zh) * 2021-11-11 2022-01-18 国网辽宁省电力有限公司营销服务中心 一种基于随机森林法的窃电分析方法及其***
CN115165553A (zh) * 2022-06-10 2022-10-11 中复神鹰碳纤维股份有限公司 一种碳纤维复丝拉伸强度测试数值的取舍方法
CN115207909A (zh) * 2022-07-20 2022-10-18 北京三圣凯瑞科技有限公司 一种台区拓扑识别方法、装置、设备及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104330678A (zh) * 2014-11-20 2015-02-04 国家电网公司 一种基于低压配电网三相状态估计的台区用电监测方法
CN105590166A (zh) * 2015-12-16 2016-05-18 国家电网公司 一种配电网中专变供电用户用电行为分析判断方法
CN106295985A (zh) * 2016-08-08 2017-01-04 国网山东省电力公司济南供电公司 一种台区线损管理***及管理方法
WO2017149748A1 (ja) * 2016-03-04 2017-09-08 楽天株式会社 情報処理装置、情報処理方法、および情報処理プログラム
US20170351288A1 (en) * 2016-06-07 2017-12-07 Shenzhen Zhidian Energy Technology LTD Non-invasive online real-time electric load identification method and identification system
CN110097297A (zh) * 2019-05-21 2019-08-06 国网湖南省电力有限公司 一种多维度窃电态势智能感知方法、***、设备及介质
CN110824270A (zh) * 2019-10-09 2020-02-21 中国电力科学研究院有限公司 结合台区线损和异常事件的窃电用户辨识方法及装置
CN111507611A (zh) * 2020-04-15 2020-08-07 北京中电普华信息技术有限公司 一种确定窃电嫌疑用户的方法及***
CN112730938A (zh) * 2020-12-15 2021-04-30 北京科东电力控制***有限责任公司 一种基于用电采集大数据的窃电用户判断方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104330678A (zh) * 2014-11-20 2015-02-04 国家电网公司 一种基于低压配电网三相状态估计的台区用电监测方法
CN105590166A (zh) * 2015-12-16 2016-05-18 国家电网公司 一种配电网中专变供电用户用电行为分析判断方法
WO2017149748A1 (ja) * 2016-03-04 2017-09-08 楽天株式会社 情報処理装置、情報処理方法、および情報処理プログラム
US20170351288A1 (en) * 2016-06-07 2017-12-07 Shenzhen Zhidian Energy Technology LTD Non-invasive online real-time electric load identification method and identification system
CN106295985A (zh) * 2016-08-08 2017-01-04 国网山东省电力公司济南供电公司 一种台区线损管理***及管理方法
CN110097297A (zh) * 2019-05-21 2019-08-06 国网湖南省电力有限公司 一种多维度窃电态势智能感知方法、***、设备及介质
CN110824270A (zh) * 2019-10-09 2020-02-21 中国电力科学研究院有限公司 结合台区线损和异常事件的窃电用户辨识方法及装置
CN111507611A (zh) * 2020-04-15 2020-08-07 北京中电普华信息技术有限公司 一种确定窃电嫌疑用户的方法及***
CN112730938A (zh) * 2020-12-15 2021-04-30 北京科东电力控制***有限责任公司 一种基于用电采集大数据的窃电用户判断方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
黄文思等: "《基于大数据的线损计算分析研究》", 《电气技术》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113947504A (zh) * 2021-11-11 2022-01-18 国网辽宁省电力有限公司营销服务中心 一种基于随机森林法的窃电分析方法及其***
CN115165553A (zh) * 2022-06-10 2022-10-11 中复神鹰碳纤维股份有限公司 一种碳纤维复丝拉伸强度测试数值的取舍方法
CN115165553B (zh) * 2022-06-10 2023-05-30 中复神鹰碳纤维股份有限公司 一种碳纤维复丝拉伸强度测试数值的取舍方法
CN115207909A (zh) * 2022-07-20 2022-10-18 北京三圣凯瑞科技有限公司 一种台区拓扑识别方法、装置、设备及存储介质
CN115207909B (zh) * 2022-07-20 2023-09-15 北京三圣凯瑞科技有限公司 一种台区拓扑识别方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN113362199B (zh) 2022-12-02

Similar Documents

Publication Publication Date Title
CN113362199B (zh) 基于用户采集电量与台区线损相关性的窃电用户核查方法
CN110223196B (zh) 基于典型行业特征库和反窃电样本库的反窃电分析方法
CN111291076B (zh) 基于大数据的异常用水监测报警***及其构建方法
CN110097297A (zh) 一种多维度窃电态势智能感知方法、***、设备及介质
Redman Measuring data accuracy: A framework and review
CN105868301A (zh) 一种碳排放检测管理***及管理方法
CN110414768B (zh) 一种基于仪器电流数据的大数据分析方法
CN107392479A (zh) 基于逻辑回归模型的电力客户停电敏感度评分卡实施方法
CN101853290A (zh) 基于地理信息***的气象服务效益评估方法
CN110782153A (zh) 一种企业园区综合能效评估体系建模方法及***
CN106384256A (zh) 基于指标体系动态变化的供电服务满意度动态测评***
CN116739368A (zh) 基于能源大数据的工业园区碳排放水平监测及评估方法
CN112883062A (zh) 一种不基于规则的自定义规则稽查方法
CN107357941A (zh) 一种可实时对水雨情数据进行检验的***和方法
CN113628024A (zh) 基于大数据平台***的财务数据智能稽核***及方法
CN117273456A (zh) 一种基于大数据技术的项目成本智能管理***
CN112184495B (zh) 存量低效土地监测***及应用其的分析平台
CN112256681A (zh) 一种空管数字化指标应用***及方法
Almuzara et al. GDP solera: The ideal vintage mix
CN113393169B (zh) 基于大数据技术的金融行业交易***性能指标分析方法
Vaezi Measuring the performances of Medical Diagnostic Laboratories based on interval efficiencies
CN114626692A (zh) 镇村规模结构优化方法、***、计算机设备和存储介质
CN207232961U (zh) 一种可实时对水雨情数据进行检验的***
CN112732773A (zh) 一种继电保护缺陷数据的唯一性校核方法及***
CN113075448A (zh) 一种基于知识图谱的业扩计量装置的配置方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant