CN113435494A - 低压居民用户异常用电识别方法及仿真模拟*** - Google Patents

低压居民用户异常用电识别方法及仿真模拟*** Download PDF

Info

Publication number
CN113435494A
CN113435494A CN202110694347.0A CN202110694347A CN113435494A CN 113435494 A CN113435494 A CN 113435494A CN 202110694347 A CN202110694347 A CN 202110694347A CN 113435494 A CN113435494 A CN 113435494A
Authority
CN
China
Prior art keywords
data
user
low
abnormal electricity
voltage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110694347.0A
Other languages
English (en)
Inventor
周玉
邵雪松
李悦
潘超
易永仙
崔高颖
张筠
褚兴旺
丁颖
庞金鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Jiangsu Electric Power Co ltd Marketing Service Center
State Grid Jiangsu Electric Power Co Ltd
Original Assignee
State Grid Jiangsu Electric Power Co ltd Marketing Service Center
State Grid Jiangsu Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Jiangsu Electric Power Co ltd Marketing Service Center, State Grid Jiangsu Electric Power Co Ltd filed Critical State Grid Jiangsu Electric Power Co ltd Marketing Service Center
Priority to CN202110694347.0A priority Critical patent/CN113435494A/zh
Publication of CN113435494A publication Critical patent/CN113435494A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Geometry (AREA)
  • Evolutionary Biology (AREA)
  • Computer Hardware Design (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种低压居民用户异常用电识别的方法和仿真模拟***。该方法包括步骤1,提交待识别的低压居民用户的用电负荷数据,从中提取多模态特征;步骤2,针对步骤1得到的多模态特征,提取并构造四维复合特征;步骤3,利用步骤2中得到的四维复合特征训练深度神经网络;步骤4,利用训练好的深度神经网络对四维复合特征进行识别,得到低压居民异常用电用户。本发明的仿真识别的方法和仿真模拟***可以实现异常用电数据的快速仿真分析和异常用电识别算法的验证等。

Description

低压居民用户异常用电识别方法及仿真模拟***
技术领域
本发明属于用户异常用电识别领域,更具体的,涉及一种低压居民用户异常用电识别方法及仿真模拟***。
背景技术
长期以来,由于窃电、电表故障和安装错误等异常用电给电网运营商每年带来巨额的经济损失。而且,由于采集到的用电数据存在巨大误差,还会影响电网的调度与管理,以及运行安全。因此,异常用电识别是智能电网运维过程中安全用电的重要支撑之一,具有非常重要的意义。通过对用电行为正常与否的甄别,既可以即使追补因为异常用电导致的少计量的电费。此外,还可以校正失真的用电数据,提高电网数据质量,为更广泛的电力大数据分析提供保障。
国务院发布的《计量发展规划(2013-2020年)》要求加强计量作弊防控技术和查处技术研究,提高依法快速查处、快速处理能力,重点查办利用高科技手段从事计量违法行为。国家电网公司大力推进智能计量体系建设,要求建立采集数据异常监控,开展数据关联分析应用。挖掘信息采集数据价值,通过建立诊断模型实现用户计量异常等现象的监测,开展用户异常用电等问题的关联分析应用。打破现有低压异常用电识别面临的技术瓶颈,快速定位异常用电区域、准确识别异常用电嫌疑用户,实现现场排查高效精准,为电能表异常快速处置工作提供有效的技术手段。
已有的用户异常用电识别技术往往致力于对具体算法的改进和具体识别精准度的提高,尚没有一个用于低压居民异常用电行为仿真模拟与识别算法验证的平台。低压居民用户异常用电识别仿真模拟***不仅能够实现异常用电数据的快速仿真、异常用电行为识别算法的验证等功能,还能够为低压居民用户用电数据分析及其异常用电行为识别算法的推广应用提供实验验证平台,解决理论研究与推广应用的衔接问题。
此外,目前低压居民用户异常用电案例不足,数据量不够,很难准确掌握低压居民异常用电行为特征,快速定位异常用电用户,缺乏快速高效准确的仿真工具。
发明内容
为解决现有技术中存在的不足,本发明的目的在于,提供一种低压居民用户异常用电识别方法及仿真模拟***,可以实现异常用电数据的快速识别分析、仿真和异常用电识别算法的验证等。
本发明采用如下的技术方案:
一种低压居民用户异常用电识别的方法,该方法包括以下步骤:
步骤1,提交待识别的低压居民用户的用电负荷数据,从中提取多模态特征;
步骤2,针对步骤1得到的多模态特征,提取并构造四维复合特征;
步骤3,利用步骤2中得到的四维复合特征训练深度神经网络;
步骤4,利用训练好的深度神经网络对四维复合特征进行识别,得到低压居民异常用电用户。
优选的,步骤1进一步包括:
步骤1.1,对提交的低压居民用户的用电负荷数据进行预处理;
步骤1.2,从预处理后的数据中提取多模态特征。
优选的,所述预处理包括乘以电表的综合倍率还原实际电量数据、删除不合理数据以及缺失值填补中的一项或多项。
优选的,所述多模态特征包括有功增量类型、运行时间、冲击电流类型、负荷范围、以及无功阈值中的一项或多项。
优选的,步骤2进一步包括:
步骤2.1,对步骤1得到的多模态特征进行数据降维;
步骤2.2,对步骤2.1得到的降维数据进行归一化处理;
步骤2.3,对步骤2.2得到的归一化后的特征值进行四维复合特征构造。
优选的,步骤2.1中的数据降维是指
lowDataM×N=ZM×KAK×N
其中,Z为原始M行K列的数据集,A为K行N列的特征变化矩阵,lowData为降维后的M行N列的数据;M代表用户数,K代表月特征数据的维度数量,N即为需要降到的维数。
优选的,步骤2.2中的归一化是指
Figure BDA0003127446710000031
其中,L代表降维后当前维度的原始值,min(L)代表当前维度所有值中的最小值,max(L)代表当前维度所有值中的最大值,NL即为归一化后的特征值。
优选的,归一化仅针对用户的月特征数据进行。
优选的,步骤2.3进一步包括:
步骤2.3.1,对步骤2.2归一化后得到的特征值计算二元分类特征;
步骤2.3.2,对步骤2.2归一化后得到的特征值计算LOF特征;
步骤2.3.3,对步骤2.2归一化后得到的特征值计算基于相似用户用电负荷的相关性度量特征;
步骤2.3.4,对步骤2.2归一化后得到的特征值计算基于最相关用户的相关性变化率度量特征;
步骤2.3.5,将步骤2.3.1至2.3.4得到的特征整合,形成四维复合特征。
优选的,步骤2.3.1中,二元分类特征的计算为:
Figure BDA0003127446710000032
其中,f是x的函数f(x);Af+B代表支持向量机;Pr(y=1|x)是预测函数,表示取类别为1的概率;PA,B(f)通过一个sigmoid函数将SVM的输出值映射到[0,1]之间。
优选的,步骤2.3.2中,LOF特征的计算为:
Figure BDA0003127446710000033
其中,点p的局部离群因子LOFk(p)表示为点p的邻域点NK(p)的局部可达密度lrdk(o)与点p的局部可达密度lrdk(p)之比的平均数,o属于点p的邻域点NK(p)。
优选的,步骤2.3.3中,基于相似用户用电负荷的相关性度量特征的计算为:
Figure BDA0003127446710000034
其中,x代表某一用户的用电负荷,xmean表示该用户所在台区所有用户的平均用电负荷,cov(x,xmean)表示x和xmean的协方差,σX
Figure BDA0003127446710000035
分别表示x和xmean的标准差。
优选的,步骤2.3.4中,基于最相关用户的相关性变化率度量特征的计算为:
Figure BDA0003127446710000041
其中,将给定时间段内的数据根据日期平均划分为前后两半段Dl和D2;D1用于找出每个用户的与其相关性系数最大的用户,rij,i,j∈[0,M-l],代表用户i与用户j相关性系数最大,且它们之间的相关性系数是Dl_rij;D2用于计算每个用户与最相关用户j的相关性系数D2_rij,使用Dl_rij到D2_rij的増长率或者减少率作为该用户异常程度的一个特征change_rate。
优选的,步骤3进一步包括:
步骤3.1,对步骤2中得到的四维复合特征利用对抗神经网络进行数据增广;
步骤3.2,用步骤3.1中增广后的特征训练深度神经网络;
步骤4中针对增广后的特征进行识别。
一种采用本发明的低压居民用户异常用电仿真识别的方法的低压居民用户异常用电识别仿真模拟***,该仿真模拟***包括:低压用电数据库、分类算法库、用户用电行为识别模型库;数据仿真模块、数据管理模块;算法验证任务配置管理模块、算法模型管理模块、算法模型调度模块;以及人机交互模块。
优选的,低压用电数据库存储有低压居民用户的用电数据;分类算法库存储有不同的算法,用于训练用户用电数据中提取的特征数据;用户用电行为识别模型库存储有不同的模型,用于识别和分析低压用户异常用电。
优选的,所述用户用电行为识别模型库包括低压居民用户用电特性与行为模型、低压居民用户异常用电模型、低压异常用电数据仿真模型、面向低压用电数据的深度神经网络模型、异构信息与低压用电行为的关联分析模型、以及异构信息融合的低压居民用户异常用电识别模型。
优选的,数据仿真模块用于支持用户进行数据仿真操作;数据管理模块用于管理模型和训练数据以及整个***的用户信息;算法验证任务配置管理模块用于选择模型进行异常用电识别;算法模型管理模块用于对算法模型进行管理;算法模型调度模块用于调度算法和模型;人机交互模块用于用户和***的交互。
本发明的有益效果在于,与现有技术相比:
(1)本发明建立了一套低压居民用户异常用电识别仿真模拟***,利用该平台,可以实现异常用电数据的快速仿真分析和异常用电识别算法的验证,为低压居民用户用电数据分析及其异常用电行为识别算法的推广应用提供实验验证平台,方便快捷高效,有利于数据分析和识别算法的推广应用,解决理论研究与推广应用的衔接问题;
(2)本发明的低压居民用户异常用电识别仿真模拟***能够实现用电数据的模拟、外部数据的导入、数据的管理、算法模型的管理、算法的执行和验证、数据的多维分析以及可视化展现,功能完善,对用户友好,便于操作,扩展性好,十分灵活;
(3)本发明的低压居民用户异常用电识别仿真模拟***支持多种人工智能算法的执行环境,包括Python、C/C++等;能够自动识别算法模型,自动调度到相应的运行环境上,自适应能力强;
(4)本发明能够有效帮助用户克服异常用电案例数据稀少的困难,对数据进行扩充,能够更为准确地掌握低压居民异常用电行为特征,快速定位异常用电用户,为现场异常用电稽查提供技术支撑,提高异常用电现场核查效率。
附图说明
图1是本发明的低压居民用户异常用电识别仿真模拟***的组成图;
图2是本发明的低压居民用户异常用电识别方法的流程图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
如图1所示,本发明的低压居民用户异常用电识别仿真模拟***包括:低压用电数据库1、分类算法库2、用户用电行为识别模型库3;数据仿真模块4、数据管理模块5;算法验证任务配置管理模块6、算法模型管理模块7、算法模型调度模块8;以及人机交互模块9。
低压用电数据库1存储有低压居民用户的数据。操作用户可利用低压用电数据库,可以实现低压用电数据的增删改查,对低压用电数据进行可视化管理。操作用户添加低压用户用电数据,加载源数据并存入数据库、数据清洗、特征构造、数据归一化。操作用户可利用低压用电数据库管理预处理的低压用电用户数据。
分类算法库2存储有不同的算法,用于训练用户数据中提取的特征数据。分类算法库存储有适合于对异常数据进行分类的数据挖掘算法。分类是在一群已经知道类别标号的样本中,训练一种分类器,让其能够对某种未知的样本进行分类。分类的目的是使用分类器对新的数据集进行划分。
用户用电行为识别模型库3存储有不同的模型。具体的,模型是利用数据训练算法得到的,可以直接用于识别和分析低压用户异常用电。
用户用电行为识别模型库包括以下模型:
(1)低压居民用户用电特性与行为模型,根据用电信息数据集提取用电行为特征指标,并生成对应的行为标签。通过抽象共同标签特征方式实现用户群体划分,确定用户的行为特征;
(2)低压居民用户异常用电模型,训练用户用电数据,用分类算法对异常用电数据进行分离,识别出低压居民用户的异常用电数据;
(3)低压异常用电数据仿真模型,对异常用电数据进行模拟,在收集到的数据集中不存在异常用电数据的情况下,模拟出异常用户数据用于训练;
(4)面向低压用电数据的深度神经网络模型,使用深度神经网络训练数据可以达到更好地拟合多维度特征数据的目的,更加准确地识别出异常用电用户;
(5)异构信息与低压用电行为的关联分析模型,通过对数据集的分析,找出异构信息和低压用电行为之间的关系;
(6)异构信息融合的低压居民用户异常用电识别模型,通过多维度的异构信息识别异常用电。数据仿真模块4用于进行数据仿真操作。具体的仿真操作可以包括信息配置、算法选择等。用户可以模拟异常用电数据,当训练数据集中不存在异常用电数据,就需要对训练数据采用模拟异常用电的步骤来模拟出异常用户用于训练模型。为了验证模型的有效性,在没有异常数据的情况下,也需要使用数据仿真模块。
数据管理模块5用于管理模型和训练数据以及整个***的用户信息。
算法验证任务配置管理模块6用于选择模型进行异常用电识别。对于适合用于低压异常用电行为识别的深度神经网络进行训练,验证模型效果。算法训练验证主要根据取出的复合特征然后训练出用电识别的模型,同一组复合特征根据不同的任务需要选择不同的算法进行训练,验证得出符合任务要求的模型。
算法模型管理模块7用于对算法模型的增删改查,记录训练算法模型的数据。
算法模型调度模块8用于调度算法和模型。具体的,算法模型调度模块通过模块接口层对模型进行调度。算法模型调度模块还可以对深度学习框架进行调度,深度学习框架可以包括TensorFlow、Caffe、MXNet以及PyTorch等。
人机交互模块9用于用户和***的交互,主要功能是接收用户输入,然后***根据输入计算结果,再将结果展示给用户。人机交互模块主要操作界面和图形化展现模块。
该仿真模拟***能够实现如下功能:
(1)算法模型和数据的管理:对异常用电数据的仿真模型和基于深度学习的识别模型进行可视化管理,支持增删改查功能;支持对仿真后的数据进行可视化分类和管理。
(2)数据模拟仿真:支持操作用户基于界面进行数据仿真操作,包括信息配置、算法选择等。
(3)算法模型的执行和验证:集成低压异常用电行为识别的深度神经网络模型,用于和待验证算法模型对比;支持在多种运行环境执行识别模型。
(4)算法模型的评估:支持对识别模型的执行结果进行评估,对准确率和召回率进行分析评估。
该仿真模拟***支持多种人工智能算法的执行环境,包括Python、C/C++等;算法的自适应能力强,能够自动识别算法模型,自动调度到相应的运行环境上;具有良好的模型和数据的管理流程,根据用户的日常使用习惯和算法流程,可以自定义一套管理流程,支撑用户快速高效地完成数据的仿真和模型的验证工作。
下面介绍利用本发明的低压居民用户异常用电识别仿真模拟***进行低压居民用户异常用电识别的方法。该方法包括如下步骤:
步骤1,提交待识别的低压居民用户的用电负荷数据,从用电负荷数据中提取数据的多模态特征。
具体的,步骤1包括:
步骤1.1,在提交用户的用电负荷数据后,先对用户提交的低压居民用户的用电负荷数据进行预处理。所述预处理包括乘以电表的综合倍率还原实际电量数据、删除不合理数据、缺失值填补。
用电负荷数据来源于用户电表采集的数据,在该数据中,电量数据都是都是缩小了综合倍率的示数,比如某电表用了100度电,且该表的综合倍率是100,那么这这种情况下,电表的示数就是1,这是为了便于电表能记录更大用电示数。基于该原因,预处理需要将电量数据都乘以对应电表的综合倍率,以还原实际电量数据。
提交的用户用电负荷数据通常是月负荷数据,往往会有采集缺失,预处理需要删除采集缺失严重的用户某天数据。比如可以设置缺失比例为0.2,代表台区有100个用户,20个以上用户没有釆集到数据,那么该天数据就会被删除。缺失比例可由操作用户根据实际情况进行配置。
对于采集缺失不严重的数据,可以填充该数据列的中位值进行缺失值填补。
步骤1.2,用户用电负荷数据进行预处理后,即可从中提取多模态特征,包括有功增量类型、运行时间、冲击电流类型、负荷范围、无功阈值等。
步骤2,针对步骤1中的多模态特征,提取并构造四维复合特征。
具体的,步骤2包括:
步骤2.1,在提取并构造四维复合特征之前,先对步骤1得到的多模态特征进行数据降维。
虽然月负荷模式已经把用户上百维的日负荷模式降低到几十维,但是仍旧属于高维度数据,而高维度的数据可能存在信息重叠的情况,故必须进行数据降维。本实施例采用主成分分析方法对月负荷模式数据进行信息去重和降维,主成分分析法作为一种数学变换的降维方法,能够把一组相关变量通过线性变换转化成另一组数量更少的不相关的变量,并且这些新的变量会依照方差递减的顺序依次排列。变量递减的顺序其实就是新坐标系选择的顺序,所以第一个坐标系是方法变量方法最大的方向,第二个新坐标轴是与第一个坐标轴正交且方差次之的方向,以后以此类推,直到达到需要降到的维度,这样新的变量按照方差递减排列,保留前几个方差较大的新特征,即达到了数据降维的目的。
数据降维可以用下式表示:
lowDataM×N=ZM×KAK×N (1)
其中,Z为原始M行K列的数据集,A为K行N列的特征变化矩阵,lowData为降维后的M行N列的数据;M代表用户数,K代表月特征数据的维度数量,N即为需要降到的维数。
在本实施例中,是24维月均用电量和7维提取特征,故K=24+7=31,A为31行N列的特征变换矩阵,是根据Z的协方差矩阵和特征值计算得出的,N即为需要降到的维数。通过降维公式可知,降维后的数据为M行N列。
步骤2.2,对步骤2.1得到的降维数据进行归一化处理。
为了消除特征之间的维度和单位的影响,使特征适用于支持向量机和局部异常因子两个算法模块,需要对数据进行归一化处理,归一化后特征值的范围为0到1。由于日特征数据用于计算相关性和变化率特征,使用原始数据具有更好的准确性,所以归一化过程只针对月特征数据。
归一化可以用下式表示:
Figure BDA0003127446710000091
其中,L代表降维后当前维度的原始值,min(L)代表当前维度所有值中的最小值,max(L)代表当前维度所有值中的最大值。NL即为归一化以后的特征值。
更具体的,在步骤2.1得到的lowData是M×N维,归一化实质是将每一列的数据进行归一化,即根据该列中多个用户的最大值和最小值进行式(2)的归一化计算。
步骤2.3,对步骤2.2得到的归一化的特征值进行四维复合特征构造。
具体的,步骤2.3进一步包括:
步骤2.3.1,对步骤2.2归一化后得到的特征值计算二元分类特征。
二元分类特征的计算可以用下式表示:
Figure BDA0003127446710000092
其中,f是x的函数f(x);Af+B代表支持向量机(SVM,Support Vector Machine);Pr(y=1|x)是预测函数,表示取类别为1的概率;PA,B(f)通过一个sigmoid函数将SVM的输出值映射到[0,1]之间。它的思想是离分隔超曲面越近的点认为分对的可能性越小,离分隔超曲面越远的点认为分对的可能性越大。该特征从全局数据角度以数据点距离SVM超曲面的远近描述了用户用电异常的程度。
根据式(3)可以求出基于SVM(支持向量机(Support Vector Machine,SVM)的异常用电的概率特征。
步骤2.3.2,对步骤2.2归一化后得到的特征值计算LOF特征。LOF(Local OutliersFactor,局部异常因子)的计算用下式表示:
Figure BDA0003127446710000101
其中,点p的局部离群因子LOFk(p)表示为点p的邻域点NK(p)的局部可达密度lrdk(o)与点p的局部可达密度lrdk(p)之比的平均数,o属于点p的邻域点NK(p)。
如果对象点p的密度小于其邻域内对象点NK(p)的密度,则局部异常因子越有可能大于1,值越大说明密度相差越大,那么有理由认为该对象是异常对象;如果对象点p的密度近似等于其邻域内对象点NK(p)的密度,则局部异常因子接近1,说明p可能与邻域属于同一簇;如果局部异常因子小于1,则是因为p的密度大于邻域NK(p)对象密度,说明p是密集点。
公式(4)提取局部异常因子特征,LOF值从局部数据角度描述了用户的异常程度,具有较高LOF值的对象被认为是异常用电对象。
步骤2.3.3,对步骤2.2归一化后得到的特征值计算基于相似用户用电负荷的相关性度量特征。
基于相似用户用电负荷的相关性度量特征的计算如下:
Figure BDA0003127446710000102
其中,x代表某一用户的用电负荷,xmean表示该用户所在台区所有用户的平均用电负荷,cov(x,xmean)表示x和xmean的协方差,σX
Figure BDA0003127446710000103
分别表示x和xmean的标准差,similar_r是x和xmean的皮尔逊相关系数(Pearson correlation coefficient)。
计算用户与其相似用户用电负荷之间的皮尔逊相关系数,相似用户定义为同一个台区下的所有用户,地理位置相近的用户极有可能用电负荷模式也相同。台区是一个电力***中的名词,可通俗的理解为我们所说的小区,台区电表的拓扑结构是一个汇总的电表下连接着多个分表。台区中的一个用户与同一台区下其他用户的平均负荷模式的线性相关程度可作为衡量该用户是否用电异常的一个指标。
该特征从地域空间角度描述了用户的异常程度,当某用户与同台区下的大部分用户用电负荷模式不一致时,则认为该用户可能为异常用电用户。
步骤2.3.4,对步骤2.2归一化后得到的特征值计算基于最相关用户的相关性变化率度量特征。
基于最相关用户的相关性变化率度量特征的计算如下:
Figure BDA0003127446710000111
其中,将给定时间段内的数据根据日期平均划分为前后两半段Dl和D2。D1用于找出每个用户的与其相关性系数最大的用户,rij,i,j∈[0,M-l],代表用户i与用户j相关性系数最大,且它们之间的相关性系数是Dl_rij。D2用于计算每个用户与最相关用户j的相关性系数D2_rij,然后使用Dl_rij到D2_rij的増长率或者减少率作为该用户异常程度的一个特征change_rate。
该特征从时间序列角度描述了用户的异常程度,当某一用户的用电负荷模式与刚开始最相关用户的用电负荷模式发生较大不一致时,则认为该用户可能为异常用电用户。
步骤2.3.5,将步骤2.3.1至2.3.4得到的特征整合,形成四维复合特征。
本发明采用基于多维复合特征的逻辑回归模型作为异常用电识别的最终模型。逻辑回归模型是一种广义的线性回归分析模型,它可以根据单个或多个自变量对二分类因变量进行分类和预测。本发明将抽取的用户四维复合特征作为自变量,是否用电异常作为因变量构建逻辑回归二分类模型。
步骤3,利用步骤2中得到的四维复合特征训练深度神经网络模型。
具体的,步骤3进一步包括:
步骤3.1,首先对步骤2中得到的四维复合特征利用对抗神经网络进行数据增广。
使用对抗神经网络,对步骤2得到的四维复合特征进行数据增广,以扩充样本数量,增加样本泛化性,最终得到低压异常用电的数据。并且可以对已有同类型不同品牌电器进行特征差异对比,提取特征差异,作为随机噪音,提高伪造数据的真实性。
首先产生一组随机噪声,让其经过对抗神经网络里的生成器,生成数据,将该数据和真实数据同时输入判别器,让判别器产生判别结果并优化对抗数据模型。
通过数据增广提升数据集中的数据量,能防止网络学习到不相关的特征,更多的学到更数据有关的性能,显著的提升整体的性能。
步骤3.2,利用步骤3.1中增广后的特征训练深度神经网络。
根据步骤3.1中得到的低压异常用电的数据,进行深度神经网络模型的训练工作,输出神经网络模型。
需要说明的是,在一些实施例中,也可以不对四维复合特征进行增广,直接训练深度神经网络。
步骤4,利用训练好的深度神经网络进行识别,得到低压居民异常用电用户。
如果未进行数据增广,则识别针对四维复合特征进行,如进行了数据增广,则针对对四维复合特征增广后的数据进行。
以上描述了本发明低压居民用户异常用电识别的方法。
本发明的方法首先从待识别的低压居民用户的用电负荷数据中提取多模态特征,然后对多模态特征提取并构造四维复合特征,接着利用得到的四维复合特征训练深度神经网络,最后用训练好的神经网络进行识别,得到低压居民异常用电用户。
低压居民用户异常用电识别的方法还可以对算法和模型进行验证和评估,输入和训练数据集不同的一组用电负荷数据,采用待验证的算法和模型对其进行验证工作,输出识别结果,对深度神经网络模型的识别结果进行评估,并产生分析报告。
本发明的低压居民用户异常用电识别的方法还可以对数据进行模拟和仿真。模拟异常用电数据是针对训练数据的步骤,而且是一个非必需步骤。当训练数据集中不存在异常用例,而又要为该小区建立模型时,就需要对训练数据采用模拟异常用电的步骤来模拟出异常用户用于模型训练,这一般适用于新的小区,或者数据量不多的小区。当模型训练好了以后就不用模拟异常用电了,因为模型要做的就是识别出异常的用户。但是,在上线之前要验证模型的有效性,却又没有异常数据的情况下,也需要使用模拟异常用电。在模拟时,用户可以配置数据集中需要模拟异常用电的比例,比如比例是10%,那么100个用户中就有10个会被模拟成异常用户,然后用户可以配置模拟异常用电开始的时间点以及配置异常用电的频率和程度。异常用电频率是指每隔几天有一次窃电行为,而异常用电的程度,则是指窃电的程度,比如配置0.5至0.8,那么***会在这个区间生成一个随机值P,然后将用户这次的用电量减去原有电量的P,即剩余(1-P)*原用电量。
在使用本发明的低压居民用户异常用电仿真模拟***及其方法进行仿真识别时,用户可以随时更新***,补充并管理新的算法模型和数据。
本发明的有益效果在于,与现有技术相比:
(1)本发明建立了一套低压居民用户异常用电识别仿真模拟***,利用该平台,可以实现异常用电数据的快速仿真分析和异常用电识别算法的验证,为低压居民用户用电数据分析及其异常用电行为识别算法的推广应用提供实验验证平台,方便快捷高效,有利于数据分析和识别算法的推广应用,解决理论研究与推广应用的衔接问题;
(2)本发明的低压居民用户异常用电识别仿真模拟***能够实现用电数据的模拟、外部数据的导入、数据的管理、算法模型的管理、算法的执行和验证、数据的多维分析以及可视化展现,功能完善,对用户友好,便于操作,扩展性好,十分灵活;
(3)本发明的低压居民用户异常用电识别仿真模拟***支持多种人工智能算法的执行环境,包括Python、C/C++等;能够自动识别算法模型,自动调度到相应的运行环境上,自适应能力强;
(4)本发明能够有效帮助用户克服异常用电案例数据稀少的困难,对数据进行扩充,能够更为准确地掌握低压居民异常用电行为特征,快速定位异常用电用户,为现场异常用电稽查提供技术支撑,提高异常用电现场核查效率。
本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施示例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。

Claims (18)

1.一种低压居民用户异常用电识别的方法,其特征在于,该方法包括以下步骤:
步骤1,提交待识别的低压居民用户的用电负荷数据,从中提取多模态特征;
步骤2,针对步骤1得到的多模态特征,提取并构造四维复合特征;
步骤3,利用步骤2中得到的四维复合特征训练深度神经网络;
步骤4,利用训练好的深度神经网络对四维复合特征进行识别,得到低压居民异常用电用户。
2.如权利要求1所述的低压居民用户异常用电识别的方法,其特征在于,
步骤1进一步包括:
步骤1.1,对提交的低压居民用户的用电负荷数据进行预处理;
步骤1.2,从预处理后的数据中提取多模态特征。
3.如权利要求2所述的低压居民用户异常用电识别的方法,其特征在于,
所述预处理包括乘以电表的综合倍率还原实际电量数据、删除不合理数据以及缺失值填补中的一项或多项。
4.如权利要求2所述的低压居民用户异常用电识别的方法,其特征在于,
所述多模态特征包括有功增量类型、运行时间、冲击电流类型、负荷范围、以及无功阈值中的一项或多项。
5.如权利要求1所述的低压居民用户异常用电识别的方法,其特征在于,
步骤2进一步包括:
步骤2.1,对步骤1得到的多模态特征进行数据降维;
步骤2.2,对步骤2.1得到的降维数据进行归一化处理;
步骤2.3,对步骤2.2得到的归一化后的特征值进行四维复合特征构造。
6.如权利要求5所述的低压居民用户异常用电识别的方法,其特征在于,
步骤2.1中的数据降维是指
lowDataM×N=ZM×KAK×N
其中,Z为原始M行K列的数据集,A为K行N列的特征变化矩阵,lowData为降维后的M行N列的数据;M代表用户数,K代表月特征数据的维度数量,N即为需要降到的维数。
7.如权利要求5所述的低压居民用户异常用电识别的方法,其特征在于,
步骤2.2中的归一化是指
Figure FDA0003127446700000021
其中,L代表降维后当前维度的原始值,min(L)代表当前维度所有值中的最小值,max(L)代表当前维度所有值中的最大值,NL即为归一化后的特征值。
8.如权利要求7所述的低压居民用户异常用电识别的方法,其特征在于,
归一化仅针对用户的月特征数据进行。
9.如权利要求5所述的低压居民用户异常用电识别的方法,其特征在于,
步骤2.3进一步包括:
步骤2.3.1,对步骤2.2归一化后得到的特征值计算二元分类特征;
步骤2.3.2,对步骤2.2归一化后得到的特征值计算LOF特征;
步骤2.3.3,对步骤2.2归一化后得到的特征值计算基于相似用户用电负荷的相关性度量特征;
步骤2.3.4,对步骤2.2归一化后得到的特征值计算基于最相关用户的相关性变化率度量特征;
步骤2.3.5,将步骤2.3.1至2.3.4得到的特征整合,形成四维复合特征。
10.如权利要求9所述的低压居民用户异常用电识别的方法,其特征在于,
步骤2.3.1中,二元分类特征的计算为:
Figure FDA0003127446700000022
其中,f是x的函数f(x);Af+B代表支持向量机;Pr(y=1|x)是预测函数,表示取类别为1的概率;PA,B(f)通过一个sigmoid函数将SVM的输出值映射到[0,1]之间。
11.如权利要求9所述的低压居民用户异常用电识别的方法,其特征在于,
步骤2.3.2中,LOF特征的计算为:
Figure FDA0003127446700000023
其中,点p的局部离群因子LOFk(p)表示为点p的邻域点NK(p)的局部可达密度lrdk(o)与点p的局部可达密度lrdk(p)之比的平均数,o属于点p的邻域点NK(p)。
12.如权利要求9所述的低压居民用户异常用电识别的方法,其特征在于,
步骤2.3.3中,基于相似用户用电负荷的相关性度量特征的计算为:
similar_r=cov(x,xmean)/σXσXmean
其中,x代表某一用户的用电负荷,xmean表示该用户所在台区所有用户的平均用电负荷,cov(x,xmean)表示x和xmean的协方差,σX和σXmean分别表示x和xmean的标准差。
13.如权利要求9所述的低压居民用户异常用电识别的方法,其特征在于,
步骤2.3.4中,基于最相关用户的相关性变化率度量特征的计算为:
Figure FDA0003127446700000031
其中,将给定时间段内的数据根据日期平均划分为前后两半段Dl和D2;D1用于找出每个用户的与其相关性系数最大的用户,rij,i,j∈[0,M-l],代表用户i与用户j相关性系数最大,且它们之间的相关性系数是Dl_rij;D2用于计算每个用户与最相关用户j的相关性系数D2_rij,使用Dl_rij到D2_rij的増长率或者减少率作为该用户异常程度的一个特征change_rate。
14.如权利要求1所述的低压居民用户异常用电识别的方法,其特征在于,
步骤3进一步包括:
步骤3.1,对步骤2中得到的四维复合特征利用对抗神经网络进行数据增广;
步骤3.2,用步骤3.1中增广后的特征训练深度神经网络;
步骤4中针对增广后的特征进行识别。
15.一种采用如权利要求1-14中任一项所述的低压居民用户异常用电识别的方法的低压居民用户异常用电识别仿真模拟***,其特征在于,
该仿真模拟***包括:低压用电数据库、分类算法库、用户用电行为识别模型库;数据仿真模块、数据管理模块;算法验证任务配置管理模块、算法模型管理模块、算法模型调度模块;以及人机交互模块。
16.如权利要求15所述的低压居民用户异常用电识别仿真模拟***,其特征在于,
低压用电数据库存储有低压居民用户的用电数据;
分类算法库存储有不同的算法,用于训练用户用电数据中提取的特征数据;
用户用电行为识别模型库存储有不同的模型,用于识别和分析低压用户异常用电。
17.如权利要求15所述的低压居民用户异常用电识别仿真模拟***,其特征在于,
所述用户用电行为识别模型库包括低压居民用户用电特性与行为模型、低压居民用户异常用电模型、低压异常用电数据仿真模型、面向低压用电数据的深度神经网络模型、异构信息与低压用电行为的关联分析模型、以及异构信息融合的低压居民用户异常用电识别模型。
18.如权利要求15所述的低压居民用户异常用电识别仿真模拟***,其特征在于,
数据仿真模块用于支持用户进行数据仿真操作;
数据管理模块用于管理模型和训练数据以及整个***的用户信息;
算法验证任务配置管理模块用于选择模型进行异常用电识别;
算法模型管理模块用于对算法模型进行管理;
算法模型调度模块用于调度算法和模型;
人机交互模块用于用户和***的交互。
CN202110694347.0A 2021-06-22 2021-06-22 低压居民用户异常用电识别方法及仿真模拟*** Pending CN113435494A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110694347.0A CN113435494A (zh) 2021-06-22 2021-06-22 低压居民用户异常用电识别方法及仿真模拟***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110694347.0A CN113435494A (zh) 2021-06-22 2021-06-22 低压居民用户异常用电识别方法及仿真模拟***

Publications (1)

Publication Number Publication Date
CN113435494A true CN113435494A (zh) 2021-09-24

Family

ID=77757198

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110694347.0A Pending CN113435494A (zh) 2021-06-22 2021-06-22 低压居民用户异常用电识别方法及仿真模拟***

Country Status (1)

Country Link
CN (1) CN113435494A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115564577A (zh) * 2022-12-02 2023-01-03 成都新希望金融信息有限公司 一种异常用户识别方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106373025A (zh) * 2016-08-22 2017-02-01 重庆邮电大学 基于离群点检测的用电信息采集***实时防窃电监测方法
CN108416693A (zh) * 2018-02-01 2018-08-17 东华大学 一种基于模糊神经网络的用电异常行为识别方法
CN109190950A (zh) * 2018-08-21 2019-01-11 国网湖北省电力有限公司鄂州供电公司 一种电表和水表档案贯通的用能异常识别方法
CN111177208A (zh) * 2019-10-18 2020-05-19 姚长征 基于大数据分析的用电异常检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106373025A (zh) * 2016-08-22 2017-02-01 重庆邮电大学 基于离群点检测的用电信息采集***实时防窃电监测方法
CN108416693A (zh) * 2018-02-01 2018-08-17 东华大学 一种基于模糊神经网络的用电异常行为识别方法
CN109190950A (zh) * 2018-08-21 2019-01-11 国网湖北省电力有限公司鄂州供电公司 一种电表和水表档案贯通的用能异常识别方法
CN111177208A (zh) * 2019-10-18 2020-05-19 姚长征 基于大数据分析的用电异常检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
熊秋: "居民用电异常识别***的研究实现", 《硕士电子期刊;工程科技Ⅱ辑;信息科技》, pages 13 - 46 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115564577A (zh) * 2022-12-02 2023-01-03 成都新希望金融信息有限公司 一种异常用户识别方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN110097297B (zh) 一种多维度窃电态势智能感知方法、***、设备及介质
CN113962364B (zh) 一种基于深度学习的多因素用电负荷预测方法
Kang et al. Big data analytics in China's electric power industry: modern information, communication technologies, and millions of smart meters
CN111738462B (zh) 电力计量装置故障抢修主动服务预警方法
CN113267692A (zh) 一种低压台区线损智能诊断分析方法和***
Bian et al. Abnormal detection of electricity consumption of user based on particle swarm optimization and long short term memory with the attention mechanism
CN112257784A (zh) 一种基于梯度提升决策树的窃电检测方法
CN111143835B (zh) 基于机器学习的电力计量***业务逻辑非侵入式防护方法
CN115375205A (zh) 一种用水用户画像的确定方法、装置及设备
CN115617784A (zh) 一种信息化配电的数据处理***及其处理方法
CN117155771B (zh) 一种基于工业物联网的设备集群故障溯源方法及装置
CN113435494A (zh) 低压居民用户异常用电识别方法及仿真模拟***
CN117331017A (zh) 一种三相四线电能表错接线研判方法及***
CN112508278A (zh) 一种基于证据回归多模型的多联供***负荷预测方法
CN115905319B (zh) 一种海量用户电费异常的自动识别方法及***
Aquize et al. Self-organizing maps for anomaly detection in fuel consumption. Case study: Illegal fuel storage in Bolivia
CN114676931B (zh) 一种基于数据中台技术的电量预测***
CN115147242A (zh) 一种基于数据挖掘的电网数据管理***
CN114154617A (zh) 一种基于vfl的低压居民用户异常用电识别方法及***
CN115130924A (zh) 一种源网荷储背景下微电网电力设备资产评估方法及***
CN113935819A (zh) 核算异常特征提取方法
CN115598459A (zh) 一种配电网10kV馈线故障停电预测方法
CN112884000A (zh) 一种基于数据挖掘的用电检查智能诊断方法及诊断***
Lu et al. Time series power anomaly detection based on Light Gradient Boosting Machine
Wang et al. A Novel Ensemble Model for Load Forecasting: Integrating Random Forest, XGBoost, and Seasonal Naive Methods

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination