CN112101635A - 一种用电异常的监测方法和*** - Google Patents
一种用电异常的监测方法和*** Download PDFInfo
- Publication number
- CN112101635A CN112101635A CN202010863258.XA CN202010863258A CN112101635A CN 112101635 A CN112101635 A CN 112101635A CN 202010863258 A CN202010863258 A CN 202010863258A CN 112101635 A CN112101635 A CN 112101635A
- Authority
- CN
- China
- Prior art keywords
- data
- user
- electricity consumption
- electricity
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 223
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000012544 monitoring process Methods 0.000 title claims abstract description 39
- 230000002159 abnormal effect Effects 0.000 claims abstract description 48
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 28
- 238000012795 verification Methods 0.000 claims abstract description 26
- 238000012549 training Methods 0.000 claims abstract description 24
- 238000001914 filtration Methods 0.000 claims abstract description 13
- 238000012706 support-vector machine Methods 0.000 claims abstract description 11
- 238000013528 artificial neural network Methods 0.000 claims abstract description 7
- 238000007637 random forest analysis Methods 0.000 claims abstract description 7
- 238000010219 correlation analysis Methods 0.000 claims description 20
- 230000005856 abnormality Effects 0.000 claims description 9
- 238000013075 data extraction Methods 0.000 claims description 3
- 238000013461 design Methods 0.000 abstract description 2
- 238000004458 analytical method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000006399 behavior Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 238000012550 audit Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Operations Research (AREA)
- Computational Linguistics (AREA)
- Development Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出了一种用电异常的监测方法和***;所述用电异常的监测方法包括以下步骤:步骤S1、获取用户的用电数据;建立用电画像模型;步骤S2、根据用电画像模型判断用户的用电数据是否异常;步骤S1包括以下步骤:获取用户的原始用电数据,将原始用电数据中的噪声数据过滤掉,从而得到过滤后数据;分别从过滤后数据中抽取数据,从而构成训练集数据和验证集数据;基于训练集数据利用Bagging算法、随机森林算法、人工神经网络算法以及支持向量机算法生成初始模型;采用验证集数据验证初始模型,判断验证集数据是否偏离初始模型,若否,则将初始模型确定为用电画像模型。本发明的用电异常的监测方法和***设计新颖,实用性强。
Description
技术领域
本发明涉及电力行业信息化领域,尤其涉及一种用电异常的监测方法和***。
背景技术
传统的电能表异常数据侦测主要是采用了漏斗法,即是以线损异常的数据为出发点,进行层层排除,如对变压器、线损量大于一定范围的数据进行过滤,然后人工检查数据,进行判断;或者对月线损率>10%或<-10%的数据进行过滤,然后对过滤的数据进行人工筛查,确认数据的正确性,或者采用其他的指标进行筛选后进行排查确定。
这种以线损异常的数据为出发点,进行层层排除的方法,容易遗漏比较隐蔽或长期以来一直偷电的行为。并且分析工作环节多,人工稽核工作量非常大,效率不高。容易遗漏比较隐蔽或长期以来一直偷电的行为。
随着大数据技术的发展和普及,企业迫切的需要一种能够快速分析和识别偷漏电的的方法和***来满足实际业务的需要。
发明内容
本发明的目的是针对上述技术问题,提出一种用电异常的监测方法和***。
本发明解决其技术问题的技术方案是:
本发明提出了一种用电异常的监测方法,包括以下步骤:
步骤S1、获取用户的用电数据;建立用电画像模型;
步骤S2、根据用电画像模型判断用户的用电数据是否异常;
其中,步骤S1包括以下步骤:
步骤S11、获取用户的原始用电数据,将原始用电数据中的噪声数据过滤掉,从而得到过滤后数据;
步骤S12、分别从过滤后数据中抽取数据,从而构成训练集数据和验证集数据;
步骤S13、基于训练集数据利用Bagging算法、随机森林算法、人工神经网络算法以及支持向量机算法生成初始模型;
步骤S14、采用验证集数据验证初始模型,判断验证集数据是否偏离初始模型,若否,则将初始模型确定为用电画像模型;若是,则调整训练集数据,再进入步骤S13。
本发明上述的用电异常的监测方法中,利用用户的历史用电数据作为原始用电数据,以此建立用户的用电画像模型;
步骤S2包括:
步骤S21、获取用户在一具体时间时的实际用电量;
步骤S22、计算在该具体时间时用户的实际用电量与通过其用电画像模型预测的预测用电量之间的偏差率;
步骤S23、判断计算得到的偏差率是否大于预设阈值,若是,则判断用户在该具体时间时的实际用电量为异常数据。
本发明上述的用电异常的监测方法中,分别利用用户及其同行业单位的历史用电数据作为原始用电数据,以此分别建立用户和其同行业单位的用电画像模型;
步骤S2包括:通过判断用户和其同行业单位的用电画像模型在趋势上是否一致来判断用户的历史用电数据是否异常。
本发明上述的用电异常的监测方法中,步骤S1还包括:对用户及其同行业单位的历史用电数据进行相关性分析,从而得到用户及其同行业单位的历史用电数据之间的相关系数,并以此作为原始用电数据建立用户所在行业的用电画像模型;
步骤S2还包括:根据用户所在行业的用电画像模型判断用户的历史用电数据是否异常。
本发明上述的用电异常的监测方法中,步骤S1还包括:将用户及其同行业单位的历史用电数据分别与气象数据进行相关性分析,从而得到用户的历史用电数据与气象数据的相关系数、用户同行业单位的历史用电数据与气象数据的相关系数;
步骤S2还包括:通过判断用户的历史用电数据与气象数据的相关系数以及用户同行业单位的历史用电数据与气象数据的相关系数是否一致判断用户的历史用电数据是否异常。
本发明还提出了一种用电异常的监测***,包括:
数据获取模块,用于获取用户的用电数据;
模型建立模块,用于建立用电画像模型;
判断模块,用于根据用电画像模型判断用户的用电数据是否异常;
其中,数据获取模块包括:
原始用电数据获取模块,用于获取用户的原始用电数据;
过滤模块,用于将原始用电数据中的噪声数据过滤掉,从而得到过滤后数据;
模型建立模块包括:
数据抽取模块,用于分别从过滤后数据中抽取数据,从而构成训练集数据和验证集数据;
初始模型生成模块,用于基于训练集数据利用Bagging算法、随机森林算法、人工神经网络算法以及支持向量机算法生成初始模型;
验证模块,用于采用验证集数据验证初始模型,判断验证集数据是否偏离初始模型,若否,则将初始模型确定为用电画像模型;若是,则调整训练集数据,并发送给初始模型生成模块以此重新生成初始模型。
本发明上述的用电异常的监测***中,模型建立模块,还用于利用用户的历史用电数据作为原始用电数据,以此建立用户的用电画像模型;
原始用电数据获取模块,用于获取用户在一具体时间时的实际用电量;
判断模块,用于计算在该具体时间时用户的实际用电量与通过其用电画像模型预测的预测用电量之间的偏差率;并判断计算得到的偏差率是否大于预设阈值,若是,则判断用户在该具体时间时的实际用电量为异常数据。
本发明上述的用电异常的监测***中,模型建立模块,还用于分别利用用户及其同行业单位的历史用电数据作为原始用电数据,以此分别建立用户和其同行业单位的用电画像模型;
判断模块,用于通过判断用户和其同行业单位的用电画像模型在趋势上是否一致来判断用户的历史用电数据是否异常。
本发明上述的用电异常的监测***中,模型建立模块,还包括:
相关性分析模块,用于对用户及其同行业单位的历史用电数据进行相关性分析,从而得到用户及其同行业单位的历史用电数据之间的相关系数,并以此作为原始用电数据建立用户所在行业的用电画像模型;
判断模块,用于根据用户所在行业的用电画像模型判断用户的历史用电数据是否异常。
本发明上述的用电异常的监测***中,关性分析模块,用于将用户及其同行业单位的历史用电数据分别与气象数据进行相关性分析,从而得到用户的历史用电数据与气象数据的相关系数、用户同行业单位的历史用电数据与气象数据的相关系数;
判断模块,用于通过判断用户的历史用电数据与气象数据的相关系数以及用户同行业单位的历史用电数据与气象数据的相关系数是否一致判断用户的历史用电数据是否异常。
本发明的用电异常的监测方法和***实现了如下有效效果:1)利用机器学习模型和电脑强大的计算能力,每月对单块电表的用电模型进行一次训练以及预测,发现异常,这在手工时代是无法做到的。2)探索新的业务模式,在抄表前,可以将各块电表预测数据推送到抄表员的手持设备上,如果所抄得数据与预测数据有较大差距,可以当场观察和走访用户的用电情况。3)本发明将天气信息与用电信息进行了关联分析,并建立了分析模型,有助于精确的对用电异常进行了判断。本发明的用电异常的监测方法和***设计新颖,实用性强。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1示出了本发明优选实施例的用电异常的监测方法的步骤S1的流程图;
图2示出了北某医院用户经过过滤、转换步骤处理后的用电数据的趋势图;
图3示出了北某医院的用电量与时间、气候数据之间的相关系数的椭圆图示图;
图4示出了与北某医院的用电数据有关的因素的示意图;
图5示出了居民用户历史用电量信息的抄表年份与其用电画像模型的预测准确率的关系的示意图;
图6示出了居民用户历史用电量信息的抄表月份与其用电画像模型的预测准确率的关系的示意图;
图7示出了根据不同地区的四个休闲中心的历史电量数据之间的相关系数所建立的行业画像的示意图;
图8示出了滨XX休闲中心的用电画像模型的趋势图;
图9示出了皇XX休闲中心的用电画像模型的趋势图;
图10示出了丽XX休闲中心的用电画像模型的趋势图;
图11示出了金XX休闲中心的用电画像模型的趋势图;
图12示出了本发明优选实施例的用电异常的监测***的功能模块示意图。
具体实施方式
本发明所要解决的技术问题是:传统的电能表异常数据侦测方法容易遗漏比较隐蔽或长期以来一直偷电的行为。并且分析工作环节多,人工稽核工作量非常大,效率不高。容易遗漏比较隐蔽或长期以来一直偷电的行为。本发明就该技术问题所提出的技术思路是:构造一种用电异常的监测方法和***,利用大数据进行分析,根据不同用户的特点,建立对应的用电模型,然后利用用电模型分析用户的用电行为,快速发现异常的用电数据,来实现快速有效甄别偷漏电的情形。
为了使本发明的技术目的、技术方案以及技术效果更为清楚,以便于本领域技术人员理解和实施本发明,下面将结合附图及具体实施例对本发明做进一步详细的说明。
本发明提出了一种用电异常的监测方法,包括以下步骤:
步骤S1、获取用户的用电数据;建立用电画像模型;
步骤S2、根据用电画像模型判断用户的用电数据是否异常;
其中,如图1所示,图1示出了本发明优选实施例的用电异常的监测方法的步骤S1的流程图。具体地,步骤S1包括以下步骤:
步骤S11、获取原始用电数据,将原始用电数据中的噪声数据过滤掉,从而得到过滤后数据;
步骤S12、分别从过滤后数据中抽取数据,从而构成训练集数据和验证集数据;
步骤S13、基于训练集数据利用Bagging算法、随机森林算法、人工神经网络算法以及支持向量机算法生成初始模型;
步骤S14、采用验证集数据验证初始模型,判断验证集数据是否偏离初始模型,若否,则将初始模型确定为用电画像模型;若是,则调整训练集数据,再进入步骤S13。
进一步地,本发明的用电异常的监测方法可以采用预测偏差法或者离群法实现。具体来说,预测偏差法,是利用用户的历史用电数据作为原始用电数据,以此建立用户的用电画像模型;这样,运用用户的用电画像模型便可以预测用户在具体时间时的用电量。具体地,步骤S2包括:
步骤S21、获取用户在一具体时间时的实际用电量;
步骤S22、计算在该具体时间时用户的实际用电量与通过其用电画像模型预测的预测用电量之间的偏差率;
步骤S23、判断计算得到的偏差率是否大于预设阈值(例如30%),若是,则判断用户在该具体时间时的实际用电量为异常数据。
预测偏差法适用于上线后,检测用户窃电。
离群法,是分别利用用户及其同行业单位的历史用电数据作为原始用电数据,以此分别建立用户和其同行业单位的用电画像模型;然后,通过判断用户和其同行业单位的用电画像模型在趋势上是否一致来判断用户的历史用电数据是否异常。离群法更适用于上线前就已经存在的窃电行为,也有助于发现上线后的窃电行为。
进一步地,在离群法中,可以对用户及其同行业单位的历史用电数据进行相关性分析,从而得到用户及其同行业单位的历史用电数据之间的相关系数,并以此作为原始用电数据建立用户所在行业的用电画像模型;
然后,根据用户所在行业的用电画像模型判断用户的历史用电数据是否异常。
还可以将用户及其同行业单位的历史用电数据分别与气象数据进行相关性分析,从而得到用户的历史用电数据与气象数据的相关系数、用户同行业单位的历史用电数据与气象数据的相关系数;
然后,通过判断用户的历史用电数据与气象数据的相关系数以及用户同行业单位的历史用电数据与气象数据的相关系数是否一致判断用户的历史用电数据是否异常。
可以理解,通过预测偏差法和离群法,可以采用数据挖掘的方法,从建立通用用电模型出发,分别建立行业模型,如:工薪家庭用电模型、重工业用电模型、中小学校用电模型、大型超市用电模型,在此基础上,进一步建立和完善个体用户模型,如A电表模型、B电表模型、C电表模型,通过大数据分析方法,快速发现异常的用电数据,从而锁定偷漏电的用户。
为了便于理解,下面列举具体例子,对用电画像模型的建立方法及其通用性、预测偏差法和离群法进行阐述。
用电画像模型
本实施例选择北某医院用户经过过滤、转换步骤处理后的用电数据作为研究对象。将该经过过滤、转换步骤处理后的用电数据制作趋势图,如图2所示。从趋势图容易看出,北某医院的用电情况随季节变化而波动,每年存在一定的规律。用时间序列分析建立预测模型,具体方法为:将用电数据导入***,用时间序列分析ARIMA(4,0,0)对北某医院的历史数据,从而构建时序模型。利用时序模型对北某医院2020年上半年的用电情况进行预测,并与实际用电量对比,如下表所示:
抄表月份 | 实际用电量 | 预测用电量 | 偏差率 |
2020/1 | 1034498 | 1013359 | 2% |
2020/2 | 1049570 | 859896.8 | 18% |
2020/3 | 923871 | 731876.2 | 21% |
2020/4 | 1262611 | 693576.7 | 45% |
2020/5 | 1274319 | 812037.4 | 36% |
2020/6 | 1753360 | 957515.3 | 45% |
偏差率随着月份逐渐增大,说明用电量除了受时间规律影响后,还与其他因素有关。经过大量资料的收集研究,发现用电情况与气候因素有关,对北某医院用电量与气象数据进行相关性分析,可以得到北某医院的用电量与时间、气候数据之间的相关系数,如下表所示:
对相关系数进行可视化,具体用椭圆图示法展示各变量间相关系数,如图3所示:椭圆越扁,说明相关性越强。向右斜的椭圆代表正相关,其颜色越深,代表正相关性越强;向左斜的椭圆代表负相关,其颜色越深,代表负相关性越强。
根据图3,确定与北某医院的用电数据有关的因素,包括抄表年份、抄表月份、降水量、气温、湿度、蒸发量、日照时数、平均风速、用电天数,如图4所示。然后,用北某医院的历史用电量和气候信息,建立各种回归模型,通过各种模型的标准化均方误差(MSE)来选择最优模型。从各模型MSE值对比得知,支持向量机建立模型的MSE(均方误差)最小,由此,支持向量机建立的模型为最优模型,并确认为北某医院的用电画像模型。
利用201X年上半年的气候信息对北某医院进行用电量预测,并将预测结果与实际用电量对比:
在对201X年上半年的预测对比结果来看,有4个月的预测结果有较高的精准度,但201X年2月份的预测偏差率达到15%。
用电画像模型的通用性
整理某北地区的居民用户的历史用电量信息,然后用支持向量机建立用电画像模型,并进行预测,检验用电画像模型的通用性。其中,选取604个居民用户的历史用电量信息进入研究,分别统计对居民用户历史用电量信息的抄表年份、抄表月份与其用电画像模型的预测准确率的关系,如图5和6所示。可以发现,机器学习所得的通用画像准确性非常高:1)每年大约有91%居民用户的数据达到90%以上的准确率;2)2月和4月份的预测准确率相对较低,高于90%的准确率大概占总居民用户的数据的84%左右;3)8月和10月份的预测准确率较理想,有97%居民用户的数据高于90%准确率。
预测偏差法
整理2019年2月前的XX休闲中心用电量数据和气候信息,利用机器学习中的支持向量机建立用电画像模型,并对训练集和验证集进行预测,结果如下表所示:
年份 | 月份 | 实际用电量 | 预测用电量 | 误差率 |
2016 | 5 | 3542 | 3628 | -2% |
2016 | 7 | 6266 | 6180 | 1% |
2016 | 9 | 5805 | 5891 | -1% |
2016 | 11 | 6407 | 6321 | 1% |
2017 | 1 | 6437 | 6351 | 1% |
2017 | 3 | 7471 | 7385 | 1% |
2017 | 5 | 6927 | 6841 | 1% |
2017 | 7 | 6676 | 6590 | 1% |
2017 | 9 | 6852 | 6766 | 1% |
2017 | 11 | 6320 | 6234 | 1% |
2018 | 1 | 5875 | 5961 | -1% |
2018 | 3 | 5895 | 5981 | -1% |
2018 | 5 | 6570 | 6484 | 1% |
2018 | 7 | 6090 | 6176 | -1% |
2018 | 9 | 5673 | 5759 | -2% |
2018 | 11 | 5303 | 5389 | -2% |
2019 | 1 | 5474 | 5560 | -2% |
从误差率来看,训练集(2019年2月前数据)的预测很准,误差率在-2%到1%之间。
利用2019年2月以前训练的模型,对2019年3月份数据进行预测,结果如下表所示:
建立的用电画像模型对2019年3月进行预测,预计用电量是6603,***登记的电量比预测值少了接近6000度,属异常现象,存在偷电、漏电嫌疑。
离群法
用户的用电量一般会随季节和气候的变化而波动。现在选取不同地区的四个休闲中心来对比分析,进一步建立行业画像模型。具体步骤包括:整理这四个休闲中心的历史电量数据,利用相关性分析研究之间的相关性。样本情况及其相关系数如下两表所示:
从上面两表可以看出:
1、丽XX休闲中心与皇XX休闲中心的相关系数是0.62,说明两者之间有很强的正相关;
2、金XX与丽XX、滨XX、皇XX三家休闲中心的相关系数均为负数,说明金XX与其他三个的规律不一致;
3、滨XX与丽XX、皇XX的相关系数小于-0.3,说明滨XX与这两家休闲中心的规律不一致。
根据样本的相关系数可建立行业画像,如图7所示。
另根据四个休闲中心的历史电量数据建立各自的用电画像模型,如图8-图11所示。可以看到,金XX休闲中心与其它三家的用电趋势图明显不同。同时,对四个休闲中心用电量与气象数据进行相关性分析,其结果如下表所示:
由上表可知,金XX休闲中心影响电量的气温、日照等相关性明显低于行业水平,存在异常。
进一步地,如图12所示,图12示出了本发明优选实施例的用电异常的监测***的功能模块示意图。该用电异常的监测***,包括:
数据获取模块100,用于获取用户的用电数据;
模型建立模块200,用于建立用电画像模型;
判断模块300,用于根据用电画像模型判断用户的用电数据是否异常;
其中,数据获取模块100包括:
原始用电数据获取模块110,用于获取用户的原始用电数据;
过滤模块120,用于将原始用电数据中的噪声数据过滤掉,从而得到过滤后数据;
模型建立模块200包括:
数据抽取模块210,用于分别从过滤后数据中抽取数据,从而构成训练集数据和验证集数据;
初始模型生成模块220,用于基于训练集数据利用Bagging算法、随机森林算法、人工神经网络算法以及支持向量机算法生成初始模型;
验证模块230,用于采用验证集数据验证初始模型,判断验证集数据是否偏离初始模型,若否,则将初始模型确定为用电画像模型;若是,则调整训练集数据,并发送给初始模型生成模块220以此重新生成初始模型。
进一步地,模型建立模块200,还用于利用用户的历史用电数据作为原始用电数据,以此建立用户的用电画像模型;
原始用电数据获取模块110,用于获取用户在一具体时间时的实际用电量;
判断模块300,用于计算在该具体时间时用户的实际用电量与通过其用电画像模型预测的预测用电量之间的偏差率;并判断计算得到的偏差率是否大于预设阈值,若是,则判断用户在该具体时间时的实际用电量为异常数据。
进一步地,模型建立模块200,还用于分别利用用户及其同行业单位的历史用电数据作为原始用电数据,以此分别建立用户和其同行业单位的用电画像模型;
判断模块300,用于通过判断用户和其同行业单位的用电画像模型在趋势上是否一致来判断用户的历史用电数据是否异常。
进一步地,模型建立模块200,还包括:
相关性分析模块240,用于对用户及其同行业单位的历史用电数据进行相关性分析,从而得到用户及其同行业单位的历史用电数据之间的相关系数,并以此作为原始用电数据建立用户所在行业的用电画像模型;
判断模块300,用于根据用户所在行业的用电画像模型判断用户的历史用电数据是否异常。
进一步地,相关性分析模块240,用于将用户及其同行业单位的历史用电数据分别与气象数据进行相关性分析,从而得到用户的历史用电数据与气象数据的相关系数、用户同行业单位的历史用电数据与气象数据的相关系数;
判断模块300,用于通过判断用户的历史用电数据与气象数据的相关系数以及用户同行业单位的历史用电数据与气象数据的相关系数是否一致判断用户的历史用电数据是否异常。
本发明的用电异常的监测方法和***实现了如下有效效果:
1)利用机器学习模型和电脑强大的计算能力,每月对单块电表的用电模型进行一次训练以及预测,发现异常,这在手工时代是无法做到的。
2)探索新的业务模式,在抄表前,可以将各块电表预测数据推送到抄表员的手持设备上,如果所抄得数据与预测数据有较大差距,可以当场观察和走访用户的用电情况。
3)本发明将天气信息与用电信息进行了关联分析,并建立了分析模型,有助于精确的对用电异常进行了判断。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。
Claims (10)
1.一种用电异常的监测方法,其特征在于,包括以下步骤:
步骤S1、获取用户的用电数据;建立用电画像模型;
步骤S2、根据用电画像模型判断用户的用电数据是否异常;
其中,步骤S1包括以下步骤:
步骤S11、获取用户的原始用电数据,将原始用电数据中的噪声数据过滤掉,从而得到过滤后数据;
步骤S12、分别从过滤后数据中抽取数据,从而构成训练集数据和验证集数据;
步骤S13、基于训练集数据利用Bagging算法、随机森林算法、人工神经网络算法以及支持向量机算法生成初始模型;
步骤S14、采用验证集数据验证初始模型,判断验证集数据是否偏离初始模型,若否,则将初始模型确定为用电画像模型;若是,则调整训练集数据,再进入步骤S13。
2.根据权利要求1所述的用电异常的监测方法,其特征在于,利用用户的历史用电数据作为原始用电数据,以此建立用户的用电画像模型;
步骤S2包括:
步骤S21、获取用户在一具体时间时的实际用电量;
步骤S22、计算在该具体时间时用户的实际用电量与通过其用电画像模型预测的预测用电量之间的偏差率;
步骤S23、判断计算得到的偏差率是否大于预设阈值,若是,则判断用户在该具体时间时的实际用电量为异常数据。
3.根据权利要求1所述的用电异常的监测方法,其特征在于,分别利用用户及其同行业单位的历史用电数据作为原始用电数据,以此分别建立用户和其同行业单位的用电画像模型;
步骤S2包括:通过判断用户和其同行业单位的用电画像模型在趋势上是否一致来判断用户的历史用电数据是否异常。
4.根据权利要求3所述的用电异常的监测方法,其特征在于,步骤S1还包括:对用户及其同行业单位的历史用电数据进行相关性分析,从而得到用户及其同行业单位的历史用电数据之间的相关系数,并以此作为原始用电数据建立用户所在行业的用电画像模型;
步骤S2还包括:根据用户所在行业的用电画像模型判断用户的历史用电数据是否异常。
5.根据权利要求3所述的用电异常的监测方法,其特征在于,步骤S1还包括:将用户及其同行业单位的历史用电数据分别与气象数据进行相关性分析,从而得到用户的历史用电数据与气象数据的相关系数、用户同行业单位的历史用电数据与气象数据的相关系数;
步骤S2还包括:通过判断用户的历史用电数据与气象数据的相关系数以及用户同行业单位的历史用电数据与气象数据的相关系数是否一致判断用户的历史用电数据是否异常。
6.一种用电异常的监测***,其特征在于,包括:
数据获取模块(100),用于获取用户的用电数据;
模型建立模块(200),用于建立用电画像模型;
判断模块(300),用于根据用电画像模型判断用户的用电数据是否异常;
其中,数据获取模块(100)包括:
原始用电数据获取模块(110),用于获取用户的原始用电数据;
过滤模块(120),用于将原始用电数据中的噪声数据过滤掉,从而得到过滤后数据;
模型建立模块(200)包括:
数据抽取模块(210),用于分别从过滤后数据中抽取数据,从而构成训练集数据和验证集数据;
初始模型生成模块(220),用于基于训练集数据利用Bagging算法、随机森林算法、人工神经网络算法以及支持向量机算法生成初始模型;
验证模块(230),用于采用验证集数据验证初始模型,判断验证集数据是否偏离初始模型,若否,则将初始模型确定为用电画像模型;若是,则调整训练集数据,并发送给初始模型生成模块(220)以此重新生成初始模型。
7.根据权利要求6所述的用电异常的监测***,其特征在于,模型建立模块(200),还用于利用用户的历史用电数据作为原始用电数据,以此建立用户的用电画像模型;
原始用电数据获取模块(110),用于获取用户在一具体时间时的实际用电量;
判断模块(300),用于计算在该具体时间时用户的实际用电量与通过其用电画像模型预测的预测用电量之间的偏差率;并判断计算得到的偏差率是否大于预设阈值,若是,则判断用户在该具体时间时的实际用电量为异常数据。
8.根据权利要求6所述的用电异常的监测***,其特征在于,模型建立模块(200),还用于分别利用用户及其同行业单位的历史用电数据作为原始用电数据,以此分别建立用户和其同行业单位的用电画像模型;
判断模块(300),用于通过判断用户和其同行业单位的用电画像模型在趋势上是否一致来判断用户的历史用电数据是否异常。
9.根据权利要求8所述的用电异常的监测***,其特征在于,模型建立模块(200),还包括:
相关性分析模块(240),用于对用户及其同行业单位的历史用电数据进行相关性分析,从而得到用户及其同行业单位的历史用电数据之间的相关系数,并以此作为原始用电数据建立用户所在行业的用电画像模型;
判断模块(300),用于根据用户所在行业的用电画像模型判断用户的历史用电数据是否异常。
10.根据权利要求8所述的用电异常的监测***,其特征在于,相关性分析模块(240),用于将用户及其同行业单位的历史用电数据分别与气象数据进行相关性分析,从而得到用户的历史用电数据与气象数据的相关系数、用户同行业单位的历史用电数据与气象数据的相关系数;
判断模块(300),用于通过判断用户的历史用电数据与气象数据的相关系数以及用户同行业单位的历史用电数据与气象数据的相关系数是否一致判断用户的历史用电数据是否异常。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010863258.XA CN112101635A (zh) | 2020-08-25 | 2020-08-25 | 一种用电异常的监测方法和*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010863258.XA CN112101635A (zh) | 2020-08-25 | 2020-08-25 | 一种用电异常的监测方法和*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112101635A true CN112101635A (zh) | 2020-12-18 |
Family
ID=73753424
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010863258.XA Pending CN112101635A (zh) | 2020-08-25 | 2020-08-25 | 一种用电异常的监测方法和*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112101635A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112633412A (zh) * | 2021-01-05 | 2021-04-09 | 南方电网深圳数字电网研究院有限公司 | 异常用电检测方法、设备及存储介质 |
CN113223263A (zh) * | 2021-04-25 | 2021-08-06 | 深圳市芯中芯科技有限公司 | 一种基于物联网的电气火灾监测*** |
CN113269478A (zh) * | 2021-07-21 | 2021-08-17 | 武汉中原电子信息有限公司 | 一种基于多模型的集中器异常数据提醒方法及*** |
CN113362118A (zh) * | 2021-07-08 | 2021-09-07 | 广东电网有限责任公司 | 一种基于随机森林的用户用电行为分析方法及*** |
CN113377760A (zh) * | 2021-07-06 | 2021-09-10 | 国网江苏省电力有限公司营销服务中心 | 基于电力数据和多元数据建立低压居民特征画像的方法和*** |
CN113947504A (zh) * | 2021-11-11 | 2022-01-18 | 国网辽宁省电力有限公司营销服务中心 | 一种基于随机森林法的窃电分析方法及其*** |
CN115170003A (zh) * | 2022-09-08 | 2022-10-11 | 国网山东省电力公司兰陵县供电公司 | 窃电监控方法及***、存储介质、终端 |
CN115905319A (zh) * | 2022-11-16 | 2023-04-04 | 国网山东省电力公司营销服务中心(计量中心) | 一种海量用户电费异常的自动识别方法及*** |
CN116662413A (zh) * | 2023-07-25 | 2023-08-29 | 成都千嘉科技股份有限公司 | 基于燃气用量数据拆解画像的工商用户业态变化监控方法 |
CN116709062A (zh) * | 2023-08-07 | 2023-09-05 | 安徽融兆智能有限公司 | 一种具有检测功能的用电信息采集设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103995161A (zh) * | 2014-06-03 | 2014-08-20 | 深圳市康拓普信息技术有限公司 | 一种用于甄别偷漏电用户的方法及*** |
CN105630885A (zh) * | 2015-12-18 | 2016-06-01 | 国网福建省电力有限公司泉州供电公司 | 一种用电异常检测方法及*** |
CN106707099A (zh) * | 2016-11-30 | 2017-05-24 | 国网上海市电力公司 | 基于异常用电检测模型的监测定位方法 |
CN107862347A (zh) * | 2017-12-04 | 2018-03-30 | 国网山东省电力公司济南供电公司 | 一种基于随机森林的窃电行为的发现方法 |
CN109614997A (zh) * | 2018-11-29 | 2019-04-12 | 武汉大学 | 一种基于深度学习的窃电风险预测方法及装置 |
CN110991555A (zh) * | 2019-12-16 | 2020-04-10 | 国网上海市电力公司 | 一种典型行业的用户用电量异常监控方法 |
-
2020
- 2020-08-25 CN CN202010863258.XA patent/CN112101635A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103995161A (zh) * | 2014-06-03 | 2014-08-20 | 深圳市康拓普信息技术有限公司 | 一种用于甄别偷漏电用户的方法及*** |
CN105630885A (zh) * | 2015-12-18 | 2016-06-01 | 国网福建省电力有限公司泉州供电公司 | 一种用电异常检测方法及*** |
CN106707099A (zh) * | 2016-11-30 | 2017-05-24 | 国网上海市电力公司 | 基于异常用电检测模型的监测定位方法 |
CN107862347A (zh) * | 2017-12-04 | 2018-03-30 | 国网山东省电力公司济南供电公司 | 一种基于随机森林的窃电行为的发现方法 |
CN109614997A (zh) * | 2018-11-29 | 2019-04-12 | 武汉大学 | 一种基于深度学习的窃电风险预测方法及装置 |
CN110991555A (zh) * | 2019-12-16 | 2020-04-10 | 国网上海市电力公司 | 一种典型行业的用户用电量异常监控方法 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112633412B (zh) * | 2021-01-05 | 2024-05-14 | 南方电网数字平台科技(广东)有限公司 | 异常用电检测方法、设备及存储介质 |
CN112633412A (zh) * | 2021-01-05 | 2021-04-09 | 南方电网深圳数字电网研究院有限公司 | 异常用电检测方法、设备及存储介质 |
CN113223263A (zh) * | 2021-04-25 | 2021-08-06 | 深圳市芯中芯科技有限公司 | 一种基于物联网的电气火灾监测*** |
CN113377760A (zh) * | 2021-07-06 | 2021-09-10 | 国网江苏省电力有限公司营销服务中心 | 基于电力数据和多元数据建立低压居民特征画像的方法和*** |
CN113362118A (zh) * | 2021-07-08 | 2021-09-07 | 广东电网有限责任公司 | 一种基于随机森林的用户用电行为分析方法及*** |
CN113269478A (zh) * | 2021-07-21 | 2021-08-17 | 武汉中原电子信息有限公司 | 一种基于多模型的集中器异常数据提醒方法及*** |
CN113947504A (zh) * | 2021-11-11 | 2022-01-18 | 国网辽宁省电力有限公司营销服务中心 | 一种基于随机森林法的窃电分析方法及其*** |
CN115170003A (zh) * | 2022-09-08 | 2022-10-11 | 国网山东省电力公司兰陵县供电公司 | 窃电监控方法及***、存储介质、终端 |
CN115905319B (zh) * | 2022-11-16 | 2024-04-19 | 国网山东省电力公司营销服务中心(计量中心) | 一种海量用户电费异常的自动识别方法及*** |
CN115905319A (zh) * | 2022-11-16 | 2023-04-04 | 国网山东省电力公司营销服务中心(计量中心) | 一种海量用户电费异常的自动识别方法及*** |
CN116662413A (zh) * | 2023-07-25 | 2023-08-29 | 成都千嘉科技股份有限公司 | 基于燃气用量数据拆解画像的工商用户业态变化监控方法 |
CN116662413B (zh) * | 2023-07-25 | 2023-10-27 | 成都千嘉科技股份有限公司 | 基于燃气用量数据拆解画像的工商用户业态变化监控方法 |
CN116709062A (zh) * | 2023-08-07 | 2023-09-05 | 安徽融兆智能有限公司 | 一种具有检测功能的用电信息采集设备 |
CN116709062B (zh) * | 2023-08-07 | 2023-10-20 | 安徽融兆智能有限公司 | 一种具有检测功能的用电信息采集设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112101635A (zh) | 一种用电异常的监测方法和*** | |
CN110097297B (zh) | 一种多维度窃电态势智能感知方法、***、设备及介质 | |
CN110634080B (zh) | 异常用电检测方法、装置、设备及计算机可读存储介质 | |
CN107220732B (zh) | 一种基于梯度提升树的停电投诉风险预测方法 | |
CN109583680B (zh) | 一种基于支持向量机的窃电辨识方法 | |
CN111882446B (zh) | 一种基于图卷积网络的异常账户检测方法 | |
Cody et al. | Decision tree learning for fraud detection in consumer energy consumption | |
CN111861786A (zh) | 一种基于特征选择和孤立随机森林的专变窃电识别方法 | |
CN106227640B (zh) | 一种基于自动监测仪器的异常数据检测方法及*** | |
CN110489785A (zh) | 一种大气污染物在线源解析方法及*** | |
CN104281779A (zh) | 一种异常数据判定与处理方法及装置 | |
CN111126820A (zh) | 反窃电方法及*** | |
CN111967717A (zh) | 一种基于信息熵值的数据质量评价方法 | |
CN111506635A (zh) | 一种基于自回归和朴素贝叶斯算法的居民用电行为分析的***及方法 | |
CN112132210A (zh) | 一种基于客户用电行为的窃电概率预警分析方法 | |
CN104657912A (zh) | 基于水电量比和支持向量聚类异常用户检测方法及*** | |
CN116467551B (zh) | 一种基于相关系数的供水管网漏损定位方法及*** | |
CN111612054A (zh) | 一种基于非负矩阵分解和密度聚类的用户窃电行为识别方法 | |
CN115905319B (zh) | 一种海量用户电费异常的自动识别方法及*** | |
CN112465397A (zh) | 一种审计数据的分析方法和装置 | |
CN115423383B (zh) | 基于人工智能的分布式村镇饮用水监测调控***及方法 | |
CN114330440B (zh) | 基于模拟学习判别的分布式电源负荷异常识别方法及*** | |
CN116205528A (zh) | 基于施工场地电力数据的违规施工辨识方法和*** | |
CN115951295A (zh) | 一种日清电量异常的自动识别方法及*** | |
CN114154617A (zh) | 一种基于vfl的低压居民用户异常用电识别方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201218 |
|
RJ01 | Rejection of invention patent application after publication |