CN110675020A - 一种基于大数据的高价低接用户识别方法 - Google Patents

一种基于大数据的高价低接用户识别方法 Download PDF

Info

Publication number
CN110675020A
CN110675020A CN201910764680.7A CN201910764680A CN110675020A CN 110675020 A CN110675020 A CN 110675020A CN 201910764680 A CN201910764680 A CN 201910764680A CN 110675020 A CN110675020 A CN 110675020A
Authority
CN
China
Prior art keywords
price
electricity
model
low
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910764680.7A
Other languages
English (en)
Inventor
段志田
陈莹
邹禹平
贾嘉
董兵
高伟
臧依璨
高嘉伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Tianjin Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Tianjin Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Tianjin Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201910764680.7A priority Critical patent/CN110675020A/zh
Publication of CN110675020A publication Critical patent/CN110675020A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0203Market surveys; Market polls
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0206Price or cost determination based on market factors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Educational Administration (AREA)
  • Public Health (AREA)
  • Biophysics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Water Supply & Treatment (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Primary Health Care (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)

Abstract

本发明公开了一种基于大数据的高价低接用户识别方法,本方法基于业务规章要求、重点工作开展情况、内外部检查发现的问题,梳理业务特征项,形成模型的基础构建;基于提取的模型特征变量,实现用户行业特征与用电特征不匹配、电价执行与政策不符、档案与电费计算的执行情况不一致等高价低接特征分析;基于神经网络分位数回归模型,建立三层感知器神经网络,并采用交叉验证法、AIC准则以及BIC准则等实现对电价执行标准分类。而且,本发明通过大数据有监督学习模型,实现机器学习,找出高价低接判断对象的表象特征与高价低接判断问题的潜在关联模式;通过不断优化监控指标及规则,实现问题对象的全面挖掘,提高疑似问题对象的准确率。

Description

一种基于大数据的高价低接用户识别方法
技术领域
本发明属于技术领域,具体涉及一种基于大数据的高价低接用户识别方法。
背景技术
电价是售电收入的重要因素,是电力企业经营效益的关键。在日常用电检检查和业务办理中发现存在有些用户的用电类别与其行业类别存在差异,如农业、工业、制造业等行业,这种情况直接给公司经营带来损失,因此通过半监督机器学习等方式建立高价低接用户大数据模型,并通过模型训练等方式最终实现对公司高价低接用户的识别,据此结合用电检查等现场核查工作完成现场甄别,从而为公司挽回经济损失。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于大数据的高价低接用户识别方法。本方法针对历史发现的高价低接用户大量的数据进行分析,利用大数据分析工具提取高价低接用户特征,构建高价低接用户识别大数据模型,并通过模型训练完成模型的完善,实现对公司存在高价低接用户的识别。
本发明是通过以下技术方案实现的:
一种基于大数据的高价低接用户识别方法,按照下列步骤进行:
步骤一、模型特征变量提取
基于业务规章要求、重点工作开展情况、内外部检查发现的问题,梳理业务特征项,形成模型的基础构建;
步骤二、高价低接特征分析
1)用户行业特征与用电特征不匹配
用户行业特征与用电特征不匹配主要分析研究电价为农业排灌,每月存在电量、居民电价用户月用电量过大、学校用电特征不符、居民照明用户电价行业分类为非居民、临时用电户执行大工业电价、临时用电户超期、临时用电户销户还有预收、执行大工业、农业、一般工商业电价的行业分类为居民生活、电采暖电价用户冬季用电量偏小、零售行业谷段电量过大、行业为制造业,负载率低于一定值、充电电价用电,但是用电量较高、合同容量小于110kv户名中含酒店、餐饮、宾馆、饭店、冷库、商城、超市的不应执行分时电价、户名含“居委会”没有执行居委会电价、户名含“学校”“幼儿园”没有执行学校电价、户名含“排灌”没有执行排灌电价等特征数据发掘。
2)电价执行与政策不符
分析售电价执行与政策不符,主要从如下政策进行分析,挖掘规律:
①变压器容量在100KVA以下用户,功率因数标准应该为“不考核”;
②变压器容量在100KVA以上的农业户和趸售用户,功率因数标准应该为0.8;
③变压器容量在100KVA以上、160KVA以下的工业及非工业用户,功率因数标准应该为0.85;
④变压器容量在160KVA以上的工业用户,功率因数标准应该为0.9;
⑥功率因数标准执0.9,变压器容量低于160KVA;
⑦合同容量小315KVA,不能执行大工业电价;
⑦执行农业电价,不应执行分时;
⑧需量用户,核定需量小于容量之和40%;
⑨减容期满后的用户以及新装、增容用户,两年内申办减容或暂停的基本电费收取50%。
3)档案与电费计算的执行情况不一致
档案与电费计算的执行情况不一致分析,主要从计量方式为高供低计的用户,未计收变损的情况进行挖掘。
步骤三、模型算法设计
对用电采集数据进行抽取与存储,通过采集数据治理实现数据预处理,包括数据格式管理、数据完整性检查、营销数据格式校验、档案问题管理、电压电流缺失数据管理、重复数据管理、电压电流错误数据管理、换表行为分析、用户电表异常事件分析等。
大数据建模采用深度学习框架TensorFlow搭建,利用GPU设备加速训练。采用K折交叉验证对模型效果进行验证,其中违约用电识别模型采用准确度、召回率、AUC等指标进行效果评估。模型部署后通过离线分析和线上分析同时进行模型评估。离线部分,针对带标签的测试集合,利用AUC指标计算违约用电识别模型的准确性,AUC越大,表示违约用电识别模型越准确。线上实际运行过程中,对接入用户数据进行近实时预测,将超过在建模过程中选择的概率阈值的疑似用户结果提供给业务人员使用,辅助进行违约用电核实,根据核实结果计算违约用电识别模型的查准率,进而评估实际运行过程中的准确性。
用电历史核查记录中各种高价低接等违约用电的标签y=1,其它用户作为负样本y=0。针对公变低压用户和专变用户分别建立高价低接分析模型。对比并选择梯度上升决策树、LSTM神经网络时序模型、SVM等模型,通过模型训练,建立X与y的关联。其中,LSTM模型结构图如下图所示:
每一个时刻,神经网络模型的输入包含当前时刻的多维特征X,通过各隐藏层的变换,得到当前时刻t的n个状态节点St=<S1,S2,S3,…,Sn>。在此DNN网络基础上,结合时序长短期记忆模型(Long Short-Term Memory,LSTM),时刻t的输出为当前时刻状态St和前一时刻状态St-1的函数Ot=f(St+W*St-1)。LSTM能够同时建模客户长期和短期数据中依赖关系,并随着时间发展迭代训练、预测。模型最终输出违约用电的概率Pi=1/(1+e-Ot)。
违约用电识别模型根据人工核实结果,反馈到模型的训练过程中,形成数据优化闭环,持续优化模型效果。考虑到不同地区的样本数据千差万别,在优化过程中对特定地区的用户特性相应建模方法单独进行优化。针对不同用电量规模的用户,其用电行为有显著差异,不同用电量等级的用户的模型建模结果会有所不同。对于不同用电量的用户,应基于其电能表日冻结数据、用电用户档案、电能表规格等信息,分析其用电行为,判断用电量不同对高价低接用电识别带来的影响,将高价低接识别模型不断完善及优化,使得对不同特点的用户识别更加准确。针对不同承载用户量的台区,其线损特性不同,其模型需要进一步优化和适配,不同地区的大用户数台区因供电半径和用户负荷特性不同,需针对具体情况进行优化和适配,并针对现场核查结果进行不断适配,对模型进行调优,不断提高模型计算的准确性。
步骤四、机器学习
长期积累发现的问题案例数据,定期将核查确定的结果作为经验信息,输入规则优化模型,通过大数据监督学习模型,实现机器学习,找出高价低接判断对象的表象特征与高价低接判断问题的潜在关联模式。不断优化监控指标及规则,提升问题对象挖掘的全面性,提高疑似问题对象的准确率。具体如下:
1)对高价低接监控触发时,结合高价低接判断指标与规则体系,全面记录当期各类高价低接判断对象的特征信息(包含高价低接判断对象的所有监控指标信息及其基础属性信息)与疑似问题对象的高价低接判断结果信息(经核实后,疑似问题对象是否确实存在问题)。通过长期积累,形成海量的高价低接判断对象特征信息与高价低接判断结果信息数据,以此数据为训练样本数据,输入规则优化模型开展机器学习训练。
2)在高价低接判断周期触发前,基于历史积累的高价低接判断经验数据对当期高价低接判断主题开展机器学习训练,根据历史高价低接判断案例数据中的高价低接判断对象特征信息与高价低接判断结果信息数据,采用有监督学习相关大数据技术,寻找出能表征对象是否存在问题的表象特征,明确高价低接判断对象表象特征与高价低接判断问题的关联模式。基于该模型对历史经验案例的客观分析,为高价低接判断指标与规则体系优化提供指导建议。
3)综合分析客户用电档案、行业分类、用电设备、负荷特性、售电均价等因素,汲取专家高价低接判断经验,利用大数据技术,建立销售电价执行高价低接判断数据模型,对分类电价、分时电价、基金与附加、基本电费、力调电费自行情况进行分析,为规范销售电价执行管理提供依据。
步骤五、高价低接用户识别
基于数据模型实现对高价低接用户的识别,根据分析出的结果结合用电检查等现场核查工作完成现场甄别,助力相关的异常问题处理。
本发明的优点和有益效果为:
本发明所述一种基于大数据的高价低接用户识别方法基于业务规章要求、重点工作开展情况、内外部检查发现的问题,梳理业务特征项,形成模型的基础构建;基于提取的模型特征变量,实现用户行业特征与用电特征不匹配、电价执行与政策不符、档案与电费计算的执行情况不一致等高价低接特征分析;基于神经网络分位数回归模型,建立三层感知器神经网络,并采用交叉验证法、AIC准则以及BIC准则等实现对电价执行标准分类。而且,本发明通过大数据有监督学***。
附图说明
图1为一种基于大数据的高价低接用户识别方法架构图。
图2为实施例中LSTM模型结构图。
对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,可以根据以上附图获得其他的相关附图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合具体实施例进一步说明本发明的技术方案。
实施例
(1)模型特征变量提取
如图1所示,基于业务规章要求、重点工作开展情况、内外部检查发现的问题,梳理业务特征项,形成模型的基础构建。高价低接电价执行特征主要从用户行业特征与用电特征不匹配、电价执行与政策不符、档案与电费计算的执行情况不一致三个方面考虑,具体如下表1所示。
表1高价低接电价执行特征类别明细表
Figure BDA0002171551450000051
Figure BDA0002171551450000061
(2)高价低接特征分析
1)用户行业特征与用电特征不匹配
用户行业特征与用电特征不匹配主要分析研究电价为农业排灌,每月存在电量、居民电价用户月用电量过大、学校用电特征不符、居民照明用户电价行业分类为非居民、临时用电户执行大工业电价、临时用电户超期、临时用电户销户还有预收、执行大工业、农业、一般工商业电价的行业分类为居民生活、电采暖电价用户冬季用电量偏小、零售行业谷段电量过大、行业为制造业,负载率低于一定值、充电电价用电,但是用电量较高、合同容量小于110kv户名中含酒店、餐饮、宾馆、饭店、冷库、商城、超市的不应执行分时电价、户名含“居委会”没有执行居委会电价、户名含“学校”“幼儿园”没有执行学校电价、户名含“排灌”没有执行排灌电价等特征数据发掘。
2)电价执行与政策不符
分析售电价执行与政策不符,主要从如下政策进行分析,挖掘规律:
①变压器容量在100KVA以下用户,功率因数标准应该为“不考核”;
②变压器容量在100KVA以上的农业户和趸售用户,功率因数标准应该为0.8;
③变压器容量在100KVA以上、160KVA以下的工业及非工业用户,功率因数标准应该为0.85;
④变压器容量在160KVA以上的工业用户,功率因数标准应该为0.9;
⑥功率因数标准执0.9,变压器容量低于160KVA;
⑦合同容量小315KVA,不能执行大工业电价;
⑦执行农业电价,不应执行分时;
⑧需量用户,核定需量小于容量之和40%;
⑨减容期满后的用户以及新装、增容用户,两年内申办减容或暂停的基本电费收取50%。
3)档案与电费计算的执行情况不一致
档案与电费计算的执行情况不一致分析,主要从计量方式为高供低计的用户,未计收变损的情况进行挖掘。
(3)模型算法设计
对用电采集数据进行抽取与存储,通过采集数据治理实现数据预处理,包括数据格式管理、数据完整性检查、营销数据格式校验、档案问题管理、电压电流缺失数据管理、重复数据管理、电压电流错误数据管理、换表行为分析、用户电表异常事件分析等。
大数据建模采用深度学习框架TensorFlow搭建,利用GPU设备加速训练。采用K折交叉验证对模型效果进行验证,其中违约用电识别模型采用准确度、召回率、AUC等指标进行效果评估。模型部署后通过离线分析和线上分析同时进行模型评估。离线部分,针对带标签的测试集合,利用AUC指标计算违约用电识别模型的准确性,AUC越大,表示违约用电识别模型越准确。线上实际运行过程中,对接入用户数据进行近实时预测,将超过在建模过程中选择的概率阈值的疑似用户结果提供给业务人员使用,辅助进行违约用电核实,根据核实结果计算违约用电识别模型的查准率,进而评估实际运行过程中的准确性。
用电历史核查记录中各种高价低接等违约用电的标签y=1,其它用户作为负样本y=0。针对公变低压用户和专变用户分别建立高价低接分析模型。对比并选择梯度上升决策树、LSTM神经网络时序模型、SVM等模型,通过模型训练,建立X与y的关联。其中,LSTM模型结构图如下图所示:
每一个时刻,神经网络模型的输入包含当前时刻的多维特征X,通过各隐藏层的变换,得到当前时刻t的n个状态节点St=<S1,S2,S3,…,Sn>。在此DNN网络基础上,结合时序长短期记忆模型(Long Short-Term Memory,LSTM),时刻t的输出为当前时刻状态St和前一时刻状态St-1的函数Ot=f(St+W*St-1)。LSTM能够同时建模客户长期和短期数据中依赖关系,并随着时间发展迭代训练、预测。模型最终输出违约用电的概率Pi=1/(1+e-Ot)。
违约用电识别模型根据人工核实结果,反馈到模型的训练过程中,形成数据优化闭环,持续优化模型效果。考虑到不同地区的样本数据千差万别,在优化过程中对特定地区的用户特性相应建模方法单独进行优化。针对不同用电量规模的用户,其用电行为有显著差异,不同用电量等级的用户的模型建模结果会有所不同。对于不同用电量的用户,应基于其电能表日冻结数据、用电用户档案、电能表规格等信息,分析其用电行为,判断用电量不同对高价低接用电识别带来的影响,将高价低接识别模型不断完善及优化,使得对不同特点的用户识别更加准确。针对不同承载用户量的台区,其线损特性不同,其模型需要进一步优化和适配,不同地区的大用户数台区因供电半径和用户负荷特性不同,需针对具体情况进行优化和适配,并针对现场核查结果进行不断适配,对模型进行调优,不断提高模型计算的准确性。
(4)机器学习
长期积累发现的问题案例数据,定期将核查确定的结果作为经验信息,输入规则优化模型,通过大数据监督学习模型,实现机器学习,找出高价低接判断对象的表象特征与高价低接判断问题的潜在关联模式。不断优化监控指标及规则,提升问题对象挖掘的全面性,提高疑似问题对象的准确率。具体如下:
1)对高价低接监控触发时,结合高价低接判断指标与规则体系,全面记录当期各类高价低接判断对象的特征信息(包含高价低接判断对象的所有监控指标信息及其基础属性信息)与疑似问题对象的高价低接判断结果信息(经核实后,疑似问题对象是否确实存在问题)。通过长期积累,形成海量的高价低接判断对象特征信息与高价低接判断结果信息数据,以此数据为训练样本数据,输入规则优化模型开展机器学习训练。
2)在高价低接判断周期触发前,基于历史积累的高价低接判断经验数据对当期高价低接判断主题开展机器学习训练,根据历史高价低接判断案例数据中的高价低接判断对象特征信息与高价低接判断结果信息数据,采用有监督学习相关大数据技术,寻找出能表征对象是否存在问题的表象特征,明确高价低接判断对象表象特征与高价低接判断问题的关联模式。基于该模型对历史经验案例的客观分析,为高价低接判断指标与规则体系优化提供指导建议。
3)综合分析客户用电档案、行业分类、用电设备、负荷特性、售电均价等因素,汲取专家高价低接判断经验,利用大数据技术,建立销售电价执行高价低接判断数据模型,对分类电价、分时电价、基金与附加、基本电费、力调电费自行情况进行分析,为规范销售电价执行管理提供依据。
(5)高价低接用户识别
基于数据模型实现对高价低接用户的识别,根据分析出的结果结合用电检查等现场核查工作完成现场甄别,助力相关的异常问题处理。
以上对本发明做了示例性的描述,应该说明的是,在不脱离本发明的核心的情况下,任何简单的变形、修改或者其他本领域技术人员能够不花费创造性劳动的等同替换均落入本发明的保护范围。

Claims (5)

1.一种基于大数据的高价低接用户识别方法,其特征在于,按照下列步骤进行:
步骤一、模型特征变量提取
基于业务规章要求、重点工作开展情况、内外部检查发现的问题,梳理业务特征项,形成模型的基础构建;
步骤二、高价低接特征分析
高价低接特征包括:1)用户行业特征与用电特征不匹配;2)电价执行与政策不符;3)档案与电费计算的执行情况不一致;
步骤三、模型算法设计
(1)对用电采集数据进行抽取与存储,通过采集数据治理实现数据预处理;
(2)采用深度学习框架TensorFlow搭建大数据建模,利用GPU设备加速训练;
(3)采用K折交叉验证对模型效果进行验证;
(4)模型部署后通过离线分析和线上分析同时进行模型评估;
(5)用电历史核查记录中各种高价低接等违约用电的标签y=1,其它用户作为负样本y=0,针对公变低压用户和专变用户分别建立高价低接分析模型,对比并选择梯度上升决策树、LSTM神经网络时序模型、SVM模型,通过模型训练,建立X与y的关联;LSTM模型结构如下所述:每一个时刻,神经网络模型的输入包含当前时刻的多维特征X,通过各隐藏层的变换,得到当前时刻t的n个状态节点St=<S1,S2,S3,…,Sn>,在此DNN网络基础上,结合时序长短期记忆模型,时刻t的输出为当前时刻状态St和前一时刻状态St-1的函数Ot=f(St+W*St-1),LSTM能够同时建模客户长期和短期数据中依赖关系,并随着时间发展迭代训练、预测,模型最终输出违约用电的概率Pi=1/(1+e-Ot);
(6)违约用电识别模型根据人工核实结果,反馈到模型的训练过程中,形成数据优化闭环,持续优化模型效果;
步骤四、机器学习
长期积累发现的问题案例数据,定期将核查确定的结果作为经验信息,输入规则优化模型,通过大数据监督学习模型,实现机器学习,找出高价低接判断对象的表象特征与高价低接判断问题的潜在关联模式,不断优化监控指标及规则,提升问题对象挖掘的全面性,提高疑似问题对象的准确率;
步骤五、高价低接用户识别
基于数据模型实现对高价低接用户的识别,根据分析出的结果结合用电检查等现场核查工作完成现场甄别,助力相关的异常问题处理。
2.如权利要求1所述的一种基于大数据的高价低接用户识别方法,其特征在于:在步骤二中,所述用户行业特征与用电特征不匹配的特征数据包括:电价为农业排灌,每月存在电量、居民电价用户月用电量过大、学校用电特征不符、居民照明用户电价行业分类为非居民、临时用电户执行大工业电价、临时用电户超期、临时用电户销户还有预收、执行大工业、农业、一般工商业电价的行业分类为居民生活、电采暖电价用户冬季用电量偏小、零售行业谷段电量过大、行业为制造业,负载率低于一定值、充电电价用电,但是用电量较高、合同容量小于110kv户名中含酒店、餐饮、宾馆、饭店、冷库、商城、超市的不应执行分时电价、户名含“居委会”没有执行居委会电价、户名含“学校”“幼儿园”没有执行学校电价、户名含“排灌”没有执行排灌电价的。
3.如权利要求1所述的一种基于大数据的高价低接用户识别方法,其特征在于:所述电价执行与政策不符的特征数据包括:
①变压器容量在100KVA以下用户,功率因数标准应该为“不考核”;
②变压器容量在100KVA以上的农业户和趸售用户,功率因数标准应该为0.8;
③变压器容量在100KVA以上、160KVA以下的工业及非工业用户,功率因数标准应该为0.85;
④变压器容量在160KVA以上的工业用户,功率因数标准应该为0.9;
⑥功率因数标准执0.9,变压器容量低于160KVA;
⑦合同容量小315KVA,不能执行大工业电价;
⑦执行农业电价,不应执行分时;
⑧需量用户,核定需量小于容量之和40%;
⑨减容期满后的用户以及新装、增容用户,两年内申办减容或暂停的基本电费收取50%。
4.如权利要求1所述的一种基于大数据的高价低接用户识别方法,其特征在于,所述档案与电费计算的执行情况不一致的数据特征为:计量方式为高供低计的用户,未计收变损。
5.如权利要求1所述的一种基于大数据的高价低接用户识别方法,其特征在于,所述步骤四中的机器学习的实施步骤如下:
1)对高价低接监控触发时,结合高价低接判断指标与规则体系,全面记录当期各类高价低接判断对象的特征信息与疑似问题对象的高价低接判断结果信息;通过长期积累,形成海量的高价低接判断对象特征信息与高价低接判断结果信息数据,以此数据为训练样本数据,输入规则优化模型开展机器学习训练。
2)在高价低接判断周期触发前,基于历史积累的高价低接判断经验数据对当期高价低接判断主题开展机器学习训练,根据历史高价低接判断案例数据中的高价低接判断对象特征信息与高价低接判断结果信息数据,采用有监督学习相关大数据技术,寻找出能表征对象是否存在问题的表象特征,明确高价低接判断对象表象特征与高价低接判断问题的关联模式。基于该模型对历史经验案例的客观分析,为高价低接判断指标与规则体系优化提供指导建议。
3)综合分析客户用电档案、行业分类、用电设备、负荷特性、售电均价等因素,汲取专家高价低接判断经验,利用大数据技术,建立销售电价执行高价低接判断数据模型,对分类电价、分时电价、基金与附加、基本电费、力调电费自行情况进行分析,为规范销售电价执行管理提供依据。
CN201910764680.7A 2019-08-19 2019-08-19 一种基于大数据的高价低接用户识别方法 Pending CN110675020A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910764680.7A CN110675020A (zh) 2019-08-19 2019-08-19 一种基于大数据的高价低接用户识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910764680.7A CN110675020A (zh) 2019-08-19 2019-08-19 一种基于大数据的高价低接用户识别方法

Publications (1)

Publication Number Publication Date
CN110675020A true CN110675020A (zh) 2020-01-10

Family

ID=69075499

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910764680.7A Pending CN110675020A (zh) 2019-08-19 2019-08-19 一种基于大数据的高价低接用户识别方法

Country Status (1)

Country Link
CN (1) CN110675020A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111275576A (zh) * 2020-01-19 2020-06-12 烟台海颐软件股份有限公司 一种电价执行异常用户的识别方法及识别***
CN111539843A (zh) * 2020-04-17 2020-08-14 国网新疆电力有限公司电力科学研究院 基于数据驱动的反窃电智能预警方法
CN112947959A (zh) * 2021-01-29 2021-06-11 京东方科技集团股份有限公司 一种ai服务平台的更新方法、装置、服务器及存储介质
CN113392910A (zh) * 2021-06-17 2021-09-14 国网江西省电力有限公司供电服务管理中心 一种判断违约用电与窃电的多维度智能分析经验算法和分类算法
CN115241980A (zh) * 2022-09-19 2022-10-25 国网江西省电力有限公司电力科学研究院 基于无人机前端识别的配网台区供电半径核查***及方法
CN117521898A (zh) * 2023-11-10 2024-02-06 国网山东省电力公司营销服务中心(计量中心) 一种基于关联分析的电费结算优化方法及***

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111275576A (zh) * 2020-01-19 2020-06-12 烟台海颐软件股份有限公司 一种电价执行异常用户的识别方法及识别***
CN111539843A (zh) * 2020-04-17 2020-08-14 国网新疆电力有限公司电力科学研究院 基于数据驱动的反窃电智能预警方法
CN112947959A (zh) * 2021-01-29 2021-06-11 京东方科技集团股份有限公司 一种ai服务平台的更新方法、装置、服务器及存储介质
CN113392910A (zh) * 2021-06-17 2021-09-14 国网江西省电力有限公司供电服务管理中心 一种判断违约用电与窃电的多维度智能分析经验算法和分类算法
CN115241980A (zh) * 2022-09-19 2022-10-25 国网江西省电力有限公司电力科学研究院 基于无人机前端识别的配网台区供电半径核查***及方法
CN117521898A (zh) * 2023-11-10 2024-02-06 国网山东省电力公司营销服务中心(计量中心) 一种基于关联分析的电费结算优化方法及***

Similar Documents

Publication Publication Date Title
CN110097297B (zh) 一种多维度窃电态势智能感知方法、***、设备及介质
CN110675020A (zh) 一种基于大数据的高价低接用户识别方法
Cody et al. Decision tree learning for fraud detection in consumer energy consumption
CN103324980B (zh) 一种风电场风速预测方法
CN111738462B (zh) 电力计量装置故障抢修主动服务预警方法
CN105117810A (zh) 一种阶梯电价机制下居民用电中期负载预测方法
CN111008193B (zh) 一种数据清洗与质量评价方法及***
CN110222991B (zh) 基于rf-gbdt的计量装置故障诊断方法
Schirmer et al. Residential energy consumption prediction using inter-household energy data and socioeconomic information
CN114004530A (zh) 基于排序支撑向量机的企业电力信用分建模方法及***
CN117674119A (zh) 电网运行风险评估方法、装置、计算机设备和存储介质
CN115905319B (zh) 一种海量用户电费异常的自动识别方法及***
CN110852621A (zh) 电力客户负荷特性分析及分类方法、装置及可读存储介质
Sankari et al. Detection of non-technical loss in power utilities using data mining techniques
CN115147242A (zh) 一种基于数据挖掘的电网数据管理***
CN114595952A (zh) 基于注意力网络改进卷积神经网络的窃电行为检测方法
CN112016631A (zh) 一种低电压治理相关的改进方案
Peiyi et al. Analysis and research on enterprise resumption of work and production based on K-means clustering
Yu et al. Research on risk identification of power theft in low-voltage distribution network based on machine learning hybrid algorithm
Raju et al. Application of Machine Learning Algorithms for Short term Load Prediction of Smart grid
Liu et al. Research on Overload Warning Method of Distribution Network Transformer Based on Neural Network
Somaratna et al. Which is better for inflation forecasting? Neural networks or data mining
Kong et al. User group portrait method of integrated energy system based on multi-source big data
Li Statistical and probabilistic models for smart electricity distribution networks
Coelho et al. HyMO-RF: Automatic Hyperparameter Tuning for Energy Theft Detection Based on Random Forest Classification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200110

RJ01 Rejection of invention patent application after publication