CN114781685A - 基于大数据挖掘技术的大用户用电负荷预测方法及*** - Google Patents

基于大数据挖掘技术的大用户用电负荷预测方法及*** Download PDF

Info

Publication number
CN114781685A
CN114781685A CN202210262891.2A CN202210262891A CN114781685A CN 114781685 A CN114781685 A CN 114781685A CN 202210262891 A CN202210262891 A CN 202210262891A CN 114781685 A CN114781685 A CN 114781685A
Authority
CN
China
Prior art keywords
data
load
user
load data
big
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210262891.2A
Other languages
English (en)
Other versions
CN114781685B (zh
Inventor
潘珍
于明
郭华
甘涌泉
林信
李波
蒋海艳
周恒旺
陈美秀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangxi Power Grid Co Ltd
Original Assignee
Guangxi Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangxi Power Grid Co Ltd filed Critical Guangxi Power Grid Co Ltd
Priority to CN202210262891.2A priority Critical patent/CN114781685B/zh
Publication of CN114781685A publication Critical patent/CN114781685A/zh
Application granted granted Critical
Publication of CN114781685B publication Critical patent/CN114781685B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/003Load forecast, e.g. methods or systems for forecasting future load demand
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/12Circuit arrangements for ac mains or ac distribution networks for adjusting voltage in ac networks by changing a characteristic of the network load
    • H02J3/14Circuit arrangements for ac mains or ac distribution networks for adjusting voltage in ac networks by changing a characteristic of the network load by switching loads on to, or off from, network, e.g. progressively balanced loading
    • H02J3/144Demand-response operation of the power transmission or distribution network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/20Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Quality & Reliability (AREA)
  • Power Engineering (AREA)
  • Computational Linguistics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Development Economics (AREA)
  • Evolutionary Computation (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Operations Research (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于负荷预测技术领域,具体涉及一种基于大数据挖掘技术的大用户用电负荷预测方法及***。通过对大用户历年数据进行影响用电负荷预测的因素分析,采用大数据挖掘技术挖掘影响因素与大用户用电负荷的关系,构建大用户用电负荷预测模型,并构建目标函数对构建的大用户用电负荷预测模型进行动态调整,提高了针对大用户用电负荷的预测精度,并且构建的大用户用电负荷预测模型进行实时动态调整,确保了构建的大用户用电负荷预测模型的有效性和时效性、精确性。本发明采用K‑Means聚类算法分析影响用电负荷预测的因素,可以有效的将关联因素聚类,实现影响因素的精准分类。

Description

基于大数据挖掘技术的大用户用电负荷预测方法及***
技术领域
本发明属于负荷预测技术领域,具体涉及一种基于大数据挖掘技术的大用户用电负荷预测方法及***。
背景技术
用户是电网中的最基础组成部分,也是造成电网负荷波动的源头。然而,现今的负荷预测方法都是针对***级的负荷预测,最深入的也不过是母线级别的预测。因此,研究一种针对用户级的负荷预测框架,并利用数据挖掘方法发掘用户用电行为规律,提高负荷预测的精度是十分必要的。
目前在针对开放售电环境下,供电企业期望增加与用户粘性,更加注重与用户的互动,用户的用电行为分析也是国际上的研究热点。通过对用户的用电行为进行数据化处理,可以对用户用电行为规律进行建模和挖掘,从而揭示与用户用电行为密切相关的属性,发现各类用户之间的隐含关系。而大用户的用电量一般比较大,基于大数据的大用户用电行为分析是供电企业了解用户的用户负荷模式特性的重要方法,研究大用户的用电负荷模式特征,有助于用电企业更深刻地认识大用户,并能够根据大用户群制定相应的市场策略、提供相应的个性化服务。在每年的调峰期间,都是通过负荷限制、行政分级限电等模式来进行错峰工作,还不能通过用户侧本身的用电需求急迫程度、用电经济效益等来进行科学合理的负荷预测以及调峰工作。研究大用户的用电行为可以为每年的调峰工作提供基础数据,然而目前对于大用户的用电行为分析不够精确,影响后续的大用户用电行为分析工作以及调峰工作。
发明内容
为了解决上述问题,本发明提供了一种基于大数据挖掘技术的大用户用电负荷预测方法及***,具体技术方案如下:
一种基于大数据挖掘技术的大用户用电负荷预测方法,包括以下步骤:
S1:从营销***获取大用户台账数据以及从计量***获取该大用户n年历史用电负荷数据,并对用电负荷数据进行预处理;所述用电负荷数据包括用电负荷曲线;
S2:建立大用户台账数据与用电负荷数据的关联关系,对源端数据进行格式转换、分类存储、数据清洗;
S3:对获取的用电负荷数据进行基础数据分析和计算,得到负荷预测模型的影响因素;
S4:基于大数据挖掘技术,挖掘负荷影响因素与大用户用电负荷的关系,构建大用户用电负荷预测模型,实现每个大用户用电负荷预测;
S5:构建大用户负荷数据验证模型,比较计算实际负荷与预测负荷的差值,动态调整大用户用电负荷预测模型。
优选地,所述步骤S1中对用电负荷数据进行预处理包括:剔除用电负荷曲线中的异常数据和重复数据,并对缺失的数据采用线性插值的方法进行补齐,所述线性插值的计算方法如下:求t时刻的大用户用电负荷y的方法如下:
Figure BDA0003551329360000021
其中,y0表示t0时刻的用电负荷,y1表示t1时刻的用电负荷。
优选地,所述步骤S3中得到负荷预测模型的影响因素具体包括以下步骤:
S31:将每个大用户的的用电负荷样本数据进行归一化处理,把所有数据转换为0~1之间的小数,具体公式为:
Figure BDA0003551329360000031
其中:y为用户用电负荷样本数据,y'为样本数据归一化处理后的值;
S32:根据K-Means聚类算法,基于大用户用电负荷归一化数据以及用电负荷曲线进行聚类分析;
1)设置初始聚类参数,即设置聚类结果中簇的个数K;
2)设置最大迭代次数;
3)聚类模型运行;
4)判断当聚类中心内的更改值为0.000时,模型达到收敛,否则返回步骤2),重新设置最大迭代次数;
5)当聚类模型结构收敛时,继续判断聚类是否满足业务要求,如果满足,则输出结果,如果不满足,则返回步骤1),重新设置聚类结果中簇的个数K。
优选地,所述构建大用户用电负荷预测模型具体包括以下步骤:
根据K-Means聚类算法得到的K类用电负荷数据,得到K个负荷预测模型的影响因素,并设置每类用电负荷数据的权重值,得到用电负荷预测模型为:
Figure BDA0003551329360000032
其中,yyc表示预测的用电负荷值,yoi表示第i类用电负荷数据的中心值,wi表示第i类用电负荷数据yi的权重系数,
Figure BDA0003551329360000033
优选地,所述权重系数wi的确定方法为:
Figure BDA0003551329360000034
优选地,所述步骤S5中大用户负荷数据验证模型具体为:
S51:采用K-Means聚类算法对每年的历史用电负荷数据分别进行聚类,得到每年的历史用电负荷数据的K类用电负荷数据;
S52:采用用电负荷预测模型计算每年的历史用电负荷数据,得到每年的历史用电负荷数据的预测值;
S53:计算每年的历史用电负荷数据的预测值与每年的历史用电负荷数据的真实值的差值;
S54:构件目标函数使得步骤S53中n年历史用电负荷数据的预测值与真实值的差值和最小,则对应的每类用电负荷数据的中心值与对应的权重达到最优组合。
优选地,所述步骤S54构建的目标函数F为:
Figure BDA0003551329360000041
Figure BDA0003551329360000042
其中,yycj为第j年历史用电负荷数据的预测值,yzsj为第j年历史用电负荷数据的真实值,yoji为第j年历史用电负荷数据聚类后第i类用电负荷数据的中心值。
一种基于大数据挖掘技术的大用户用电负荷预测***,包括负荷数据采集模块、负荷数据预处理模块、负荷数据处理模块、负荷数据分析模块、负荷数据预测模块、预测验证模块;所述负荷数据采集模块、负荷数据预处理模块、负荷数据处理模块、负荷数据分析模块、负荷数据预测模块、预测验证模块依次连接;
所述负荷数据采集模块用于从营销***采集获取大用户台账数据以及从计量***获取该大用户历年的用电负荷数据;
所述负荷数据预处理模块用于对负荷数据采集模块采集的大用户历年的用电负荷数据进行预处理;
所述负荷数据处理模块用于对经过预处理后的大用户历年的用电负荷数据进行格式转换、分类存储、数据清洗;
所述负荷数据分析模块用于对经过处理后的大用户历年的用电负荷数据进行分析和计算得到负荷预测模型的影响因素;
所述负荷数据预测模块用于挖掘影响因素与大用户用电负荷的关系,并构建大用户用电负荷预测模型实现大用户用电负荷预测;
所述预测验证模块用于对负荷数据预测模块预测得到的大用户用电负荷预测模型进行验证。
本发明的有益效果为:本发明提供了一种基于大数据挖掘技术的大用户用电负荷预测方法及***,通过对大用户历年数据进行影响用电负荷预测的因素分析,采用大数据挖掘技术挖掘影响因素与大用户用电负荷的关系,构建大用户用电负荷预测模型,并构建目标函数对构建的大用户用电负荷预测模型进行动态调整,提高了针对大用户用电负荷的预测精度,并且构建的大用户用电负荷预测模型进行实时动态调整,确保了构建的大用户用电负荷预测模型的有效性和时效性、精确性。本发明采用K-Means聚类算法分析影响用电负荷预测的因素,可以有效的将关联因素聚类,实现影响因素的精准分类。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
图1为本发明的方法流程示意图;
图2为本发明的***原理图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
一种基于大数据挖掘技术的大用户用电负荷预测方法,包括以下步骤:
S1:从营销***获取大用户台账数据以及从计量***获取该大用户n年历史用电负荷数据,并对用电负荷数据进行预处理;所述用电负荷数据包括用电负荷曲线;对用电负荷数据进行预处理包括:剔除用电负荷曲线中的异常数据和重复数据,并对缺失的数据采用线性插值的方法进行补齐,所述线性插值的计算方法如下:求t时刻的大用户用电负荷y的方法如下:
Figure BDA0003551329360000061
其中,y0表示t0时刻的用电负荷,y1表示t1时刻的用电负荷。对用电负荷数据进行预处理可以保证续步骤对数据计算分析的精确性。
S2:建立大用户台账数据与用电负荷数据的关联关系,对源端数据进行格式转换、分类存储、数据清洗;
S3:对获取的用电负荷数据进行基础数据分析和计算,得到负荷预测模型的影响因素;具体包括以下步骤:
S31:将每个大用户的的用电负荷样本数据进行归一化处理,把所有数据转换为0~1之间的小数,具体公式为:
Figure BDA0003551329360000071
其中:y为用户用电负荷样本数据,y'为样本数据归一化处理后的值;
S32:根据K-Means聚类算法,基于大用户用电负荷归一化数据以及用电负荷曲线进行聚类分析;
1)设置初始聚类参数,即设置聚类结果中簇的个数K;
2)设置最大迭代次数;
3)聚类模型运行;
4)判断当聚类中心内的更改值为0.000时,模型达到收敛,否则返回步骤2),重新设置最大迭代次数;
5)当聚类模型结构收敛时,继续判断聚类是否满足业务要求,如果满足,则输出结果,如果不满足,则返回步骤1),重新设置聚类结果中簇的个数K。采用K-Means聚类算法分析影响用电负荷预测的因素,可以有效的将关联因素聚类,实现影响因素的精准分类。
K-Means算法接受一个参数k用以决定结果中簇的数目。算法开始时,要在数据集中随机选择k个数据对象用来当做k个簇的初始中心,而将剩下的各个数据对象就根据他们和每个聚类簇心的距离选择簇心最近的簇分配到其中。然后重新计算各个聚类簇中的所有数据对象的平均值,并将得到的结果作为新的簇心;逐步重复上述的过程直至目标函数收敛为止。通常都是使用均方差函数作为目标函数,公式如下:
Figure BDA0003551329360000081
此公式中J为数据集合中所有数据与相应聚类中心的均方差的总和,D是数据对象,mi是簇的平均值(D和mi都是多维的)。在确定了数据集中聚类簇的预期数目k之后,该数字用来指定数据集中的k个种子点。并将各个种子点用作聚类的质心。数目k的确定既可以是主观的选择也可以是利用其它聚类技术得到的一个数。选好初始种子点之后,每个簇中没有其它的数据对象。下一步就是通过循环将剩余的点放到离种子点最近的簇之中去。有很多衡量聚类的方法,在此欧氏距离是一种比较常见的衡量数据点之间的距离的方法。然后就是簇心点重新计算,进而再一次对所有点进行所属簇的计算与划分。由于簇的中心点的移动(每次重新计算簇的中心点都有可能会改变中心点的位置直至中心点不变或者目标函数达到收敛为止)使得一些原本不在该簇的数据被划分到簇中,那么此次聚类过程就可以视为上一次聚类结果的校正使得更接近新的质心的点重新得以划分到更合理的簇中。通过一些数据点的重新划分使得质心也可以进行更新升级。上述质心更新的过程一直迭代,直至质心没有明显变化结束。
S4:基于大数据挖掘技术,挖掘负荷影响因素与大用户用电负荷的关系,构建大用户用电负荷预测模型,实现每个大用户用电负荷预测;构建大用户用电负荷预测模型具体包括以下步骤:
S41:根据K-Means聚类算法得到的K类用电负荷数据,得到K个负荷预测模型的影响因素,并设置每类用电负荷数据的权重值,得到用电负荷预测模型为:
Figure BDA0003551329360000091
其中,yyc表示预测的用电负荷值,yoi表示第i类用电负荷数据的中心值,wi表示第i类用电负荷数据yi的权重系数,
Figure BDA0003551329360000092
权重系数wi的确定方法为:
Figure BDA0003551329360000093
S5:构建大用户负荷数据验证模型,比较计算实际负荷与预测负荷的差值,动态调整大用户用电负荷预测模型。大用户负荷数据验证模型具体为:
S51:采用K-Means聚类算法对每年的历史用电负荷数据分别进行聚类,得到每年的历史用电负荷数据的K类用电负荷数据;
S52:采用用电负荷预测模型计算每年的历史用电负荷数据,得到每年的历史用电负荷数据的预测值;
S53:计算每年的历史用电负荷数据的预测值与每年的历史用电负荷数据的真实值的差值;
S54:构件目标函数使得步骤S53中n年历史用电负荷数据的预测值与真实值的差值和最小,则对应的每类用电负荷数据的中心值与对应的权重达到最优组合。步骤S54构建的目标函数F为:
Figure BDA0003551329360000094
Figure BDA0003551329360000095
其中,yycj为第j年历史用电负荷数据的预测值,yzsj为第j年历史用电负荷数据的真实值,yoji为第j年历史用电负荷数据聚类后第i类用电负荷数据的中心值。
一种基于大数据挖掘技术的大用户用电负荷预测***,包括负荷数据采集模块、负荷数据预处理模块、负荷数据处理模块、负荷数据分析模块、负荷数据预测模块、预测验证模块;所述负荷数据采集模块、负荷数据预处理模块、负荷数据处理模块、负荷数据分析模块、负荷数据预测模块、预测验证模块依次连接;
所述负荷数据采集模块用于从营销***采集获取大用户台账数据以及从计量***获取该大用户历年的用电负荷数据;
所述负荷数据预处理模块用于对负荷数据采集模块采集的大用户历年的用电负荷数据进行预处理;
所述负荷数据处理模块用于对经过预处理后的大用户历年的用电负荷数据进行格式转换、分类存储、数据清洗;
所述负荷数据分析模块用于对经过处理后的大用户历年的用电负荷数据进行分析和计算得到负荷预测模型的影响因素;
所述负荷数据预测模块用于挖掘影响因素与大用户用电负荷的关系,并构建大用户用电负荷预测模型实现大用户用电负荷预测;
所述预测验证模块用于对负荷数据预测模块预测得到的大用户用电负荷预测模型进行验证。
其中,负荷数据预处理模块对负荷数据采集模块采集的大用户历年的用电负荷数据进行预处理包括剔除用电负荷曲线中的异常数据和重复数据,并对缺失的数据采用线性插值的方法进行补齐,所述线性插值的计算方法如下:求t时刻的大用户用电负荷y的方法如下:
Figure BDA0003551329360000101
其中,y0表示t0时刻的用电负荷,y1表示t1时刻的用电负荷。
负荷数据分析模块对经过处理后的大用户历年的用电负荷数据进行分析和计算得到负荷预测模型的影响因素包括:将每个大用户的的用电负荷样本数据进行归一化处理,把所有数据转换为0~1之间的小数,具体公式为:
Figure BDA0003551329360000111
其中:y为用户用电负荷样本数据,y'为样本数据归一化处理后的值;
根据K-Means聚类算法,基于大用户用电负荷归一化数据以及用电负荷曲线进行聚类分析;
1)设置初始聚类参数,即设置聚类结果中簇的个数K;
2)设置最大迭代次数;
3)聚类模型运行;
4)判断当聚类中心内的更改值为0.000时,模型达到收敛,否则返回步骤2),重新设置最大迭代次数;
5)当聚类模型结构收敛时,继续判断聚类是否满足业务要求,如果满足,则输出结果,如果不满足,则返回步骤1),重新设置聚类结果中簇的个数K。
负荷数据预测模块中构建大用户用电负荷预测模型具体为:根据K-Means聚类算法得到的K类用电负荷数据,得到K个负荷预测模型的影响因素,并设置每类用电负荷数据的权重值,得到用电负荷预测模型为:
Figure BDA0003551329360000112
其中,yyc表示预测的用电负荷值,yoi表示第i类用电负荷数据的中心值,wi表示第i类用电负荷数据yi的权重系数,
Figure BDA0003551329360000113
权重系数wi的确定方法为:
Figure BDA0003551329360000114
预测验证模块动态调整大用户用电负荷预测模型具体为:
采用K-Means聚类算法对每年的历史用电负荷数据分别进行聚类,得到每年的历史用电负荷数据的K类用电负荷数据;
采用用电负荷预测模型计算每年的历史用电负荷数据,得到每年的历史用电负荷数据的预测值;
计算每年的历史用电负荷数据的预测值与每年的历史用电负荷数据的真实值的差值;
构件目标函数使得步骤S53中n年历史用电负荷数据的预测值与真实值的差值和最小,则对应的每类用电负荷数据的中心值与对应的权重达到最优组合。构建的目标函数F为:
Figure BDA0003551329360000121
Figure BDA0003551329360000122
其中,yycj为第j年历史用电负荷数据的预测值,yzsj为第j年历史用电负荷数据的真实值,yoji为第j年历史用电负荷数据聚类后第i类用电负荷数据的中心值。
本发明提供了一种基于大数据挖掘技术的大用户用电负荷预测方法及***,通过对大用户历年数据进行影响用电负荷预测的因素分析,采用大数据挖掘技术挖掘影响因素与大用户用电负荷的关系,构建大用户用电负荷预测模型,并构建目标函数对构建的大用户用电负荷预测模型进行动态调整,提高了针对大用户用电负荷的预测精度,并且构建的大用户用电负荷预测模型进行实时动态调整,确保了构建的大用户用电负荷预测模型的有效性和时效性、精确性。本发明采用K-Means聚类算法分析影响用电负荷预测的因素,可以有效的将关联因素聚类,实现影响因素的精准分类。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本申请所提供的实施例中,应该理解到,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元可结合为一个单元,一个单元可拆分为多个单元,或一些特征可以忽略等。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims (8)

1.一种基于大数据挖掘技术的大用户用电负荷预测方法,其特征在于:包括以下步骤:
S1:从营销***获取大用户台账数据以及从计量***获取该大用户n年历史用电负荷数据,并对用电负荷数据进行预处理;所述用电负荷数据包括用电负荷曲线;
S2:建立大用户台账数据与用电负荷数据的关联关系,对源端数据进行格式转换、分类存储、数据清洗;
S3:对获取的用电负荷数据进行基础数据分析和计算,得到负荷预测模型的影响因素;
S4:基于大数据挖掘技术,挖掘负荷影响因素与大用户用电负荷的关系,构建大用户用电负荷预测模型,实现每个大用户用电负荷预测;
S5:构建大用户负荷数据验证模型,比较计算实际负荷与预测负荷的差值,动态调整大用户用电负荷预测模型。
2.根据权利要求1所述的一种基于大数据挖掘技术的大用户用电负荷预测方法,其特征在于:所述步骤S1中对用电负荷数据进行预处理包括:剔除用电负荷曲线中的异常数据和重复数据,并对缺失的数据采用线性插值的方法进行补齐,所述线性插值的计算方法如下:求t时刻的大用户用电负荷y的方法如下:
Figure FDA0003551329350000011
其中,y0表示t0时刻的用电负荷,y1表示t1时刻的用电负荷。
3.根据权利要求1所述的一种基于大数据挖掘技术的大用户用电负荷预测方法,其特征在于:所述步骤S3中得到负荷预测模型的影响因素具体包括以下步骤:
S31:将每个大用户的的用电负荷样本数据进行归一化处理,把所有数据转换为0~1之间的小数,具体公式为:
Figure FDA0003551329350000021
其中:y为用户用电负荷样本数据,y'为样本数据归一化处理后的值;
S32:根据K-Means聚类算法,基于大用户用电负荷归一化数据以及用电负荷曲线进行聚类分析;
1)设置初始聚类参数,即设置聚类结果中簇的个数K;
2)设置最大迭代次数;
3)聚类模型运行;
4)判断当聚类中心内的更改值为0.000时,模型达到收敛,否则返回步骤2),重新设置最大迭代次数;
5)当聚类模型结构收敛时,继续判断聚类是否满足业务要求,如果满足,则输出结果,如果不满足,则返回步骤1),重新设置聚类结果中簇的个数K。
4.根据权利要求3所述的一种基于大数据挖掘技术的大用户用电负荷预测方法,其特征在于:所述构建大用户用电负荷预测模型具体包括以下步骤:
根据K-Means聚类算法得到的K类用电负荷数据,得到K个负荷预测模型的影响因素,并设置每类用电负荷数据的权重值,得到用电负荷预测模型为:
Figure FDA0003551329350000022
其中,yyc表示预测的用电负荷值,yoi表示第i类用电负荷数据的中心值,wi表示第i类用电负荷数据yi的权重系数,
Figure FDA0003551329350000023
5.根据权利要求4所述的一种基于大数据挖掘技术的大用户用电负荷预测方法,其特征在于:所述权重系数wi的确定方法为:
Figure FDA0003551329350000024
6.根据权利要求5所述的一种基于大数据挖掘技术的大用户用电负荷预测方法,其特征在于:所述步骤S5中大用户负荷数据验证模型具体为:
S51:采用K-Means聚类算法对每年的历史用电负荷数据分别进行聚类,得到每年的历史用电负荷数据的K类用电负荷数据;
S52:采用用电负荷预测模型计算每年的历史用电负荷数据,得到每年的历史用电负荷数据的预测值;
S53:计算每年的历史用电负荷数据的预测值与每年的历史用电负荷数据的真实值的差值;
S54:构件目标函数使得步骤S53中n年历史用电负荷数据的预测值与真实值的差值和最小,则对应的每类用电负荷数据的中心值与对应的权重达到最优组合。
7.根据权利要求6所述的一种基于大数据挖掘技术的大用户用电负荷预测方法,其特征在于:所述步骤S54构建的目标函数F为:
Figure FDA0003551329350000031
Figure FDA0003551329350000032
其中,yycj为第j年历史用电负荷数据的预测值,yzsj为第j年历史用电负荷数据的真实值,yoji为第j年历史用电负荷数据聚类后第i类用电负荷数据的中心值。
8.一种基于大数据挖掘技术的大用户用电负荷预测***,其特征在于:包括负荷数据采集模块、负荷数据预处理模块、负荷数据处理模块、负荷数据分析模块、负荷数据预测模块、预测验证模块;所述负荷数据采集模块、负荷数据预处理模块、负荷数据处理模块、负荷数据分析模块、负荷数据预测模块、预测验证模块依次连接;
所述负荷数据采集模块用于从营销***采集获取大用户台账数据以及从计量***获取该大用户历年的用电负荷数据;
所述负荷数据预处理模块用于对负荷数据采集模块采集的大用户历年的用电负荷数据进行预处理;
所述负荷数据处理模块用于对经过预处理后的大用户历年的用电负荷数据进行格式转换、分类存储、数据清洗;
所述负荷数据分析模块用于对经过处理后的大用户历年的用电负荷数据进行分析和计算得到负荷预测模型的影响因素;
所述负荷数据预测模块用于挖掘影响因素与大用户用电负荷的关系,并构建大用户用电负荷预测模型实现大用户用电负荷预测;
所述预测验证模块用于对负荷数据预测模块预测得到的大用户用电负荷预测模型进行验证。
CN202210262891.2A 2022-03-17 2022-03-17 基于大数据挖掘技术的大用户用电负荷预测方法及*** Active CN114781685B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210262891.2A CN114781685B (zh) 2022-03-17 2022-03-17 基于大数据挖掘技术的大用户用电负荷预测方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210262891.2A CN114781685B (zh) 2022-03-17 2022-03-17 基于大数据挖掘技术的大用户用电负荷预测方法及***

Publications (2)

Publication Number Publication Date
CN114781685A true CN114781685A (zh) 2022-07-22
CN114781685B CN114781685B (zh) 2024-01-09

Family

ID=82425936

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210262891.2A Active CN114781685B (zh) 2022-03-17 2022-03-17 基于大数据挖掘技术的大用户用电负荷预测方法及***

Country Status (1)

Country Link
CN (1) CN114781685B (zh)

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105184402A (zh) * 2015-08-31 2015-12-23 国家电网公司 一种基于决策树的个性化用户短期负荷预测算法
CN105303263A (zh) * 2015-11-16 2016-02-03 深圳合纵能源技术有限公司 一种区域电网的负荷预测***及其方法
CN105590174A (zh) * 2015-12-29 2016-05-18 南京因泰莱电器股份有限公司 基于k-均值聚类rbf神经网络的企业用电负荷预测方法
CN105844371A (zh) * 2016-05-19 2016-08-10 北京中电普华信息技术有限公司 一种用电客户短期负荷需求预测方法及装置
CN109376971A (zh) * 2018-12-29 2019-02-22 北京中电普华信息技术有限公司 一种面向电力用户的负荷曲线预测方法及***
CN109636101A (zh) * 2018-11-02 2019-04-16 国网辽宁省电力有限公司朝阳供电公司 基于大数据的开放售电环境下大用户用电行为分析方法
CN109858667A (zh) * 2018-12-21 2019-06-07 国网江苏省电力有限公司苏州供电分公司 一种基于雷电气候对负荷影响的短期负荷聚类方法
CN109886465A (zh) * 2019-01-20 2019-06-14 东北电力大学 一种基于智能电表用户聚类分析的配电网负荷预测方法
CN110610280A (zh) * 2018-10-31 2019-12-24 山东大学 一种电力负荷短期预测方法、模型、装置及***
CN110689195A (zh) * 2019-09-26 2020-01-14 云南电网有限责任公司电力科学研究院 一种电力日负荷预测方法
CN110837857A (zh) * 2019-10-31 2020-02-25 杭州中恒云能源互联网技术有限公司 工业用电负荷预测方法、***及其存储介质
CN112561156A (zh) * 2020-12-11 2021-03-26 国网江苏省电力有限公司南通供电分公司 基于用户负荷模式分类的短期电力负荷预测方法
CN113205207A (zh) * 2021-04-19 2021-08-03 深圳供电局有限公司 一种基于XGBoost算法的用电短期负荷波动预测方法及***
CN113282646A (zh) * 2021-04-30 2021-08-20 国网四川省电力公司经济技术研究院 一种基于用电行为影响因素的日负荷曲线获取方法
CN113361202A (zh) * 2021-06-11 2021-09-07 国网上海市电力公司 一种基于特征负荷预测的配变重过载快速预警方法
CN113393028A (zh) * 2021-06-10 2021-09-14 国网江苏省电力有限公司南通供电分公司 一种基于数据挖掘技术的负荷预测方法
CN113869601A (zh) * 2021-10-18 2021-12-31 深圳供电局有限公司 一种电力用户负荷预测方法、装置及设备
CN115689001A (zh) * 2022-10-26 2023-02-03 四川大学 基于模式匹配的短期负荷预测方法

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105184402A (zh) * 2015-08-31 2015-12-23 国家电网公司 一种基于决策树的个性化用户短期负荷预测算法
CN105303263A (zh) * 2015-11-16 2016-02-03 深圳合纵能源技术有限公司 一种区域电网的负荷预测***及其方法
CN105590174A (zh) * 2015-12-29 2016-05-18 南京因泰莱电器股份有限公司 基于k-均值聚类rbf神经网络的企业用电负荷预测方法
CN105844371A (zh) * 2016-05-19 2016-08-10 北京中电普华信息技术有限公司 一种用电客户短期负荷需求预测方法及装置
CN110610280A (zh) * 2018-10-31 2019-12-24 山东大学 一种电力负荷短期预测方法、模型、装置及***
CN109636101A (zh) * 2018-11-02 2019-04-16 国网辽宁省电力有限公司朝阳供电公司 基于大数据的开放售电环境下大用户用电行为分析方法
CN109858667A (zh) * 2018-12-21 2019-06-07 国网江苏省电力有限公司苏州供电分公司 一种基于雷电气候对负荷影响的短期负荷聚类方法
CN109376971A (zh) * 2018-12-29 2019-02-22 北京中电普华信息技术有限公司 一种面向电力用户的负荷曲线预测方法及***
CN109886465A (zh) * 2019-01-20 2019-06-14 东北电力大学 一种基于智能电表用户聚类分析的配电网负荷预测方法
CN110689195A (zh) * 2019-09-26 2020-01-14 云南电网有限责任公司电力科学研究院 一种电力日负荷预测方法
CN110837857A (zh) * 2019-10-31 2020-02-25 杭州中恒云能源互联网技术有限公司 工业用电负荷预测方法、***及其存储介质
CN112561156A (zh) * 2020-12-11 2021-03-26 国网江苏省电力有限公司南通供电分公司 基于用户负荷模式分类的短期电力负荷预测方法
CN113205207A (zh) * 2021-04-19 2021-08-03 深圳供电局有限公司 一种基于XGBoost算法的用电短期负荷波动预测方法及***
CN113282646A (zh) * 2021-04-30 2021-08-20 国网四川省电力公司经济技术研究院 一种基于用电行为影响因素的日负荷曲线获取方法
CN113393028A (zh) * 2021-06-10 2021-09-14 国网江苏省电力有限公司南通供电分公司 一种基于数据挖掘技术的负荷预测方法
CN113361202A (zh) * 2021-06-11 2021-09-07 国网上海市电力公司 一种基于特征负荷预测的配变重过载快速预警方法
CN113869601A (zh) * 2021-10-18 2021-12-31 深圳供电局有限公司 一种电力用户负荷预测方法、装置及设备
CN115689001A (zh) * 2022-10-26 2023-02-03 四川大学 基于模式匹配的短期负荷预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
崔旻, 顾洁: "基于数据挖掘的电力***中长期负荷预测新方法", 电力自动化设备, no. 06 *

Also Published As

Publication number Publication date
CN114781685B (zh) 2024-01-09

Similar Documents

Publication Publication Date Title
CN111199016B (zh) 一种基于DTW的改进K-means的日负荷曲线聚类方法
CN110991786B (zh) 基于相似日负荷曲线的10kV静态负荷模型参数辨识方法
CN110610280A (zh) 一种电力负荷短期预测方法、模型、装置及***
CN108376262B (zh) 一种风电出力典型特性的分析模型构建方法
CN110766200A (zh) 一种基于K-means均值聚类的风电机组发电功率预测方法
CN112186761A (zh) 一种基于概率分布的风电功率场景生成方法及***
CN117272850B (zh) 配电网安全运行调度弹性空间分析方法
CN113283674A (zh) 一种基于用户用电特征的基线负荷预测修正方法
CN115470862A (zh) 动态自适应负荷预测模型组合方法
CN115809719A (zh) 一种基于形态聚类的短期负荷预测修正方法
CN109389517B (zh) 一种量化线路损耗影响因素的分析方法及装置
CN112330030A (zh) 业扩物资需求预测***及方法
CN113919610A (zh) 低压台区线损预测用arima模型构建方法及评估方法
CN114781685A (zh) 基于大数据挖掘技术的大用户用电负荷预测方法及***
CN109064353B (zh) 一种基于改进聚类融合的大型建筑用户行为分析方法
CN116470491A (zh) 基于copula函数的光伏功率概率预测方法及***
CN114676931B (zh) 一种基于数据中台技术的电量预测***
CN112508224B (zh) 微电网多模型负荷预测自适应选择方法、***及存储介质
CN115130924A (zh) 一种源网荷储背景下微电网电力设备资产评估方法及***
CN114064794A (zh) 一种基于大数据技术的业扩报装档案挖掘分析方法
CN111222688B (zh) 一种商业楼宇的日负荷预测方法
CN113869601A (zh) 一种电力用户负荷预测方法、装置及设备
CN112990533A (zh) 一种稀疏约束和动态权重分配的风电集群功率预测方法
CN112418633A (zh) 一种基于典型相关分析的停电敏感性相关因素分析方法
CN112906931A (zh) 一种电力现货市场下售电公司短期负荷的预测方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant