CN105404944A - 一种面向电力***重过载预警的大数据分析方法 - Google Patents

一种面向电力***重过载预警的大数据分析方法 Download PDF

Info

Publication number
CN105404944A
CN105404944A CN201510920842.3A CN201510920842A CN105404944A CN 105404944 A CN105404944 A CN 105404944A CN 201510920842 A CN201510920842 A CN 201510920842A CN 105404944 A CN105404944 A CN 105404944A
Authority
CN
China
Prior art keywords
data
power system
load
system load
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510920842.3A
Other languages
English (en)
Inventor
王继业
朱朝阳
张东霞
邓春宇
王晓蓉
贾育培
李浥东
季知祥
张磊
张涛
贺简章
王海波
李慧芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Beijing Jiaotong University
China Electric Power Research Institute Co Ltd CEPRI
Electric Power Research Institute of State Grid Shandong Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Beijing Jiaotong University
China Electric Power Research Institute Co Ltd CEPRI
Electric Power Research Institute of State Grid Shandong Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Beijing Jiaotong University, China Electric Power Research Institute Co Ltd CEPRI, Electric Power Research Institute of State Grid Shandong Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201510920842.3A priority Critical patent/CN105404944A/zh
Publication of CN105404944A publication Critical patent/CN105404944A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种面向电力***重过载预警的大数据分析方法,包括:对历史电力负荷数据进行预处理;提取预处理后的历史电力负荷数据D中与负荷属性关联性强的属性集合,建立包含负荷属性数据和与负荷属性关联性强的属性集合数据集D′;利用聚类方法将数据集D分为正常运行数据类、重载数据类和过载数据类;根据数据集D构建电力负荷数据预测模型,预测变压器的重载概率和过载概率;本发明提供的方法利用历史负载数据,天气数据及其他外部数据,对特定时期区域下属各台区在特定时间段的负荷重过载概率进行预测,从而优化配置在此时期的配电网检测、检修等人力和物质资源,以提高***运行的安全稳定性,并减少电网工作人员的劳动强度。

Description

一种面向电力***重过载预警的大数据分析方法
技术领域
本发明涉及电力负荷预测技术领域,具体涉及一种面向电力***重过载预警的大数据分析方法。
背景技术
电力负荷有两方面的含义:一方面是指电力工业的服务对象,包括使用电力的部门、机关、企事业单位、工厂、农村、车间、学校以及各种各样的用电设备;另一方面是指上述各用电单位、用电部门或用电设备使用电力和电量的具体数量。电力负荷预测中的负荷概念是指国民经济整体或部门或地区对电力和电量消费的历史情况及未来的变化发展趋势。
负荷预测是根据***的运行特性、增容决策、自然条件与社会影响等诸多因数,在满足一定精度要求的条件下,确定未来某特定时刻的负荷数据,其中负荷是指电力需求量(功率)或用电量;负荷预测是电力***经济调度中的一项重要内容。
目前,对负荷特性的现状、影响负荷特性的主要因素和未来负荷特性的变化趋势等都进行了***的分析和研究,得出了一些对电力规划和电网运行有指导意义和参考价值的结论,但缺乏对影响负荷的相关因素分析。限于过去的条件,在绝大多数***中没有考虑气象、温度等因素对负荷的影响,预测精度不高。
发明内容
针对现有技术的不足,本发明提供一种面向电力***重过载预警的大数据分析方法,利用区域内所有变压器的历史负载数据,本地区的天气数据及其他外部数据,对特定时期区域下属各台区在特定时间段的负荷重过载概率进行预测,从而优化配置在此时期的配电网检测、检修等人力和物质资源,以提高***运行的安全稳定性,并减少电网工作人员的劳动强度。
本发明的目的是采用下述技术方案实现的:
一种面向电力***重过载预警的大数据分析方法,其改进之处在于,包括:
(1)对历史电力负荷数据进行预处理;
(2)对预处理后的所述历史电力负荷数据D进行关联规则挖掘,提取与负荷属性关联性强的属性集合,建立包含所述负荷属性数据和与负荷属性关联性强的属性集合数据集D′;
(3)利用聚类方法将所述数据集D分为正常运行数据类、重载数据类和过载数据类;
(4)根据所述数据集D构建电力负荷数据预测模型,预测变压器的重载概率和过载概率。
优选的,所述步骤(1)包括:
(1-1)对所述历史电力负荷数据进行匿名化处理;
(1-2)采用K近邻填补算法对数值型数据缺失值进行填补;
(1-3)对所述历史电力负荷数据对应的天气数据进行处理;
(1-4)获取所述历史电力负荷数据的负荷值,并根据所述负荷值将所述历史电力负荷数据分为正常、重载和过载三类。
进一步的,所述步骤(1-1)中,采用混合K-匿名对所述历史电力负荷数据进行匿名化处理,包括:
令攻击者的背景知识包括:目标客户地址及目标客户至多m个受电点,以客户作为顶点,客户地址作为顶点属性,建立复合超图,其中,顶点包含 m m i n { m , | S | } 条超边,S为所述客户的受电点集合,超边的标签为所述客户的受电点集合S的全部大小为min{m,|S|}的子集;
将所述复合超图中秩小于k的超边进行合并,直至所述复合超图中超边的秩均大于或等于k;
将所述复合超图中顶点属性进行泛化,直至所述复合超图每个连通量中顶点属性相同。
进一步的,所述步骤(1-2)中,将所述历史电力负荷数据的数据表中的空缺位置进行数据填充,填充内容为所述空缺位置列临近的k个邻居的众数或平均值。
进一步的,所述步骤(1-3)中,将每天t时间段内所述历史电力负荷数据对应的天气温度求平均值作为温度基准值,采用温度基准值+温度变化率作为所述历史电力负荷数据的属性。
进一步的,所述步骤(1-4)中,确定所述历史电力负荷数据第i时的负荷值Pi,公式为:
P i = P i ′ P - - - ( 1 )
式(1)中,i∈[1,24],Pi′为所述历史电力负荷数据第i时的视在功率值,P为变压器容量;
若max{Pi}∈(0,80],则所述历史电力负荷数据为正常运行数据;
若max{Pi}∈(80,100],则所述历史电力负荷数据为重载数据;
若max{Pi}∈[100,+∞),则所述历史电力负荷数据为过载数据。
优选的,所述步骤(2)中,输入所述预处理后的历史电力负荷数据D作为事务集,A和B分别为两个互斥的项集,其中,A为所述历史电力负荷数据中除负荷属性数据外的属性集合,B为所述历史电力负荷数据中负荷属性,设定支持度最小阈值min_supp,设定置信度最小阈值min_conf,确定项集A与项集B的支持度公式为:
sup p o r t ( A ⇒ B ) = P ( A ∪ B ) - - - ( 2 )
式(2)中,P(A∪B)为事务集D中既包含项集A又包含项集B的实例所占的百分比;
确定项集A与项集B的置信度公式为:
c o n f i d e n c e ( A ⇒ B ) = P ( B | A ) - - - ( 3 )
式(3)中,P(B|A)为事务集D中包含项集A也包含项集B的实例所占的百分比;
获取 sup p o r t ( A ⇒ B ) ≥ m i n _ sup p c o n f i d e n c e ( A ⇒ B ) ≥ min _ c o n f 的属性数据;
确定项集A与项集B的提升度公式为:
l i f t ( A ⇒ B ) = c o n f i d e n c e ( A ⇒ B ) P ( B ) - - - ( 4 )
式(4)中,P(B)为事务集D中包含项集B的实例所占的百分比;
根据对所述历史电力负荷数据中挖掘到的规则进行排序,设定阈值e,提取的规则包含的属性数据和负荷属性数据建立所述数据集D′。
优选的,所述步骤(3)中,调用DBSCAN算法,输入所述数据集D′,具体包括:
(3-1)设置扫描半径d和最小包含点数min_pts,选择任意核心点,其中,核心点为满足扫描半径d内指定数据样本数大于min_pts的对象;
(3-2)获取从所述核心点出发的所有密度相连的负荷样本;
(3-3)遍历所述核心点在扫描半径d内的全部核心点样本,并获取所述全部核心点样本密度相连的负荷样本,形成聚类。
优选的,所述步骤(4)中,调用随机森林算法,输入所述数据集D′构造电力负荷预测模型,其中,以所述数据集D′为根节点构造分类决策树,叶子节点为模型决策的类别,所述分类决策树中的分支选择根据下述公式:
GINI(s,t)=pLGINI(tL)+pRGINI(tR)(5)
式(5)中,t为当前节点分支的属性,s为当前节点分支的属性值,pL为节点t以s为切分点生成的左子树中的样例占当前节点样例的比例,pR为节点t以s为切分点生成的右子树中的样例占当前节点样例的比例,GINI(tL)为节点t以s为切分点生成的左子树的基尼指数,GINI(tR)为节点t以s为切分点生成的右子树的基尼指数,其中,所述基尼指数GINI(t)的公式为:
G I N I ( t ) = 1 - Σ j p 2 ( j / t ) - - - ( 6 )
式(6)中,p(j/t)为目标类别j在节点t出现的比例,j取值为0/1/2,分别表示正常运行/重载/过载;
选择使GINI(s,t)值最小的t和s对当前节点进行***,生成所述分类决策树。
与最接近的现有技术相比,本发明具有的有益效果:
本发明提供的一种面向电力***重过载预警的大数据分析方法,采用匿名化方法,在保证数据安全性的同时最大限度保障数据的可用性,数据质量控制方法采用混合质量评价模型,使数据质量具有高度可信性、可用性。
本发明提供的一种面向电力***重过载预警的大数据分析方法,,采用频繁项集找不小于最小支持度和最小置信度的强关联规则,提取挖掘到的属性作为对负荷影响较大的属性,解决电力大数据候选属性过多的问题,最大程度提高算法效率。
本发明提供的一种面向电力***重过载预警的大数据分析方法,采用随机森林方法用于建模,对大数据有良好的可扩展性,能够解决大数据的快速处理问题,又防止电力***中正样本较少时过拟合发生,针对大数据环境下的电力负荷预测有较好的应用前景。
附图说明
图1是本发明提供的一种面向电力***重过载预警的大数据分析方法流程图;
图2是本发明实施例中用户与受电点的二分图;
图3是本发明实施例中用户与受电点的复合超图;
图4是本发明实施例中合并超边后用户与受电点的复合超图。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步的详细说明。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明提供了一种面向电力***重过载预警的大数据分析方法,如图1所示,包括:
(1)对历史电力负荷数据进行预处理;
(2)对预处理后的所述历史电力负荷数据D进行关联规则挖掘,提取与负荷属性关联性强的属性集合,建立包含所述负荷属性数据和与负荷属性关联性强的属性集合数据集D′;
(3)利用聚类方法将所述数据集D分为正常运行数据类、重载数据类和过载数据类;
(4)根据所述数据集D构建电力负荷数据预测模型,预测变压器的重载概率和过载概率。
具体的,所述步骤(1)包括:
(1-1)对所述历史电力负荷数据进行匿名化处理;
(1-2)采用K近邻填补算法对数值型数据缺失值进行填补;
(1-3)对所述历史电力负荷数据对应的天气数据进行处理;
(1-4)获取所述历史电力负荷数据的负荷值,并根据所述负荷值将所述历史电力负荷数据分为正常、重载和过载三类。
进一步的,部分实体之间存在多对多关系,对于客户来说,自身具有行业类别,用电地址,电压等级等信息,同时,客户可能使用来自多个受电点的服务,这样客户和受电点之间的多对多关系形成二分图,客户的自身信息和二分图的结构信息,如度、边权,可以联合起来作为背景信息用于唯一识别用户身份,同时,这些信息可能不能全被攻击者拿到,通过假设攻击者只能获取部分信息,可以减少对数据的修改,所述步骤(1-1)中,采用混合K-匿名对所述历史电力负荷数据进行匿名化处理,包括:
令攻击者的背景知识包括:目标客户地址及目标客户至多m个受电点,以客户作为顶点,客户地址作为顶点属性,建立复合超图,其中,顶点包含 m m i n { m , | S | } 条超边,S为所述客户的受电点集合,超边的标签为所述客户的受电点集合S的全部大小为min{m,|S|}的子集;
将所述复合超图中秩小于k的超边进行合并,直至所述复合超图中超边的秩均大于或等于k;
其中,所述将所述复合超图中秩小于k的超边进行合并,直至所述复合超图中超边的秩均大于或等于k中,选择两个超边所关联的客户实际需要修改的受电点个数的和最小的超边进行合并;
将所述复合超图中顶点属性进行泛化,直至所述复合超图每个连通量中顶点属性相同。
例如:将客户地址按街道、区、市、省逐级泛化,使得复合超图每个连通分量中客户的地址相同,这样的复合超图能够保证每个准标识符在数据集中出现的次数不少于k,从而有效地保护客户不被攻击者再识别,保护了客户自身的隐私信息和客户的用电信息。
再例如:如图2所示,v1-v5表示用户a-e表示受电点,用户与受电点的完整信息如表1所示:
表1用户与受电点的完整信息
用户 受电点 地址
v1 a,b,c 济南市天桥区无影山中路12号
v2 a,b,c 济南市天桥区无影山中路104号
v3 a,b,d 济南市历下区二环东路1002号
v4 d,e 济南市历下区二环东路2912号
v5 c,d 济南市历下区二环东路2210号
假设攻击者至多知道用户的地址和两个受电点的信息,v3的受电点集合的子集{c,d}在所有准标识符中是唯一的,且在攻击者的背景知识范围内,所以可被唯一识别。根据用户与受电点的完整信息建立用户与受电点间的复合超图,如图3所示,可以看出存在秩小于2的超边,通过合并这些秩小于2的超边,使得所有超边的秩都大于等于2,合并后如图4所示,对于地址信息,采用泛化方法实现匿名,将门牌号和街道依次去掉,最终变换结果如表2所示:
表2匿名化处理后用户与受电点的信息
用户 受电点 地址
v1 a,b,c 济南市天桥区无影山中路
v2 a,b,c 济南市天桥区无影山中路
v3 a,b,d 济南市历下区二环东路
v4 a,d 济南市历下区二环东路
v5 b,d 济南市历下区二环东路
所述步骤(1-2)中,将所述历史电力负荷数据的数据表中的空缺位置进行数据填充,填充内容为所述空缺位置列临近的k个邻居的众数或平均值。
其中,k值能够通过人工设定;
同样是温度升高3℃,但在冬天和在夏天对变压器的功率造成不一样的影响;将一个地区某个时间段的温度求平均值作为该时间段的温度基准值,然后将该时间段内每天的温度处理为基准值+变化率,作为后续***分析的属性,因此,所述步骤(1-3)中,将每天t时间段内所述历史电力负荷数据对应的天气温度求平均值作为温度基准值,采用温度基准值+温度变化率作为所述历史电力负荷数据的属性。
所述步骤(1-4)中,确定所述历史电力负荷数据第i时的负荷值Pi,公式为:
P i = P i ′ P - - - ( 1 )
式(1)中,i∈[1,24],Pi′为所述历史电力负荷数据第i时的视在功率值,P为变压器容量;
若max{Pi}∈(0,80],则所述历史电力负荷数据为正常运行数据;
若max{Pi}∈(80,100],则所述历史电力负荷数据为重载数据;
若max{Pi}∈[100,+∞),则所述历史电力负荷数据为过载数据。
所述步骤(2)中将原始数据中挖掘出与负荷关联性强的属性,进而对原始数据属性集进行化简,为分类和聚类操作做准备,以提高数据处理的效率和精确性。具体包括:输入所述预处理后的历史电力负荷数据D作为事务集,A和B分别为两个互斥的项集,其中,A为所述历史电力负荷数据中除负荷属性数据外的属性集合,B为所述历史电力负荷数据中负荷属性,设定支持度最小阈值min_supp,设定置信度最小阈值min_conf,确定项集A与项集B的支持度 sup p o r t ( A ⇒ B ) , 公式为:
sup p o r t ( A ⇒ B ) = P ( A ∪ B ) - - - ( 2 )
式(2)中,P(A∪B)为事务集D中既包含项集A又包含项集B的实例所占的百分比;
确定项集A与项集B的置信度公式为:
c o n f i d e n c e ( A ⇒ B ) = P ( B | A ) - - - ( 3 )
式(3)中,P(B|A)为事务集D中包含项集A也包含项集B的实例所占的百分比;
获取 sup p o r t ( A ⇒ B ) ≥ m i n _ sup p c o n f i d e n c e ( A ⇒ B ) ≥ min _ c o n f 的属性数据;
确定项集A与项集B的提升度公式为:
l i f t ( A ⇒ B ) = c o n f i d e n c e ( A ⇒ B ) P ( B ) - - - ( 4 )
式(4)中,P(B)为事务集D中包含项集B的实例所占的百分比;
根据对所述历史电力负荷数据中挖掘到的规则进行排序,设定阈值e,提取的规则包含的属性数据和负荷属性数据建立所述数据集D′。
其中,所述历史电力负荷数据中除负荷属性数据外的属性集合包括:变压器属性数据、台区属性数据、用户属性数据和天气属性数据等。
所述步骤(3)中,基于电力***的大数据,就是根据所述历史电力负荷数据中除负荷属性数据外的属性将其负荷划分到正常、重载和过载不同的簇中,当输入新的数据时,***会根据这些信息将其分到与其最相似的类别中。可用的聚类方法有:DBSCAN和k-means。其中DBSCAN是基于密度的聚类,是一种无监督的分类方法,优势是可以发现任意形状的簇,并且对噪声数据不敏感;相比之下k-means算法:更倾向于发现球状的且大小相近的簇,且对噪声数据较为敏感。考虑到电网的数据分布不均匀,本模块采用基于密度的聚类方法进行分析,将密度(距离近)相连的数据样本分到同一簇(正常/重载/过载)中,调用DBSCAN算法,输入所述数据集D′,具体包括:
(3-1)设置扫描半径d和最小包含点数min_pts,选择任意核心点,其中,核心点为满足扫描半径d内指定数据样本数大于min_pts的对象;
(3-2)获取从所述核心点出发的所有密度相连的负荷样本;
(3-3)遍历所述核心点在扫描半径d内的全部核心点样本,并获取所述全部核心点样本密度相连的负荷样本,形成聚类。
简单的来说就是对电网数据集D′中任一满足核心对象条件的数据对象p,所有从p密度可达的数据对象o所组成的集合构成了一个完整的聚类C,其中,所述聚类C为负荷正常类、重载类或过载类;
其中,p核心对象:NUM(dis(q→p)≤d)>=min_pts;
p和q密度可达:电网数据集D′存在一个数据对象链p1p2,...,pn,其中p1=q,pn=p对于pi∈D′(1≤i≤n),pi+1是从pi关于用户指定的邻域d直接密度可达(pi+1和pi在同一个核心对象的邻域内),则数据对象p是从数据对象q关于d和min_pts密度可达的。
p和o密度相连:如果在电网数据D′中存在数据对象o∈D′,使对象p和q都是从o关于用户定义的样本邻域d和min_pts密度可达的,那么对象p到q是关于ε和min_pts密度相连的。
所述步骤(4)中,根据大量的变压器功率历史数据结合时间人口等外部因素较为准确的预测出某时某地某台变压器的重、过载概率。短期来看,管理者可以根据预测的结果及时做出相关调整,保障社会生产的安全稳定。长期来看,预测结果可以为配网改造提供决策意见,对重过载频繁地区进行适当增容和维护,对其他地区进行线路改造来达到电力资源分配的合理性。运用基于决策树的随机森林方法来构造分类模型,其中决策树从一组无规则的事例推理得出树状的分类规则,树的根结点是整个数据集合空间,采用自顶向下的递归方式,在每个内部节点上对属性测试,并根据不同属性判断从该节点向下分为2支或者多支,最后在每个叶节点得到结论。从决策树的根结点到叶节点的1条路径就是1条分类规则,整棵树对应着1组表达式规则。常用的经典决策树算法包括ID3,C4.5和CART。
具体的,调用随机森林算法,输入所述数据集D′构造电力负荷预测模型,其中,以所述数据集D′为根节点构造分类决策树,叶子节点为模型决策的类别,所述分类决策树中的分支选择根据下述公式:
GINI(s,t)=pLGINI(tL)+pRGINI(tR)(5)
式(5)中,t为当前节点分支的属性,s为当前节点分支的属性值,pL为节点t以s为切分点生成的左子树中的样例占当前节点样例的比例,pR为节点t以s为切分点生成的右子树中的样例占当前节点样例的比例,GINI(tL)为节点t以s为切分点生成的左子树的基尼指数,GINI(tR)为节点t以s为切分点生成的右子树的基尼指数,其中,所述基尼指数GINI(t)的公式为:
G I N I ( t ) = 1 - Σ j p 2 ( j / t ) - - - ( 6 )
式(6)中,p(j/t)为目标类别j在节点t出现的比例,j取值为0/1/2,分别表示正常运行/重载/过载;
选择使GINI(s,t)值最小的t和s对当前节点进行***,生成所述分类决策树。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (9)

1.一种面向电力***重过载预警的大数据分析方法,其特征在于,包括步骤:
(1)对历史电力负荷数据进行预处理;
(2)对预处理后的所述历史电力负荷数据D进行关联规则挖掘,提取与负荷属性关联性强的属性集合,建立包含所述负荷属性数据和与负荷属性关联性强的属性集合数据集D′;
(3)利用聚类方法将所述数据集D分为正常运行数据类、重载数据类和过载数据类;
(4)根据所述数据集D构建电力负荷数据预测模型,预测变压器的重载概率和过载概率。
2.如权利要求1所述的方法,其特征在于,所述步骤(1)包括:
(1-1)对所述历史电力负荷数据进行匿名化处理;
(1-2)采用K近邻填补算法对数值型数据缺失值进行填补;
(1-3)对所述历史电力负荷数据对应的天气数据进行处理;
(1-4)获取所述历史电力负荷数据的负荷值,并根据所述负荷值将所述历史电力负荷数据分为正常、重载和过载三类。
3.如权利要求2所述的方法,其特征在于,所述步骤(1-1)中,采用混合K-匿名对所述历史电力负荷数据进行匿名化处理,包括:
令攻击者的背景知识包括:目标客户地址及目标客户至多m个受电点,以客户作为顶点,客户地址作为顶点属性,建立复合超图,其中,顶点包含条超边,S为所述客户的受电点集合,超边的标签为所述客户的受电点集合S的全部大小为min{m,|S|}的子集;
将所述复合超图中秩小于k的超边进行合并,直至所述复合超图中超边的秩均大于或等于k;
将所述复合超图中顶点属性进行泛化,直至所述复合超图每个连通量中顶点属性相同。
4.如权利要求2所述的方法,其特征在于,所述步骤(1-2)中,将所述历史电力负荷数据的数据表中的空缺位置进行数据填充,填充内容为所述空缺位置列临近的k个邻居的众数或平均值。
5.如权利要求2所述的方法,其特征在于,所述步骤(1-3)中,将每天t时间段内所述历史电力负荷数据对应的天气温度求平均值作为温度基准值,采用温度基准值+温度变化率作为所述历史电力负荷数据的属性。
6.如权利要求2所述的方法,其特征在于,所述步骤(1-4)中,确定所述历史电力负荷数据第i时的负荷值Pi,公式为:
P i = P i ′ P - - - ( 1 )
式(1)中,i∈[1,24],P′i为所述历史电力负荷数据第i时的视在功率值,P为变压器容量;
若max{Pi}∈(0,80],则所述历史电力负荷数据为正常运行数据;
若max{Pi}∈(80,100],则所述历史电力负荷数据为重载数据;
若max{Pi}∈[100,+∞),则所述历史电力负荷数据为过载数据。
7.如权利要求1所述的方法,其特征在于,所述步骤(2)中,输入所述预处理后的历史电力负荷数据D作为事务集,A和B分别为两个互斥的项集,其中,A为所述历史电力负荷数据中除负荷属性数据外的属性集合,B为所述历史电力负荷数据中负荷属性,设定支持度最小阈值min_supp,设定置信度最小阈值min_conf,确定项集A与项集B的支持度 sup p o r t ( A ⇒ B ) , 公式为:
sup p o r t ( A ⇒ B ) = P ( A ∪ B ) - - - ( 2 )
式(2)中,P(A∪B)为事务集D中既包含项集A又包含项集B的实例所占的百分比;
确定项集A与项集B的置信度公式为:
c o n f i d e n c e ( A ⇒ B ) = P ( B | A ) - - - ( 3 )
式(3)中,P(B|A)为事务集D中包含项集A也包含项集B的实例所占的百分比;
获取 sup p o r t ( A ⇒ B ) ≥ m i n _ sup p c o n f i d e n c e ( A ⇒ B ) ≥ min _ c o n f 的属性数据;
确定项集A与项集B的提升度公式为:
l i f t ( A ⇒ B ) = c o n f i d e n c e ( A ⇒ B ) P ( B ) - - - ( 4 )
式(4)中,P(B)为事务集D中包含项集B的实例所占的百分比;
根据对所述历史电力负荷数据中挖掘到的规则进行排序,设定阈值e,提取的规则包含的属性数据和负荷属性数据建立所述数据集D′。
8.如权利要求1所述的方法,其特征在于,所述步骤(3)中,调用DBSCAN算法,输入所述数据集D′,具体包括:
(3-1)设置扫描半径d和最小包含点数min_pts,选择任意核心点,其中,核心点为满足扫描半径d内指定数据样本数大于min_pts的对象;
(3-2)获取从所述核心点出发的所有密度相连的负荷样本;
(3-3)遍历所述核心点在扫描半径d内的全部核心点样本,并获取所述全部核心点样本密度相连的负荷样本,形成聚类。
9.如权利要求1所述的方法,其特征在于,所述步骤(4)中,调用随机森林算法,输入所述数据集D′构造电力负荷预测模型,其中,以所述数据集D′为根节点构造分类决策树,叶子节点为模型决策的类别,所述分类决策树中的分支选择根据下述公式:
GINI(s,t)=pLGINI(tL)+pRGINI(tR)(5)
式(5)中,t为当前节点分支的属性,s为当前节点分支的属性值,pL为节点t以s为切分点生成的左子树中的样例占当前节点样例的比例,pR为节点t以s为切分点生成的右子树中的样例占当前节点样例的比例,GINI(tL)为节点t以s为切分点生成的左子树的基尼指数,GINI(tR)为节点t以s为切分点生成的右子树的基尼指数,其中,所述基尼指数GINI(t)的公式为:
G I N I ( t ) = 1 - Σ j p 2 ( j / t ) - - - ( 6 )
式(6)中,p(j/t)为目标类别j在节点t出现的比例,j取值为0/1/2,分别表示正常运行/重载/过载;
选择使GINI(s,t)值最小的t和s对当前节点进行***,生成所述分类决策树。
CN201510920842.3A 2015-12-11 2015-12-11 一种面向电力***重过载预警的大数据分析方法 Pending CN105404944A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510920842.3A CN105404944A (zh) 2015-12-11 2015-12-11 一种面向电力***重过载预警的大数据分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510920842.3A CN105404944A (zh) 2015-12-11 2015-12-11 一种面向电力***重过载预警的大数据分析方法

Publications (1)

Publication Number Publication Date
CN105404944A true CN105404944A (zh) 2016-03-16

Family

ID=55470417

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510920842.3A Pending CN105404944A (zh) 2015-12-11 2015-12-11 一种面向电力***重过载预警的大数据分析方法

Country Status (1)

Country Link
CN (1) CN105404944A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108335231A (zh) * 2018-01-29 2018-07-27 国网福建省电力有限公司 一种自动匹配的配电网数据诊断方法
CN108460534A (zh) * 2018-03-20 2018-08-28 广东电网有限责任公司佛山供电局 一种基于改进型密度聚类的负荷管理方法
CN109063922A (zh) * 2018-08-21 2018-12-21 国网湖北省电力有限公司鄂州供电公司 一种基于小区入住率的配电变压器重过载预测方法
CN109117974A (zh) * 2017-06-26 2019-01-01 中国电力科学研究院 一种配电网台区重过载风险评估方法和装置
CN109376858A (zh) * 2018-09-12 2019-02-22 天津大学 一种基于部分负荷率对冷凝式换热器性能预测的方法
CN109460004A (zh) * 2018-10-26 2019-03-12 国网天津市电力公司 基于大数据的配电网故障预测方法及***
CN109829497A (zh) * 2019-01-31 2019-05-31 清华四川能源互联网研究院 一种基于监督学习的台区用户识别及判别方法
CN110263995A (zh) * 2019-06-18 2019-09-20 广西电网有限责任公司电力科学研究院 考虑负荷增长率与用户用电特性的配变重过载预测方法
CN110516884A (zh) * 2019-08-30 2019-11-29 贵州大学 一种基于大数据平台的短期负荷预测方法
CN110533089A (zh) * 2019-08-19 2019-12-03 三峡大学 基于随机森林的自适应非侵入式负荷识别方法
CN110825518A (zh) * 2019-10-14 2020-02-21 上海交通大学 面向微服务的纳秒级电力资源分配方法和***
CN112034302A (zh) * 2020-07-17 2020-12-04 贵州电网有限责任公司 利用微气象实时监测信息强化架空线路输送安全性的方法
CN112384920A (zh) * 2018-07-11 2021-02-19 维萨国际服务协会 具有自动模糊变量检测功能的保护隐私的图压缩
CN112750051A (zh) * 2020-12-30 2021-05-04 广东电网有限责任公司计量中心 基于随机森林算法的台区相序识别方法、装置及终端设备
CN112994250A (zh) * 2021-04-20 2021-06-18 广东电网有限责任公司佛山供电局 重过载事件的监测方法、装置、电子设备及存储介质
CN113704436A (zh) * 2021-09-02 2021-11-26 宁波深擎信息科技有限公司 基于会话场景的用户画像标签挖掘方法及装置

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109117974A (zh) * 2017-06-26 2019-01-01 中国电力科学研究院 一种配电网台区重过载风险评估方法和装置
CN108335231A (zh) * 2018-01-29 2018-07-27 国网福建省电力有限公司 一种自动匹配的配电网数据诊断方法
CN108460534A (zh) * 2018-03-20 2018-08-28 广东电网有限责任公司佛山供电局 一种基于改进型密度聚类的负荷管理方法
CN112384920A (zh) * 2018-07-11 2021-02-19 维萨国际服务协会 具有自动模糊变量检测功能的保护隐私的图压缩
CN109063922A (zh) * 2018-08-21 2018-12-21 国网湖北省电力有限公司鄂州供电公司 一种基于小区入住率的配电变压器重过载预测方法
CN109063922B (zh) * 2018-08-21 2021-04-09 国网湖北省电力有限公司鄂州供电公司 一种基于小区入住率的配电变压器重过载预测方法
CN109376858A (zh) * 2018-09-12 2019-02-22 天津大学 一种基于部分负荷率对冷凝式换热器性能预测的方法
CN109376858B (zh) * 2018-09-12 2021-12-31 天津大学 一种基于部分负荷率对冷凝式换热器性能预测的方法
CN109460004A (zh) * 2018-10-26 2019-03-12 国网天津市电力公司 基于大数据的配电网故障预测方法及***
CN109829497A (zh) * 2019-01-31 2019-05-31 清华四川能源互联网研究院 一种基于监督学习的台区用户识别及判别方法
CN109829497B (zh) * 2019-01-31 2021-06-22 清华四川能源互联网研究院 一种基于监督学习的台区用户识别及判别方法
CN110263995A (zh) * 2019-06-18 2019-09-20 广西电网有限责任公司电力科学研究院 考虑负荷增长率与用户用电特性的配变重过载预测方法
CN110263995B (zh) * 2019-06-18 2022-03-22 广西电网有限责任公司电力科学研究院 考虑负荷增长率与用户用电特性的配变重过载预测方法
CN110533089A (zh) * 2019-08-19 2019-12-03 三峡大学 基于随机森林的自适应非侵入式负荷识别方法
CN110516884A (zh) * 2019-08-30 2019-11-29 贵州大学 一种基于大数据平台的短期负荷预测方法
CN110825518A (zh) * 2019-10-14 2020-02-21 上海交通大学 面向微服务的纳秒级电力资源分配方法和***
CN110825518B (zh) * 2019-10-14 2023-06-09 上海交通大学 面向微服务的纳秒级电力资源分配方法和***
CN112034302A (zh) * 2020-07-17 2020-12-04 贵州电网有限责任公司 利用微气象实时监测信息强化架空线路输送安全性的方法
CN112750051A (zh) * 2020-12-30 2021-05-04 广东电网有限责任公司计量中心 基于随机森林算法的台区相序识别方法、装置及终端设备
CN112750051B (zh) * 2020-12-30 2023-04-07 广东电网有限责任公司计量中心 基于随机森林算法的台区相序识别方法、装置及终端设备
CN112994250A (zh) * 2021-04-20 2021-06-18 广东电网有限责任公司佛山供电局 重过载事件的监测方法、装置、电子设备及存储介质
CN112994250B (zh) * 2021-04-20 2021-08-13 广东电网有限责任公司佛山供电局 重过载事件的监测方法、装置、电子设备及存储介质
CN113704436A (zh) * 2021-09-02 2021-11-26 宁波深擎信息科技有限公司 基于会话场景的用户画像标签挖掘方法及装置
CN113704436B (zh) * 2021-09-02 2023-08-08 宁波深擎信息科技有限公司 基于会话场景的用户画像标签挖掘方法及装置

Similar Documents

Publication Publication Date Title
CN105404944A (zh) 一种面向电力***重过载预警的大数据分析方法
CN107610469B (zh) 一种考虑多因素影响的日维度区域交通指数预测方法
CN111639237B (zh) 一种基于聚类和关联规则挖掘的电力通信网风险评估***
CN110097297A (zh) 一种多维度窃电态势智能感知方法、***、设备及介质
CN104809658B (zh) 一种低压配网台区线损的快速分析方法
CN107918830B (zh) 一种基于大数据技术的配电网运行状态评估方法
CN106203867A (zh) 基于配电网评价指标体系和聚类分析的电网区域划分方法
CN106372747B (zh) 基于随机森林的台区合理线损率估计方法
CN101320449A (zh) 基于组合评价方法的配电网评估方法
CN105654196A (zh) 一种基于电力大数据的自适应负荷预测选择方法
CN107909208A (zh) 一种台区配网降损方法
CN108011367A (zh) 一种基于深度决策树算法的电力负荷特性挖掘方法
CN103942606A (zh) 基于果蝇智能优化算法的居民用电客户细分方法
CN110690701A (zh) 一种异常线损影响因素的分析方法
CN106296315A (zh) 基于用户用电数据的情境感知***
CN113988484B (zh) 一种应用于国土空间总体规划的交通可达性指标优化方法
CN113872204B (zh) 一种基于电网图拓扑计算的用电负荷性质确定方法及装置
CN104376371A (zh) 一种基于拓扑的配网分层负荷预测方法
CN104346698A (zh) 基于云计算和数据挖掘的餐饮会员大数据分析和考核***
CN107729939A (zh) 一种面向新增电网资源的cim模型扩展方法及装置
CN111415049A (zh) 一种基于神经网络及聚类的停电敏感性分析方法
CN115409264A (zh) 基于馈线故障预测的配电网抢修驻点位置优化方法
CN111814528A (zh) 一种连通性分析的夜光影像城市等级分类方法
CN102930007A (zh) 大面积停电应急处理中的用户复电紧急程度分类方法
Shao-hong et al. Location algorithm of transfer stations based on density peak and outlier detection

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160316