CN105512799B - 一种基于海量在线历史数据的电力***暂态稳定评估方法 - Google Patents

一种基于海量在线历史数据的电力***暂态稳定评估方法 Download PDF

Info

Publication number
CN105512799B
CN105512799B CN201510837215.3A CN201510837215A CN105512799B CN 105512799 B CN105512799 B CN 105512799B CN 201510837215 A CN201510837215 A CN 201510837215A CN 105512799 B CN105512799 B CN 105512799B
Authority
CN
China
Prior art keywords
sample
classification
svm
calculation
sample set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510837215.3A
Other languages
English (en)
Other versions
CN105512799A (zh
Inventor
黄彦浩
戴红阳
于之虹
才洪全
边二曼
史东宇
邱健
华科
鲁广明
李伟
周前
陈哲
汪成根
孙蓉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
Electric Power Research Institute of State Grid Jiangsu Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
Electric Power Research Institute of State Grid Jiangsu Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, China Electric Power Research Institute Co Ltd CEPRI, Electric Power Research Institute of State Grid Jiangsu Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201510837215.3A priority Critical patent/CN105512799B/zh
Publication of CN105512799A publication Critical patent/CN105512799A/zh
Application granted granted Critical
Publication of CN105512799B publication Critical patent/CN105512799B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明涉及一种基于海量在线历史数据的电力***暂态稳定评估方法,包括:对海量在线历史数据进行选取,生成仿真数据;根据仿真数据,提取特征量,生成初始样本集;采用扩展边界的方式,进行失稳样本的扩展和稳定样本的压缩,形成计算样本;基于计算样本,利用支持向量机SVM算法进行分类模型训练以及参数优化,最终形成分类模型,评估电力***暂态稳定性。本发明提供的技术方案包含了从原始在线计算结果到形成实际可用SVM模型所涉及的主要问题,建立了一个可复用的理论方案。该方案反应了大数据处理的一些特点,并为电力大数据技术包提供了新的方法。

Description

一种基于海量在线历史数据的电力***暂态稳定评估方法
技术领域
本发明涉及一种电力***安全稳定分析技术领域的评估方法,具体涉及一种基于海量在线历史数据的电力***暂态稳定评估方法。
背景技术
已有的快速判稳方法大多从在线计算数据和结果中提取静态特征和动态特征作为数据分析的基础。前者可由基础数据,以及潮流、短路等静态计算得到,后者需要进行暂态稳定计算得到。为了与在线计算相配合,这种暂态稳定计算通常仅进行几步迭代以减少耗时。从已有成果的效果看,基于含有静态和动态特征的分析数据,使用常规的数据分析算法,已可以获得较为满意的结果。但由于无法避免暂态稳定计算,其仍需要较多的硬件资源,***实现也较为复杂。
此外,对于大***在线计算,其所积累的历史数据体量极其庞大,并且随着时间推移还在快速产生。例如,国调35000节点***每15分钟产生的计算数据就有20M,全天可达2GB,全年可以达到0.7PB。利用这些数据进行快速判稳,在现有的软硬件条件下势必不能简单地采取“全部采用”的方式,必须考虑到其“大”和“快”的特点。在这方面,大数据处理的思想和技术可以提供帮助,同时针对该问题的研究成果也可丰富电力大数据技术包。
在电力***在线计算数据中,元件的模型及参数通常不会经常改变。若在两个时刻***的静态运行点相同,在发生相同故障的情况下,在线稳定计算结果也应相同。同时,根据惯常理解,随着运行方式的连续变化,电力***稳定性也会随之变化,两者是密切关联的。上述两点为使用静态特征直接判断***稳定性提供了可能。同时,从实际工作方式来看,电网运行控制的惯常作法是首先进行运行方式计算,给出具有指导意义的结论和策略;而后在调度运行中,当静态测得的物理量与方式计算对应的物理量相近时,就认为***会具有方式计算结论中得到的特点,进而采取预定策略。这一过程实际上可以看作仅通过与已有计算结果比较静态量而确定***特征,包括稳定性。
基于现有理论,很难直接建立起***静态特征与稳定性间的明确关系。
发明内容
为解决上述现有技术中的不足,本发明的目的是提供一种基于海量在线历史数据的电力***暂态稳定评估方法。
本发明的目的是采用下述技术方案实现的:
本发明提供一种基于海量在线历史数据的电力***暂态稳定评估方法,其特征在于,所述方法包括下述步骤:
步骤一:对海量在线历史数据进行选取,生成仿真数据;
步骤二:根据仿真数据,提取特征量,生成初始样本集;
步骤三:采用扩展边界的方式,进行失稳样本的扩展和稳定样本的压缩,形成计算样本;
步骤四:基于计算样本,利用支持向量机SVM算法进行分类模型训练以及参数优化,最终形成分类模型,评估电力***暂态稳定性。
进一步地,利用时间窗的方式选取在线历史数据,设需考虑的时间窗天数为d,则对于第m日,所需的计算样本Sjsd_m表示为:
Figure BDA0000858336630000021
其中:Sjsd_m表示所需的多日样本集合,k表示第k日,d表示时间窗天数,Sjs k表示第k日的计算样本。
进一步地,提取特征量包括下述步骤:
(1)特征量初筛;
(2)特征量压缩。
进一步地,所述特征量初筛选用的电力***静态状态量如下:
V:母线电压幅值;θV:母线电压角度;Pg:发电机有功,按有功出力为正、负的发电机分别统计;Qg:发电机无功,按有功出力为正、负的发电机分别统计;cosθg:发电机功率因数;PL:负荷有功,按有功为正、负的负荷分别统计;QL:负荷无功,按有功为正、负的负荷分别统计;cosθL:负荷功率因数;PACLine:交流线路有功,取I侧;QACLine:交流线路无功,取I侧;PDCLine:直流线路有功,取I侧;QDCLine:直流线路无功,取I侧;QPCP:并联电容器投入容量;QPLP:并联电抗器投入容量;
对于电力***静态状态量采用以下初始统计参数:Max:最大值;Min:最小值;Mean:均值;Sd:均值的标准差;
具有稳健特性的统计量:Median:中位数;Mds:中位数标准差;1st:四分之一分位数;3st:四分之三分位数;Mad:中位绝对离差;Interq:四分位差;Mj10:10%截尾均值;Mj10s:10%截尾均值方差;
Skew:偏度;Kurt:峰度;
在对电力***状态进行分析时按电压等级统计母线电压和交流线的静态状态量和统计量,对发电机和负荷按照有功的正负分别统计状态量,对于发电机和负荷的统计状态量包括:
SumPz:正有功总量;SumPf:负有功总量;Pzfb:正负有功总量之比;SumQz:正无功总量;SumQf:负无功总量;Qzfb:正负无功总量之比;
对于故障点,其特征量分为两个部分,一是故障点周边两级母线所在分区的运行状态统计,其统计内容与全***运行情况统计相同;二是表征故障自身特点的特征量,包括:故障电流If、故障点电压幅值Vf、故障点电压相角θVf和戴维南阻抗幅值Zf;
初始样本集Sjb由电力***特征量和故障点及其周边区域特征量组成。
进一步地,采用随机森林RF算法进行特征量压缩,随机森林RF算法及用其进行特征量重要程度计算的基本思想包括:
①生成若干个决策树而不是一个;
②生成决策树时,随机从初始样本集中选取一组初始样本,使用完毕后再放回初始样本集;
③生成决策树时,使用随机选择的初始样本的一组属性作为候选特征集,而不是全部属性;
④最后的特征量重要程度指标通常由所有决策树的计算结果采取投票法共同决定;
随机森林RF算法的参数包括:决策树的个数ntree和候选特征集中特征的个数mtry,mtry采用经验值,取特征量个数的算数平方根;
RF算法所获得的特征量重要程度指标,表示的是当移去该特征量或在该特征量中加入噪声时对分类结果的影响;特征量的平均重要性指标越大表示特征量越重要,如果指标为负表示特征量对分类起反作用,如果为0则对分类没有作用;对于指标等于0的特征量采取直接去除的方式,对于指标大于0的特征量根据计算能力的实际情况选择剔除,并通过测试确定剔除比例;去除重要性为负值的特征量导致判稳效果不稳定,仅剔除掉重要性为0的特征量。
进一步地,所述步骤三包括:
1)失稳样本的扩展:采用扩展边界方式对失稳样本进行扩展;
设初始的单日失稳样本集为Sn1,因扩展新增的失稳样本集为Sn2,扩展后的失稳样本集为Sn3,则有:
Sn2=svm_sup(Yi) Yi∈Sn1,i=1,2…N,N=num(Sn1)
Sn3=Sn1∪Sn2
其中,svm_sup()为寻找支持向量并将其标记为失稳样本的运算,Yi为Sn1中的单个样本,num()为样本集的个数统计运算;
设与失稳样本集Sn2对应的初始稳定样本为Sn2jb,则扩展后的单日样本集Skzjb表示为:
Skzjb=Sjb-Sn2jb+Sn2
扩展运算并不改变样本的个数,只是改变其中部分样本的标签;
2)稳定样本的压缩;
对扩展后的失稳样本集再次采用支持向量机SVM进行自分类,即先选取大的罚函数值基于样本集训练模型,再用样本集训练模型对该样本集进行分类计算,选取与分类面距离最近的num(Sn3)个稳定样本与失稳样本组合形成新的样本集;
样本压缩处理后的包括失稳样本和稳定样本的样本集为Sjs,设压缩后的稳定样本集为Swd,则Sjs表示为:
Swd=svm_sj(Skzjb,Sn3)
Sjs=Sn3+Swd
其中,svm_sj()为基于SVM的稳定样本压缩运算。
进一步地,所述步骤四包括:在获得Sjsd_m后,采用支持向量机SVM算法基于Sjsd_m进行计算样本分类训练,得到进行快速判稳的判别函数;最终的判别函数写作:
Figure BDA0000858336630000041
其中,sgn为符号函数用于最终确定计算样本的分类,计算结果的正、负分别对应于两个分类结果,K为核函数,α和b是由SVM训练得到的参数,xi和yi为支持向量及其分类,yi=1或-1,等于1和-1时没有特定意义,只是决定各项的符号,x为待判别样本;
Figure BDA0000858336630000043
和b*分别是SVM训练得到的系数,xi表示SVM训练得到的支持向量;核函数K采用高斯函数形式,即径向基函数:
Figure BDA0000858336630000042
其中:σ是人为指定的核函数参数。
在训练过程中,除了指定核函数的参数σ外,还指定松弛系数c,即允许分类出错的程度,用于增强支持向量机SVM的泛化能力;
采用网格方法进行参数优化:指定核函数的参数σ和松弛系数c的搜索范围,根据分类错误按一定步进完成寻优,利用R语言或Matlab,其所提供的支持向量机SVM分类模型训练函数均有默认参数,对于支持向量机SVM,通常σ的取值为特征向量的倒数,c常取为1。在实际应用时,样本准备和特征量生成在每个断面完成动态安全分析计算后的剩余时间进行,模型训练在判定日的零点前后进行;在完成模型训练后,在判定日的全天内都采用该模型在进行动态安全分析之前判定稳定,对于被判定为失稳的故障,补入动态安全分析的故障集,同时也进行样本的准备;如此连续进行。
本发明提供的技术方案具有的优异效果是:
本发明算法体现了使用海量在线历史数据进行分析工作的特点。由于仿真数据量过于庞大,因此初始样本的特征量比之一般的算例***多出很多,稳健统计量的引入也体现了大***数据的复杂性。同时,样本的压缩与扩展处理反应了在海量数据分析中容易出现的过拟合问题,特别是有价值样本过少、容易被“淹没”的情况,而计算样本集的选取策略则可适应在线数据不断产生的特点。此外,SVM算法本身是一个成熟的方法,具有使用简单的特点,对其的选用符合在大数据分析中采用成熟简单方法的观点。
本发明内容包含了从原始在线计算结果到形成实际可用SVM模型所涉及的主要问题,建立了一个可复用的理论方案。该方案反应了大数据处理的一些特点,并为电力大数据技术包提供了新的方法。
附图说明
图1是本发明提供的基于海量在线历史数据的电力***暂态稳定评估方法的流程图
具体实施方式
下面结合附图对本发明的具体实施方式作进一步的详细说明。
以下描述和附图充分地示出本发明的具体实施方案,以使本领域的技术人员能够实践它们。其他实施方案可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求,否则单独的组件和功能是可选的,并且操作的顺序可以变化。一些实施方案的部分和特征可以被包括在或替换其他实施方案的部分和特征。本发明的实施方案的范围包括权利要求书的整个范围,以及权利要求书的所有可获得的等同物。在本文中,本发明的这些实施方案可以被单独地或总地用术语“发明”来表示,这仅仅是为了方便,并且如果事实上公开了超过一个的发明,不是要自动地限制该应用的范围为任何单个发明或发明构思。
本发明提供一种基于海量在线历史数据的电力***暂态稳定评估方法,首先,将与***稳定性相关的特征分为表征***运行状态和故障情况两大类,认为***是否能够保持稳定与故障发生时刻***的运行状态和故障冲击有关;然后,分别寻找与表征***运行状态和故障冲击相关的静态特征,认为***的稳定性由这两类特征刻画。从理论上讲,这一策略有效的前提是元件模型及其参数不变,而在线计算数据通常符合这一要求。
在确定上述特征量的基础上,判稳问题就是一个分类问题,进而可以采用合适的分类算法进行处理。
具体包括下述步骤:
步骤一:对海量在线历史数据进行选取,生成仿真数据。
根据数据分析的一般规律,采用如图1所示的步骤完成分析:
其中,“初始样本生成”涉及特征量的初筛和压缩,“样本压缩/扩展”涉及稳定和失稳样本的处理,所谓“扩展边界”即与该步有关。将最终用于训练分类模型的单日样本集称为“计算样本(集合)”,用Sjs表示,多日的用Sjsd表示;其之前的初始单日样本集称为“样本集(合)”,用Sjb表示,多日的用Sjbd表示;与一个故障相对应的暂态稳定计算数据及结果,经处理后得到的记录称为一个样本,用Y表示,Y∈Sjb;特征量集合用T表示。测试样本集合与Sjs均由Sjb得到,两者的特征量相同。如果将样本集看作一个二维表,那么特征量就是表的属性,样本就是每一条记录。
为了提高对失稳故障的预测准确性,在进行SVM模型训练时需考虑判稳时刻之前多日乃至更长时间的历史数据,即最终应采用Sjsd进行SVM训练。如前所述,电力***的运行存在周期性,这种周期性在短时间内较为稳定,而随着时间的拉长,周期两端的***运行方式不可避免的会产生越来越大的差异。因此,对于Sjsd的时间跨度选择应着重于判定日前的若干天。采取这样的按日跟踪方式也能够使算法的最终实际应用变得简便易行,大大简化样本数据准备的复杂性。若设需考虑的时间窗天数为d则对于第m日,所需的样本Sjsd_m可表示为:
Figure BDA0000858336630000061
步骤二:根据仿真数据,进行特征量的提取,生成初始样本。
特征量的意义在于区分不同的样本,在样本间产生“合理”的距离。由于***运行状态的区别具有整体性,属于不同数据集合之间的比较,因此与其对应的特征量应着重于统计特征。对于故障则需给出能够反应其位置特点的特征量。
特征量的确定分为初筛和压缩两步,在初筛中确定与问题可能相关的特征量,而后再根据需要进行数据压缩。由于对信息的压缩通常会导致信息的损失,因此在计算能力允许的情况下,应尽可能减小压缩量或不压缩。
(1)特征量的初筛
通过潮流计算可以确定***的静态运行点,但对于大***,不可能将所有元件的静态结果直接作为数据分析程序的输入,如全网母线电压,必须进行必要的统计。这与惯常通过枢纽点、关键断面等个别元件评估确定***运行状态的作法有所不同,能够更全面的反应***的静态运行点。
本发明现在特征量初筛阶段选用的***静态状态量如下:
V:母线电压幅值;
θV:母线电压角度;
Pg:发电机有功(按有功出力为正、负的发电机分别统计);
Qg:发电机无功(按有功出力为正、负的发电机分别统计);
cosθg:发电机功率因数;
PL:负荷有功(按有功为正、负的负荷分别统计);
QL:负荷无功(按有功为正、负的负荷分别统计);
cosθL:负荷功率因数;
PACLine:交流线路有功(取I侧);
QACLine:交流线路无功(取I侧);
PDCLine:直流线路有功(取I侧);
QDCLine:直流线路无功(取I侧);
QPCP:并联电容器投入容量;
QPLP:并联电抗器投入容量。
在已有的研究中,对静态状态量的统计通常采用平均值、最大值、最小值等统计量。这些统计量可以在一定程度上反应***静态状态量的特点,但存在抗干扰能力差的问题。这里的干扰包括两类,一是特异值的干扰,如出现很大或很小的值,这种干扰对平均值的影响尤大;二是因静态量的分布特征产生的误差。如果静态量服从正态分布,那么使用平均值和方差就可以比较好的对其进行描述,但若静态量的分布是偏离中间值的长尾分布或是不规则分布,那么使用传统的统计量就难以对其进行合理描述。
现代稳健回归方法研究了存在上述两种干扰时如何有效地描述分布,其采用的位置参数和距离参数主要包括中位数、四分位数、截尾均值、M估计等。对于大***,当状态量很多时,其分布较为平滑,接近于自然分布。但对于局部***,当状态量有限时,其分布则同已知标准分布差距较大,此时采用稳健回归技术可以获得较好的效果。
为了便于研究比较,在本课题中对于***静态状态量采用以下初始统计参数:
Max:最大值;
Min:最小值;
Mean:均值;
Sd:均值的标准差;
---------------------------------以下为具有稳健特性的统计量----------------
Median:中位数;
Mds:中位数标准差;
1st:四分之一分位数;
3st:四分之三分位数;
Mad:中位绝对离差;
Interq:四分位差;
Mj10:10%截尾均值;
Mj10s:10%截尾均值方差;
---------------------------------以上为具有稳健特性的统计量----------------
Skew:偏度;
Kurt:峰度
在对***状态进行分析时按电压等级统计母线电压和交流线的相关状态量和统计量,对发电机和负荷按照有功的正负分别统计前述状态量。同时,对于发电机和负荷还包括:
SumPz:正有功总量;
SumPf:负有功总量;
Pzfb:正负有功总量之比;
SumQz:正无功总量;
SumQf:负无功总量;
Qzfb:正负无功总量之比。
对于故障点,其特征量分为两个部分,一是故障点周边两级母线所在分区的运行状态统计,其统计内容与全***运行情况统计相同;二是表征故障自身特点的特征量,主要有故障电流If、故障点电压幅值Vf、故障点电压相角θVf和戴维南阻抗幅值Zf
最终,Sjb由***特征量和故障点及其周边区域特征量组成。
(2)特征量的压缩
按上面的思路,由初始计算结果得到的样本其长度达到1226维,数据分析的计算量很大,而且其中有可能存在冗余信息。为了加快分析速度、提升分析效果,可以考虑对初筛的特征量进行压缩。
本课题采用随机森林算法(Random Forest,RF)实现对特征量的筛选。
RF算法基本思想的要点有:
1、生成若干个决策树而不是一个;
2、生成决策树时,随机从样本集中选取一组样本,使用完毕后再放回样本集;
3、生成决策树时,使用随机选择的、该组样本的一组属性作为候选特征集,而不是全部属性;
4、最后的结果由所有决策树的计算结果共同决定,可采用投票法或其它方法确定。
选择RF算法筛选特征量的原因有两个:
1、RF算法不会出现过拟合,适用于大样本量数据的处理;
2、RF可以得到表征特征量重要程度的指标,例如对预测准确度的影响、Gini指数等。
RF算法的参数主要是树的个数ntree和候选特征集中特征的个数mtry。对于国调35000点***,初筛后的样本经试算发现ntree=500时,已经足以得到稳定的计算结果,而mtry可采用经验值,取特征量个数的算数平方根。
RF算法所获得的特征量重要程度指标,通常表示的是当移去该特征量或在该特征量中加入噪声时对分类结果的影响。一般情况下,特征量的平均重要性指标(在R语言中是MeanDecreaseAccuracy)越大表示该特征量越重要,如果指标为负表示该特征量可能对分类起反作用,如果为0则可能对分类没有作用。因此,对于指标等于0的特征量可采取直接去除的方式,对于指标大于0的特征量应根据计算能力的实际情况选择剔除,并通过测试确定剔除比例。
经测试,去除重要性为负值的特征量会导致判稳效果不稳定,因此仅剔除掉重要性为0的特征量
步骤三:针对原始样本中的失稳样本过少的问题,采用扩展边界的方式,进行失稳样本的扩展和稳定样本的压缩,形成计算样本。
本发明采用扩展边界的方式,也就是将一部分与失稳故障“接近”的稳定故障标记为“失稳”,从而增加样本中的失稳故障数量,并在此基础上完成对稳定故障的压缩。
(1)失稳样本的扩展
将与失稳故障“接近”的稳定故障标记为失稳,相当于认为***的稳定性在该故障与失稳故障间发生了改变。由于***状态不会突变,因此“真正”的判稳边界应该在这两类故障之间。同时,本发明的失稳样本扩展策略是一种以进行更多的实际时域仿真计算为代价,提高数据分析效率和失稳故障覆盖率的方式。其主要目标是达到两者的均衡点,即实现在预定时间内完成数据分析计算并覆盖失稳故障的前提下,尽可能减少无用的时域仿真计算。
设初始的单日失稳样本集为Sn1,因扩展新增的失稳样本集为Sn2,扩展后的失稳样本集为Sn3,则有:
Sn2=svm_sup(Yi) Yi∈Sn1,i=1,2…N,N=num(Sn1)
Sn3=Sn1∪Sn2
其中,svm_sup()为寻找支持向量并将其标记为失稳样本的运算,Yi为Sn1中的单个样本,num()为样本集的个数统计运算。
设与Sn2对应的初始稳定样本为Sn2jb,则扩展后的单日样本集Skzjb可以表示为:
Skzjb=Sjb-Sn2jb+Sn2
可见,扩展运算并不改变样本的个数,只是改变其中部分样本的标签。
需要注意的是,失稳样本集的扩展可以按照单日或单断面进行,也可以在多日的数据集合中进行,所得的结果可能不尽相同,需结合实际问题考虑。
(2)稳定样本的压缩
经过扩展计算可以有效增加样本集中的失稳样本,但其总量依然很难超过20%,大多在10%以内,分类效果仍不理想。因此,需要考虑对稳定样本进行压缩。由于我国电力***大多数时候运行都有一定的裕度,因此可以想见大量的稳定样本实际与分类面都会有一定距离,而对分类有意义的更多的是与分类面接近的稳定样本。
基于上述分析,对扩展后的样本集再次采用SVM进行自分类,即先选取大的c值基于样本集训练模型,而后再用该模型对样本集进行分类计算。之后,选取与分类面距离最近的num(Sn3)个稳定样本与失稳样本组合形成新的样本集。
该处理实质上是在核空间寻找与Sn3在SVM分类意义下最近的num(Sn3)个稳定样本,是由失稳区域向稳定区域进行扩展,可以认为与4.3.3中所述的方法类似。
经过该步处理,新的样本集中失稳与稳定的样本个数相等,总量较之初始样本集平均可减少约80%,有效解决了稳定样本的过拟合问题,并压缩了样本总数。
样本压缩处理后的样本集为Sjs,若设压缩后的稳定样本集为Swd,则Sjs可表示为:
Swd=svm_sj(Skzjb,Sn3)
Sjs=Sn3+Swd
其中,svm_sj()为基于SVM的稳定样本压缩运算。
需要注意的是,稳定样本的压缩可以按照单日或单断面进行,也可以在多日的数据集合中进行,所得的结果可能不尽相同,需结合实际问题考虑。
步骤四:基于计算样本,利用SVM算法进行分类模型训练以及参数优化,最终形成分类模型。
采用SVM算法进行样本分类训练,最终的分类函数可以写作:
Figure BDA0000858336630000112
其中,sgn为符号函数用于最终确定样本的分类(如计算结果的正、负分别对应于两个分类结果),K为核函数,α和b是由训练得到的参数,xi和yi为支持向量及其分类(yi=1或-1),x为待判别样本。
核函数K采用高斯形式(径向基函数):
Figure BDA0000858336630000111
其中:σ为核函数的参数。
在训练过程中,除了需指定核函数的参数之外,通常还需指定一个松弛系数c,即允许分类出错的程度,用于增强SVM的泛化能力。
采用上述高斯函数所需确定的参数有两个,一是核函数中的参数σ,二是松弛系数c。这两个参数的取值对模型的性能将有一定程度的影响。在失稳样本扩展和稳定样本压缩中,对它们的取值已有说明,这里着重讨论在训练判稳模型时对其的优化。
本发明采用网格方法进行参数优化。其基本原理是指定参数σ和c的搜索范围,而后根据分类错误按一定步进完成寻优。在一些成熟的数据分析工具中都提供了基于网格方法的寻优函数。
需明确的是,在实际训练模型时,如果基于成熟的数据分析工具,如R语言或Matlab,其所提供的分类模型训练函数通常都有默认参数。对于SVM,通常σ的取值为特征向量的倒数,c常取为1。在一般情况下,仅靠默认参数就可以获得较好的效果,参数优化所能带来的提升有限。
本发明面向大电网海量在线历史数据的快速判稳问题,根据实际***运行的特点,提出了时间窗的方式选取多日样本集;提出了基于静态***特征的数据分析特征量初筛策略,并采用RF算法实现了特征量的压缩;根据初始样本集的特点,提出了扩展边界SVM算法,通过在核空间中进行SVM分类意义下的失稳样本扩充和稳定样本压缩,以解决初始样本中失稳样本过少的问题;采用网格算法解决了SVM训练参数优化问题。
以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员依然可以对本发明的具体实施方式进行修改或者等同替换,这些未脱离本发明精神和范围的任何修改或者等同替换,均在申请待批的本发明的权利要求保护范围之内。

Claims (1)

1.一种基于海量在线历史数据的电力***暂态稳定评估方法,其特征在于,所述方法包括下述步骤:
步骤一:对海量在线历史数据进行选取,生成仿真数据;
步骤二:根据仿真数据,提取特征量,生成初始样本集;
步骤三:采用扩展边界的方式,进行失稳样本的扩展和稳定样本的压缩,形成计算样本;
步骤四:基于计算样本,利用支持向量机SVM算法进行分类模型训练以及参数优化,最终形成分类模型,评估电力***暂态稳定性;
所述步骤一中,利用时间窗的方式选取在线历史数据,设需考虑的时间窗天数为d,则对于第m日,所需的计算样本Sjsd_m表示为:
Figure FDA0003861032180000011
其中:Sjsd_m表示所需的多日样本集合,k表示第k日,d表示时间窗天数,Sjs k表示第k日的计算样本;
所述步骤二中,提取特征量包括下述步骤:
(1)特征量初筛;
(2)特征量压缩;
所述特征量初筛选用的电力***静态状态量如下:
V:母线电压幅值;θV:母线电压角度;Pg:发电机有功,按有功出力为正、负的发电机分别统计;Qg:发电机无功,按有功出力为正、负的发电机分别统计;cosθg:发电机功率因数;PL:负荷有功,按有功为正、负的负荷分别统计;QL:负荷无功,按有功为正、负的负荷分别统计;cosθL:负荷功率因数;PACLine:交流线路有功,取I侧;QACLine:交流线路无功,取I侧;PDCLine:直流线路有功,取I侧;QDCLine:直流线路无功,取I侧;QPCP:并联电容器投入容量;QPLP:并联电抗器投入容量;
对于电力***静态状态量采用以下初始统计参数:Max:最大值;Min:最小值;Mean:均值;Sd:均值的标准差;
具有稳健特性的统计量:Median:中位数;Mds:中位数标准差;1st:四分之一分位数;3st:四分之三分位数;Mad:中位绝对离差;Interq:四分位差;Mj10:10%截尾均值;Mj10s:10%截尾均值方差;
Skew:偏度;Kurt:峰度;
在对电力***状态进行分析时按电压等级统计母线电压和交流线的静态状态量和统计量,对发电机和负荷按照有功的正负分别统计状态量,对于发电机和负荷的统计状态量包括:
SumPz:正有功总量;SumPf:负有功总量;Pzfb:正负有功总量之比;
SumQz:正无功总量;SumQf:负无功总量;Qzfb:正负无功总量之比;
对于故障点,其特征量分为两个部分,一是故障点周边两级母线所在分区的运行状态统计,其统计内容与全***运行情况统计相同;二是表征故障自身特点的特征量,包括:故障电流If、故障点电压幅值Vf、故障点电压相角θVf和戴维南阻抗幅值Zf;
初始样本集Sjb由电力***特征量和故障点及其周边区域特征量组成;采用随机森林RF算法进行特征量压缩,随机森林RF算法及用其进行特征量重要程度计算的基本思想包括:
①生成若干个决策树而不是一个;
②生成决策树时,随机从初始样本集中选取一组初始样本,使用完毕后再放回初始样本集;
③生成决策树时,使用随机选择的初始样本的一组属性作为候选特征集,而不是全部属性;
④最后的特征量重要程度指标由所有决策树的计算结果采取投票法共同决定;
随机森林RF算法的参数包括:决策树的个数ntree和候选特征集中特征的个数mtry,mtry采用经验值,取特征量个数的算数平方根;
RF算法所获得的特征量重要程度指标,表示的是当移去该特征量或在该特征量中加入噪声时对分类结果的影响;特征量的平均重要性指标越大表示特征量越重要,如果指标为负表示特征量对分类起反作用,如果为0则对分类没有作用;对于指标等于0的特征量采取直接去除的方式,对于指标大于0的特征量根据计算能力的实际情况选择剔除,并通过测试确定剔除比例;去除重要性为负值的特征量导致判稳效果不稳定,仅剔除掉重要性为0的特征量;
所述步骤三包括:
1)失稳样本的扩展:采用扩展边界方式对失稳样本进行扩展;
设初始的单日失稳样本集为Sn1,因扩展新增的失稳样本集为Sn2,扩展后的失稳样本集为Sn3,则有:
Sn2=svm_sup(Yi)Yi∈Sn1,i=1,2,…,N,N=num(Sn1)
Sn3=Sn1∪Sn2
其中,svm_sup()为寻找支持向量并将其标记为失稳样本的运算,Yi为Sn1中的单个样本,num()为样本集的个数统计运算;
设与失稳样本集Sn2对应的初始稳定样本为Sn2jb,则扩展后的单日样本集Skzjb表示为:
Skzjb=Sjb-Sn2jb+Sn2
扩展运算并不改变样本的个数,只是改变其中部分样本的标签;
2)稳定样本的压缩;
对扩展后的失稳样本集再次采用支持向量机SVM进行自分类,即先选取大的罚函数值基于样本集训练模型,再用样本集训练模型对该样本集进行分类计算,选取与分类面距离最近的num(Sn3)个稳定样本与失稳样本组合形成新的样本集;
样本压缩处理后的包括失稳样本和稳定样本的样本集为Sjs,设压缩后的稳定样本集为Swd,则Sjs表示为:
Swd=svm_sj(Skzjb,Sn3)
Sjs=Sn3+Swd
其中,svm_sj()为基于SVM的稳定样本压缩运算;
所述步骤四包括:在获得Sjsd_m后,采用支持向量机SVM算法基于Sjsd_m进行计算样本分类训练,得到进行快速判稳的判别函数;最终的判别函数写作:
Figure FDA0003861032180000041
其中,sgn为符号函数用于最终确定计算样本的分类,计算结果的正、负分别对应于两个分类结果,K为核函数,xi和yi为支持向量及其分类,yi=1或-1,等于1和-1时没有特定意义,只是决定各项的符号,x为待判别样本;
Figure FDA0003861032180000052
和b*分别是SVM训练得到的系数,xi表示SVM训练得到的支持向量;核函数K采用高斯函数形式,即径向基函数:
Figure FDA0003861032180000051
其中:σ是人为指定的核函数参数;
在训练过程中,除了指定核函数的参数σ外,还指定松弛系数c,即允许分类出错的程度,用于增强支持向量机SVM的泛化能力;
采用网格方法进行参数优化:指定核函数的参数σ和松弛系数c的搜索范围,根据分类错误按一定步进完成寻优,利用R语言或Matlab,其所提供的支持向量机SVM分类模型训练函数均有默认参数,对于支持向量机SVM,σ的取值为特征向量的倒数,c取为1;
在实际应用时,样本准备和特征量生成在每个断面完成动态安全分析计算后的剩余时间进行,模型训练在判定日的零点前后进行;在完成模型训练后,在判定日的全天内都采用该模型在进行动态安全分析之前判定稳定,对于被判定为失稳的故障,补入动态安全分析的故障集,同时也进行样本的准备;如此连续进行。
CN201510837215.3A 2015-11-26 2015-11-26 一种基于海量在线历史数据的电力***暂态稳定评估方法 Active CN105512799B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510837215.3A CN105512799B (zh) 2015-11-26 2015-11-26 一种基于海量在线历史数据的电力***暂态稳定评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510837215.3A CN105512799B (zh) 2015-11-26 2015-11-26 一种基于海量在线历史数据的电力***暂态稳定评估方法

Publications (2)

Publication Number Publication Date
CN105512799A CN105512799A (zh) 2016-04-20
CN105512799B true CN105512799B (zh) 2022-12-30

Family

ID=55720761

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510837215.3A Active CN105512799B (zh) 2015-11-26 2015-11-26 一种基于海量在线历史数据的电力***暂态稳定评估方法

Country Status (1)

Country Link
CN (1) CN105512799B (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107784015B (zh) * 2016-08-30 2022-04-05 中国电力科学研究院 一种基于电力***在线历史数据的数据约简方法
CN106504116B (zh) * 2016-10-31 2020-05-22 山东大学 基于电网运行与暂态稳定裕度指标关联的稳定评估方法
CN106786560B (zh) * 2017-02-14 2021-04-30 中国电力科学研究院 一种电力***稳定特征自动提取方法及装置
CN107144721A (zh) * 2017-05-26 2017-09-08 北京戴纳实验科技有限公司 用于实验室设备的电流和电压的大数据分析构架
CN107274105B (zh) * 2017-06-28 2020-10-13 山东大学 基于线性判别分析的多属性决策树电网稳定裕度评估方法
CN107482621B (zh) * 2017-08-02 2019-09-27 清华大学 一种基于电压时序轨迹的电力***暂态电压稳定评估方法
CN107609760B (zh) * 2017-08-30 2020-11-24 清华大学 电力***的关键特征选择方法及装置
CN107782442A (zh) * 2017-10-24 2018-03-09 华北电力大学(保定) 基于大数据和随机森林的变压器多特征参量选择方法
CN107942411B (zh) * 2017-11-30 2020-04-17 南京理工大学 一种大气能见度预测方法
CN110198223B (zh) * 2018-02-27 2022-01-28 中兴通讯股份有限公司 网络故障预测方法、装置及设备、存储介质
CN108776711A (zh) * 2018-03-07 2018-11-09 中国电力科学研究院有限公司 一种电力***暂态样本数据提取方法及***
CN110428005B (zh) * 2019-07-31 2022-11-08 三峡大学 一种基于伞式算法的电力***动态安全误分类约束方法
CN110417011B (zh) * 2019-07-31 2022-11-08 三峡大学 一种基于互信息与迭代随机森林的在线动态安全评估方法
CN110311376B (zh) * 2019-07-31 2022-12-20 三峡大学 一种电力***动态安全评估综合模型及时空可视化方法
CN111091142A (zh) * 2019-11-25 2020-05-01 国网四川省电力公司电力科学研究院 样本数量不平衡的电力***暂态稳定状态集成预测方法
CN111064186A (zh) * 2019-12-06 2020-04-24 广东电网有限责任公司 一种暂态稳定性分析方法及装置
CN111244937B (zh) * 2020-01-09 2021-01-05 清华大学 一种电力***暂态电压稳定性严重故障筛选方法
CN111193260B (zh) * 2020-01-16 2021-01-05 清华大学 一种自适应扩充数据的电力***暂态稳定自动评估方法
CN111652479B (zh) * 2020-05-19 2023-06-02 三峡大学 一种针对电力***动态安全评估的数据驱动方法
CN112909939B (zh) * 2021-03-10 2022-07-12 山东科技大学 一种基于故障前后潮流特征的电力***暂态稳定评估方法
CN112952830B (zh) * 2021-04-16 2024-06-11 山东科技大学 一种故障后电力***暂态稳定预测方法
CN117215205B (zh) * 2023-11-09 2024-02-06 国网经济技术研究院有限公司 基于决策树和iss理论的直流***控制参数分析方法
CN117574116B (zh) * 2024-01-15 2024-04-19 湖南大学 一种海底直流***暂态稳定评估的混合特征选择方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268576A (zh) * 2014-10-11 2015-01-07 国家电网公司 一种基于tnn-svm的电力***暂态稳定分类方法
CN104881741A (zh) * 2015-05-25 2015-09-02 清华大学 基于支持向量机的电力***暂态稳定判断方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268576A (zh) * 2014-10-11 2015-01-07 国家电网公司 一种基于tnn-svm的电力***暂态稳定分类方法
CN104881741A (zh) * 2015-05-25 2015-09-02 清华大学 基于支持向量机的电力***暂态稳定判断方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于支持向量机的电力***暂态稳定评估研究;盛琪;《中国优秀博硕士学位论文全文数据库(硕士)工程科技Ⅱ辑》;20070131(第1期);第8-33页 *

Also Published As

Publication number Publication date
CN105512799A (zh) 2016-04-20

Similar Documents

Publication Publication Date Title
CN105512799B (zh) 一种基于海量在线历史数据的电力***暂态稳定评估方法
CN102074955B (zh) 基于知识发现技术的电力***稳定评估及控制方法
CN110417011B (zh) 一种基于互信息与迭代随机森林的在线动态安全评估方法
CN110111113B (zh) 一种异常交易节点的检测方法及装置
CN110826618A (zh) 一种基于随机森林的个人信用风险评估方法
CN112207631B (zh) 刀具检测模型的生成方法、检测方法、***、设备及介质
CN113922412B (zh) 一种新能源多场站短路比全景化评估方法、***、存储介质及计算设备
CN112990330A (zh) 用户用能异常数据检测方法及设备
CN113189418B (zh) 一种基于电压数据的拓扑关系识别方法
CN108320112B (zh) 一种确定设备健康状态的方法及装置
CN109241849B (zh) 面向智能电厂汽轮机主机的特征分解选择与故障诊断方法
Obi et al. Including exogenous factors in the evaluation of harvesting crew technical efficiency using a multi-step data envelopment analysis procedure
CN109902133B (zh) 基于电网任意分割区域的多源数据纠错处理方法及***
CN112528762B (zh) 一种基于数据关联分析的谐波源识别方法
CN113988459A (zh) 一种基于电力营销数据的中小企业成长性评估方法及***
CN107274025B (zh) 一种实现用电模式智能识别与管理的***和方法
CN105183612B (zh) 服务器可用内存异常增长及运行状况的评估方法
CN116630989A (zh) 智能电表可视故障检测方法、***、电子设备及存储介质
CN115166625A (zh) 智能电表误差估计方法及装置
CN111985526B (zh) 一种基于相似场景聚类的尾随间隔管理策略生成方法及其***
CN108920810A (zh) 基于大数据架构的电力仿真方法
CN111160712B (zh) 一种用户的用电参数调节方法及装置
CN113962158A (zh) 基于改进决策树的压路机施工工艺知识库构建方法及***
CN116910596B (zh) 一种基于改进dbscan聚类的用户窃电分析方法、设备及存储介质
CN104794290B (zh) 一种用于机械装备结构的模态参数自动识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Huang Yanhao

Inventor after: Li Wei

Inventor after: Zhou Qian

Inventor after: Chen Zhe

Inventor after: Wang Chenggen

Inventor after: Sun Rong

Inventor after: Dai Hongyang

Inventor after: Yu Zhihong

Inventor after: Cai Hongquan

Inventor after: Bian Erman

Inventor after: Shi Dongyu

Inventor after: Qiu Jian

Inventor after: Hua Ke

Inventor after: Lu Guangming

Inventor before: Huang Yanhao

Inventor before: Li Wei

Inventor before: Dai Hongyang

Inventor before: Yu Zhihong

Inventor before: Cai Hongquan

Inventor before: Bian Erman

Inventor before: Shi Dongyu

Inventor before: Qiu Jian

Inventor before: Hua Ke

Inventor before: Lu Guangming

CB03 Change of inventor or designer information
TA01 Transfer of patent application right

Effective date of registration: 20170915

Address after: 100192 Beijing city Haidian District Qinghe small Camp Road No. 15

Applicant after: China Electric Power Research Institute

Applicant after: State Grid Corporation of China

Applicant after: STATE GRID JIANGSU ELECTRIC POWER COMPANY Research Institute

Address before: 100192 Beijing city Haidian District Qinghe small Camp Road No. 15

Applicant before: China Electric Power Research Institute

Applicant before: State Grid Corporation of China

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant