CN111292020A - 一种基于随机森林的电网实时运行风险评估方法及*** - Google Patents

一种基于随机森林的电网实时运行风险评估方法及*** Download PDF

Info

Publication number
CN111292020A
CN111292020A CN202010174831.6A CN202010174831A CN111292020A CN 111292020 A CN111292020 A CN 111292020A CN 202010174831 A CN202010174831 A CN 202010174831A CN 111292020 A CN111292020 A CN 111292020A
Authority
CN
China
Prior art keywords
power grid
real
data
random forest
operation risk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010174831.6A
Other languages
English (en)
Other versions
CN111292020B (zh
Inventor
罗艳
林成
肖辅盛
周智海
王庭刚
李慧敏
张薇薇
王彦
孟悦恒
陈仕宇
林治芸
刘喜成
张迎秋
田恩勇
张承模
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guizhou Power Grid Co Ltd
Original Assignee
Guizhou Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guizhou Power Grid Co Ltd filed Critical Guizhou Power Grid Co Ltd
Priority to CN202010174831.6A priority Critical patent/CN111292020B/zh
Publication of CN111292020A publication Critical patent/CN111292020A/zh
Application granted granted Critical
Publication of CN111292020B publication Critical patent/CN111292020B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Power Engineering (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Educational Administration (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于随机森林的电网实时运行风险评估方法及***,包括,数据中心模块将电网运行风险历史数据和实时数据进行预处理,分别得到训练集、验证集和测试集;控制模块对获得的训练集和测试集进行随机森林生成训练,生成电网运行风险判定随机森林智能体,结合计算模块判定验证集的准确率是否满足结果输出要求;分析模块利用满足准确率的随机森林智能体进行实时运行风险判定分析,实时获得电网运行风险判定结果。本发明能够根据相关因素的取值情况直接评估运行风险,从而避免复杂的电网全景建模、设备可靠性评估过程,在满足实时判定误差要求的前提下,大幅降低实时判定的耗时,有力支撑大电网运行风险在线分析的要求。

Description

一种基于随机森林的电网实时运行风险评估方法及***
技术领域
本发明涉及电网风险评估技术领域,尤其涉及一种基于随机森林的电网实时运行风险评估方法及***。
背景技术
传统的电网实时运行风险评估方法需要对电网全景建模,考虑不同的气象条件下输变电设备故障概率,扫描不同类型、不同概率故障发生后的事故风险,并量化其事故后果,通过统计不同概率下的事故风险后果,计算电网实时运行风险。上述实施过程中,无论电网全景建模、设备可靠性评估还是事故后果量化,每一个环节均涉及复杂的建模过程和庞大的计算工作量,导致准确评估耗时极长。为此,当前主要通过简化模型来提高计算效率。然而即便如此,任意时刻的电网运行风险评估都往往需要消耗几个甚至十几个小时,依然难以满足实时运行要求。
本文提出一种基于随机森林的电网实时运行风险评估方法。通过挖掘电网运行特征实现对运行风险的评估,结合电网实时运行风险评估问题实际,构建了运行风险相关因素库,利用历史数据对随机森林智能体训练,实现了对电网实时运行风险等级的高效辨识。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有存在的问题,提出了本发明。
因此,本发明提供了一种基于随机森林的电网实时运行风险评估方法,能够大幅降低实时判定的耗时。
为解决上述技术问题,本发明提供如下技术方案:包括,数据中心模块将电网运行风险历史数据和实时数据进行预处理,分别得到训练集、验证集和测试集;控制模块对获得的所述训练集和所述测试集进行随机森林生成训练,生成电网运行风险判定随机森林智能体,结合计算模块判定所述验证集的准确率是否满足结果输出要求;分析模块利用满足所述准确率的所述随机森林智能体进行实时运行风险判定分析,实时获得所述电网运行风险判定结果。
作为本发明所述的一种基于随机森林的电网实时运行风险评估方法的一种优选方案,其中:判定所述验证集的所述准确率是否满足所述结果输出要求,包括,若所述准确率满足所述结果输出要求,则输出电网运行风险判定结果数据,所述随机森林智能体训练完成;若所述准确率不满足所述结果输出要求,则增加决策树数量,重新训练生成所述随机森立智能体,直至所述准确率满足所述结果输出要求。
作为本发明所述的一种基于随机森林的电网实时运行风险评估方法的一种优选方案,其中:预处理所述电网运行风险历史数据和所述实时数据包括,利用所述电网运行历史数据采集所述电网运行数据及其他相关数据;对所述电网运行进行全景建模,扫描典型的故障类型,评估不同的所述故障类型的危害与后果;利用所述数据中心模块测算运行风险,获得电网运行风险历史数据集;随机采集所述电网运行实时数据,利用所述数据中心模块测算运行风险,获得电网运行风险实时数据集。
作为本发明所述的一种基于随机森林的电网实时运行风险评估方法的一种优选方案,其中:获得所述训练集、所述测试集和所述验证集包括,所述数据中心模块处理所述电网运行风险历史数据集,获得两类无交集的数据样本,生成所述训练集和所述验证集;所述数据中心模块处理所述电网运行风险实时数据集,生成所述测试集。
作为本发明所述的一种基于随机森林的电网实时运行风险评估方法的一种优选方案,其中:所述控制模块利用所述训练集和所述测试集进行所述随机森林生成训练,构建多个决策树综合分析得到最终判定结果,提升整体决策分析的准确率,包括,预处理所述所述训练集和所述测试集内的所述数据样本,建立模型;设定子集属性数量;训练决策树;汇总所述决策树的判定结果数据。
作为本发明所述的一种基于随机森林的电网实时运行风险评估方法的一种优选方案,其中:训练生成所述随机森林智能体具体包括,剔除所述训练集中的无效数据,补齐其中的数据缺失项,并将不满足数据类型要求的属性转化为离散化的属性取值;设定所述子集属性数log2d为所述训练集中随机选出后续所述决策树训练生成的属性范围;采用决策树算法策略进行训练,在设定的所述子集属性数基础上对每个所述决策树优先选定所述属性;利用综合策略将所述随机森林智能体中所述决策树的判定结果汇总,形成整体判定结果。
作为本发明所述的一种基于随机森林的电网实时运行风险评估方法的一种优选方案,其中:利用所述随机森林智能体判定所述验证集的准确率具体包括,所述随机森林智能体判断所述验证集中各样本数据的运行风险,与离线策略下计算得到的风险值对比,判定所述验证集准确率。
作为本发明所述的一种基于随机森林的电网实时运行风险评估方法的一种优选方案,其中:进行所述实时运行风险判定分析需计算数据集的属性类型,即数据类型,包括,电网运行属性类型:字符型;设备状态属性类型:离散数值型;外界环境属性类型:连续数值型。
作为本发明所述的一种基于随机森林的电网实时运行风险评估方法的一种优选方案,其中:所述属性类型具体包括,电网实时运行状态类型数据;电网运行中各类输发变电设备运行状态参数;影响电网及其设备可靠运行的外界环境参数。
作为本发明所述的一种基于随机森林的电网实时运行风险评估***的一种优选方案,其中:数据中心模块,用于处理所述电网运行风险历史数据集和所述实时数据集;控制模块,用于控制所述训练集和所述测试集进行所述随机森林生成训练;计算模块,用于计算所述随机森林智能体判定所述验证集的准确率;分析模块,用于分析判定所述电网实时运行风险结果。
本发明的有益效果:本发明能够根据相关因素的取值情况直接评估运行风险,从而避免复杂的电网全景建模、设备可靠性评估过程,在满足实时判定误差要求的前提下,大幅降低实时判定的耗时,有力支撑大电网运行风险在线分析的要求。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明第一个实施例所述的基于随机森林的电网实时运行风险评估方法的流程示意图;
图2为本发明第一个实施例所述的基于随机森林的电网实时运行风险评估方法的电网实时运行风险判定实施框架示意图;
图3为本发明第一个实施例所述的基于随机森林的电网实时运行风险评估方法的随机森林智能体训练示意图;
图4为本发明第一个实施例所述的基于随机森林的电网实时运行风险评估方法的地区电网网架结构示意图;
图5为本发明第一个实施例所述的基于随机森林的电网实时运行风险评估方法的样本运行风险分布直方示意图;
图6为本发明第一个实施例所述的基于随机森林的电网实时运行风险评估方法的测试集判定结果对比示意图;
图7为本发明第二个实施例所述的基于随机森林的电网实时运行风险评估***的模块结构分布示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例1
随机森林,本质上是一种仅由决策树构成的集成学习智能体,其基本思想在于通过构建多个独立性较强的决策树,综合分析得到最终的判定结果,以提升整体决策分析的准确率。其中构成随机森林的每一个决策树称为基学习器,与其他集成学习算法相比,随机森林具有更高的泛化误差和训练效率,意味着随机森林算法能在更短的时间内获得独立性更加显著的基学习器,使得其能够更有效地解决复杂度更高的实际问题,避免陷入局部最优解。
参照图1~图6,为本发明的第一个实施例,提供了一种基于随机森林的电网实时运行风险评估方法,包括:
S1:数据中心模块100将电网运行风险历史数据和实时数据进行预处理,分别得到训练集、验证集和测试集。其中需要说明的是,预处理电网运行风险历史数据和实时数据包括:
利用电网运行历史数据采集电网运行数据及其他相关数据;
对电网运行进行全景建模,扫描典型的故障类型,评估不同的故障类型的危害与后果;
利用数据中心模块100测算运行风险,获得电网运行风险历史数据集;
随机采集电网运行实时数据,利用数据中心模块100测算运行风险,获得电网运行风险实时数据集。
具体的,获得训练集、测试集和验证集包括:
数据中心模块100处理电网运行风险历史数据集,获得两类无交集的数据样本,生成训练集和验证集;
数据中心模块100处理电网运行风险实时数据集,生成测试集。
S2:控制模块200对获得的训练集和测试集进行随机森林生成训练,生成电网运行风险判定随机森林智能体,结合计算模块300判定验证集的准确率是否满足结果输出要求。本步骤需要说明的是,控制模块200利用训练集和测试集进行随机森林生成训练,构建多个决策树综合分析得到最终判定结果,提升整体决策分析的准确率,包括:
预处理训练集和测试集内的数据样本,建立模型;
设定子集属性数量;
训练决策树;
汇总决策树的判定结果数据。
具体的,训练生成随机森林智能体具体包括:
剔除训练集中的无效数据,补齐其中的数据缺失项,并将不满足数据类型要求的属性转化为离散化的属性取值;
设定子集属性数log2d为训练集中随机选出后续决策树训练生成的属性范围;
采用决策树算法策略进行训练,在设定的子集属性数基础上对每个决策树优先选定属性;
利用综合策略将随机森林智能体中决策树的判定结果汇总,形成整体判定结果。
进一步的,判定验证集的准确率是否满足结果输出要求,包括:
若准确率满足结果输出要求,则输出电网运行风险判定结果数据,随机森林智能体训练完成;
若准确率不满足结果输出要求,则增加决策树数量,重新训练生成随机森立智能体,直至准确率满足结果输出要求。
较佳的,其中还需要说明的是,利用随机森林智能体判定验证集的准确率具体包括:
随机森林智能体判断验证集中各样本数据的运行风险,与离线策略下计算得到的风险值对比,判定验证集准确率。
S3:分析模块400利用满足准确率的随机森林智能体进行实时运行风险判定分析,实时获得电网运行风险判定结果。本步骤还需要说明的是,进行实时运行风险判定分析需计算数据集的属性类型,即数据类型,包括:
电网运行属性类型:字符型;
设备状态属性类型:离散数值型;
外界环境属性类型:连续数值型。
进一步的,属性类型具体包括:
电网实时运行状态类型数据;
电网运行中各类输发变电设备运行状态参数;
影响电网及其设备可靠运行的外界环境参数。
较佳的,本实施例通过挖掘电网运行特征实现对运行风险的评估,利用电网运行历史数据,对运行风险相关因素进行分析,生成面向电网运行风险评估的随机森林智能体,能够根据相关因素的取值情况直接评估运行风险,拥有较高的监测错误率,从而避免复杂的电网全景建模、设备可靠性评估;进一步的,随机森林的泛化误差上界
Figure BDA0002410441970000071
构成该随机森林各决策树之间的平均相关系数(即决策树之间的分类强度),对比国际通用的数据分析数据库glass数据库和auto-mpg数据库,能够发现随机森林智能体的监测错误率比其他Bagging类型的集成学习智能算法高4%,由此验证本实施例提供的发明方法能够更有效地解决复杂度较高的实际问题。
优选的,随机森林中所包含的决策树越多,其训练生成速度越慢,在实时判断分析中耗时也相应增加,而本发明方法能够获得满足准确率要求的计算开支最小的随机森林智能体,用于电网实时运行风险计算,并能根据随机森林决策分析需要,不同类型数据转化为范围确定的离散数值,提升决策树的训练生成效率;字符类型:取值均为字符类型数据的属性类型,例如部分降水数据中,降水量是以“暴雨”“大雨”“中雨”“小雨”等不同字符型数据类型表示,考虑到当前电网运行风险评估问题中所涉及的字符类型属性均为取值范围确定且有限的字符类型属性,可将根据其属性取值范围将其转换为对应的离散数值,例如上述降水数据中,将“暴雨”“大雨”等四类降水字符数据等效转换为4至1的离散数据;离散数值类型:取值为范围有限的离散数值的属性类型,例如输变电设备运行状态,往往以“1”代表投入运行,“0”代表停电状态,这种数值类型不需要转换,可直接使用;连续数值类型:取值为范围有限的连续数值的属性类型,例如输变电设备的潮流,取值一般在0至其最大传输能力范围内连续取值,可通过给定离散幅度将其转换为离散数值。
优选的是,为验证本发明方法的有效性,参照图4,为本实施例在某地区电网实际数据基础上构造算例,该地区电网范围共有5个变电站、8条输电线路、3个发电厂、6台发电机组,本实施例结合该地区电网实际数据,实现电网运行风险分析考虑共计66项属性,通过2条输电线路与主网联络,利用基础数据分析运行风险属性,从而获得该地区电网运行风险分析判断结果,各类属性如表1所示:
表1:运行风险分析属性表。
Figure BDA0002410441970000081
优选的是,为了对本发明方法中采用的技术效果加以验证说明,本实施例选择以传统电网运行风险分析方法与本实施例提供的基于随机森林的电网实时运行风险评估方法进行对比测试,以科学论证的手段对比实验结果,以验证本发明方法所具有的真实效果。传统的电网运行风险分析方法需建模分析计算该时刻的运行风险,评估耗时较长,为验证本发明方法相较于传统评估方法具有较短评估时长、准确的评估结果,本实施例将采用传统电网运行风险评估方法与本发明方法分别对逐日电网运行状态进行分析,传统评估方法测试条件:分析2018年逐日电网运行状态,随机选取20个时刻的运行参数,得到7300个样本数据,以7000个样本数据为训练集,3000个样本数据为验证集;本发明方法测试条件:在7000个样本数据为训练集、3000个样本数据为验证集的基础上,从2019年1月中随机抽取20个时刻作为测试集,利用随机森林算法进行智能体训练,测算分析运行风险;测试结果:参照图5,能够看出传统的评估方法在该地区全网运行风险均在1~4范围内,超出该风险范围的样本数仅占样本总数的18%;参照图6,本发明方法利用离线判断测试集和随机森林智能体判定测试集,两种判断方法测试精度和耗时对比如下表所示:
表2:判断方法对比分析表。
Figure BDA0002410441970000091
参照表2和图6,能够看出相比于离线判定方法,本发明方法判定误差仅为3%,且每次测试样本耗时不超过2分钟,不足离线判定方法的0.2%,充分验证了本发明方法能够满足大电网实时运行风险分析的需要,大幅降低运行风险的判定耗时。
实施例2
参照图7,为本发明的第二个实施例,该实施例不同于第一个实施例的是,提供了一种基于随机森林的电网实时运行风险评估***,包括,
数据中心模块100,用于处理电网运行风险历史数据集和实时数据集。
控制模块200,用于控制训练集和测试集进行随机森林生成训练。
计算模块300,用于计算随机森林智能体判定验证集的准确率。
分析模块400,用于分析判定电网实时运行风险结果。
应当认识到,本发明的实施例可以由计算机硬件、硬件和软件的组合、或者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。所述方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存储介质在计算机程序中实现,其中如此配置的存储介质使得计算机以特定和预定义的方式操作——根据在具体实施例中描述的方法和附图。每个程序可以以高级过程或面向对象的编程语言来实现以与计算机***通信。然而,若需要,该程序可以以汇编或机器语言实现。在任何情况下,该语言可以是编译或解释的语言。此外,为此目的该程序能够在编程的专用集成电路上运行。
此外,可按任何合适的顺序来执行本文描述的过程的操作,除非本文另外指示或以其他方式明显地与上下文矛盾。本文描述的过程(或变型和/或其组合)可在配置有可执行指令的一个或多个计算机***的控制下执行,并且可作为共同地在一个或多个处理器上执行的代码(例如,可执行指令、一个或多个计算机程序或一个或多个应用)、由硬件或其组合来实现。所述计算机程序包括可由一个或多个处理器执行的多个指令。
进一步,所述方法可以在可操作地连接至合适的任何类型的计算平台中实现,包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计算环境、单独的或集成的计算机平台、或者与带电粒子工具或其它成像装置通信等等。本发明的各方面可以以存储在非暂时性存储介质或设备上的机器可读代码来实现,无论是可移动的还是集成至计算平台,如硬盘、光学读取和/或写入存储介质、RAM、ROM等,使得其可由可编程计算机读取,当存储介质或设备由计算机读取时可用于配置和操作计算机以执行在此所描述的过程。此外,机器可读代码,或其部分可以通过有线或无线网络传输。当此类媒体包括结合微处理器或其他数据处理器实现上文所述步骤的指令或程序时,本文所述的发明包括这些和其他不同类型的非暂时性计算机可读存储介质。当根据本发明所述的方法和技术编程时,本发明还包括计算机本身。计算机程序能够应用于输入数据以执行本文所述的功能,从而转换输入数据以生成存储至非易失性存储器的输出数据。输出信息还可以应用于一个或多个输出设备如显示器。在本发明优选的实施例中,转换的数据表示物理和有形的对象,包括显示器上产生的物理和有形对象的特定视觉描绘。
如在本申请所使用的,术语“组件”、“模块”、“***”等等旨在指代计算机相关实体,该计算机相关实体可以是硬件、固件、硬件和软件的结合、软件或者运行中的软件。例如,组件可以是,但不限于是:在处理器上运行的处理、处理器、对象、可执行文件、执行中的线程、程序和/或计算机。作为示例,在计算设备上运行的应用和该计算设备都可以是组件。一个或多个组件可以存在于执行中的过程和/或线程中,并且组件可以位于一个计算机中以及/或者分布在两个或更多个计算机之间。此外,这些组件能够从在其上具有各种数据结构的各种计算机可读介质中执行。这些组件可以通过诸如根据具有一个或多个数据分组(例如,来自一个组件的数据,该组件与本地***、分布式***中的另一个组件进行交互和/或以信号的方式通过诸如互联网之类的网络与其它***进行交互)的信号,以本地和/或远程过程的方式进行通信。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (10)

1.一种基于随机森林的电网实时运行风险评估方法,其特征在于:包括,
数据中心模块(100)将电网运行风险历史数据和实时数据进行预处理,分别得到训练集、验证集和测试集;
控制模块(200)对获得的所述训练集和所述测试集进行随机森林生成训练,生成电网运行风险判定随机森林智能体,结合计算模块(300)判定所述验证集的准确率是否满足结果输出要求;
分析模块(400)利用满足所述准确率的所述随机森林智能体进行实时运行风险判定分析,实时获得所述电网运行风险判定结果。
2.如权利要求1所述的基于随机森林的电网实时运行风险评估方法,其特征在于:判定所述验证集的所述准确率是否满足所述结果输出要求,包括,
若所述准确率满足所述结果输出要求,则输出电网运行风险判定结果数据,所述随机森林智能体训练完成;
若所述准确率不满足所述结果输出要求,则增加决策树数量,重新训练生成所述随机森立智能体,直至所述准确率满足所述结果输出要求。
3.如权利要求1或2所述的基于随机森林的电网实时运行风险评估方法,其特征在于:预处理所述电网运行风险历史数据和所述实时数据包括,
利用所述电网运行历史数据采集所述电网运行数据及其他相关数据;
对所述电网运行进行全景建模,扫描典型的故障类型,评估不同的所述故障类型的危害与后果;
利用所述数据中心模块(100)测算运行风险,获得电网运行风险历史数据集;
随机采集所述电网运行实时数据,利用所述数据中心模块(100)测算运行风险,获得电网运行风险实时数据集。
4.如权利要求3所述的基于随机森林的电网实时运行风险评估方法,其特征在于:获得所述训练集、所述测试集和所述验证集包括,
所述数据中心模块(100)处理所述电网运行风险历史数据集,获得两类无交集的数据样本,生成所述训练集和所述验证集;
所述数据中心模块(100)处理所述电网运行风险实时数据集,生成所述测试集。
5.如权利要求1或4所述的基于随机森林的电网实时运行风险评估方法,其特征在于:所述控制模块(200)利用所述训练集和所述测试集进行所述随机森林生成训练,构建多个决策树综合分析得到最终判定结果,提升整体决策分析的准确率,包括,
预处理所述所述训练集和所述测试集内的所述数据样本,建立模型;
设定子集属性数量;
训练决策树;
汇总所述决策树的判定结果数据。
6.如权利要求5所述的基于随机森林的电网实时运行风险评估方法,其特征在于:训练生成所述随机森林智能体具体包括,
剔除所述训练集中的无效数据,补齐其中的数据缺失项,并将不满足数据类型要求的属性转化为离散化的属性取值;
设定所述子集属性数log2d为所述训练集中随机选出后续所述决策树训练生成的属性范围;
采用决策树算法策略进行训练,在设定的所述子集属性数基础上对每个所述决策树优先选定所述属性;
利用综合策略将所述随机森林智能体中所述决策树的判定结果汇总,形成整体判定结果。
7.如权利要求6所述的基于随机森林的电网实时运行风险评估方法,其特征在于:利用所述随机森林智能体判定所述验证集的准确率具体包括,
所述随机森林智能体判断所述验证集中各样本数据的运行风险,与离线策略下计算得到的风险值对比,判定所述验证集准确率。
8.如权利要求1或7所述的基于随机森林的电网实时运行风险评估方法,其特征在于:进行所述实时运行风险判定分析需计算数据集的属性类型,即数据类型,包括,
电网运行属性类型:字符型;
设备状态属性类型:离散数值型;
外界环境属性类型:连续数值型。
9.如权利要求8所述的基于随机森林的电网实时运行风险评估方法,其特征在于:所述属性类型具体包括,
电网实时运行状态类型数据;
电网运行中各类输发变电设备运行状态参数;
影响电网及其设备可靠运行的外界环境参数。
10.一种基于随机森林的电网实时运行风险评估***,其特征在于:包括,
数据中心模块(100),用于处理所述电网运行风险历史数据集和所述实时数据集;
控制模块(200),用于控制所述训练集和所述测试集进行所述随机森林生成训练;
计算模块(300),用于计算所述随机森林智能体判定所述验证集的准确率;
分析模块(400),用于分析判定所述电网实时运行风险结果。
CN202010174831.6A 2020-03-13 2020-03-13 一种基于随机森林的电网实时运行风险评估方法及*** Active CN111292020B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010174831.6A CN111292020B (zh) 2020-03-13 2020-03-13 一种基于随机森林的电网实时运行风险评估方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010174831.6A CN111292020B (zh) 2020-03-13 2020-03-13 一种基于随机森林的电网实时运行风险评估方法及***

Publications (2)

Publication Number Publication Date
CN111292020A true CN111292020A (zh) 2020-06-16
CN111292020B CN111292020B (zh) 2020-12-15

Family

ID=71028612

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010174831.6A Active CN111292020B (zh) 2020-03-13 2020-03-13 一种基于随机森林的电网实时运行风险评估方法及***

Country Status (1)

Country Link
CN (1) CN111292020B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111914881A (zh) * 2020-06-18 2020-11-10 北京百度网讯科技有限公司 随机森林的生成方法、装置、电子设备及存储介质
CN112734274A (zh) * 2021-01-20 2021-04-30 国家电网公司华中分部 一种低碳电网运营主导影响因素挖掘及综合评估方法
CN113159615A (zh) * 2021-05-10 2021-07-23 麦荣章 一种工业控制***信息安全风险智能测定***及方法
CN116090834A (zh) * 2023-03-07 2023-05-09 安徽农业大学 基于Flink平台的林业管理方法、装置
CN117131464A (zh) * 2023-10-25 2023-11-28 湖北华中电力科技开发有限责任公司 一种电网数据的可用性评估方法及***
CN117689214A (zh) * 2024-01-31 2024-03-12 天津华凯电气有限公司 一种柔性直流牵引供电***能量路由器动态安全评估方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107392363A (zh) * 2017-07-12 2017-11-24 河海大学 一种ceemd和随机森林的短期风功率预测方法
CN108537683A (zh) * 2018-04-13 2018-09-14 贵州电网有限责任公司 一种基于相似日选取及随机森林算法的负荷预测方法
CN109948839A (zh) * 2019-03-06 2019-06-28 国网河南省电力公司电力科学研究院 架空输电线路舞动风险的预测和预警方法及***
CN110232499A (zh) * 2019-04-26 2019-09-13 中国电力科学研究院有限公司 一种配电网信息物理侧风险预警方法及***
CN110311376A (zh) * 2019-07-31 2019-10-08 三峡大学 一种电力***动态安全评估综合模型及时空可视化方法
CN110417011A (zh) * 2019-07-31 2019-11-05 三峡大学 一种基于互信息与迭代随机森林的在线动态安全评估方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107392363A (zh) * 2017-07-12 2017-11-24 河海大学 一种ceemd和随机森林的短期风功率预测方法
CN108537683A (zh) * 2018-04-13 2018-09-14 贵州电网有限责任公司 一种基于相似日选取及随机森林算法的负荷预测方法
CN109948839A (zh) * 2019-03-06 2019-06-28 国网河南省电力公司电力科学研究院 架空输电线路舞动风险的预测和预警方法及***
CN110232499A (zh) * 2019-04-26 2019-09-13 中国电力科学研究院有限公司 一种配电网信息物理侧风险预警方法及***
CN110311376A (zh) * 2019-07-31 2019-10-08 三峡大学 一种电力***动态安全评估综合模型及时空可视化方法
CN110417011A (zh) * 2019-07-31 2019-11-05 三峡大学 一种基于互信息与迭代随机森林的在线动态安全评估方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ALEXEI ZHUKOV ETC.: "Ensemble Methods of Classification for Power Systems Security Assessment", 《ARXIV:1601.01675V1 [CS.AI] 》 *
N. TOMIN ETC.: "Random Forest Based Model for Preventing Large-Scale Emergencies in Power Systems", 《 INTERNATIONAL JOURNAL OF ARTIFICIAL INTELLIGENCE 》 *
SHUAN LI ETC.: "Electricity Theft Detection in Power Grids with Deep Learning and Random Forests", 《JOURNAL OF ELECTRICAL AND COMPUTER ENGINEERING》 *
李常刚等: ""大电网动态安全风险智能评估***"", 《电力***自动化》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111914881A (zh) * 2020-06-18 2020-11-10 北京百度网讯科技有限公司 随机森林的生成方法、装置、电子设备及存储介质
CN112734274A (zh) * 2021-01-20 2021-04-30 国家电网公司华中分部 一种低碳电网运营主导影响因素挖掘及综合评估方法
CN112734274B (zh) * 2021-01-20 2023-11-03 国家电网公司华中分部 一种低碳电网运营主导影响因素挖掘及综合评估方法
CN113159615A (zh) * 2021-05-10 2021-07-23 麦荣章 一种工业控制***信息安全风险智能测定***及方法
CN116090834A (zh) * 2023-03-07 2023-05-09 安徽农业大学 基于Flink平台的林业管理方法、装置
CN116090834B (zh) * 2023-03-07 2023-06-13 安徽农业大学 基于Flink平台的林业管理方法、装置
CN117131464A (zh) * 2023-10-25 2023-11-28 湖北华中电力科技开发有限责任公司 一种电网数据的可用性评估方法及***
CN117131464B (zh) * 2023-10-25 2024-01-09 湖北华中电力科技开发有限责任公司 一种电网数据的可用性评估方法及***
CN117689214A (zh) * 2024-01-31 2024-03-12 天津华凯电气有限公司 一种柔性直流牵引供电***能量路由器动态安全评估方法
CN117689214B (zh) * 2024-01-31 2024-05-14 天津华凯电气有限公司 一种柔性直流牵引供电***能量路由器动态安全评估方法

Also Published As

Publication number Publication date
CN111292020B (zh) 2020-12-15

Similar Documents

Publication Publication Date Title
CN111292020B (zh) 一种基于随机森林的电网实时运行风险评估方法及***
CN111639815A (zh) 一种多模型融合预测电网缺陷物资的方法及***
CN105354636B (zh) 一种基于非参数核密度估计的风功率波动性概率密度建模方法
CN111900694B (zh) 一种基于自动识别的继电保护设备信息采集方法及***
CN109446812A (zh) 一种嵌入式***固件安全分析方法及***
CN110232499A (zh) 一种配电网信息物理侧风险预警方法及***
CN114723285A (zh) 一种电网设备安全性评估预测方法
CN109711707B (zh) 一种船舶动力装置综合状态评估方法
CN112308436A (zh) 一种配电网评估诊断分析方法、装置、设备及存储介质
CN108573227A (zh) 心电图数据质量评价方法及装置
CN111199469A (zh) 用户还款模型生成方法、装置及电子设备
CN112001644A (zh) 一种配电网运行可靠性检测方法、装置、终端及存储介质
CN112200238A (zh) 基于声响特征的硬岩拉剪破裂识别方法与装置
CN114970357A (zh) 节能效果评价方法、***、装置及存储介质
CN114462828A (zh) 一种工程施工用安全预警监理***及其监理方法
CN111950752A (zh) 光伏电站发电量预测方法、装置、***及其存储介质
CN113313304A (zh) 一种基于大数据决策树的电网事故异常分析方法及***
CN116204846B (zh) 一种基于可见图的配电网传感器数据异常快速定位方法
CN117034149A (zh) 故障处理策略确定方法、装置、电子设备和存储介质
CN112083275A (zh) 一种配网故障类型识别方法及***
CN115987692A (zh) 一种基于流量回溯分析的安全防护***及方法
CN116187932A (zh) 一种信息***工程监理项目风险自适应评估方法
CN113408816B (zh) 一种基于深度神经网络的电网灾情评估方法
CN107679478A (zh) 输电线路空间负荷状态的提取方法和***
CN114548307A (zh) 分类模型训练方法和装置、分类方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant