CN113313304A - 一种基于大数据决策树的电网事故异常分析方法及*** - Google Patents
一种基于大数据决策树的电网事故异常分析方法及*** Download PDFInfo
- Publication number
- CN113313304A CN113313304A CN202110592830.8A CN202110592830A CN113313304A CN 113313304 A CN113313304 A CN 113313304A CN 202110592830 A CN202110592830 A CN 202110592830A CN 113313304 A CN113313304 A CN 113313304A
- Authority
- CN
- China
- Prior art keywords
- power grid
- data
- test sample
- sample set
- accident
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000003066 decision tree Methods 0.000 title claims abstract description 92
- 238000004458 analytical method Methods 0.000 title claims abstract description 80
- 238000012360 testing method Methods 0.000 claims abstract description 108
- 230000002159 abnormal effect Effects 0.000 claims abstract description 88
- 238000012544 monitoring process Methods 0.000 claims abstract description 57
- 238000012545 processing Methods 0.000 claims abstract description 24
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 9
- 230000007613 environmental effect Effects 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 4
- 238000012550 audit Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 238000000034 method Methods 0.000 abstract description 17
- 230000001364 causal effect Effects 0.000 abstract description 5
- 238000004140 cleaning Methods 0.000 abstract description 4
- 238000004590 computer program Methods 0.000 description 6
- 230000005856 abnormality Effects 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 4
- 230000011664 signaling Effects 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Game Theory and Decision Science (AREA)
- Computational Linguistics (AREA)
- Development Economics (AREA)
- Software Systems (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明公开了一种基于大数据决策树的电网事故异常分析方法及***,通过获取电网历史事故异常信号数据和电网历史监控数据,并进行清洗、划归等规范化处理后,建立测试样本集,然后设置电网事故异常信号的所有相关属性,并分别计算在测试样本集中各个相关属性的信息增益,根据信息增益的大小构建决策树,最终将待分析的电网监控数据输入到决策树中,得到电网事故异常分析结果,由此通过决策树实现电网事故异常分析结果与电网监控数据的因果联系,与现有技术相比,能够基于大数据决策树对电网事故异常进行智能分析,从而向监控人员展示可信度高的事故异常分析结果和可行性好的事故处理建议。
Description
技术领域
本发明涉及电力***技术领域,尤其涉及一种基于大数据决策树的电网事故异常分析方法及***。
背景技术
随着国家电网管理模式的逐步优化,电网调控人员是否能及时准确的判断事故信号的正确性并预测电力需求是一项必要的需求。但由于每个调控人员本身的工作经验和业务能力各不相同,对于相同的信号数据会得出不同的处置结果,会对电网的安全稳定运行产生很大问题。另一方面,事故判断、处理的时间越长,电网在非正常运行方式下运行的时间就越长,电能损耗就越大,事故进一步扩大的可能性也就越大。事故判断、处理的准确性和实效性的双重压力,给调控人员的工作带来很大的压力。
因此,如何提供一种能够智能分析电网事故异常的方法及***,是本领域技术人员需要解决的技术问题。
公开于该背景技术部分的信息仅仅旨在加深对本发明总体背景技术的理解,而不应当被视为承认或以任何形式暗示该信息构成本领域技术人员所公知的现有技术。
发明内容
本发明的目的是:提供一种基于大数据决策树的电网事故异常分析方法及***,能够基于大数据决策树对电网事故异常进行智能分析,从而向监控人员展示可信度高的事故异常分析结果和可行性好的事故处理建议。
为了达到上述目的,本发明一方面提供一种基于大数据决策树的电网事故异常分析方法,包括:
获取电网历史事故异常信号数据和电网历史监控数据,并进行规范化处理,建立测试样本集;
设置电网事故异常信号的所有相关属性;
计算所述测试样本集中各个所述相关属性的信息增益;
将信息增益最大的所述相关属性作为根节点,其他所述相关属性按照信息增益的大小依次作为决策分支,构建决策树;
输入待分析的电网监控数据到所述决策树中,得到电网事故异常分析结果。
优选地,所述信息增益的计算方法,包括:
Gain(A)=I(S1,S2)-E(A);
式中,I(S1,S2)代表所述测试样本集中相关属性A的信息熵,E(A)代表所述测试样本集中相关属性A在不同情况下的信息熵期望,Gain(A)代表所述测试样本集中相关属性 A的信息增益,S代表所述测试样本集中的样本数量,S1代表在相关属性A的影响下所述测试样本集中电网事故异常信号为正确信号的样本数量,S2代表在相关属性A的影响下所述测试样本集中电网事故异常信号为错误信号的样本数量,S11代表在相关属性A 为A1情况的影响下所述测试样本集中电网事故异常信号为正确信号的样本数量,S21代表在相关属性A为A1情况的影响下所述测试样本集中电网事故异常信号为错误信号的样本数量,S12代表在相关属性A为A2情况的影响下所述测试样本集中电网事故异常信号为正确信号的样本数量,S22代表在相关属性A为A2情况的影响下所述测试样本集中电网事故异常信号为错误信号的样本数量。
优选地,所述输入待分析的电网监控数据到所述决策树中,得到电网事故异常分析结果,包括:
获取待分析的电网实时数据,通过数据预测算法对所述待分析的电网实时数据进行数据预测,得到待分析的电网预测数据;
输入所述待分析的电网实时数据和所述待分析的电网预测数据到所述决策树中,得到电网事故异常分析结果。
优选地,所述方法还包括:
对所述电网事故异常分析结果进行审核,得到审核结果;
更新所述电网历史事故异常信号数据和电网历史监控数据,并对所述测试样本集进行更新处理,得到更新后的测试样本集;
根据所述审核结果和所述更新后的测试样本集,对所述决策树进行优化。
优选地,所述电网历史监控数据包括电网历史设备台账数据、电网历史遥测数据、电网历史遥信数据和电网历史环境数据。
本发明另一方面提供一种基于大数据决策树的电网事故异常分析***,包括:
测试样本集建立单元,用于获取电网历史事故异常信号数据和电网历史监控数据,并进行规范化处理,建立测试样本集;
相关属性设置单元,用于设置电网事故异常信号的所有相关属性;
信息增益计算单元,用于计算所述测试样本集中各个所述相关属性的信息增益;
决策树构建单元,将信息增益最大的所述相关属性作为根节点,其他所述相关属性按照信息增益的大小依次作为决策分支,构建决策树;
电网事故异常分析单元,用于输入待分析的电网监控数据到所述决策树中,得到电网事故异常分析结果。
优选地,所述信息增益的计算方法,包括:
Gain(A)=I(S1,S2)-E(A);
式中,I(S1,S2)代表所述测试样本集中相关属性A的信息熵,E(A)代表所述测试样本集中相关属性A在不同情况下的信息熵期望,Gain(A)代表所述测试样本集中相关属性 A的信息增益,S代表所述测试样本集中的样本数量,S1代表在相关属性A的影响下所述测试样本集中电网事故异常信号为正确信号的样本数量,S2代表在相关属性A的影响下所述测试样本集中电网事故异常信号为错误信号的样本数量,S11代表在相关属性A 为A1情况的影响下所述测试样本集中电网事故异常信号为正确信号的样本数量,S21代表在相关属性A为A1情况的影响下所述测试样本集中电网事故异常信号为错误信号的样本数量,S12代表在相关属性A为A2情况的影响下所述测试样本集中电网事故异常信号为正确信号的样本数量,S22代表在相关属性A为A2情况的影响下所述测试样本集中电网事故异常信号为错误信号的样本数量。
优选地,所述电网事故异常分析单元包括:
数据预测子单元,用于获取待分析的电网实时数据,通过数据预测算法对所述待分析的电网实时数据进行数据预测,得到待分析的电网预测数据;
电网事故异常分析子单元,用于输入所述待分析的电网实时数据和所述待分析的电网预测数据到所述决策树中,得到电网事故异常分析结果。
优选地,所述***还包括:
结果审核单元,用于对所述电网事故异常分析结果进行审核,得到审核结果;
数据更新单元,用于更新所述电网历史事故异常信号数据和电网历史监控数据,并对所述测试样本集进行更新处理,得到更新后的测试样本集;
决策树优化单元,用于根据所述审核结果和所述更新后的测试样本集,对所述决策树进行优化。
优选地,所述电网历史监控数据包括电网历史设备台账数据、电网历史遥测数据、电网历史遥信数据和电网历史环境数据。
本发明至少具有以下有益效果:
本发明通过获取电网历史事故异常信号数据和电网历史监控数据,并进行清洗、划归等规范化处理后,建立测试样本集,然后设置电网事故异常信号的所有相关属性,并分别计算在测试样本集中各个相关属性的信息增益,根据信息增益的大小构建决策树,最终将待分析的电网监控数据输入到决策树中,得到电网事故异常分析结果,由此通过决策树实现电网事故异常分析结果与电网监控数据的因果联系,与现有技术相比,能够基于大数据决策树对电网事故异常进行智能分析,从而向监控人员展示可信度高的事故异常分析结果和可行性好的事故处理建议。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中基于大数据决策树的电网事故异常分析方法的流程示意图;
图2为本发明实施例中决策树算法的流程示意图;
图3为本发明实施例中基于大数据决策树的电网事故异常分析***的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
需要说明的是,当元件被称为“固定于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的,并不表示是唯一的实施方式。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
请参阅图1,本发明实施例一方面提供一种基于大数据决策树的电网事故异常分析方法,包括:
S110、获取电网历史事故异常信号数据和电网历史监控数据,并进行规范化处理,建立测试样本集。
本发明实施例中,获取电网历史事故异常信号数据和电网历史监控数据后,需要对获取的数据进行清洗、划归等规范化处理,得到能够使用的数据,并建立测试样本集。
具体实施时,电网历史监控数据包括电网历史设备台账数据、电网历史遥测数据、电网历史遥信数据和电网历史环境数据等。
S120、设置电网事故异常信号的所有相关属性。
本发明实施例中,某类电网事故异常信号的发生是否正确或某种电网事故异常信号是否可能发生,取决于很多因素,如电网设备整体更新、制定新的规则等,监控人员可以列出对各种类型电网事故异常信号起判定作用的所有相关属性。
S130、计算测试样本集中各个相关属性的信息增益。
本发明实施例中,对各种类型电网事故异常信号起判定作用的所有相关属性之间存在关联性,同时这些相关属性所占权重也各不相同,有些相关属性是某种类型事故异常信号得以发生的决定性条件,有些相关属性则是多个相关属性以特定优先级组合后决定某种类型事故异常信号是否有可能发生。由于对各种类型电网事故异常信号起判定作用的相关属性很多,我们需要在测试样本集中分别计算各个相关属性的信息增益(Gain)。
S140、将信息增益最大的相关属性作为根节点,其他相关属性按照信息增益的大小依次作为决策分支,构建决策树。
本发明实施例中,计算出测试样本集中各个相关属性的信息增益后,比较各个相关属性的信息增量,选取信息增量最大的相关属性为基础判断条件,作为决策树的根节点,其他相关属性按照信息增量的大小依次作为决策分支,从而构建出决策树。
S150、输入待分析的电网监控数据到决策树中,得到电网事故异常分析结果。
本发明实施例中,将待分析的电网监控数据输入到决策树中,即可得到电网事故异常分析结果,从而通过决策树实现电网事故异常分析结果与电网监控数据的因果联系,同时自动判断电网事故异常信号是否正确,进而推算出电网可能存在的隐患,并给出可行性好的事故处理建议。
以上可知,本发明实施例提供的基于大数据决策树的电网事故异常分析方法,通过获取电网历史事故异常信号数据和电网历史监控数据,并进行清洗、划归等规范化处理后,建立测试样本集,然后设置电网事故异常信号的所有相关属性,并分别计算在测试样本集中各个相关属性的信息增益,根据信息增益的大小构建决策树,最终将待分析的电网监控数据输入到决策树中,得到电网事故异常分析结果,由此通过决策树实现电网事故异常分析结果与电网监控数据的因果联系,与现有技术相比,能够基于大数据决策树对电网事故异常进行智能分析,从而向监控人员展示可信度高的事故异常分析结果和可行性好的事故处理建议。
作为本发明优选的实施例,在步骤S130中,信息增益的计算方法,包括:
Gain(A)=I(S1,S2)-E(A);
式中,I(S1,S2)代表测试样本集中相关属性A的信息熵,E(A)代表测试样本集中相关属性A在不同情况下的信息熵期望,Gain(A)代表测试样本集中相关属性A的信息增益,S代表测试样本集中的样本数量,S1代表在相关属性A的影响下测试样本集中电网事故异常信号为正确信号的样本数量,S2代表在相关属性A的影响下测试样本集中电网事故异常信号为错误信号的样本数量,S11代表在相关属性A为A1情况的影响下测试样本集中电网事故异常信号为正确信号的样本数量,S21代表在相关属性A为A1情况的影响下测试样本集中电网事故异常信号为错误信号的样本数量,S12代表在相关属性A为 A2情况的影响下测试样本集中电网事故异常信号为正确信号的样本数量,S22代表在相关属性A为A2情况的影响下测试样本集中电网事故异常信号为错误信号的样本数量。
本发明实施例中,选取某种类型电网事故异常信号的相关属性A为基础判决条件,测试样本集中该电网事故异常信号的样本数量记为S。
首先,计算测试样本集中该电网事故异常信号在相关属性A的影响下的信息熵,其中,在相关属性A的影响下,测试样本集中电网事故异常信号为正确信号的样本数量记为S1,错误信号的样本数量记为S2,信息熵计算公式为:
其次,计算测试样本集中相关属性A在不同情况下该电网事故异常信号发生的信息熵期望,设相关属性A分别有A1和A2两种情况,在相关属性A为A1情况的影响下测试样本集中电网事故异常信号为正确信号的样本数量记为S11,错误信号的样本数量记为S21;在相关属性A为A2情况的影响下测试样本集中电网事故异常信号为正确信号的样本数量记为S12,错误信号的样本数量记为S22,信息熵期望的计算公式为:
其中,I(S11,S21)和I(S12,S22)分别根据上述信息熵计算公式计算。
最后,计算测试样本集中相关属性A的信息增量,信息增量的计算公式为:
Gain(A)=I(S1,S2)-E(A)。
作为本发明优选的实施例,步骤S150具体包括:
获取待分析的电网实时数据,通过数据预测算法对待分析的电网实时数据进行数据预测,得到待分析的电网预测数据;
输入待分析的电网实时数据和待分析的电网预测数据到决策树中,得到电网事故异常分析结果。
本发明实施例中,对未来的电网事故异常进行预警,不仅需要分析电网的各种实时数据,还需要对电网的各种数据进行预测。获取电网实时遥测数据和电网实时遥信数据后,通过数据预测算法,预测电网遥测数据和电网遥信数据在未来一段时间段内的数据,同时由于电网实时环境数据的精度往往不高,也需要利用现有数据对气象、雷电等数据进行预测,得到电网预测数据。最终将待分析的电网实时数据和待分析的电网预测数据输入到决策树中,以得到电网事故异常分析结果。
作为本发明优选的实施例,该方法还包括:
对电网事故异常分析结果进行审核,得到审核结果;
更新电网历史事故异常信号数据和电网历史监控数据,并对测试样本集进行更新处理,得到更新后的测试样本集;
根据审核结果和更新后的测试样本集,对决策树进行优化。
请参阅图2,本发明实施例中,由于电网在不断运行,通过电网历史事故异常信号数据和电网历史监控数据对决策树的建模也需要进行不断的优化更新。一方面,电网在运行时不断产生新的监控数据,可以将新的监控数据和对应的事故异常信号在现有决策树模型下进行匹配,同时监控人员对电网事故异常分析结果进行审核,找出电网事故异常分析结果存在的错误之处,为后续的事故异常分析奠定基础。
另外,对于每条电网事故异常信号,可以计算出该条电网事故异常信号是正确信号的几率。当该几率不是100%时(与历史出现的电网事故异常信号可以完全匹配时记做100%),在***中展示该条电网事故异常信号,并分别列出可以和电网历史事故异常信号匹配的相关属性和其他未匹配的相关属性。监控人员验证后,如果该条电网事故异常信号属于误发,监控人员需要在列出的相关属性中圈选可以证明该电网事故异常信号为误发的决定性相关属性,自学习算法会在该类型电网事故异常信号再次出现时,将圈选的相关属性进行高优先度处理。当某类型电网事故异常信号不再依赖于某些条件时(例如电网设备整体更新,指定新的规则),监控人员可以针对某一特定类型的电网事故异常信号进行规则修改,删除某些起判定作用的相关属性,同时决策树模型会根据现有电网历史监控数据进行重新构建,计算出最优决策树后,将产生变化的信号在***中进行展示。通过监控人员再次审核,最终确定一套新的决策树模型。
本发明实施例另一方面提供一种基于大数据决策树的电网事故异常分析***,下文描述的该***可以与上文描述的方法相互对应参照
请参阅图3,该***包括:
测试样本集建立单元110,用于获取电网历史事故异常信号数据和电网历史监控数据,并进行规范化处理,建立测试样本集;
相关属性设置单元120,用于设置电网事故异常信号的所有相关属性;
信息增益计算单元130,用于计算测试样本集中各个相关属性的信息增益;
决策树构建单元140,将信息增益最大的相关属性作为根节点,其他相关属性按照信息增益的大小依次作为决策分支,构建决策树;
电网事故异常分析单元150,用于输入待分析的电网监控数据到决策树中,得到电网事故异常分析结果。
作为本发明优选的实施例,信息增益的计算方法,包括:
Gain(A)=I(S1,S2)-E(A);
式中,I(S1,S2)代表测试样本集中相关属性A的信息熵,E(A)代表测试样本集中相关属性A在不同情况下的信息熵期望,Gain(A)代表测试样本集中相关属性A的信息增益,S代表测试样本集中的样本数量,S1代表在相关属性A的影响下测试样本集中电网事故异常信号为正确信号的样本数量,S2代表在相关属性A的影响下测试样本集中电网事故异常信号为错误信号的样本数量,S11代表在相关属性A为A1情况的影响下测试样本集中电网事故异常信号为正确信号的样本数量,S21代表在相关属性A为A1情况的影响下测试样本集中电网事故异常信号为错误信号的样本数量,S12代表在相关属性A为 A2情况的影响下测试样本集中电网事故异常信号为正确信号的样本数量,S22代表在相关属性A为A2情况的影响下测试样本集中电网事故异常信号为错误信号的样本数量。
作为本发明优选的实施例,电网事故异常分析单元150包括:
数据预测子单元,用于获取待分析的电网实时数据,通过数据预测算法对待分析的电网实时数据进行数据预测,得到待分析的电网预测数据;
电网事故异常分析子单元,用于输入待分析的电网实时数据和待分析的电网预测数据到决策树中,得到电网事故异常分析结果。
作为本发明优选的实施例,该***还包括:
结果审核单元,用于对电网事故异常分析结果进行审核,得到审核结果;
数据更新单元,用于更新电网历史事故异常信号数据和电网历史监控数据,并对测试样本集进行更新处理,得到更新后的测试样本集;
决策树优化单元,用于根据审核结果和更新后的测试样本集,对决策树进行优化。
作为本发明优选的实施例,电网历史监控数据包括电网历史设备台账数据、电网历史遥测数据、电网历史遥信数据和电网历史环境数据。
以上可知,本发明实施例提供的基于大数据决策树的电网事故异常分析***,通过获取电网历史事故异常信号数据和电网历史监控数据,并进行清洗、划归等规范化处理后,建立测试样本集,然后设置电网事故异常信号的所有相关属性,并分别计算在测试样本集中各个相关属性的信息增益,根据信息增益的大小构建决策树,最终将待分析的电网监控数据输入到决策树中,得到电网事故异常分析结果,由此通过决策树实现电网事故异常分析结果与电网监控数据的因果联系,与现有技术相比,能够基于大数据决策树对电网事故异常进行智能分析,从而向监控人员展示可信度高的事故异常分析结果和可行性好的事故处理建议。
本发明实施例提供的一种基于大数据决策树的电网事故异常分析***中相关部分的说明请参见本发明实施例提供的一种基于大数据决策树的电网事故异常分析方法中对应部分的详细说明,且均具有本发明实施例提供的一种基于大数据决策树的电网事故异常分析方法具有的对应效果,在此不再赘述。
上文中提到的基于大数据决策树的电网事故异常分析***是从功能模块的角度描述,进一步的,本发明实施例又一方面提供一种基于大数据决策树的电网事故异常分析设备,是从硬件角度描述。
该设备包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序时实现如上述任意实施例提供的基于大数据决策树的电网事故异常分析方法的步骤。
其中,处理器可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器可以集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器还可以包括AI(ArtificialIntelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器至少用于存储以下计算机程序,其中,该计算机程序被处理器加载并执行之后,能够实现前述任一实施例公开的基于大数据决策树的电网事故异常分析方法的相关步骤。另外,存储器所存储的资源还可以包括操作***和数据等,存储方式可以是短暂存储或者永久存储。其中,操作***可以包括 Windows、Unix、Linux等,数据可以包括但不限于测试结果对应的数据等。
可以理解的是,如果上述任意实施例提供的基于大数据决策树的电网事故异常分析方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、磁碟或者光盘等各种可以存储程序代码的介质。
有鉴于此,本发明实施例又一方面提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述任意实施例提供的基于大数据决策树的电网事故异常分析方法的步骤。
本发明实施例提供的计算机可读存储介质的各功能模块的功能可根据上述任意方法实施例中的方法具体实现,其具体实现过程可以参照上述任意方法实施例的相关描述,此处不再赘述。
本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (10)
1.一种基于大数据决策树的电网事故异常分析方法,其特征在于,包括:
获取电网历史事故异常信号数据和电网历史监控数据,并进行规范化处理,建立测试样本集;
设置电网事故异常信号的所有相关属性;
计算所述测试样本集中各个所述相关属性的信息增益;
将信息增益最大的所述相关属性作为根节点,其他所述相关属性按照信息增益的大小依次作为决策分支,构建决策树;
输入待分析的电网监控数据到所述决策树中,得到电网事故异常分析结果。
2.根据权利要求1所述的基于大数据决策树的电网事故异常分析方法,其特征在于,所述信息增益的计算方法,包括:
Gain(A)=I(S1,S2)-E(A);
式中,I(S1,S2)代表所述测试样本集中相关属性A的信息熵,E(A)代表所述测试样本集中相关属性A在不同情况下的信息熵期望,Gain(A)代表所述测试样本集中相关属性A的信息增益,S代表所述测试样本集中的样本数量,S1代表在相关属性A的影响下所述测试样本集中电网事故异常信号为正确信号的样本数量,S2代表在相关属性A的影响下所述测试样本集中电网事故异常信号为错误信号的样本数量,S11代表在相关属性A为A1情况的影响下所述测试样本集中电网事故异常信号为正确信号的样本数量,S21代表在相关属性A为A1情况的影响下所述测试样本集中电网事故异常信号为错误信号的样本数量,S12代表在相关属性A为A2情况的影响下所述测试样本集中电网事故异常信号为正确信号的样本数量,S22代表在相关属性A为A2情况的影响下所述测试样本集中电网事故异常信号为错误信号的样本数量。
3.根据权利要求1所述的基于大数据决策树的电网事故异常分析方法,其特征在于,所述输入待分析的电网监控数据到所述决策树中,得到电网事故异常分析结果,包括:
获取待分析的电网实时数据,通过数据预测算法对所述待分析的电网实时数据进行数据预测,得到待分析的电网预测数据;
输入所述待分析的电网实时数据和所述待分析的电网预测数据到所述决策树中,得到电网事故异常分析结果。
4.根据权利要求1所述的基于大数据决策树的电网事故异常分析方法,其特征在于,所述方法还包括:
对所述电网事故异常分析结果进行审核,得到审核结果;
更新所述电网历史事故异常信号数据和电网历史监控数据,并对所述测试样本集进行更新处理,得到更新后的测试样本集;
根据所述审核结果和所述更新后的测试样本集,对所述决策树进行优化。
5.根据权利要求1所述的基于大数据决策树的电网事故异常分析方法,其特征在于,所述电网历史监控数据包括电网历史设备台账数据、电网历史遥测数据、电网历史遥信数据和电网历史环境数据。
6.一种基于大数据决策树的电网事故异常分析***,其特征在于,包括:
测试样本集建立单元,用于获取电网历史事故异常信号数据和电网历史监控数据,并进行规范化处理,建立测试样本集;
相关属性设置单元,用于设置电网事故异常信号的所有相关属性;
信息增益计算单元,用于计算所述测试样本集中各个所述相关属性的信息增益;
决策树构建单元,将信息增益最大的所述相关属性作为根节点,其他所述相关属性按照信息增益的大小依次作为决策分支,构建决策树;
电网事故异常分析单元,用于输入待分析的电网监控数据到所述决策树中,得到电网事故异常分析结果。
7.根据权利要求6所述的基于大数据决策树的电网事故异常分析***,其特征在于,所述信息增益的计算方法,包括:
Gain(A)=I(S1,S2)-E(A);
式中,I(S1,S2)代表所述测试样本集中相关属性A的信息熵,E(A)代表所述测试样本集中相关属性A在不同情况下的信息熵期望,Gain(A)代表所述测试样本集中相关属性A的信息增益,S代表所述测试样本集中的样本数量,S1代表在相关属性A的影响下所述测试样本集中电网事故异常信号为正确信号的样本数量,S2代表在相关属性A的影响下所述测试样本集中电网事故异常信号为错误信号的样本数量,S11代表在相关属性A为A1情况的影响下所述测试样本集中电网事故异常信号为正确信号的样本数量,S21代表在相关属性A为A1情况的影响下所述测试样本集中电网事故异常信号为错误信号的样本数量,S12代表在相关属性A为A2情况的影响下所述测试样本集中电网事故异常信号为正确信号的样本数量,S22代表在相关属性A为A2情况的影响下所述测试样本集中电网事故异常信号为错误信号的样本数量。
8.根据权利要求6所述的基于大数据决策树的电网事故异常分析***,其特征在于,所述电网事故异常分析单元包括:
数据预测子单元,用于获取待分析的电网实时数据,通过数据预测算法对所述待分析的电网实时数据进行数据预测,得到待分析的电网预测数据;
电网事故异常分析子单元,用于输入所述待分析的电网实时数据和所述待分析的电网预测数据到所述决策树中,得到电网事故异常分析结果。
9.根据权利要求6所述的基于大数据决策树的电网事故异常分析***,其特征在于,所述***还包括:
结果审核单元,用于对所述电网事故异常分析结果进行审核,得到审核结果;
数据更新单元,用于更新所述电网历史事故异常信号数据和电网历史监控数据,并对所述测试样本集进行更新处理,得到更新后的测试样本集;
决策树优化单元,用于根据所述审核结果和所述更新后的测试样本集,对所述决策树进行优化。
10.根据权利要求6所述的基于大数据决策树的电网事故异常分析***,其特征在于,所述电网历史监控数据包括电网历史设备台账数据、电网历史遥测数据、电网历史遥信数据和电网历史环境数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110592830.8A CN113313304A (zh) | 2021-05-28 | 2021-05-28 | 一种基于大数据决策树的电网事故异常分析方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110592830.8A CN113313304A (zh) | 2021-05-28 | 2021-05-28 | 一种基于大数据决策树的电网事故异常分析方法及*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113313304A true CN113313304A (zh) | 2021-08-27 |
Family
ID=77376015
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110592830.8A Withdrawn CN113313304A (zh) | 2021-05-28 | 2021-05-28 | 一种基于大数据决策树的电网事故异常分析方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113313304A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117150393A (zh) * | 2023-10-26 | 2023-12-01 | 国网经济技术研究院有限公司 | 一种基于决策树的电力***薄弱支路辨识方法及*** |
CN117289143A (zh) * | 2023-11-27 | 2023-12-26 | 宁德时代新能源科技股份有限公司 | 一种故障预测方法、装置、设备、***和介质 |
-
2021
- 2021-05-28 CN CN202110592830.8A patent/CN113313304A/zh not_active Withdrawn
Non-Patent Citations (1)
Title |
---|
周勇: "关联规则决策树算法在电网故障中的分析及应用", 《工程科技Ⅱ辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117150393A (zh) * | 2023-10-26 | 2023-12-01 | 国网经济技术研究院有限公司 | 一种基于决策树的电力***薄弱支路辨识方法及*** |
CN117150393B (zh) * | 2023-10-26 | 2024-01-05 | 国网经济技术研究院有限公司 | 一种基于决策树的电力***薄弱支路辨识方法及*** |
CN117289143A (zh) * | 2023-11-27 | 2023-12-26 | 宁德时代新能源科技股份有限公司 | 一种故障预测方法、装置、设备、***和介质 |
CN117289143B (zh) * | 2023-11-27 | 2024-04-19 | 宁德时代新能源科技股份有限公司 | 一种故障预测方法、装置、设备、***和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111459700B (zh) | 设备故障的诊断方法、诊断装置、诊断设备及存储介质 | |
CN111563606A (zh) | 一种设备预测性维护方法及装置 | |
CN113313304A (zh) | 一种基于大数据决策树的电网事故异常分析方法及*** | |
CN114493049A (zh) | 基于数字孪生的产线优化方法、装置、电子设备及介质 | |
CN110388315A (zh) | 基于多源信息融合的输油泵故障识别方法、装置及*** | |
CN111738331A (zh) | 用户分类方法及装置、计算机可读存储介质、电子设备 | |
CN114282752A (zh) | 流程任务的生成方法、装置、电子设备及存储介质 | |
CN111199469A (zh) | 用户还款模型生成方法、装置及电子设备 | |
CN115034596A (zh) | 一种风险传导预测方法、装置、设备和介质 | |
CN112801315A (zh) | 电力二次设备的状态诊断方法、装置及终端 | |
CN117709715A (zh) | 一种隧道工程施工风险评估方法、***、终端及介质 | |
CN117149565A (zh) | 云平台关键性能指标的状态检测方法、装置、设备及介质 | |
CN111008119A (zh) | 一种硬盘预测模型的更新方法、装置、设备及介质 | |
CN114312930B (zh) | 基于日志数据的列车运行异常诊断方法和装置 | |
CN115314528A (zh) | 桥梁结构健康监测***、方法和平台 | |
CN114896418A (zh) | 知识图谱构建方法、装置、电子设备及存储介质 | |
CN111611117B (zh) | 硬盘故障的预测方法、装置、设备及计算机可读存储介质 | |
CN114706856A (zh) | 故障处理方法及装置、电子设备和计算机可读存储介质 | |
CN114610648A (zh) | 一种测试方法、装置及设备 | |
CN111209158B (zh) | 服务器集群的挖矿监控方法及集群监控*** | |
CN113887101A (zh) | 网络模型的可视化方法、装置、电子设备及存储介质 | |
CN114298226A (zh) | 一种核电厂故障诊断方法、装置及其介质 | |
CN114443738A (zh) | 异常数据挖掘方法、装置、设备及介质 | |
CN113240140A (zh) | 物理设备的故障检测方法、装置、设备及存储介质 | |
CN112395167A (zh) | 一种作业故障预测方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20210827 |