CN115526407A - 基于因果机器学习的电网大数据安全检测预警方法及*** - Google Patents

基于因果机器学习的电网大数据安全检测预警方法及*** Download PDF

Info

Publication number
CN115526407A
CN115526407A CN202211230320.7A CN202211230320A CN115526407A CN 115526407 A CN115526407 A CN 115526407A CN 202211230320 A CN202211230320 A CN 202211230320A CN 115526407 A CN115526407 A CN 115526407A
Authority
CN
China
Prior art keywords
early warning
power grid
safety
instantaneous
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211230320.7A
Other languages
English (en)
Inventor
赵博
党倩
尚闻博
孙碧颖
邱昱
刘欣蕊
杜春慧
录鹏东
裴俊捷
金鑫
刘晓琴
李娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Gansu Electric Power Co Ltd
Information and Telecommunication Branch of State Grid Gansu Electric Power Co Ltd
Original Assignee
State Grid Gansu Electric Power Co Ltd
Information and Telecommunication Branch of State Grid Gansu Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Gansu Electric Power Co Ltd, Information and Telecommunication Branch of State Grid Gansu Electric Power Co Ltd filed Critical State Grid Gansu Electric Power Co Ltd
Priority to CN202211230320.7A priority Critical patent/CN115526407A/zh
Publication of CN115526407A publication Critical patent/CN115526407A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Software Systems (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于因果机器学习的电网大数据安全检测预警方法及***,将电网场景大数据分为设备历史数据集和当前数据集;并进行预处理得到设备瞬时历史数据集和设备步进历史数据集;构建包括瞬时因果关系网络和步进因果关系网络的因果关系网络;基于瞬时因果关系网络和步进因果关系网络分析并筛选当前数据集;构建电网大数据瞬时预警规则库和电网大数据事前预警规则库;生成多维度电网大数据安全预警模型;根据多维度电网大数据安全预警模型,计算瞬时全局预警分数S1和事前全局预警分数S2;根据设备类型动态调整权重比例动态计算安全预警分数S,得到动态预警等级实施最终预警。用于增加电网终端设备的韧性与电力大数据运行环境的安全性。

Description

基于因果机器学习的电网大数据安全检测预警方法及***
技术领域
本发明属于安全预警技术领域,具体涉及一种基于因果机器学习的电网大数据安全检测预警方法及***。
背景技术
在能耗问题上,如何高效准确及时的甄别各终端设备所传输数据的准确性,并从冗余量较大的数据中甄选出所需数据并进行安全预警,已成为电网安全运行中提高基础设施韧性与安全预警中亟待解决的问题之一。数据检测与预警模型的数据来源为实时采集的现场数据与电网数据库数据,聚焦电网智能终端所采集数据的可靠性、准确性与及时安全预警,围绕着电网大数据闭环中终端设备数据采集、人员操作、环境等关键要素展开探究。然而现有相关的数据检测的甄别机制与预警模型存在静态性、数据联动性不足、没有考虑因果关系以及技术可拓展性差等问题导致准确性低、预警不及时可信度不高、时效性与联动性欠缺。为此,从电网大数据及其具体采集分析场景出发,设计一个针对电网***的数据检测与安全预警高效、可信的联动模型尤为重要。
与一般数据检测与安全预警模型不同的是,导致电网大数据环境下检测与预警机制效果与实时性较差的原因有如下几点:
首先,由于电网终端设备部署位置多变、设备质量参差不齐、数据传输渠道可信性不强,仅靠传统的数据清理无法保证数据的准确性,从基础数据上直接限制了预警的有效性,同时限制了基础设备的韧性;
其次,电网大数据与普通工业大数据不同的是,电网大数据之前存在着因果关系,在现有的预警模型中,无法从多维度、多要素的立体层面上提取出电网大数据之间的因果关系,进而难以保证预警机制的准确性;
最后,随着传感器终端设备与设备类型的不断增多,数据冗余量也增大,现有数据检测与预警模型无法分层式抽取电网摘要性数据,进而造成***运行缓慢、迁移性较差以及难以拓展等问题。
发明内容
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种基于因果机器学习的电网大数据安全检测预警方法及***,用于解决终端设备部署位置不定、设备质量良莠不齐、数据传输渠道可靠度弱造成的检测预警数据可靠性差以及缺少多维度、多要素的数据因果关系导致检测预警结果准确性差的技术问题。
本发明采用以下技术方案:
基于因果机器学习的电网大数据安全检测预警方法,包括以下步骤:
S1、将电网场景大数据D分为设备历史数据集iDold和设备当前数据集iDnew,i为数据来源设备序列;
S2、对步骤S1得到的设备历史数据集iDold进行预处理分类,得到设备瞬时历史数据集iDoldtime和设备步进历史数据集iDoldstep
S3、基于步骤S2得到的设备瞬时历史数据集iDoldtime和设备步进历史数据集iDoldstep构建因果关系网络M,因果关系网络M分为瞬时因果关系网络Mtime和步进因果关系网络Mstep
S4、基于步骤S3得到的瞬时因果关系网络Mtime和步进因果关系网络Mstep分析并筛选步骤S1得到的设备当前数据集iDnew
S5、基于步骤S2得到的设备瞬时历史数据集iDoldtime所对应每时刻安全生产的影响结果构建电网大数据瞬时预警规则库,基于步骤S2得到的设备步进历史数据集iDoldstep和步骤S4得到的设备当前数据集iDnew预测尚未发生和尚未观测的数据并且构建电网大数据事前预警规则库;
S6、基于步骤S3得到的因果关系网络M,以及步骤S5得到的电网大数据瞬时预警规则库和电网大数据事前预警规则库生成多维度电网大数据安全预警模型;
S7、根据步骤S6得到的多维度电网大数据安全预警模型,利用步骤S4得到的设备当前数据集iDnew计算瞬时全局预警分数S1,并对步骤S5中预测尚未发生和尚未观测的数据计算事前全局预警分数S2;根据瞬时全局预警分数S1和事前全局预警分数S2计算安全预警分数S,得到动态预警等级用于实施最终预警。
具体的,步骤S2具体为:
S201、首先对设备历史数据集iDold中的数据根据时间序列排序得到设备瞬时历史安全数据集iDoldtime,对每条数据进行标注,得到安全Lsafe、一般警告Lnd和严重警告Ldd
S202、确定设备瞬时历史安全数据集iDoldtime,并将设备瞬时历史安全数据集iDoldtime当中安全、一般警告和严重警告的数据比例作为数据集的标注iSetLabel;
S203、对设备在特定时间内的所有数据根据采集时间排序,将时间序列上数据的临近前后差值
Figure BDA0003880834290000031
的正负关系得到设备步进历史安全数据集iDoldstep
具体的,步骤S3具体为:
S301、根据领域专家先验知识构建基础因果关系网络Mfirst
S302、在步骤S301得到的基础因果关系网络Mfirst的基础上,利用无向链接补全无因果关系的两两节点,采取改进的因果机器学习算法以iDoldtime和iDoldstep为数据集修正新添加的无向链接得到理论因果关系,与基础因果关系网络相结合得到基于电网多维度大数据的瞬时因果关系网络Mtime和步进因果关系网络Mstep
具体的,步骤S4中,根据瞬时因果关系网络Mtime,将实时采集的当前数据集Dnew结合自身阈值预警特征检验设备间数据的因果性,当实时采集的当前数据集Dnew因果节点之间呈现反因果性,清除果节点数据,根据步进因果关系网络Mstep,将实时采集的当前数据集Dnew根据时序差值正负性检验因果性。
具体的,步骤S5具体为:
S501、根据瞬时历史安全数据集iDoldtime所对应每时刻瞬时安全生产的影响结果将预警等级分为安全、一般警告和严重警告;
S502、在步骤S501得到的安全、一般警告和严重警告基础上,计算瞬时历史安全数据集iDoldtime中每个数据的瞬时安全预警分数iStime并构建电网大数据瞬时预警规则库、预测数据D的事前安全预警分数iSpre并构建电网大数据事前预警规则库,安全对应预警分数为1,严重警告对应预警分数为0,一般警告对应的预警分数通过归一化计算均匀分布在(0,1)范围之内。
具体的,步骤S6具体为:
S601、通过利用领域专家先验知识,将历史安全数据集中的所对应的电网大数据现场安全情况分为安全、一般警告和严重警告;
S602、以瞬时因果关系网络Mtime和步进因果关系网络Mstep为基础,以所有设备节点为网络输入层,以因果关系网络为网络节点拓扑结构,以所有设备节点全连接作为网络输出层,通过历史数据集iDold及步骤S5标注的电网大数据现场安全预警标注为训练数据,训练并补充以因果关系网络为基础的神经网络各连接层之间的权重比例,其中与瞬时因果关系网络具有相同结构的神经网络为电网大数据安全预警模型的瞬时模型,与步进因果关系网络相同结构的神经网络为电网大数据安全预警模型的步进模型。
具体的,步骤S7具体为:
S701、根据多维度电网大数据安全预警模型的瞬时模型,对当前数据集Dnew计算瞬时全局预警分数S1
S702、根据多维度电网大数据安全预警模型的步进模型,对当前数据集Dnew结合步骤S5中的预测数据,计算事前全局预警分数S2,计算方法类似于步骤S701,在此基础上,计算最终安全预警分数S。
进一步的,瞬时全局预警分数S1为:
S1=(a1*ΠiScore*α2*∑jScore)*iStime
其中,iScore为父因节点经电网大数据瞬时预警规则库得到的安全预警分数,jScore为子果节点经电网大数据瞬时预警规则库得到的安全预警分数,iStime为当前数据通过瞬时模型并结合电网大数据瞬时预警规则库得到的瞬时安全预警分数,a1和a2为激活因子。
进一步的,最终安全预警分数S为:
S=α1*S12*S2
其中,α1和α2为激活因子。
第二方面,本发明实施例提供了一种基于因果机器学习的电网大数据安全检测预警***,包括:
预处理模块,用于将电网场景大数据D分为设备历史数据集iDold和设备当前数据集iDnew,i为数据来源设备序列,对设备历史数据集iDold进行预处理分类,得到设备瞬时历史数据集iDoldtime和设备步进历史数据集iDoldstep
关系模块,用于基于预处理模块得到的设备瞬时历史数据集iDoldtime和设备步进历史数据集iDoldstep构建因果关系网络M,因果关系网络M分为瞬时因果关系网络Mtime和步进因果关系网络Mstep
筛选模块,用于基于关系模块得到的瞬时因果关系网络Mtime和步进因果关系网络Mstep分析并筛选预处理模块得到的设备当前数据集iDnew
规则库模块,用于基于预处理模块得到的设备瞬时历史数据集iDoldtime所对应每时刻安全生产的影响结果构建电网大数据瞬时预警规则库,基于预处理模块得到的设备步进历史数据集iDoldstep和筛选模块得到的设备当前数据集iDnew预测尚未发生和尚未观测的数据并且构建电网大数据事前预警规则库;
预警模块,用于基于关系模块得到的因果关系网络M,以及规则库模块得到的电网大数据瞬时预警规则库和电网大数据事前预警规则库生成多维度电网大数据安全预警模型,根据多维度电网大数据安全预警模型对筛选模块得到的设备当前数据集iDnew计算瞬时全局预警分数S1,并对规则库模块中预测尚未发生和尚未观测的数据计算事前全局预警分数S2;根据瞬时全局预警分数S1和事前全局预警分数S2计算安全预警分数S,得到动态预警等级用于实施最终预警。
与现有技术相比,本发明至少具有以下有益效果:
本发明基于因果机器学习的电网大数据安全检测预警方法,围绕电网项目与一般项目的不同,基于电网大数据环境下检测与预警机制效果与实时性较差的原因分析,展开数据检测与安全预警方法设计,采用数据过滤机制,从因果关系层面过滤伪造或采集错误导致的非法电网大数据,解决终端设备部署位置不定、设备质量良莠不齐、数据传输渠道可靠度弱造成的检测预警数据准确性差的问题,相较于一般的数据检测与安全预警模型,突破了基础数据上对于预警有效性的限制,明显提高了电网大数据多级安全预警的***性、准确性与可靠性以及终端设备的韧性;对智能终端设备采集的数据进行标签化与危险性划分,通过深度挖掘多维度、多要素数据之间的因果关联关系,实现了多级因果机器学习下的立体化预警模型,成功提取出了电网大数据之间的因果关系,进一步保证了预警机制的可靠性,并且在保障准确度与时效性的前提下,有效节省了预警成本;本发明有效预防安全检测中出现脱离背景的错误的情况发生,并赋予了***动态调整预警等级的能力。
进一步的,通过对瞬时历史安全数据进行标注与排序处理,并对每个数据集进行了成分标注,完成了数据标签化与危险性划分的工作,为进一步建立多级因果关系的机器学习立体化预警模型做好了基础数据处理。
进一步的,利用领域专家先验知识构建了基础因果关系网络,以改进的因果机器学习算法和基础因果关系网络相结合得到多维度大数据的因果关系网络。
进一步的,以瞬时因果关系网络通过对实时采集的数据集进行检测,对呈现反因果性的节点进行辨别与清除。进一步提高数据可靠性,进而提高预警机制的可靠性。
进一步的,通过计算出的每时刻瞬时安全等级并对此时数据集进行标注,结合当前数据集,采取差分预测的方法计算出下一时刻的新数据并归一化,做到事前预警。
进一步的,以步骤S5所标注的电网大数据现场安全预警数据为训练数据,得到多级连接层之间的权重比例。
进一步的,根据安全预警分数和阈值安全预警分数计算全局预警分数,动态调整激活因子从而改变各项预警占比,能够依据实际情况适应多种场合,提高预警准确性。
进一步的,将当前数据通过电网大数据安全预警模型并且结合电网大数据瞬时或事前预警规则库所得到的安全预警分数,融合因果关系网络中父因节点与子果节点的安全预警分数得到瞬时或事前全局预警分数,能够根据不同设备数据之间的因果关联性提高安全预警能力,进而提高预警结果的准确性。
进一步的,根据得到的瞬时全局预警分数和事前全局预警分数,能够根据实际情况动态调整多维度模型之间的权重比例,进而提高电网大数据安全检测预警***的普适性与准确性。
可以理解的是,上述第二方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
综上所述,本发明通过对多维度电网大数据标签化处理及危险性划分,利用因果机器学习算法挖掘电网大数据之间的潜在因果关系,再根据因果关系网络训练并生成电网大数据安全预警模型,充分解决因终端设备部署位置不定、设备质量良莠不齐、数据传输渠道可靠度弱造成的检测预警数据可靠性差以及缺少多维度、多要素的数据因果关系导致检测预警结果准确性差的技术问题。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本发明实施例中可能采用术语第一、第二、第三等来描述预设范围等,但这些预设范围不应限于这些术语。这些术语仅用来将预设范围彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一预设范围也可以被称为第二预设范围,类似地,第二预设范围也可以被称为第一预设范围。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
在附图中示出了根据本发明公开实施例的各种结构示意图。这些图并非是按比例绘制的,其中为了清楚表达的目的,放大了某些细节,并且可能省略了某些细节。图中所示出的各种区域、层的形状及它们之间的相对大小、位置关系仅是示例性的,实际中可能由于制造公差或技术限制而有所偏差,并且本领域技术人员根据实际所需可以另外设计具有不同形状、大小、相对位置的区域/层。
本发明提供了一种基于因果机器学习的电网大数据安全检测预警方法,采用多方位、多要素多级因果机器学习下的立体化预警模型。利用计算机视觉与因果机器学习技术实现数据准确性、可信性与可靠性的过滤,在此基础上将环境因素与行为因素纳入预警模型,使得预警具有层次性、联动性与实时性,进而增加电网终端设备的韧性与电力大数据运行环境的安全性。
请参阅图1,本发明基于因果机器学习的电网大数据安全检测预警方法,包括以下步骤:
S1、边缘网关智能设备采集多维度多要素电网场景大数据D,该大数据D包含电网工业现场的监控***等所采集的图像视频等流媒体数据、温度湿度气压等无线传感器所采集的数字数据以及电压电流表等仪器仪表设备所采集的文本数据;
其中,大数据D由需要标注并用于训练模型的历史数据集Dold和实时采集并用于预警预测的当前数据集Dnew构成,根据数据来源设备不同分为iDold和iDnew,i为数据来源设备序列。
利用机器学习算法对电网工业现场的监控***所采集的图像视频等流媒体数据进行摘要处理,包括但不限于提取关键帧进行关键目标识别,例如工作人员的位置信息、工作人员是否正确穿戴防护措施以及生产工具是否正常运作等。对温度湿度气压等无线传感器所采集的数字数据和仪器仪表设备所采集的文本数据作归一化处理,保证每种设备所采集的数据集应有着相同的数据范围及格式。
S2、针对设备历史数据集iDold实行预处理分类,得到设备瞬时历史数据集idoldtime和设备步进历史数据集iDoldstep,并且将预处理分类后的数据集当中安全数据的比例作为标注;
S201、首先对设备历史数据集iDold中的数据根据时间序列排序,利用半自动化工具方式对每条数据进行标注,标注分为指标安全、指标一般警告和指标严重警告三类。其中在领域专家先验知识条件下,所采集的数据满足正常安全生产即为指标安全Lsafe,数据超出指标阈值的少部分以内(例如无线传感器设备和仪器仪表设备超出阈值系数,而视频摘要数据不允许少部分超出阈值)即为指标一般警告Lnd,数据超出指标阈值系数即为指标严重警告Ldd,如下式所示:
Figure BDA0003880834290000101
其中,threshold为指标阈值,通常来源于领域专家的先验知识,也可由现场情况进行动态调整,β为超出阈值系数,取值通常在(1,2)之间。
S202、对特定设备在特定时间范围内的所有数据直接进行统计学处理,得到设备瞬时历史安全数据集iDoldtime,并且将该数据集当中指标安全、指标一般警告和指标严重警告的数据比例作为该数据集的标注iSetLabel,如下式所示:
iSetLabel=[iSetSafe,iSetNd,iSetDd]
Figure BDA0003880834290000102
Figure BDA0003880834290000103
Figure BDA0003880834290000104
即每个设备的瞬时历史安全数据集iDoldtime的标注包含三个维度,指标安全比例iSetSafe、指标一般警告比例iSetNd和指标严重警告iSetDd。
S203、对特定设备在特定时间范围内的所有数据根据采集时间排序,将时间序列上数据的临近前后差值
Figure BDA0003880834290000105
作为构建新数据集的依据,根据如下公式得到:
Figure BDA0003880834290000111
根据
Figure BDA0003880834290000112
的正负关系得到步进历史安全数据集iDoldstep,即该数据集只存在三类数据:正值、零值、负值。
S3、基于设备瞬时历史数据集iDoldtime和设备步进历史数据集iDoldstep构建因果关系网络M,主要分为瞬时因果关系网络Mtime和步进因果关系网络Mstep两类;
S301、根据领域专家先验知识构建基础因果关系网络Mfirst,其特征为有向无环图,相链接节点均为有向链接,由因果关系中的因指向果,即子节点受到父节点当前状态或变化趋势的影响;
S302、在基础因果关系网络Mfirst的基础上,利用无向链接补全无因果关系的两两节点,采取改进的因果机器学习算法以iDoldtime和iDoldstep为数据集修正新添加的无向链接得到理论因果关系,与基础因果关系网络相结合得到基于电网多维度大数据的因果关系网络Mtime和Mstep
S4、基于瞬时因果关系网络Mtime和步进因果关系网络Mstep分析并筛选步骤S1得到的设备当前数据集iDnew,即从因果关系层面清洗部分伪造或采集错误导致的非法电网大数据;
根据瞬时因果关系网络Mtime,将实时采集的当前数据集Dnew结合其自身阈值预警特征检验设备间数据的因果性。例如某一对因果节点之间存在同向关系(即因节点指标安全,果节点也呈现指标安全),当实时采集的当前数据集Dnew因果节点之间呈现反因果性,则认为果节点数据存在伪造或错误等情况而被清除出该数据集。根据步进因果关系网络Mstep,将实时采集的当前数据集Dnew根据时序差值正负性检验因果性。
S5、基于设备瞬时历史数据集iDoldtime所对应每时刻安全生产的影响结果构建电网大数据瞬时预警规则库,基于设备步进历史数据集iDoldstep和设备当前数据集iDnew预测尚未发生或尚未观测的数据并且构建电网大数据事前预警规则库;
S501、根据瞬时历史安全数据集iDoldtime所对应每时刻瞬时安全生产的影响结果将预警等级分为三类,预警分类标注方法与步骤S2中类似,即
Figure BDA0003880834290000121
根据对特定设备在特定时间范围内的所有数据根据采集时间排序得到的时间序列上数据的临近前后差值
Figure BDA0003880834290000122
结合当前数据集Dnew当中的实时数据D,采取差分预测的方法计算下一时刻尚未发生的新数据Dnext,即根据近期历史数据趋势预测各项指标走势,做到事前预警。
Figure BDA0003880834290000123
对预测得到的新数据Dnext采取同样的预警分类标注方法。
S502、在此分类标注基础上,计算瞬时历史安全数据集iDoldtime中每个数据的瞬时安全预警分数iStime以及预测数据D的事前安全预警分数iSpre,即指标安全所对应预警分数为1,指标严重警告所对应预警分数为0,指标一般警告所对应的预警分数通过归一化计算均匀分布在(0,1)范围之内。
Figure BDA0003880834290000124
S6、基于瞬时因果关系网络Mtime、步进因果关系网络Mstep以及历史数据集Dold生成多维度电网大数据安全预警模型,即瞬时预警和事前预警的两方有机结合;
S601、通过利用领域专家先验知识,对历史安全数据集中的所对应的电网大数据现场安全情况作以安全预警标注,同样地分为指标安全、指标一般警告和指标严重警告三类;
S602、以因果关系网络Mtime和Mstep为基础,构建因果关系网络相应结构的神经网络,通过历史数据集iDold及其步骤S5所标注的电网大数据现场安全预警标注为训练数据,训练并得到各连接层之间的权重比例。
S7、根据多维度电网大数据安全预警模型,对当前数据集Dnew计算瞬时全局预警分数S1,并且对步骤S5中预测尚未发生和尚未观测的数据计算事前全局预警分数S2;根据设备类型动态调整权重比例,达到***动态计算安全预警分数S,得到动态预警等级实施最终预警。
S701、根据多维度电网大数据安全预警模型的瞬时模型,对当前数据集Dnew计算瞬时全局预警分数S1,同时根据因果关系网络的结构,将不受其他节点因影响的节点称之为父因节点,将只受其他节点因影响而不对其他节点产生因影响的节点称之为子果节点。其计算方法如下:
S1=(a1ΠiScore*a2*∑jScore)*iStime
其中,iScore为父因节点初步阈值法得到的安全预警分数,jScore为子果节点初步阈值法得到的安全预警分数,iStime为当前数据通过多维度电网大数据安全预警模型即步骤S502得到的瞬时安全预警分数,a1和a2为激活因子,可以通过修改激活因子调控两类重要节点在预警模型中的权重占比。
S702、根据多维度电网大数据安全预警模型的步进模型,对当前数据集Dnew结合步骤S5中的预测数据,计算事前全局预警分数S2,计算方法类似于步骤S701,在此基础上,计算最终安全预警分数S,如下:
S=α1*S12*S2
其中,α1和α2为激活因子,通过修改激活参数调控两个模型网络在最终预警分数所占的权重占比。
本发明再一个实施例中,提供一种基于因果机器学习的电网大数据安全检测预警***,该***能够用于实现上述基于因果机器学习的电网大数据安全检测预警方法,具体的,该基于因果机器学习的电网大数据安全检测预警***包括预处理模块、关系模块、筛选模块、规则库模块以及预警模块。
其中,预处理模块,用于将电网场景大数据D分为设备历史数据集iDold和当前数据集iDnew,i为数据来源设备序列,对设备历史数据集iDold进行预处理分类,得到设备瞬时历史数据集iDoldtime和设备步进历史数据集iDoldstep
关系模块,用于基于预处理模块得到的设备瞬时历史数据集iDoldtime和设备步进历史数据集iDoldstep构建因果关系网络M,因果关系网络M分为瞬时因果关系网络Mtime和步进因果关系网络Mstep
筛选模块,用于基于关系模块得到的瞬时因果关系网络Mtime和步进因果关系网络Mstep分析并筛选预处理模块得到的设备当前数据集iDnew
规则库模块,用于基于预处理模块得到的设备瞬时历史数据集iDoldtime所对应每时刻安全生产的影响结果构建电网大数据瞬时预警规则库,基于预处理模块得到的设备步进历史数据集iDoldstep和筛选模块得到的设备当前数据集iDnew预测尚未发生和尚未观测的数据并且构建电网大数据事前预警规则库;
预警模块,用于基于关系模块得到的因果关系网络M,以及规则库模块得到的电网大数据瞬时预警规则库和电网大数据事前预警规则库生成多维度电网大数据安全预警模型,根据多维度电网大数据安全预警模型对筛选模块得到的设备当前数据集iDnew计算瞬时全局预警分数S1,并对规则库模块中预测尚未发生和尚未观测的数据计算事前全局预警分数S2;根据瞬时全局预警分数S1和事前全局预警分数S2计算最终的安全预警分数S,得到动态预警等级用于实施最终预警。
综上所述,本发明一种基于因果机器学习的电网大数据安全检测预警方法及***,充分实现了适应多场合的电网大数据安全检测与预警方法,通过对多维度、多要素的电网大数据进行归一化和标签处理,利用因果机器学习生成的因果关系网络对电网大数据进行反因果清洗,提高数据可靠性,借助因果关系网络建立神经网络,降低模型的训练成本,同时通过多级预警和动态调整激活因子,提高模型的适应性。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。

Claims (10)

1.基于因果机器学习的电网大数据安全检测预警方法,其特征在于,包括以下步骤:
S1、将电网场景大数据D分为设备历史数据集iDold和设备当前数据集iDnew,i为数据来源设备序列;
S2、对步骤S1得到的设备历史数据集iDold进行预处理分类,得到设备瞬时历史数据集iDoldtime和设备步进历史数据集iDoldstep
S3、基于步骤S2得到的设备瞬时历史数据集iDoldtime和设备步进历史数据集iDoldstep构建因果关系网络M,因果关系网络M分为瞬时因果关系网络Mtime和步进因果关系网络Mstep
S4、基于步骤S3得到的瞬时因果关系网络Mtime和步进因果关系网络Mstep分析并筛选步骤S1得到的设备当前数据集iDnew
S5、基于步骤S2得到的设备瞬时历史数据集iDoldtime所对应每时刻安全生产的影响结果构建电网大数据瞬时预警规则库,基于步骤S2得到的设备步进历史数据集iDoldstep和步骤S4得到的设备当前数据集iDnew预测尚未发生和尚未观测的数据并且构建电网大数据事前预警规则库;
S6、基于步骤S3得到的因果关系网络M,以及步骤S5得到的电网大数据瞬时预警规则库和电网大数据事前预警规则库生成多维度电网大数据安全预警模型;
S7、根据步骤S6得到的多维度电网大数据安全预警模型,利用步骤S4得到的设备当前数据集iDnew计算瞬时全局预警分数S1,并对步骤S5中预测尚未发生和尚未观测的数据计算事前全局预警分数S2;根据瞬时全局预警分数S1和事前全局预警分数S2计算安全预警分数S,得到动态预警等级用于实施最终预警。
2.根据权利要求1所述的基于因果机器学习的电网大数据安全检测预警方法,其特征在于,步骤S2具体为:
S201、首先对设备历史数据集iDold中的数据根据时间序列排序得到设备瞬时历史安全数据集iDoldtime,对每条数据进行标注,得到安全Lsafe、一般警告Lnd和严重警告Ldd
S202、确定设备瞬时历史安全数据集iDoldtime,并将设备瞬时历史安全数据集iDoldtime当中安全、一般警告和严重警告的数据比例作为数据集的标注iSetLabel;
S203、对设备在特定时间内的所有数据根据采集时间排序,将时间序列上数据的临近前后差值
Figure FDA0003880834280000021
的正负关系得到设备步进历史安全数据集iDoldstep
3.根据权利要求1所述的基于因果机器学习的电网大数据安全检测预警方法,其特征在于,步骤S3具体为:
S301、根据领域专家先验知识构建基础因果关系网络Mfirst
S302、在步骤S301得到的基础因果关系网络Mfirst的基础上,利用无向链接补全无因果关系的两两节点,采取改进的因果机器学习算法以iDoldtime和iDoldstep为数据集修正新添加的无向链接得到理论因果关系,与基础因果关系网络相结合得到基于电网多维度大数据的瞬时因果关系网络Mtime和步进因果关系网络Mstep
4.根据权利要求1所述的基于因果机器学习的电网大数据安全检测预警方法,其特征在于,步骤S4中,根据瞬时因果关系网络Mtime,将实时采集的当前数据集Dnew结合自身阈值预警特征检验设备间数据的因果性,当实时采集的当前数据集Dnew因果节点之间呈现反因果性,清除果节点数据,根据步进因果关系网络Mstep,将实时采集的当前数据集Dnew根据时序差值正负性检验因果性。
5.根据权利要求1所述的基于因果机器学习的电网大数据安全检测预警方法,其特征在于,步骤S5具体为:
S501、根据瞬时历史安全数据集iDoldtime所对应每时刻瞬时安全生产的影响结果将预警等级分为安全、一般警告和严重警告;
S502、在步骤S501得到的安全、一般警告和严重警告基础上,计算瞬时历史安全数据集iDoldtime中每个数据的瞬时安全预警分数iStime并构建电网大数据瞬时预警规则库、预测数据D的事前安全预警分数iSpre并构建电网大数据事前预警规则库,安全对应预警分数为1,严重警告对应预警分数为0,一般警告对应的预警分数通过归一化计算均匀分布在(0,1)范围之内。
6.根据权利要求1所述的基于因果机器学习的电网大数据安全检测预警方法,其特征在于,步骤S6具体为:
S601、通过利用领域专家先验知识,将历史安全数据集中的所对应的电网大数据现场安全情况分为安全、一般警告和严重警告;
S602、以瞬时因果关系网络Mtime和步进因果关系网络Mstep为基础,以所有设备节点为网络输入层,以因果关系网络为网络节点拓扑结构,以所有设备节点全连接作为网络输出层,通过历史数据集iDold及步骤S5标注的电网大数据现场安全预警标注为训练数据,训练并补充以因果关系网络为基础的神经网络各连接层之间的权重比例,其中与瞬时因果关系网络具有相同结构的神经网络为电网大数据安全预警模型的瞬时模型,与步进因果关系网络相同结构的神经网络为电网大数据安全预警模型的步进模型。
7.根据权利要求1所述的基于因果机器学习的电网大数据安全检测预警方法,其特征在于,步骤S7具体为:
S701、根据多维度电网大数据安全预警模型的瞬时模型,对当前数据集Dnew计算瞬时全局预警分数S1
S702、根据多维度电网大数据安全预警模型的步进模型,对当前数据集Dnew结合步骤S5中的预测数据,计算事前全局预警分数S2,计算方法类似于步骤S701,在此基础上,计算最终安全预警分数S。
8.根据权利要求7所述的基于因果机器学习的电网大数据安全检测预警方法,其特征在于,瞬时全局预警分数S1为:
S1=(a1*ΠiScore*a2*∑jScore)*iStime
其中,iScore为父因节点经电网大数据瞬时预警规则库得到的安全预警分数,jScore为子果节点经电网大数据瞬时预警规则库得到的安全预警分数,iStime为当前数据通过瞬时模型并结合电网大数据瞬时预警规则库得到的瞬时安全预警分数,α1和α2为激活因子。
9.根据权利要求7所述的基于因果机器学习的电网大数据安全检测预警方法,其特征在于,最终安全预警分数S为:
S=α1*S12*S2
其中,α1和α2为激活因子。
10.一种基于因果机器学习的电网大数据安全检测预警***,其特征在于,包括:
预处理模块,用于将电网场景大数据D分为设备历史数据集iDold和设备当前数据集iDnew,i为数据来源设备序列,对设备历史数据集iDold进行预处理分类,得到设备瞬时历史数据集iDoldtime和设备步进历史数据集iDoldstep
关系模块,用于基于预处理模块得到的设备瞬时历史数据集iDoldtime和设备步进历史数据集iDoldstep构建因果关系网络M,因果关系网络M分为瞬时因果关系网络Mtime和步进因果关系网络Mstep
筛选模块,用于基于关系模块得到的瞬时因果关系网络Mtime和步进因果关系网络Mstep分析并筛选预处理模块得到的设备当前数据集iDnew
规则库模块,用于基于预处理模块得到的设备瞬时历史数据集iDoldtime所对应每时刻安全生产的影响结果构建电网大数据瞬时预警规则库,基于预处理模块得到的设备步进历史数据集iDoldstep和筛选模块得到的设备当前数据集iDnew预测尚未发生和尚未观测的数据并且构建电网大数据事前预警规则库;
预警模块,用于基于关系模块得到的因果关系网络M,以及规则库模块得到的电网大数据瞬时预警规则库和电网大数据事前预警规则库生成多维度电网大数据安全预警模型,根据多维度电网大数据安全预警模型对筛选模块得到的设备当前数据集iDnew计算瞬时全局预警分数S1,并对规则库模块中预测尚未发生和尚未观测的数据计算事前全局预警分数S2;根据瞬时全局预警分数S1和事前全局预警分数S2计算最终的安全预警分数S,得到动态预警等级用于实施最终预警。
CN202211230320.7A 2022-09-30 2022-09-30 基于因果机器学习的电网大数据安全检测预警方法及*** Pending CN115526407A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211230320.7A CN115526407A (zh) 2022-09-30 2022-09-30 基于因果机器学习的电网大数据安全检测预警方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211230320.7A CN115526407A (zh) 2022-09-30 2022-09-30 基于因果机器学习的电网大数据安全检测预警方法及***

Publications (1)

Publication Number Publication Date
CN115526407A true CN115526407A (zh) 2022-12-27

Family

ID=84701027

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211230320.7A Pending CN115526407A (zh) 2022-09-30 2022-09-30 基于因果机器学习的电网大数据安全检测预警方法及***

Country Status (1)

Country Link
CN (1) CN115526407A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116343454A (zh) * 2023-05-30 2023-06-27 中航创世机器人(西安)有限公司 一种基于实时状态捕捉的安全辅助方法及***

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116343454A (zh) * 2023-05-30 2023-06-27 中航创世机器人(西安)有限公司 一种基于实时状态捕捉的安全辅助方法及***

Similar Documents

Publication Publication Date Title
CN105279365B (zh) 用于学习异常检测的样本的方法
CN101561878B (zh) 基于改进cure聚类算法的无监督异常检测方法与***
CN106888205B (zh) 一种非侵入式基于功耗分析的plc异常检测方法
CN108986869B (zh) 一种使用多模型预测的磁盘故障检测方法
US11301759B2 (en) Detective method and system for activity-or-behavior model construction and automatic detection of the abnormal activities or behaviors of a subject system without requiring prior domain knowledge
CN110895526A (zh) 一种大气监测***中数据异常的修正方法
CN107038167A (zh) 基于模型评估的大数据挖掘分析***及其分析方法
CN110636066B (zh) 基于无监督生成推理的网络安全威胁态势评估方法
CN110737874A (zh) 一种基于空间关系的流域水质监测异常值检测方法
CN110175247B (zh) 一种优化基于深度学习的异常检测模型的方法
CN111325410A (zh) 基于样本分布的通用故障预警***及其预警方法
CN110011990B (zh) 内网安全威胁智能分析方法
CN114201374A (zh) 基于混合机器学习的运维时序数据异常检测方法及***
CN110851422A (zh) 一种基于机器学习的数据异常监测模型构建方法
CN103473459A (zh) 一种多***大数据的处理及融合方法
CN114723285A (zh) 一种电网设备安全性评估预测方法
CN111949480A (zh) 一种基于组件感知的日志异常检测方法
CN117056688A (zh) 一种基于数据分析的新材料生产数据管理***及方法
CN115526407A (zh) 基于因果机器学习的电网大数据安全检测预警方法及***
CN113901043B (zh) 污染源智能监管和数据融合分析方法和***
CN113516162A (zh) 一种基于OCSVM和K-means算法的工控***流量异常检测方法与***
KR102366787B1 (ko) 슬라이딩 윈도우 기법을 이용한 제조설비의 실시간 다변량 이상감지 시스템
CN110348510B (zh) 一种基于深水油气钻井过程阶段性特征的数据预处理方法
CN104537392A (zh) 一种基于判别性语义部件学习的对象检测方法
CN116862867A (zh) 基于改进AnoGAN的小样本变电站设备视觉缺陷检测方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination