CN111950853B - 一种基于信息物理双侧数据的电力运行状态白名单生成方法 - Google Patents

一种基于信息物理双侧数据的电力运行状态白名单生成方法 Download PDF

Info

Publication number
CN111950853B
CN111950853B CN202010674120.5A CN202010674120A CN111950853B CN 111950853 B CN111950853 B CN 111950853B CN 202010674120 A CN202010674120 A CN 202010674120A CN 111950853 B CN111950853 B CN 111950853B
Authority
CN
China
Prior art keywords
data
forest
white list
weight
physical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010674120.5A
Other languages
English (en)
Other versions
CN111950853A (zh
Inventor
王�琦
蔡星浦
汤奕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202010674120.5A priority Critical patent/CN111950853B/zh
Publication of CN111950853A publication Critical patent/CN111950853A/zh
Application granted granted Critical
Publication of CN111950853B publication Critical patent/CN111950853B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • Marketing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Tourism & Hospitality (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Computer Hardware Design (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Water Supply & Treatment (AREA)
  • Geometry (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Supply And Distribution Of Alternating Current (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于信息物理双侧数据的电力运行状态白名单生成方法,属于计算、推算或计数的技术领域。主要包含离线仿真提取各类事件数据,数据预处理,特征学习,最终训练得到白名单模型。基于硬件在环的信息物理联合实时仿真***,对确定***在确定运行方式下的各种可能正常事件、故障事件和网络攻击行为进行仿真,获取事件状态信息侧和物理侧变化数据。将双侧数据共同输入改进孤立森林的模型中进行训练。该方法可帮助电网在稳态运行时,有效辨识故障类型其确定其为网络攻击行为的可能,有助于电网制定预先防御措施,保障电力***安全稳定运行。

Description

一种基于信息物理双侧数据的电力运行状态白名单生成方法
技术领域
本发明涉及电力***网络安全技术,具体涉及一种基于信息物理双侧数据的电力运行状态白名单生成方法,属于计算、推算或计数的技术领域。
背景技术
随着通信技术的快速发展,电力***逐渐成为一个信息物理***(CPS,Cyber-Physical Systems)。信息技术使电网侧控制日趋智能化的同时也带来了新的网络攻击风险。目前,电力***对网络攻击的检测仅限于信息侧且方法局限于基于既定规则的异常风险排除,对于针对物理侧工程故障的攻击类型具有较大的漏检风险。由于电力***中信息与物理***的深度耦合特性,双侧的行为往往存在隐性的关联。本发明旨在从信息侧和物理侧数据中挖掘异常状态构建更准确的白名单模型。
发明内容
本发明的发明目的是针对上述背景技术的不足,提供了一种基于信息物理双侧数据的电力运行状态白名单生成方法,通过错误类型反馈缩小孤立森林算法中最优权值参数的搜索空间实现白名单模型的有向优化,进而提高了异常事件的识别率,解决了基于既定规则的异常风险排除方法检测物理侧工程故障的攻击类型时有较大漏检风险的技术问题。
本发明为实现上述发明目的采用如下技术方案:
一种基于信息物理双侧数据的电力运行状态白名单生成方法,包括以下三个步骤。
步骤一,基于仿真平台,通过随机改变***的状态,模拟可能发生的各种事件,采集稳态下的***信息侧和物理侧双侧的数据m组,一次仿真对应一组数据。
步骤二,将m组数据中N组正常事件下的采集数据作为训练样本,输入至动态权值孤立森林算法中进行学习;剩余的(m-N)组数据作为验证样本,验证模型的效果。通过调整机器学习的各项参数,获得的较优的模型作为白名单模型;动态权值孤立森林算法包括如下两个分步骤:
步骤1)从总数为N的训练数据集每次均匀抽样(有放回)ψ条数据,采用现有孤立森林算法构建隔离L棵树;确定子森林的集成规模,在L棵隔离树中***抽样构建主森林检测器;
步骤2)根据错误学习样本反馈修正模型:若将异常样本判断为正常,则减小路径偏短的树(对该样本适应度较低)在总期望值中的权值,增加路径较长的树的权值,如式(1)所示;反之,则优化方向相反,
式(1)中,hi(x)代表样本x在第i个子森林中的平均路径长度;c(n)代表L棵孤立树的平均路径长度;U,V分别代表优化前后子森林权值的变化量集合。
步骤三:将新发生事件下采集的数据输入至训练好的白名单模型,白名单模型输出判断新事件为正常事件还是异常事件的结果。
本发明采用上述技术方案,具有以下有益效果:
本发明的故障辨识方法通过在联合仿真平台仿真已知的可能发生在线路上的各种事件的数据,相对于实际***中较少发生的攻击场景,可以通过仿真获得大量数据;针对目前单纯依靠信息单侧数据的异常辨识方法,提出了综合信息侧和物理侧数据的事件采集数据来描述事故过程。为了获得更快的计算速度,更高的辨识精度,结合机器学习的方法进行训练,通过错误类型反馈缩小集成孤立森林算法最优权值参数的搜索空间,实现了模型的有向优化,进而能够实现基事件类型的准确识别。
本发明方法主要有以下优点:
(1)由于电力CPS信息物理的深度耦合,信息侧的行为、状态和物理侧的工况通常存在某种关联,因此基于双侧信息可以更有效的挖掘电力CPS事件特征,有助于异常行为的判断。
(2)双侧协同的攻击感知可以结合物理侧的工况对攻击行为的危害程度作出更恰当的判断,有助于后续防御资源、防御手段的分配。
附图说明
图1为本申请电力运行状态白名单生成方法的流程图。
图2为硬件在环的信息物理联合实时仿真平台的通讯架构图。
图3为构建动态权值孤立森林的流程图。
图4为IEEE 14节点的***图。
图5为IEEE 14节点的通信拓扑图。
具体实施方式
下面结合附图对发明的技术方案进行详细说明。
以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
本发明为一种基于信息物理双侧数据的电力运行状态白名单生成方法,主要包含离线仿真提取各类事件数据,数据预处理,特征学习,最终训练得到白名单模型。基于硬件在环的信息物理联合实时仿真***,对确定***在确定运行方式下的各种可能正常事件、故障事件和网络攻击行为进行仿真,获取事件状态信息侧和物理侧变化数据。将双侧数据共同输入改进孤立森林的模型中进行训练。
具体实施步骤如图1所示,一种基于信息物理双侧数据的电力运行状态白名单生成方法包括如下三个步骤。
步骤一,基于仿真平台,通过随机改变***的状态,模拟可能发生的各种事件,采集稳态下的***信息侧和物理侧双侧的数据m组,一次仿真对应一组数据。
信息侧信息包括:所有信息链路流量、传输数据量、链路利用率、信息节点CPU使用率。物理侧信息包括:各个节点的电量测值压、线路的潮流数据。
正常事件包括:不同负荷情况下***的正常稳态运行状态;各类正常电力***业务的指令传输和通信行为。异常事件包括:针对不同信息节点的DDoS攻击事件;针对不同通信链路的DDoS。
可采用的仿真平台例如硬件在环的信息物理仿真平台如图2所示。用OPAL-RT仿真物理侧过程,OPNET仿真通信过程,C语言开发的控制中心模拟收发数据、处理数据和下达控制指令过程。
步骤二,将m组数据中的正常事件下采集的数据作为训练样本,共N组,输入动态权值孤立森林算法中进行学习;剩余部分(m-N)作为验证样本,验证模型的效果。通过调整机器学习的各项参数获得较优的模型,作为白名单模型。
动态权值孤立森林的整体流程如图3所示,包括两个分步骤:
步骤1)从总数为N的训练数据集每次均匀抽样(有放回)ψ条数据,采用现有孤立森林算法构建L棵隔离树,在L棵隔离树中***抽样构建主森林检测器以确定子森林的集成规模;
步骤2)根据错误学习样本反馈修正模型:若将异常样本判断为正常,则减小路径偏短的树(对该样本适应度较低)在总期望值中的权值,增加路径较长的树的权值,如式(1)所示;反之,则优化方向相反。
式(1)中,AUC代表***工作特征曲线面积,用于量化模型检测异常事件的性能;hi(x)代表样本x在第i个子森林中的平均路径长度;c(n)代表第n次迭代过程中L棵孤立树的平均路径长度;F(i)、F'(i)为优化前后第i个子森林的权值;U、V分别代表优化前后子森林权值的变化量集合;ui、vi为优化前后第i个子森林权值的变化量。具体算法如下所示:
步骤三:新事件数据输入时,通过白名单模型输出的结果,判断事件为正常事件还是异常事件。
本实施例通过联合仿真平台,以图4所示IEEE 14节点电力拓扑和图5所示通信拓扑为例,通过随机改变负荷情况和通信事件(延时、误码),采集不同场景下的数据,通过RT-LAB收集包括节点电压、线路潮流的电力物理侧量测量,,通过OPNET记录信息侧信息。
白名单选取了不同工况下的双侧运行数据,信息侧数据目前包括信息链路流量、传输数据量、链路利用率、进程CPU占用率,对于16条链路和14个节点,共62维数据;物理侧数据包括各个节点的电压,线路的潮流,共34维。白名单数据共450组。
每个样本随机采四个时刻,间隔为1秒的双侧数据,正常事件450组,异常事件50组。
在评估异常检测算法的性能时常用受试者工作特征曲线(receiver operatingcharacteristic curve,ROC曲线)描述。有效的异常检测方法需要保持较高的查全率和查准率,这两者之间的均衡可以用ROC曲线来描述。在算法评估时,通常需要一个量化的指标来衡量异常检测的性能,可以用ROC曲线下的面积(area under curve,AUC)来量化。AUC越接近于1,表示异常检测算法在查全率和查准率综合性能上表现越好。选取500组数据中30%(150组正常数据)作为训练数据,70%(350组其余数据)作为验证数据。
表1集成规模和样本点数对AUC值的影响
由结果可知,对于此数据集,选取集成规模为50,样本点数为128时算法的AUC值较高,性能较好,在该点下,孤立森林的查全率和查准率分别为:
表2性能指标
故以此两个参数进行后续的动态权值优化,改进后的模型准确率如表3所示。
表3动态权值优化前后性能对比
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也落入本发明的保护范围。

Claims (2)

1.一种基于信息物理双侧数据的电力运行状态白名单生成方法,其特征在于,获取***运行在随机状态下发生各种事件后物理侧数据和信息侧数据,将每一次事件下采集的物理侧数据和信息侧数据作为一组数据,将正常事件下采集的各组数据送入基于动态权值孤立森林算法的学习机训练,将剩余的各组数据作为验证样本送入学习机,得到微调参数后的白名单模型,将新发生事件下采集ID数据输入白名单模型得到异常事件判别结果,所述动态权值孤立森林算法从输入的数据中进行有放回的均匀抽样构建隔离树,
其中,所述动态权值孤立森林算法从输入的数据中均匀抽样后构建隔离树,在隔离树中进行无放回的***抽样构建包含至少一个子森林的主森林检测器,以***工作特征曲线面积最大为目标,根据主森林检测器识别输入数据的错误类型调整各子森林权值参数的搜索空间:
AUC代表***工作特征曲线面积;hi(x)代表样本x在第i个子森林中的平均路径长度,c(n)代表第n次迭代过程中L棵孤立树的平均路径长度,F(i)、F'(i)为优化前后第i个子森林的权值,U、V分别代表优化前后子森林权值的变化量集合,ui、vi为优化前后第i个子森林权值的变化量。
2.根据权利要求1所述一种基于信息物理双侧数据的电力运行状态白名单生成方法,其特征在于,根据主森林检测器识别输入数据的错误类型调整各子森林权值参数的搜索空间的方法为:若主森林检测器将异常事件判断为正常事件,则减小路径偏短的隔离树在总期望值中的权值,并增加路径较长的隔离树在总期望值中的权值;反之,增加路径偏短的隔离树在总期望值中的权值,并减小路径较长的隔离树在总期望值中的权值。
CN202010674120.5A 2020-07-14 2020-07-14 一种基于信息物理双侧数据的电力运行状态白名单生成方法 Active CN111950853B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010674120.5A CN111950853B (zh) 2020-07-14 2020-07-14 一种基于信息物理双侧数据的电力运行状态白名单生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010674120.5A CN111950853B (zh) 2020-07-14 2020-07-14 一种基于信息物理双侧数据的电力运行状态白名单生成方法

Publications (2)

Publication Number Publication Date
CN111950853A CN111950853A (zh) 2020-11-17
CN111950853B true CN111950853B (zh) 2024-05-31

Family

ID=73341093

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010674120.5A Active CN111950853B (zh) 2020-07-14 2020-07-14 一种基于信息物理双侧数据的电力运行状态白名单生成方法

Country Status (1)

Country Link
CN (1) CN111950853B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114282855B (zh) * 2022-03-07 2022-05-31 四川大学 负荷重分配攻击下电-气耦合***的综合防护方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108776683A (zh) * 2018-06-01 2018-11-09 广东电网有限责任公司 一种基于孤立森林算法和神经网络的电力运维数据清洗方法
CN110149258A (zh) * 2019-04-12 2019-08-20 北京航空航天大学 一种基于孤立森林的汽车can总线网络数据异常检测方法
WO2020010701A1 (zh) * 2018-07-11 2020-01-16 平安科技(深圳)有限公司 污染物异常监测方法、***、计算机设备和存储介质
CN111382842A (zh) * 2020-03-06 2020-07-07 佳源科技有限公司 一种高速载波通信动态路由方法及***
WO2020140678A1 (zh) * 2019-01-04 2020-07-09 深圳壹账通智能科技有限公司 异常申请检测方法、装置、计算机设备和存储介质
CN111401749A (zh) * 2020-03-17 2020-07-10 三峡大学 一种基于随机森林与极限学习回归的动态安全评估方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108776683A (zh) * 2018-06-01 2018-11-09 广东电网有限责任公司 一种基于孤立森林算法和神经网络的电力运维数据清洗方法
WO2020010701A1 (zh) * 2018-07-11 2020-01-16 平安科技(深圳)有限公司 污染物异常监测方法、***、计算机设备和存储介质
WO2020140678A1 (zh) * 2019-01-04 2020-07-09 深圳壹账通智能科技有限公司 异常申请检测方法、装置、计算机设备和存储介质
CN110149258A (zh) * 2019-04-12 2019-08-20 北京航空航天大学 一种基于孤立森林的汽车can总线网络数据异常检测方法
CN111382842A (zh) * 2020-03-06 2020-07-07 佳源科技有限公司 一种高速载波通信动态路由方法及***
CN111401749A (zh) * 2020-03-17 2020-07-10 三峡大学 一种基于随机森林与极限学习回归的动态安全评估方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于信息物理***的配电网故障处理仿真研究;王耀坤;赵煜;梁英;刘科研;叶学顺;白牧可;;智慧电力;20191220(第12期);全文 *
基于孤立森林算法和BP神经网络算法的电力运维数据清洗方法;李星南;施展;亢中苗;苏卓;;电气应用;20180820(第16期);全文 *

Also Published As

Publication number Publication date
CN111950853A (zh) 2020-11-17

Similar Documents

Publication Publication Date Title
CN110417011B (zh) 一种基于互信息与迭代随机森林的在线动态安全评估方法
CN107370732B (zh) 基于神经网络和最优推荐的工控***异常行为发现***
CN115412947B (zh) 一种基于数字孪生与ai算法的故障仿真方法和***
CN102938742B (zh) 基于电力业务需求的通信带宽预测方法及装置
CN105406476B (zh) 基于历史数据的电力***稳定性快速判断方法
CN110348615B (zh) 基于蚁群优化支持向量机的电缆线路故障概率预测方法
CN107872457B (zh) 一种基于网络流量预测进行网络操作的方法及***
CN115442375B (zh) 一种基于云边协同技术的物业数字化管理***
CN109446635A (zh) 一种基于机器学习的电力工控攻击分类方法和***
CN110798314B (zh) 一种基于随机森林算法的量子密钥分发参数优化方法
CN111092862A (zh) 一种用于对电网终端通信流量异常进行检测的方法及***
CN103778467A (zh) 一种选择电力***暂态稳定评估输入特征量的方法
CN104598968A (zh) 变压器故障诊断方法
CN103869192A (zh) 智能电网线损检测方法和***
CN113422695A (zh) 一种提高物联网拓扑结构鲁棒性能的优化方法
CN112149967A (zh) 基于复杂***理论的电力通信网脆弱性评估方法和***
CN111950853B (zh) 一种基于信息物理双侧数据的电力运行状态白名单生成方法
CN105954650A (zh) 配电网故障定位方法和***
CN112821424A (zh) 一种基于数据-模型融合驱动的电力***频率响应分析方法
CN115545479A (zh) 一种配电网重要节点或重要线路的确定方法及装置
CN116581890B (zh) 一种电网运行稳定性的智能监测方法及***
CN109376990B (zh) 一种基于Siamese网络模型确定电力***的临界切除时间的方法及***
CN116151799A (zh) 一种基于bp神经网络的配电线路多工况故障率快速评估方法
CN108833156B (zh) 一种针对电力通信网的仿真性能指标的评估方法及***
AU2021106383A4 (en) Method for Calculating Reliability of Distribution System Based on Equipment Reliability Cloud Model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant