CN111614491A - 一种面向电力监控***安全态势评估指标选取方法及*** - Google Patents

一种面向电力监控***安全态势评估指标选取方法及*** Download PDF

Info

Publication number
CN111614491A
CN111614491A CN202010370523.0A CN202010370523A CN111614491A CN 111614491 A CN111614491 A CN 111614491A CN 202010370523 A CN202010370523 A CN 202010370523A CN 111614491 A CN111614491 A CN 111614491A
Authority
CN
China
Prior art keywords
index
monitoring system
power monitoring
indexes
candidate characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010370523.0A
Other languages
English (en)
Other versions
CN111614491B (zh
Inventor
王梓
杨维永
朱世顺
黄益彬
刘苇
黄天明
朱江
韩勇
程长春
郑卫波
祁龙云
魏兴慎
李牧野
景娜
张林霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Fujian Electric Power Co Ltd
Nari Information and Communication Technology Co
State Grid Electric Power Research Institute
Original Assignee
State Grid Corp of China SGCC
State Grid Fujian Electric Power Co Ltd
Nari Information and Communication Technology Co
State Grid Electric Power Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Fujian Electric Power Co Ltd, Nari Information and Communication Technology Co, State Grid Electric Power Research Institute filed Critical State Grid Corp of China SGCC
Priority to CN202010370523.0A priority Critical patent/CN111614491B/zh
Publication of CN111614491A publication Critical patent/CN111614491A/zh
Application granted granted Critical
Publication of CN111614491B publication Critical patent/CN111614491B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/20Network architectures or network communication protocols for network security for managing network security; network security policies in general

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Supply And Distribution Of Alternating Current (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种面向电力监控***安全态势评估指标选取方法及***,包括:采集能够反映电力监控***安全状态的历史数据经标准化处理后构造训练样本数据集;分析样本数据集中用于安全评估的候选指标与电力监控***是否存在安全问题的相关性,确定各个候选指标能否判断电力监控***安全状态的相关性优先排序;计算两两候选指标之间的冗余性,从相关性优先排序集合中去除冗余度高的特征指标,最终综合考虑分类准确率和指标集规模选取出电力监控***安全态势评估最优指标集。本发明通过对电力监控***安全态势评估指标进行特征选取,提高了评估结果准确性,降低了数据采集、存储、传输和处理资源的开销,提升对电力监控***安全态势实施评估的性能。

Description

一种面向电力监控***安全态势评估指标选取方法及***
技术领域
本发明属于电力信息安全技术领域,具体涉及一种面向电力监控***安全态势评估指标选取方法及***。
背景技术
近年来,随着各类网络化应用的不断拓展和深化,计算机病毒、木马、黑客攻击等恶意网络攻击行为日益猖獗,网络安全事件进入了高发、频发时期,网络信息战和网络恐怖行动等国家、集团性网络攻击行为已对全社会的生产和生活造成严重影响。电网作为一种关乎国计民生的重要基础设施,其核心是监视并控制智能电网平稳运行的电力监控***,因为电力监控***结构复杂多样、分布广泛、重要性高,一旦瘫痪影响巨大,所以极易成为敌对势力攻击目标。进入二十一世纪以来,国内外已发生多起针对电力监控***的网络攻击行为,使相关国家蒙受重大损失,国内也相继出现类似事故,给人民群众的生产生活造成了极大影响。
随着能源互联网的全面推进,作为电网调度控制中枢的电力监控***的智能化、网络化和互动化水平不断提升,同时以高级持续性网络攻击(APT)为代表的新型攻击手段也不断演进,都将给电力监控***安全防护工作带来严峻挑战。因此,需要对电力监控***的安全状态进行实时监控,掌握安全状态变化趋势,在安全问题出现之前及时察觉,并采取相应的应对措施。随着电网规模不断扩大,电力监控***内庞大的信息数据交互,以及智能终端的不断接入,安全复杂度不断提升,现有的定期人工评估方式已无法满足新形式下电力监控***精益化、智能化和实时化的安全管理要求。随着人工智能技术的发展,机器学习技术被广泛用于各个领域的评估工作中,从而减少人工评估的代价。为此,需要选取优质的电力监控***安全态势评估指标为后续实时准确地评估提供服务。
目前,通常对电力监控***安全态势评估指标进行选取的方法分成Filter特征选取方法和Wrapper特征选取方法两种方式。
Fliter特征选择方法独立于任何机器学习算法,它根据各种统计检验中的分数以及相关性来选择特征,指标评价方法有信息度量、依赖性度量和一致性度量等。但该类方法只能计算单一特征对分类结果的影响,而数据集的分布不均和分类特征稀疏性问题,容易导致重要特征被误认为无用特征。
Wrapper特征选取方法通常与分类学习算法紧密联系,通常把指标选择问题与遗传算法、机器学习、神经网络等结合。这种基于分类学习算法进行特征选择的方法,主要是获得一个分类性能较高的分类模型,能够很好地辨识出与分类结果相关的关键特征,但仍未能很好去除特征间的冗余,且泛化能力较差,时间复杂度较高。
因此,采用上述方法选取评估电力监控***的安全评估指标时,所选取的指标中会存在与安全评估无关、指标间有冗余关系等问题,将会导致在评估电力监控***安全态势时,产生对不相关指标和冗余指标采集、传输、处理的开销,降低实时评估的性能,同时也会降低评估的准确性。因此,在选取电力监控***安全态势评估指标时,需要对指标的相关性和冗余性进行分析,而现有的指标特征选取方法都存在着一些问题,所以需要更优的方法来解决评估指标特征的选择问题。
发明内容
本发明提供一种面向电力监控***安全态势评估指标选取方法及***,通过对影响电力监控***安全性的指标进行相关性及指标间冗余性分析,进而选取最优指标子集。
为达到上述目的,本发明采用的技术方案如下:
本发明实施例一方面提供一种面向电力监控***安全态势评估指标选取方法,包括:
获取用于电力监控***安全评估的候选特征指标;
基于所述候选特征指标构建训练样本数据集;
基于所述训练样本数据集计算所述候选特征指标用于评估电力监控***安全状态的相关性,得到候选特征指标相关性排序集合;
剔除所述候选特征指标相关性排序集合中的冗余指标,构成剔除了冗余指标的候选特征指标相关性排序集合;
从所述剔除了冗余指标的候选特征指标相关性排序集合中,选取电力监控***安全态势评估的最优指标集。
进一步的,所述获取用于电力监控***安全评估的候选特征指标,包括:
从流量特征、设备运行状态和告警日志中选取若干个能够反映电力监控***安全状态的候选特征指标。
进一步的,所述基于所述候选特征指标构建训练样本数据集,包括:
采集用于电力监控***安全评估的候选特征指标历史数据,形成原始样本数据集D:
Figure BDA0002478115700000021
其中,Xi,i∈[1,m],为第i条反映电力监控***安全状态的历史数据记录,m为采集的历史数据记录条数,xij表示第i条历史数据记录中第j个候选特征指标对应的数值,j∈[1,n],n为候选特征指标个数;
对原始样本数据集D进行标准化处理,生成标准化的样本数据集D':
Figure BDA0002478115700000031
其中:X′i为Xi标准化的样本数据记录,x′ij为xij标准化的数值;
x′ij计算如下:
Figure BDA0002478115700000032
对标准化的原始样本数据集D'进行人工标注,生成训练样本数据集T:
Figure BDA0002478115700000033
其中,Ti,i∈[1,m],为第i条训练样本记录,yi,yi∈{0,1},表示第i条训练样本记录对应的电力监控***安全状态,取值1表示安全状态,取值0表示危险状态。
进一步的,所述基于所述训练样本数据集计算所述候选特征指标用于评估电力监控***安全状态的相关性,得到候选特征指标相关性排序集合,包括:
采用训练样本数据集训练支持向量机模型,得到候选特征指标的权重;
根据候选特征指标的权重计算候选特征指标和电力监控***安全评估的相关性评价分数;
使用序列后向选择启发式搜索算法对候选特征指标集进行循环处理,每次从候选特征指标集中剔除一个相关性评价分数最小的候选特征指标,依次放入候选特征指标相关性排序集合中,最终得到候选特征指标相关性从大到小的排序集合。
进一步的,所述采用训练样本数据集训练支持向量机模型,得到候选特征指标的权重,包括:
支持向量机的分类函数为:
Figure BDA0002478115700000034
其中,自变量X表示标准化的反映电力监控***安全状态的待测数据记录,f(X)表示根据自变量X得到的分类结果,αi是拉格朗日乘子,sgn(·)是符号函数,b为阈值,αi和b经过模型训练得到,X′i为标准化的训练样本数据记录,yi,表示第i条训练样本记录对应的电力监控***安全状态;
使用训练样本数据集T训练支持向量机模型,得到自变量X的系数ω:
Figure BDA0002478115700000041
则向量ω的第j个元素对应的
Figure BDA0002478115700000042
表示第j个候选特征指标的权重ωj,,x′ij为标准化的第i条训练数据记录中第j个候选特征指标对应的数值,m为训练数据记录条数,n为候选特征指标个数。
进一步的,所述根据候选特征指标的权重计算候选特征指标和电力监控***安全评估的相关性评价分数,包括:
cj=ωj 2
其中,cj是第j个候选特征指标的相关性评价分数,ωj是第j个候选特征指标的权重。
进一步的,所述剔除所述候选特征指标相关性排序集合中的冗余指标,构成剔除了冗余指标的候选特征指标相关性排序集合,包括:
采用Pearson相关系数作为候选特征指标相关性排序集合中指标间的冗余度:
Figure BDA0002478115700000043
其中,pearson(s,g)为候选特征指标相关性排序集合中两个候选特征指标s,g的Pearson相关系数,
Figure BDA0002478115700000044
分别表示两个候选特征指标在训练样本数据集T中的平均值,si,gi分别表示两个候选特征指标在训练样本数据集T中第i条训练样本记录中的取值;
剔除冗余度大于预先设置的冗余度阈值的冗余指标。
进一步的,从所述剔除了冗余指标的候选特征指标相关性排序集合中,选取电力监控***安全态势评估的最优指标集,包括:
设计最优指标集选择的目标函数如下:
Figure BDA0002478115700000051
其中,S是剔除了冗余指标的候选特征指标相关性排序集合Q的子集,P(S)为根据指标集S构造的支持向量机分类器的分类准确率,|S|为指标集S的指标个数,|Q|为指标集Q的指标个数,μ是用来权衡分类准确率和指标个数的权重因子;
求解所述目标函数得到最优指标集。
本发明实施例另一方面还提供一种面向电力监控***安全态势评估指标选取***,包括:
指标获取模块,用于获取用于电力监控***安全评估的候选特征指标;
样本获取模块,用于基于所述候选特征指标构建训练样本数据集;
训练模块,用于基于所述训练样本数据集计算所述候选特征指标用于评估电力监控***安全状态的相关性,得到候选特征指标相关性排序集合;
筛选模块,用于剔除所述候选特征指标相关性排序集合中的冗余指标,构成剔除了冗余指标的候选特征指标相关性排序集合;
以及,
寻优模块,用于从所述剔除了冗余指标的候选特征指标相关性排序集合中,选取电力监控***安全态势评估的最优指标集。
进一步的,所述训练模块具体用于,
采用训练样本数据集训练支持向量机模型,得到候选特征指标的权重;
根据候选特征指标的权重计算候选特征指标和电力监控***安全评估的相关性评价分数;
使用序列后向选择启发式搜索算法对候选特征指标集进行循环处理,每次从候选特征指标集中剔除一个相关性评价分数最小的候选特征指标,依次放入候选特征指标相关性排序集合中,最终得到候选特征指标相关性从大到小的排序集合。
进一步的,所述筛选模块具体用于,
采用Pearson相关系数作为候选特征指标相关性排序集合中指标间的冗余度:
Figure BDA0002478115700000052
其中,pearson(s,g)为候选特征指标相关性排序集合中两个候选特征指标s,g的Pearson相关系数,
Figure BDA0002478115700000053
分别表示两个候选特征指标在训练样本数据集T中的平均值,si,gi分别表示两个候选特征指标在训练样本数据集T中第i条训练样本记录中的取值;
剔除冗余度大于预先设置的冗余度阈值的冗余指标。
进一步的,所述寻优模块具体用于,
设计最优指标集选择的目标函数如下:
Figure BDA0002478115700000061
其中,S是剔除了冗余指标的候选特征指标相关性排序集合Q的子集,P(S)为根据指标集S构造的支持向量机分类器的分类准确率,|S|为指标集S的指标个数,|Q|为指标集Q的指标个数,μ是用来权衡分类准确率和指标个数的权重因子;
求解所述目标函数得到最优指标集。
与现有的技术相比,本发明提出的一种面向电力监控***安全态势评估指标选取方法,具有如下优点:
本发明从指标与评估安全状态相关性和指标之间的冗余性两方面入手,基于相关性对候选特征指标进行排序,通过设置冗余度阈值除去冗余指标,最后使用最优指标集选择算法来选择最优评估指标,有利于降低数据采集、存储、传输和处理资源的开销,提升对电力监控***安全态势实时评估的性能,为后续电力监控***安全态势准确地评估提供支撑。
附图说明
图1为本发明的面向电力监控***安全态势评估指标选取方法流程图。
具体实施方式
下面对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
本发明实施例一方面提出了一种面向电力监控***安全态势评估指标选取方法,从指标与电力监控***安全状态的相关性、指标之间的冗余性两方面入手对指标进行选取。首先,从影响电力监控***安全因素入手,采集能够反映电力监控***安全状态的历史数据,标准化处理后进行人工标注,确定每一条标准化的原始样本数据记录对应的电力监控***安全状态,构造训练样本数据集。之后,分析每个候选指标对判断电力监控***安全状态的相关程度,并确定候选指标和电力监控***安全状态的相关性排序。最后,在候选指标相关性排序的基础上,通过计算指标两两之间的冗余性,去除冗余性较大的指标,最终选取出最优指标集。
参见图1,具体实施过程如下:
第一步:构造训练样本数据集,具体如下:
从流量特征、设备运行状态和告警日志三个方面分析影响电力监控***的安全因素,选取n个能够反映电力监控***安全状态的特征指标,并采集相应特征指标的数据。
选取已经采集到的反映电力监控***安全状态的历史数据构建样本数据集D表示如下:
Figure BDA0002478115700000071
其中,Xi(i∈[1,m]),为第i条反映电力监控***安全状态的数据记录,xij表示第i条数据记录中第j(j∈[1,n])个特征指标对应的数值。
对原始样本数据集D采用最小—最大化方法进行标准化处理,生成标准化的样本数据集D'表示如下:
Figure BDA0002478115700000072
其中:
Figure BDA0002478115700000073
根据专家经验和历史数据中是否已造成安全问题等事实对标准化的原始样本数据集D'进行人工标注,注明每一条标准化后的样本数据记录对应的电力监控***安全状态,生成训练样本数据集T表示如下:
Figure BDA0002478115700000074
其中,Ti(i∈[1,m])为第i条训练样本数据,yi(yi∈{0,1})表示第i条训练样本数据对应的电力监控***安全状态,取值1表示安全状态,取值0表示危险状态。
第二步:以第一步中选取的n个能够反映电力监控***安全状态的特征指标为候选指标,分析候选指标和电力监控***安全评估的相关性,确定各个候选指标能否判断电力监控***安全状态的相关性优先排序;
根据基于线型核函数的支持向量机(SVM)分类算法对每一个候选能够判断电力监控***安全状态的相关性程度进行分析,包括:
支持向量机(SVM)的分类函数为:
Figure BDA0002478115700000081
其中,自变量X表示标准化的反映电力监控***安全状态的待测数据记录,f(X)表示根据自变量X得到的分类结果,即其对应的电力监控***安全状态,X′i为标准化的样本数据集D'中反映电力监控***安全状态的第i条数据记录,yi(yi∈{0,1})表示标准化的样本数据集D'中第i条数据记录对应的电力监控***安全状态,取值1表示安全状态,取值0表示危险状态,αi是拉格朗日乘子,sgn(·)是符号函数,b为阈值,αi和b都是经过模型训练得到的参数。
使用训练样本数据集T训练支持向量机模型,得到自变量X的系数ω:
Figure BDA0002478115700000082
则向量ω的第j(j∈[1,n])个元素对应的
Figure BDA0002478115700000083
表示第j个候选指标在SVM分类模型中的权重ωj,选取每一个候选指标在SVM分类模型中相应权重的平方作为判断相关性的评价分数cj,即:
cj=ωj 2(j∈[1,n])
cj值越大,说明第j个候选指标和电力监控***安全评估的相关性越大。
使用序列后向选择启发式搜索算法对n个候选指标构成的集合S进行循环处理,每一次均采用上述分析候选指标和电力监控***安全评估相关性的方法,从S中剔除一个和电力监控***安全评估相关性最小的候选指标,依次放入候选指标相关性排序集合R中,最终得到候选指标相关性从大到小的排序。
候选指标和电力监控***安全评估相关性分析的具体算法如下:
Figure BDA0002478115700000084
Figure BDA0002478115700000091
第三步:剔除候选指标相关性排序集合R中的冗余指标,具体如下:
采用Pearson相关系数依次计算候选指标相关性排序集合R中两两指标之间的冗余性,设置冗余度阈值,剔除冗余度大于阈值的指标,得到剔除了冗余指标的候选指标相关性排序集合Q。Pearson相关系数公式如下:
Figure BDA0002478115700000092
其中,以s、g分别表示候选指标相关性排序集合R中的两个候选指标,
Figure BDA0002478115700000093
分别表示两个候选指标在训练样本数据集T中所有样本记录的均值,si、gi分别表示两个候选指标在T中第i条训练样本记录中的取值。
第四步:从剔除了冗余指标的候选指标相关性排序集合Q中,选取电力监控***安全态势评估最优指标集。
最优指标集的选择主要考虑两个方面,一是由最优指标集构建的样本数据集训练出来的模型分类准确率高,二是指标集的个数不宜过多。最优指标集选择的目标函数如下:
Figure BDA0002478115700000094
其中,S是剔除了冗余指标的候选指标相关性排序集合Q的子集,P(S)为根据指标集S构造的支持向量机(SVM)分类器的分类准确率,|S|为指标集S的指标个数,|Q|为指标集Q的指标个数,μ是用来权衡分类准确率和指标个数的权重因子。目标函数的值越大,所选指标集越优。
选择最优指标集的具体算法如下:
Figure BDA0002478115700000101
最终,得到经过特征相关性排序、删除冗余指标的电力监控***安全态势评估最优指标集,有利于降低数据采集、存储、传输和处理资源的开销,提升对电力监控***安全态势实时评估的性能,为后续电力监控***安全态势准确地评估提供支撑。
本发明实施例另一方面还提供一种面向电力监控***安全态势评估指标选取***,包括:
指标获取模块,用于获取用于电力监控***安全评估的候选特征指标;
样本获取模块,用于基于所述候选特征指标构建训练样本数据集;
训练模块,用于基于所述训练样本数据集计算所述候选特征指标用于评估电力监控***安全状态的相关性,得到候选特征指标相关性排序集合;
筛选模块,用于剔除所述候选特征指标相关性排序集合中的冗余指标,构成剔除了冗余指标的候选特征指标相关性排序集合;
以及,
寻优模块,用于从所述剔除了冗余指标的候选特征指标相关性排序集合中,选取电力监控***安全态势评估的最优指标集。
进一步的,所述训练模块具体用于,
采用训练样本数据集训练支持向量机模型,得到候选特征指标的权重;
根据候选特征指标的权重计算候选特征指标和电力监控***安全评估的相关性评价分数;
使用序列后向选择启发式搜索算法对候选特征指标集进行循环处理,每次从候选特征指标集中剔除一个相关性评价分数最小的候选特征指标,依次放入候选特征指标相关性排序集合中,最终得到候选特征指标相关性从大到小的排序集合。
进一步的,所述筛选模块具体用于,
采用Pearson相关系数作为候选特征指标相关性排序集合中指标间的冗余度:
Figure BDA0002478115700000111
其中,pearson(s,g)为候选特征指标相关性排序集合中两个候选特征指标s,g的Pearson相关系数,
Figure BDA0002478115700000112
分别表示两个候选特征指标在训练样本数据集T中的平均值,si,gi分别表示两个候选特征指标在训练样本数据集T中第i条训练样本记录中的取值;
设置冗余度阈值,剔除冗余度大于阈值的冗余指标。
进一步的,所述寻优模块具体用于,
设计最优指标集选择的目标函数如下:
Figure BDA0002478115700000113
其中,S是剔除了冗余指标的候选特征指标相关性排序集合Q的子集,P(S)为根据指标集S构造的支持向量机分类器的分类准确率,|S|为指标集S的指标个数,|Q|为指标集Q的指标个数,μ是用来权衡分类准确率和指标个数的权重因子;
求解所述目标函数得到最优指标集。
值得指出的是,该装置实施例是与上述方法实施例对应的,上述方法实施例的实现方式均适用于该装置实施例中,并能达到相同或相似的技术效果,故不在此赘述。
本发明从指标与评估安全状态相关性和指标之间的冗余性两方面入手,使用基于支持向量机的分类算法和序列后向选择启发式搜索算法来分析指标和评估安全状态的相关性,并采用Pearson相关系数计算指标之间的冗余性,通过设置冗余度阈值除去冗余指标,最后使用最优指标集选择算法来选择最优评估指标,有利于降低数据采集、存储、传输和处理资源的开销,提升对电力监控***安全态势实时评估的性能,为后续电力监控***安全态势准确地评估提供支撑。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (12)

1.一种面向电力监控***安全态势评估指标选取方法,其特征在于,包括:
获取用于电力监控***安全评估的候选特征指标;
基于所述候选特征指标构建训练样本数据集;
基于所述训练样本数据集计算所述候选特征指标用于评估电力监控***安全状态的相关性,得到候选特征指标相关性排序集合;
剔除所述候选特征指标相关性排序集合中的冗余指标,构成剔除了冗余指标的候选特征指标相关性排序集合;
从所述剔除了冗余指标的候选特征指标相关性排序集合中,选取电力监控***安全态势评估的最优指标集。
2.根据权利要求1所述的一种面向电力监控***安全态势评估指标选取方法,其特征在于,所述获取用于电力监控***安全评估的候选特征指标,包括:
从流量特征、设备运行状态和告警日志中选取若干个能够反映电力监控***安全状态的候选特征指标。
3.根据权利要求1所述的一种面向电力监控***安全态势评估指标选取方法,其特征在于,所述基于所述候选特征指标构建训练样本数据集,包括:
采集用于电力监控***安全评估的候选特征指标历史数据,形成原始样本数据集D:
Figure FDA0002478115690000011
其中,Xi,i∈[1,m],为第i条反映电力监控***安全状态的历史数据记录,m为采集的历史数据记录条数,xij表示第i条历史数据记录中第j个候选特征指标对应的数值,j∈[1,n],n为候选特征指标个数;
对原始样本数据集D进行标准化处理,生成标准化的样本数据集D′:
Figure FDA0002478115690000012
其中:X′i为Xi标准化的样本数据记录,x′ij为xij标准化的数值;
x′ij计算如下:
Figure FDA0002478115690000021
对标准化的原始样本数据集D′进行人工标注,生成训练样本数据集T:
Figure FDA0002478115690000022
其中,Ti,i∈[1,m],为第i条训练样本记录,yi,yi∈{0,1},表示第i条训练样本记录对应的电力监控***安全状态,取值1表示安全状态,取值0表示危险状态。
4.根据权利要求1所述的一种面向电力监控***安全态势评估指标选取方法,其特征在于,所述基于所述训练样本数据集计算所述候选特征指标用于评估电力监控***安全状态的相关性,得到候选特征指标相关性排序集合,包括:
采用训练样本数据集训练支持向量机模型,得到候选特征指标的权重;
根据候选特征指标的权重计算候选特征指标和电力监控***安全评估的相关性评价分数;
使用序列后向选择启发式搜索算法对候选特征指标集进行循环处理,每次从候选特征指标集中剔除一个相关性评价分数最小的候选特征指标,依次放入候选特征指标相关性排序集合中,最终得到候选特征指标相关性从大到小的排序集合。
5.根据权利要求4所述的一种面向电力监控***安全态势评估指标选取方法,其特征在于,所述采用训练样本数据集训练支持向量机模型,得到候选特征指标的权重,包括:
支持向量机的分类函数为:
Figure FDA0002478115690000023
其中,自变量X表示标准化的反映电力监控***安全状态的待测数据记录,f(X)表示根据自变量X得到的分类结果,αi是拉格朗日乘子,sgn(·)是符号函数,b为阈值,αi和b经过模型训练得到,X′i为标准化的训练样本数据记录,yi,表示第i条训练样本记录对应的电力监控***安全状态;
使用训练样本数据集训练支持向量机模型,得到自变量X的系数ω:
Figure FDA0002478115690000031
则向量ω的第j个元素对应的
Figure FDA0002478115690000032
表示第j个候选特征指标的权重ωj,x′ij为标准化的第i条训练数据记录中第j个候选特征指标对应的数值,m为训练数据记录条数,n为候选特征指标个数。
6.根据权利要求4所述的一种面向电力监控***安全态势评估指标选取方法,其特征在于,所述根据候选特征指标的权重计算候选特征指标和电力监控***安全评估的相关性评价分数,包括:
cj=ωj 2
其中,cj是第j个候选特征指标的相关性评价分数,ωj是第j个候选特征指标的权重。
7.根据权利要求1所述的一种面向电力监控***安全态势评估指标选取方法,其特征在于,所述剔除所述候选特征指标相关性排序集合中的冗余指标,构成剔除了冗余指标的候选特征指标相关性排序集合,包括:
采用Pearson相关系数作为候选特征指标相关性排序集合中指标间的冗余度:
Figure FDA0002478115690000033
其中,pearson(s,g)为候选特征指标相关性排序集合中两个候选特征指标s,g的Pearson相关系数,
Figure FDA0002478115690000034
分别表示两个候选特征指标在训练样本数据集T中的平均值,si,gi分别表示两个候选特征指标在训练样本数据集T中第i条训练样本记录中的取值;
剔除冗余度大于预先设置的冗余度阈值的冗余指标。
8.根据权利要求1所述的一种面向电力监控***安全态势评估指标选取方法,其特征在于,从所述剔除了冗余指标的候选特征指标相关性排序集合中,选取电力监控***安全态势评估的最优指标集,包括:
设计最优指标集选择的目标函数如下:
Figure FDA0002478115690000035
其中,S是剔除了冗余指标的候选特征指标相关性排序集合Q的子集,P(S)为根据指标集S构造的支持向量机分类器的分类准确率,|S|为指标集S的指标个数,|Q|为指标集Q的指标个数,μ是用来权衡分类准确率和指标个数的权重因子;
求解所述目标函数得到最优指标集。
9.一种面向电力监控***安全态势评估指标选取***,其特征在于,包括:
指标获取模块,用于获取用于电力监控***安全评估的候选特征指标;
样本获取模块,用于基于所述候选特征指标构建训练样本数据集;
训练模块,用于基于所述训练样本数据集计算所述候选特征指标用于评估电力监控***安全状态的相关性,得到候选特征指标相关性排序集合;
筛选模块,用于剔除所述候选特征指标相关性排序集合中的冗余指标,构成剔除了冗余指标的候选特征指标相关性排序集合;
以及,
寻优模块,用于从所述剔除了冗余指标的候选特征指标相关性排序集合中,选取电力监控***安全态势评估的最优指标集。
10.根据权利要求9所述的一种面向电力监控***安全态势评估指标选取***,其特征在于,所述训练模块具体用于,
采用训练样本数据集训练支持向量机模型,得到候选特征指标的权重;
根据候选特征指标的权重计算候选特征指标和电力监控***安全评估的相关性评价分数;
使用序列后向选择启发式搜索算法对候选特征指标集进行循环处理,每次从候选特征指标集中剔除一个相关性评价分数最小的候选特征指标,依次放入候选特征指标相关性排序集合中,最终得到候选特征指标相关性从大到小的排序集合。
11.根据权利要求9所述的一种面向电力监控***安全态势评估指标选取***,其特征在于,所述筛选模块具体用于,
采用Pearson相关系数作为候选特征指标相关性排序集合中指标间的冗余度:
Figure FDA0002478115690000041
其中,pearson(s,g)为候选特征指标相关性排序集合中两个候选特征指标s,g的Pearson相关系数,
Figure FDA0002478115690000042
分别表示两个候选特征指标在训练样本数据集T中的平均值,si,gi分别表示两个候选特征指标在训练样本数据集T中第i条训练样本记录中的取值;
剔除冗余度大于预先设置的冗余度阈值的冗余指标。
12.根据权利要求9所述的一种面向电力监控***安全态势评估指标选取***,其特征在于,所述寻优模块具体用于,
设计最优指标集选择的目标函数如下:
Figure FDA0002478115690000051
其中,S是剔除了冗余指标的候选特征指标相关性排序集合Q的子集,P(S)为根据指标集S构造的支持向量机分类器的分类准确率,|S|为指标集S的指标个数,|Q|为指标集Q的指标个数,μ是用来权衡分类准确率和指标个数的权重因子;
求解所述目标函数得到最优指标集。
CN202010370523.0A 2020-05-06 2020-05-06 一种面向电力监控***安全态势评估指标选取方法及*** Active CN111614491B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010370523.0A CN111614491B (zh) 2020-05-06 2020-05-06 一种面向电力监控***安全态势评估指标选取方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010370523.0A CN111614491B (zh) 2020-05-06 2020-05-06 一种面向电力监控***安全态势评估指标选取方法及***

Publications (2)

Publication Number Publication Date
CN111614491A true CN111614491A (zh) 2020-09-01
CN111614491B CN111614491B (zh) 2022-10-04

Family

ID=72201998

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010370523.0A Active CN111614491B (zh) 2020-05-06 2020-05-06 一种面向电力监控***安全态势评估指标选取方法及***

Country Status (1)

Country Link
CN (1) CN111614491B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112330116A (zh) * 2020-10-27 2021-02-05 中国建设银行股份有限公司 一种业务***性能分析方法、装置及存储介质
CN112488871A (zh) * 2020-10-23 2021-03-12 广西电网有限责任公司电力科学研究院 一种电网原始输入特征冗余数据剔除方法及***
CN112633622A (zh) * 2020-09-29 2021-04-09 国网四川省电力公司信息通信公司 一种智能电网运营指标筛选方法
CN112818028A (zh) * 2021-01-12 2021-05-18 平安科技(深圳)有限公司 数据指标筛选方法、装置、计算机设备及存储介质
CN113111854A (zh) * 2021-04-30 2021-07-13 平安国际融资租赁有限公司 电流信号提取方法、装置、计算机设备和存储介质
CN113469151A (zh) * 2021-09-03 2021-10-01 深圳市信润富联数字科技有限公司 工业制造中传感器的筛选方法、装置、设备及介质
CN113592379A (zh) * 2021-06-25 2021-11-02 南京财经大学 散粮集装箱物流运输环境异常检测的关键特征识别方法
CN113935031A (zh) * 2020-12-03 2022-01-14 网神信息技术(北京)股份有限公司 文件特征提取范围配置及静态恶意软件识别的方法、***
CN114553681A (zh) * 2022-03-08 2022-05-27 中国人民解放军国防科技大学 设备状态异常检测方法、装置和计算机设备
CN116226705A (zh) * 2022-12-05 2023-06-06 安徽继远软件有限公司 一种基于电力资源监控的态势感知方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102123149A (zh) * 2011-03-04 2011-07-13 哈尔滨工程大学 面向服务的大规模网络安全态势评估装置及方法
CN104794534A (zh) * 2015-04-16 2015-07-22 国网山东省电力公司临沂供电公司 一种基于改进深度学习模型的电网安全态势预测方法
CN106483947A (zh) * 2016-09-21 2017-03-08 国网江苏省电力公司南通供电公司 基于大数据的配电网运行状态评估和预警方法
US20190378044A1 (en) * 2013-12-23 2019-12-12 Groupon, Inc. Processing dynamic data within an adaptive oracle-trained learning system using curated training data for incremental re-training of a predictive model

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102123149A (zh) * 2011-03-04 2011-07-13 哈尔滨工程大学 面向服务的大规模网络安全态势评估装置及方法
US20190378044A1 (en) * 2013-12-23 2019-12-12 Groupon, Inc. Processing dynamic data within an adaptive oracle-trained learning system using curated training data for incremental re-training of a predictive model
CN104794534A (zh) * 2015-04-16 2015-07-22 国网山东省电力公司临沂供电公司 一种基于改进深度学习模型的电网安全态势预测方法
CN106483947A (zh) * 2016-09-21 2017-03-08 国网江苏省电力公司南通供电公司 基于大数据的配电网运行状态评估和预警方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112633622A (zh) * 2020-09-29 2021-04-09 国网四川省电力公司信息通信公司 一种智能电网运营指标筛选方法
CN112633622B (zh) * 2020-09-29 2024-02-27 国网四川省电力公司信息通信公司 一种智能电网运营指标筛选方法
CN112488871A (zh) * 2020-10-23 2021-03-12 广西电网有限责任公司电力科学研究院 一种电网原始输入特征冗余数据剔除方法及***
CN112330116A (zh) * 2020-10-27 2021-02-05 中国建设银行股份有限公司 一种业务***性能分析方法、装置及存储介质
CN113935031B (zh) * 2020-12-03 2022-07-05 奇安信网神信息技术(北京)股份有限公司 文件特征提取范围配置及静态恶意软件识别的方法、***
CN113935031A (zh) * 2020-12-03 2022-01-14 网神信息技术(北京)股份有限公司 文件特征提取范围配置及静态恶意软件识别的方法、***
CN112818028A (zh) * 2021-01-12 2021-05-18 平安科技(深圳)有限公司 数据指标筛选方法、装置、计算机设备及存储介质
CN113111854A (zh) * 2021-04-30 2021-07-13 平安国际融资租赁有限公司 电流信号提取方法、装置、计算机设备和存储介质
CN113592379A (zh) * 2021-06-25 2021-11-02 南京财经大学 散粮集装箱物流运输环境异常检测的关键特征识别方法
CN113592379B (zh) * 2021-06-25 2024-05-14 南京财经大学 散粮集装箱物流运输环境异常检测的关键特征识别方法
CN113469151B (zh) * 2021-09-03 2022-02-15 深圳市信润富联数字科技有限公司 工业制造中传感器的筛选方法、装置、设备及介质
CN113469151A (zh) * 2021-09-03 2021-10-01 深圳市信润富联数字科技有限公司 工业制造中传感器的筛选方法、装置、设备及介质
CN114553681A (zh) * 2022-03-08 2022-05-27 中国人民解放军国防科技大学 设备状态异常检测方法、装置和计算机设备
CN114553681B (zh) * 2022-03-08 2024-02-02 中国人民解放军国防科技大学 设备状态异常检测方法、装置和计算机设备
CN116226705A (zh) * 2022-12-05 2023-06-06 安徽继远软件有限公司 一种基于电力资源监控的态势感知方法

Also Published As

Publication number Publication date
CN111614491B (zh) 2022-10-04

Similar Documents

Publication Publication Date Title
CN111614491B (zh) 一种面向电力监控***安全态势评估指标选取方法及***
CN112731159B (zh) 一种储能电站电池舱电池故障预判及定位的方法
CN111612650B (zh) 一种基于dtw距离的电力用户分群方法及***
CN111723367B (zh) 一种电力监控***业务场景处置风险评价方法及***
CN110636066B (zh) 基于无监督生成推理的网络安全威胁态势评估方法
CN113570200B (zh) 一种基于多维信息的电网运行状态监测方法及***
CN114580706A (zh) 基于gru-lstm神经网络的电力金融业务风控方法及***
CN113780443B (zh) 一种面向威胁检测的网络安全态势评估方法
CN116862081B (zh) 一种污染治理设备运维方法及***
CN113239087A (zh) 一种反窃电稽查监控方法及***
CN112257784A (zh) 一种基于梯度提升决策树的窃电检测方法
CN115242441A (zh) 一种基于特征选择和深度神经网络的网络入侵检测方法
CN115719283A (zh) 一种智能化会计管理***
CN117113232A (zh) 一种电动汽车锂离子电池组热失控风险识别方法
CN114548494A (zh) 一种可视化造价数据预测智能分析***
CN116030955B (zh) 基于物联网的医疗设备状态监测方法及相关装置
CN111934903A (zh) 一种基于时序演化基因的Docker容器故障智能预测方法
CN116225752A (zh) 基于故障模式库的微服务***故障根因分析方法及***
CN115312193A (zh) 医学潜在相关指标风险监控***、方法、终端及存储介质
CN115018007A (zh) 一种基于改进id3决策树的敏感数据分类方法
CN111221704B (zh) 一种确定办公管理应用***运行状态的方法及***
CN113807743A (zh) 一种电网调度自动化软件可靠性评估方法及***
Xi et al. Power mobile terminal security assessment based on weights self-learning
CN117745080B (zh) 基于多因素认证的数据访问控制和***方法和***
Ling et al. Graph Attention Mechanism-Based Method for Tracing APT Attacks in Power Systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant