CN113255775A - 一种电力***异常数据的识别方法、装置和智能芯片 - Google Patents

一种电力***异常数据的识别方法、装置和智能芯片 Download PDF

Info

Publication number
CN113255775A
CN113255775A CN202110587768.3A CN202110587768A CN113255775A CN 113255775 A CN113255775 A CN 113255775A CN 202110587768 A CN202110587768 A CN 202110587768A CN 113255775 A CN113255775 A CN 113255775A
Authority
CN
China
Prior art keywords
data
state estimation
estimation value
power system
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110587768.3A
Other languages
English (en)
Other versions
CN113255775B (zh
Inventor
王嘉诚
张少仲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongcheng Hualong Computer Technology Co Ltd
Original Assignee
Shenwei Super Computing Beijing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenwei Super Computing Beijing Technology Co ltd filed Critical Shenwei Super Computing Beijing Technology Co ltd
Priority to CN202110587768.3A priority Critical patent/CN113255775B/zh
Publication of CN113255775A publication Critical patent/CN113255775A/zh
Application granted granted Critical
Publication of CN113255775B publication Critical patent/CN113255775B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明涉及一种电力***异常数据的识别方法、装置和智能芯片,该方法包括:获取电力***的待测数据和与所述待测数据对应的实际状态估计值;获取状态估计值预测模型;其中,所述状态估计值预测模型是采用电力***的至少一组样本数据组对循环神经网络进行训练得到的,每一组所述样本数据组均包括样本数据和预先标注的状态估计值;根据所述待测数据,调用所述状态估计值预测模型输出得到预测状态估计值;基于所述实际状态估计值和所述预测状态估计值,识别电力***的异常数据。本发明的方案能够提高电力***异常数据的识别的准确性。

Description

一种电力***异常数据的识别方法、装置和智能芯片
技术领域
本发明涉及计算机技术领域,尤其涉及电力***异常数据的识别方法、装置和智能芯片。
背景技术
电力***中存在的异常数据会对潮流分析计算、状态估计和在线分析软件的功能产生影响,调度员决策受到异常数据的干扰也会影响电力***的正常运行。
现有技术中,异常数据的识别方法利用状态估计计算得到的量测残差进行分析,面对多个具有强相关关系的异常数据的情况,往往会出现残差污染和残差淹没的现象,影响异常数据识别的准确性。
因此,针对以上不足,需要提供一种电力***异常数据的识别方法、装置和智能芯片。
发明内容
本发明要解决的技术问题在于电力***异常数据识别的准确性不高,针对现有技术中的缺陷,提供一种电力***异常数据的识别方法、装置和智能芯片。
为了解决上述技术问题,本发明提供了一种电力***异常数据的识别方法,包括:
获取电力***的待测数据和与所述待测数据对应的实际状态估计值;
获取状态估计值预测模型;其中,所述状态估计值预测模型是采用电力***的至少一组样本数据组对循环神经网络进行训练得到的,每一组所述样本数据组均包括样本数据和预先标注的状态估计值;
根据所述待测数据,调用所述状态估计值预测模型输出得到预测状态估计值;
基于所述实际状态估计值和所述预测状态估计值,识别电力***的异常数据。
在一种可能的实现方式中,所述根据所述待测数据,调用所述状态估计值预测模型输出得到预测状态估计值,包括:
从所述待测数据中提取数据特征;其中,所述数据特征包括电流波动特征和/或电压波动特征;
将所述数据特征输入到所述状态估计值预测模型中,输出得到所述预测状态估计值。
在一种可能的实现方式中,在所述状态估计值预测模型之前,还包括:
获取训练样本集,所述训练样本集包括至少一组所述样本数据组;
对于每一组所述样本数据组,从所述样本数据中提取样本数据特征;
将所述样本数据特征输入到所述循环神经网络,输出得到样本预测状态估计值;其中,所述循环神经网络为长短期记忆模型;
将所述样本预测状态估计值与预先标注的状态估计值进行比较,得到计算损失;其中,所述计算损失用于指示所述样本预测状态估计值与预先标注的状态估计值之间的误差;
根据每一组所述样本数据组各自对应的计算损失,采用误差反向传播算法训练得到所述状态估计值预测模型。
在一种可能的实现方式中,所述根据所述待测数据,调用所述状态估计值预测模型输出得到预测状态估计值,包括:
对所述待测数据进行降维处理,得到低维待测数据;
将所述低维待测数据输入到所述状态估计值预测模型,输出得到预测状态估计值。
在一种可能的实现方式中,所述对所述待测数据进行降维处理,得到低维待测数据,包括:
将所述待测数据映射到高维,并进行中心化操作,形成数据矩阵;
对所述数据矩阵进行线性转换,得到该数据矩阵的协方差矩阵;
基于所述协方差矩阵的特征值和特征向量,得到低维待测数据。
在一种可能的实现方式中,所述基于所述实际状态估计值和所述预测状态估计值,识别电力***的异常数据,包括:
基于所述实际状态估计值和所述预测状态估计值的平方误差得到量测残差;
对所述量测残差进行聚类分析,识别电力***的异常数据。
在一种可能的实现方式中,所述基于所述实际状态估计值和所述预测状态估计值,识别电力***的异常数据,包括:
根据如下公式,确定估计阈值;其中,所述公式为:
Figure DEST_PATH_IMAGE001
Figure 855374DEST_PATH_IMAGE002
用于表征所述估计阈值,
Figure DEST_PATH_IMAGE003
用于表征与每一次样本数据对应的实际状态 估计值,
Figure 303672DEST_PATH_IMAGE004
用于表征与每一次样本数据对应的预测状态估计值,n用于表征选取的样本数据 的次数;
如果所述实际状态估计值和所述预测状态估计值的差值的绝对值大于所述估计阈值,则确定所述待测数据中存在异常数据。
本发明还提供了一种电力***异常数据的识别装置,包括:
第一获取模块,用于获取电力***的待测数据和与所述待测数据对应的实际状态估计值;
第二获取模块,用于获取状态估计值预测模型;其中,所述状态估计值预测模型是采用电力***的至少一组样本数据组对循环神经网络进行训练得到的,每一组所述样本数据组均包括样本数据和预先标注的状态估计值;
调用模块,用于根据所述待测数据,调用所述状态估计值预测模型输出得到预测状态估计值;
识别模块,用于基于所述实际状态估计值和所述预测状态估计值,识别电力***的异常数据。
本发明还提供了一种智能芯片,包括:至少一个存储器和至少一个处理器;
所述至少一个存储器,用于存储机器可读程序;
所述至少一个处理器,用于调用所述机器可读程序,执行如上述所述的方法。
本发明还提供了一种计算机可读介质,所述计算机可读介质上存储有计算机指令,所述计算机指令在被处理器执行时,使所述处理器执行如上述所述的方法。
实施本发明的电力***异常数据的识别方法、装置和智能芯片,具有以下有益效果:
本发明所提供的技术方案,将电力***的待测数据输入到预先训练好的状态估计值预测模型,输出得到预测状态估计值,再根据与待测数据对应的实际状态估计值和该预测状态估计值,识别电力***的异常数据,其中,状态估计值预测模型是利用电力***海量运行数据进行训练得到的。上述技术方案避免了传统识别方法的残差污染和残差淹没的问题,对存在异常数据的电力***能够进行准确预测,提高了电力***异常数据识别的准确性;而且,利用预先训练好的状态估计值预测模型进行识别的运算时间很短,适用于规模较大、数据量较大的电力***,大大提高了在线识别应用的快速性。
附图说明
图1是本发明一个实施例提供的电力***异常数据的识别方法的流程图;
图2是本发明另一个实施例提供的电力***异常数据的识别方法的流程图;
图3是本发明一个实施例提供的智能芯片的示意图;
图4是本发明一个实施例提供的电力***异常数据的识别装置的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1示出根据一个实施例的电力***异常数据的识别方法的流程图。可以理解,该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。
参见图1,该方法包括:
步骤101:获取电力***的待测数据和与待测数据对应的实际状态估计值。
在步骤101中,待测数据取自待识别的时间断面上电力***各个设备的量测值,例如可以通过SCADA(Supervisory Control And Data Acquisition,监视控制和数据采集)***获取,具体地,从各厂站设备采集的量测数据,受采集仪表精度、数据传输通道、传输模式、传输延时等因素影响,不可避免地存在量测误差,产生较大误差的数据称之为异常数据。
环境噪声使理想的运动方程无法精确求解,测量***的随机误差,使测量向量不能直接通过理想的测量方程求出状态真值。通过统计学的方法加以处理以求出对状态向量的估计值,这种方法称为状态估计。在一些实施方式中,与待测数据对应的实际状态估计值可以通过状态估计器(State Estimator,SE)进行确定。
步骤102:获取状态估计值预测模型。
在步骤102中,状态估计值预测模型是采用电力***的至少一组样本数据组对循环神经网络进行训练得到的,每一组样本数据组均包括样本数据和预先标注的状态估计值。
计算机设备获取预先训练好的状态估计值预测模型。在一种可能的实现方式中,当计算机设备为终端时,终端获取自身存储的训练好的状态估计值预测模型,或者从服务器中获取训练好的状态估计值预测模型。在另一种可能的实现方式中,当计算机设备为服务器时,服务器获取自身存储的训练好的状态估计值预测模型。
状态估计值预测模型是具有对样本数据进行识别的循环神经网络模型。状态估计值预测模型为预设的数学模型,该状态估计值预测模型包括样本数据和状态估计值之间的模型系数。模型系数可以为固定值,也可以是随时间动态修改的值,还可以是随着使用场景动态修改的值。
在一些实施方式中,状态估计值预测模型为卷积神经网络(ConvolutionalNeural Network,CNN)和循环神经网络的混合模型,或者,状态估计值预测模型为循环神经网络模型。例如,循环神经网络为长短期记忆(Long-Short Term Memory,LSTM)网络。
步骤103:根据待测数据,调用状态估计值预测模型输出得到预测状态估计值。
在一些实施方式中,步骤103具体包括如下步骤:
从待测数据中提取数据特征;其中,数据特征包括电流波动特征和/或电压波动特征;
将数据特征输入到状态估计值预测模型中,输出得到预测状态估计值。
在该实施方式中,特征提取是从待测数据中提取特征,并将提取的特征转换为结构化数据的过程,通过将特征提取到的数据特征输入到状态估计值预测模型中,输出得到预测状态估计值。此外,由于待测数据包括电压量测数据和电流量测数据,因此数据特征包括电流波动特征和/或电压波动特征。
需要说明的是,在计算机设备获取状态估计值预测模型之前,需要对训练样本集进行训练得到状态估计值预测模型。下面对状态估计值预测模型的训练过程进行介绍。
在一种可能的实现方式中,对状态估计值预测模型的训练过程包括如下几个步骤:
步骤A1、计算机设备获取训练样本集,训练样本集包括至少一组样本数据组。
在步骤A1中,状态估计值预测模型是根据至少一组样本数据组训练得到的,每一组样本数据组均包括样本数据和预先标注的状态估计值。
步骤A2、对于每一组样本数据组,计算机设备从样本数据中提取样本数据特征。
在步骤A2中,计算机设备对样本数据进行特征提取,将经过特征提取后的数据确定为样本数据特征。
示意性的,特征提取是从待测数据中提取特征,并将提取的特征转换为结构化数据的过程。
步骤A3、计算机设备将样本数据特征输入循环神经网络得到训练结果,循环神经网络为长短期记忆模型。
示意性的,对于每组样本数据组,计算机设备创建该组样本数据组对应的输入输出对,输入输出对的输入参数为该组样本数据组中的样本数据特征,输出参数为该组样本数据组中的预先标注的状态估计值;计算机设备将输入参数输入预测模型,得到训练结果。
可选的,输入输出对通过特征向量表示。
步骤A4、计算机设备将样本预测状态估计值与预先标注的状态估计值进行比较,得到计算损失,计算损失用于指示样本预测状态估计值与预先标注的状态估计值的误差。
可选的,计算损失通过交叉熵来表示,在此不进行赘述。
步骤A5、计算机设备根据每一组样本数据组各自对应的计算损失,采用误差反向传播算法训练得到状态估计值预测模型。
可选的,计算机设备通过反向传播算法根据计算损失确定状态估计值预测模型的梯度方向,从状态估计值预测模型的输出层逐层向前更新状态估计值预测模型中的模型参数。
在另一些实施方式中,由于待测数据可能是波形连续信号,对这种波形连续信号进行数据处理的效率较为低下,不利于对异常数据的快速识别。基于此,可以考虑对待测数据进行降维处理。
具体地,步骤103可以包括如下步骤:
对待测数据进行降维处理,得到低维待测数据;
将低维待测数据输入到状态估计值预测模型,输出得到预测状态估计值。
在本实施例中,通过对待测数据进行降维处理后初步提取数据特征,以将保留的重要信息的数据特征作为进一步处理的输入,在大数据量处理的背景下可以有效提高数据的处理效率,改善训练结果,以提高异常数据识别的准确性。
进一步地,可以通过如下步骤进行数据的降维处理:
将待测数据映射到高维,并进行中心化操作,形成数据矩阵;
对数据矩阵进行线性转换,得到该数据矩阵的协方差矩阵;
基于协方差矩阵的特征值和特征向量,得到低维待测数据。
在本实施例中,可以将待测数据通过主成分分析(Principal ComponentAnalysis,PCA)算法进行降维处理,保留重要的数据特征,去除噪声等不重要的数据特征,以提升后续数据的处理速度。在处理过程中将每一个待测数据。在处理过程中视每一个待测数据为一行字段,同时选取多个待测数据作为一个处理矩阵单元,具体降维方式可通过以下步骤进行:
(1)数据映射到高维,并进行中心化操作,m个待测数据中心化后,以每个待测数据为一行,m个待测数据组成m行n列的数据矩阵X;
(2)对数据矩阵X进行线性转换,计算X矩阵的协方差矩阵C;
(3)计算协方差矩阵C的特征值和特征向量;
(4)低维投影,依据特征值大小取k∈(0,n)个对应的特征行向量,组成投影矩阵P;在k值得选择中,通过交叉验证的方法,并设置下限阈值t=0.96;
(5)Y=PX,即为降维到k维的数据(即低维待测数据)。
步骤104:基于实际状态估计值和预测状态估计值,识别电力***的异常数据。
在步骤104中,具体可以包括如下步骤:
基于实际状态估计值和预测状态估计值的平方误差得到量测残差;
对量测残差进行聚类分析,识别电力***的异常数据。
在本实施例中,量测残差作为后续步骤聚类算法的输入数据集。
具体地,步骤对量测残差进行聚类分析,识别电力***的异常数据,包括如下步骤:
步骤B1、将量测残差设定为多个聚类。
步骤B2、根据设定的聚类数量、聚类的间隙值和离散度,获得最佳聚类个数。
在步骤B2中,例如利用改进GSA间隙统计算法计算最佳聚类个数。其中,GSA间隙统计算法,是一种强化聚类效果的数据挖掘算法,通过比较聚类结果的离散度指标和其参考值,确定最佳聚类个数,将正常数据和异常数据所在聚类准确区分。
步骤B3、基于最佳聚类个数对所述量测残差进行聚类,得到聚类结果。
具体地,步骤B3包括如下步骤:
步骤B31、根据最佳聚类个数k,任选聚类数据集中的k个量测残差数据作为初始聚类中心;
步骤B32、对聚类数据集中的每一个量测残差数据,计算其与k个聚类中心数据的距离,选择距离最近的一个归入其类;
步骤B33、聚类数据集中的所有设备的量测残差数据归类完成后,计算k个聚类的量测残差数据平均值,并将平均值作为新的聚类中心,重复步骤B32;
步骤B34、当连续两次聚类的聚类结果完全一致,终止步骤B32和B33循环,确定最终的聚类结果。
步骤B4、在聚类结果中确定电力***的异常数据的数量和位置。
具体地,确定电力***的异常数据的数量和位置的方法为:
1)若最佳聚类个数为1,则不存在异常数据;
2)若最佳聚类个数大于1,则存在异常数据;在聚类结果中,计算每一聚类中量测误差数据的平均值,平均值最小的聚类为正常数据,其余聚类内的量测误差数据对应的量测全部为异常数据。
在步骤104中,具体还可以包括如下步骤:
根据如下公式,确定估计阈值;其中,所述公式为:
Figure 348989DEST_PATH_IMAGE001
Figure 9777DEST_PATH_IMAGE002
用于表征所述估计阈值,
Figure 89729DEST_PATH_IMAGE003
用于表征与每一次样本数据对应的实际状态 估计值,
Figure 240087DEST_PATH_IMAGE004
用于表征与每一次样本数据对应的预测状态估计值,n用于表征选取的样本数据 的次数;
如果所述实际状态估计值和所述预测状态估计值的差值的绝对值大于所述估计阈值,则确定所述待测数据中存在异常数据。
在本实施例中,上述估计阈值是利用n次样本数据的样本标准差的无偏估计进行确定的,这种方式确定的估计阈值更利于确定出待测数据中存在异常数据。
可见,在上述图1所示过程中,将电力***的待测数据输入到预先训练好的状态估计值预测模型,输出得到预测状态估计值,再根据与待测数据对应的实际状态估计值和该预测状态估计值,识别电力***的异常数据,其中,状态估计值预测模型是利用电力***海量运行数据进行训练得到的。上述技术方案避免了传统识别方法的残差污染和残差淹没的问题,对存在异常数据的电力***能够进行准确预测,提高了电力***异常数据识别的准确性;而且,利用预先训练好的状态估计值预测模型进行识别的运算时间很短,适用于规模较大、数据量较大的电力***,大大提高了在线识别应用的快速性。
图2示出根据另一个实施例的电力***异常数据的识别方法的流程图。参见图2,该方法包括:
步骤201:获取电力***的待测数据和与待测数据对应的实际状态估计值。
步骤202:获取状态估计值预测模型。
步骤203:对待测数据进行降维处理,得到低维待测数据。
步骤204:从低维待测数据中提取数据特征。
步骤205:将从低维待测数据中提取的数据特征输入到状态估计值预测模型,输出得到预测状态估计值。
步骤206:基于实际状态估计值和预测状态估计值的平方误差得到量测残差。
步骤207:对量测残差进行聚类分析,识别电力***的异常数据。
如图3和图4所示,本发明实施例提供了一种智能芯片和电力***异常数据的识别装置。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。从硬件层面而言,如图3所示,为本发明实施例提供的智能芯片的一种硬件结构图,除了图3所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的设备通常还可以包括其他硬件,如负责处理报文的转发芯片等等。以软件实现为例,如图4所示,作为一个逻辑意义上的装置,是通过其所在设备的CPU将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。
如图4所示,本实施例提供的电力***异常数据的识别装置,包括:
第一获取模块401,用于获取电力***的待测数据和与所述待测数据对应的实际状态估计值;
第二获取模块402,用于获取状态估计值预测模型;其中,所述状态估计值预测模型是采用电力***的至少一组样本数据组对循环神经网络进行训练得到的,每一组所述样本数据组均包括样本数据和预先标注的状态估计值;
调用模块403,用于根据所述待测数据,调用所述状态估计值预测模型输出得到预测状态估计值;
识别模块404,用于基于所述实际状态估计值和所述预测状态估计值,识别电力***的异常数据。
在本发明实施例中,第一获取模块401可用于执行上述方法实施例中的步骤101,第二获取模块402可用于执行上述方法实施例中的步骤102,调用模块403可用于执行上述方法实施例中的步骤103,识别模块404可用于执行上述方法实施例中的步骤104。
在本发明的一个实施例中,调用模块403,用于执行如下操作:
从所述待测数据中提取数据特征;其中,所述数据特征包括电流波动特征和/或电压波动特征;
将所述数据特征输入到所述状态估计值预测模型中,输出得到所述预测状态估计值。
在本发明的一个实施例中,还包括:训练模块;
所述训练模块,用于执行如下操作:
获取训练样本集,所述训练样本集包括至少一组所述样本数据组;
对于每一组所述样本数据组,从所述样本数据中提取样本数据特征;
将所述样本数据特征输入到所述循环神经网络,输出得到样本预测状态估计值;其中,所述循环神经网络为长短期记忆模型;
将所述样本预测状态估计值与预先标注的状态估计值进行比较,得到计算损失;其中,所述计算损失用于指示所述样本预测状态估计值与预先标注的状态估计值之间的误差;
根据每一组所述样本数据组各自对应的计算损失,采用误差反向传播算法训练得到所述状态估计值预测模型。
在本发明的一个实施例中,调用模块403,用于执行如下操作:
对所述待测数据进行降维处理,得到低维待测数据;
将所述低维待测数据输入到所述状态估计值预测模型,输出得到预测状态估计值。
在本发明的一个实施例中,调用模块403在执行对所述待测数据进行降维处理,得到低维待测数据时,用于执行如下操作:
将所述待测数据映射到高维,并进行中心化操作,形成数据矩阵;
对所述数据矩阵进行线性转换,得到该数据矩阵的协方差矩阵;
基于所述协方差矩阵的特征值和特征向量,得到低维待测数据。
在本发明的一个实施例中,识别模块404,用于执行如下操作:
基于所述实际状态估计值和所述预测状态估计值的平方误差得到量测残差;
对所述量测残差进行聚类分析,识别电力***的异常数据。
在本发明的一个实施例中,识别模块404在执行所述对所述量测残差进行聚类分析,识别电力***的异常数据时,用于执行如下操作:
将所述量测残差设定为多个聚类;
根据设定的聚类数量、聚类的间隙值和离散度,获得最佳聚类个数;
基于所述最佳聚类个数对所述量测残差进行聚类,得到聚类结果;
在所述聚类结果中确定电力***的异常数据的数量和位置。
在本发明的一个实施例中,识别模块404,用于执行如下操作:
根据如下公式,确定估计阈值;其中,所述公式为:
Figure 772700DEST_PATH_IMAGE001
Figure 237179DEST_PATH_IMAGE002
用于表征所述估计阈值,
Figure 171637DEST_PATH_IMAGE003
用于表征与每一次样本数据对应的实际状态 估计值,
Figure 430580DEST_PATH_IMAGE004
用于表征与每一次样本数据对应的预测状态估计值,n用于表征选取的样本数据 的次数;
如果所述实际状态估计值和所述预测状态估计值的差值的绝对值大于所述估计阈值,则确定所述待测数据中存在异常数据。
可以理解的是,本发明实施例示意的结构并不构成对电力***异常数据的识别装置的具体限定。在本发明的另一些实施例中,电力***异常数据的识别装置可以包括比图示更多或者更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或者软件和硬件的组合来实现。
上述装置内的各模块之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
本发明实施例还提供了一种电力***异常数据的识别装置,包括:至少一个存储器和至少一个处理器;
至少一个存储器,用于存储机器可读程序;
至少一个处理器,用于调用机器可读程序,执行本发明任一实施例中的电力***异常数据的识别方法。
本发明实施例还提供了一种计算机可读介质,存储用于使一计算机执行如本文的电力***异常数据的识别方法的指令。具体地,可以提供配有存储介质的方法或者装置,在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该方法或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。
在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本发明的一部分。
用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上下载程序代码。
此外,应该清楚的是,不仅可以通过执行计算机所读出的程序代码,而且可以通过基于程序代码的指令使计算机上操作的操作方法等来完成部分或者全部的实际操作,从而实现上述实施例中任意一项实施例的功能。
此外,可以理解的是,将由存储介质读出的程序代码写到***计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展单元上的CPU等来执行部分和全部实际操作,从而实现上述实施例中任一实施例的功能。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修复,或者对其中部分技术特征进行等同替换;而这些修复或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种电力***异常数据的识别方法,其特征在于,包括:
获取电力***的待测数据和与所述待测数据对应的实际状态估计值;
获取状态估计值预测模型;其中,所述状态估计值预测模型是采用电力***的至少一组样本数据组对循环神经网络进行训练得到的,每一组所述样本数据组均包括样本数据和预先标注的状态估计值;
根据所述待测数据,调用所述状态估计值预测模型输出得到预测状态估计值;
基于所述实际状态估计值和所述预测状态估计值,识别电力***的异常数据。
2.根据权利要求1所述的方法,其特征在于,所述根据所述待测数据,调用所述状态估计值预测模型输出得到预测状态估计值,包括:
从所述待测数据中提取数据特征;其中,所述数据特征包括电流波动特征和/或电压波动特征;
将所述数据特征输入到所述状态估计值预测模型中,输出得到所述预测状态估计值。
3.根据权利要求1所述的方法,其特征在于,在所述状态估计值预测模型之前,还包括:
获取训练样本集,所述训练样本集包括至少一组所述样本数据组;
对于每一组所述样本数据组,从所述样本数据中提取样本数据特征;
将所述样本数据特征输入到所述循环神经网络,输出得到样本预测状态估计值;其中,所述循环神经网络为长短期记忆模型;
将所述样本预测状态估计值与预先标注的状态估计值进行比较,得到计算损失;其中,所述计算损失用于指示所述样本预测状态估计值与预先标注的状态估计值之间的误差;
根据每一组所述样本数据组各自对应的计算损失,采用误差反向传播算法训练得到所述状态估计值预测模型。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述根据所述待测数据,调用所述状态估计值预测模型输出得到预测状态估计值,包括:
对所述待测数据进行降维处理,得到低维待测数据;
将所述低维待测数据输入到所述状态估计值预测模型,输出得到预测状态估计值。
5.根据权利要求4所述的方法,其特征在于,所述对所述待测数据进行降维处理,得到低维待测数据,包括:
将所述待测数据映射到高维,并进行中心化操作,形成数据矩阵;
对所述数据矩阵进行线性转换,得到该数据矩阵的协方差矩阵;
基于所述协方差矩阵的特征值和特征向量,得到低维待测数据。
6.根据权利要求1-3中任一项所述的方法,其特征在于,所述基于所述实际状态估计值和所述预测状态估计值,识别电力***的异常数据,包括:
基于所述实际状态估计值和所述预测状态估计值的平方误差得到量测残差;
对所述量测残差进行聚类分析,识别电力***的异常数据。
7.根据权利要求1-3中任一项所述的方法,其特征在于,所述基于所述实际状态估计值和所述预测状态估计值,识别电力***的异常数据,包括:
根据如下公式,确定估计阈值;其中,所述公式为:
Figure 973355DEST_PATH_IMAGE001
Figure DEST_PATH_IMAGE002
用于表征所述估计阈值,
Figure 93757DEST_PATH_IMAGE003
用于表征与每一次样本数据对应的实际状态估计 值,
Figure DEST_PATH_IMAGE004
用于表征与每一次样本数据对应的预测状态估计值,n用于表征选取的样本数据的次 数;
如果所述实际状态估计值和所述预测状态估计值的差值的绝对值大于所述估计阈值,则确定所述待测数据中存在异常数据。
8.一种电力***异常数据的识别装置,其特征在于,包括:
第一获取模块,用于获取电力***的待测数据和与所述待测数据对应的实际状态估计值;
第二获取模块,用于获取状态估计值预测模型;其中,所述状态估计值预测模型是采用电力***的至少一组样本数据组对循环神经网络进行训练得到的,每一组所述样本数据组均包括样本数据和预先标注的状态估计值;
调用模块,用于根据所述待测数据,调用所述状态估计值预测模型输出得到预测状态估计值;
识别模块,用于基于所述实际状态估计值和所述预测状态估计值,识别电力***的异常数据。
9.一种智能芯片,其特征在于,包括:至少一个存储器和至少一个处理器;
所述至少一个存储器,用于存储机器可读程序;
所述至少一个处理器,用于调用所述机器可读程序,执行权利要求1-7中任一项所述的方法。
10.一种计算机可读介质,其特征在于,所述计算机可读介质上存储有计算机指令,所述计算机指令在被处理器执行时,使所述处理器执行权利要求1-7中任一项所述的方法。
CN202110587768.3A 2021-05-28 2021-05-28 一种电力***异常数据的识别方法、装置和智能芯片 Active CN113255775B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110587768.3A CN113255775B (zh) 2021-05-28 2021-05-28 一种电力***异常数据的识别方法、装置和智能芯片

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110587768.3A CN113255775B (zh) 2021-05-28 2021-05-28 一种电力***异常数据的识别方法、装置和智能芯片

Publications (2)

Publication Number Publication Date
CN113255775A true CN113255775A (zh) 2021-08-13
CN113255775B CN113255775B (zh) 2021-09-24

Family

ID=77185013

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110587768.3A Active CN113255775B (zh) 2021-05-28 2021-05-28 一种电力***异常数据的识别方法、装置和智能芯片

Country Status (1)

Country Link
CN (1) CN113255775B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114580467A (zh) * 2022-02-22 2022-06-03 国网山东省电力公司信息通信公司 基于数据增强和Tri-Training的电力数据异常检测方法及***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101893430A (zh) * 2010-07-20 2010-11-24 哈尔滨工业大学 基于cnc齿轮测量中心的测量异常值处理方法
CN108629371A (zh) * 2018-05-02 2018-10-09 电子科技大学 一种对二维时频数据的数据降维方法
CN108900546A (zh) * 2018-08-13 2018-11-27 杭州安恒信息技术股份有限公司 基于lstm的时间序列网络异常检测的方法与装置
CN110298369A (zh) * 2018-03-21 2019-10-01 中国电力科学研究院有限公司 一种电力***不良数据的辨识方法及***
US20200104224A1 (en) * 2018-09-27 2020-04-02 Kabushiki Kaisha Toshiba Anomaly detection device, anomaly detection method and storage medium

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101893430A (zh) * 2010-07-20 2010-11-24 哈尔滨工业大学 基于cnc齿轮测量中心的测量异常值处理方法
CN110298369A (zh) * 2018-03-21 2019-10-01 中国电力科学研究院有限公司 一种电力***不良数据的辨识方法及***
CN108629371A (zh) * 2018-05-02 2018-10-09 电子科技大学 一种对二维时频数据的数据降维方法
CN108900546A (zh) * 2018-08-13 2018-11-27 杭州安恒信息技术股份有限公司 基于lstm的时间序列网络异常检测的方法与装置
US20200104224A1 (en) * 2018-09-27 2020-04-02 Kabushiki Kaisha Toshiba Anomaly detection device, anomaly detection method and storage medium

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114580467A (zh) * 2022-02-22 2022-06-03 国网山东省电力公司信息通信公司 基于数据增强和Tri-Training的电力数据异常检测方法及***
CN114580467B (zh) * 2022-02-22 2023-11-17 国网山东省电力公司信息通信公司 基于数据增强和Tri-Training的电力数据异常检测方法及***

Also Published As

Publication number Publication date
CN113255775B (zh) 2021-09-24

Similar Documents

Publication Publication Date Title
CN112731260B (zh) 基于概念漂移识别的电压互感器误差状态在线评估方法
CN112101765A (zh) 一种配电网运行指标数据异常数据处理方法及***
CN113255775B (zh) 一种电力***异常数据的识别方法、装置和智能芯片
CN114386537A (zh) 基于CatBoost的锂电池故障诊断方法、装置及电子设备
CN111768034A (zh) 一种电力负荷预测中基于近邻算法进行插补补充缺失值的方法
CN111738348A (zh) 一种电力数据异常检测方法和装置
CN113484817A (zh) 基于tsvm模型的智能电能表自动化检定***异常检测方法
CN111104241A (zh) 基于自编码器的服务器内存异常检测方法、***及设备
CN116070302A (zh) 一种电缆绝缘状态的预测方法及装置
CN115526258A (zh) 基于Spearman相关系数特征提取的电力***暂稳评估方法
CN107274025B (zh) 一种实现用电模式智能识别与管理的***和方法
CN117711295A (zh) 基于人工智能的显示模组控制方法、装置、芯片及介质
CN112949201A (zh) 一种风速预测方法、装置、电子设备及存储介质
CN117152529A (zh) 基于目标检测算法的电力***故障诊断方法
CN116630989A (zh) 智能电表可视故障检测方法、***、电子设备及存储介质
CN116400266A (zh) 基于数字孪生模型的变压器故障检测方法、装置及介质
CN115239971A (zh) Gis局部放电类型识别模型训练方法、识别方法及***
CN110334125A (zh) 一种配电网量测异常数据辨识方法及装置
CN116079498A (zh) 一种刀具异常信号的识别方法
CN112416709A (zh) 芯片动态功耗估计方法、装置、处理器芯片及服务器
CN116796213B (zh) 一种基于聚类算法的配电网线变关系辨识方法
CN117494588B (zh) 一种风机轴承剩余有效寿命优化方法、设备及介质
CN113239236B (zh) 视频处理方法、装置、电子设备及存储介质
CN117277422B (zh) 一种直驱风电场稳定评估方法、***、终端及介质
CN117829625A (zh) 电压互感器的误差状态预测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20221215

Address after: 807-3, floor 8, block F, No. 9, Shangdi Third Street, Haidian District, Beijing 100080

Patentee after: Zhongcheng Hualong Computer Technology Co.,Ltd.

Address before: No.114, 14th floor, block B, building 1, No.38, Zhongguancun Street, Haidian District, Beijing 100082

Patentee before: Shenwei Super Computing (Beijing) Technology Co.,Ltd.

TR01 Transfer of patent right