CN113554117A - 异常负荷数据识别方法及电子设备 - Google Patents

异常负荷数据识别方法及电子设备 Download PDF

Info

Publication number
CN113554117A
CN113554117A CN202110939592.3A CN202110939592A CN113554117A CN 113554117 A CN113554117 A CN 113554117A CN 202110939592 A CN202110939592 A CN 202110939592A CN 113554117 A CN113554117 A CN 113554117A
Authority
CN
China
Prior art keywords
load data
abnormal
load
data
subset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110939592.3A
Other languages
English (en)
Inventor
张蔷
周毓敏
马骞
李豹
王巍
王子强
刘梅
周辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Tsingsoft Technology Co ltd
China Southern Power Grid Co Ltd
Original Assignee
Beijing Tsingsoft Technology Co ltd
China Southern Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Tsingsoft Technology Co ltd, China Southern Power Grid Co Ltd filed Critical Beijing Tsingsoft Technology Co ltd
Priority to CN202110939592.3A priority Critical patent/CN113554117A/zh
Publication of CN113554117A publication Critical patent/CN113554117A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Water Supply & Treatment (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明适用于电力技术领域,提供了一种异常负荷数据识别方法及电子设备,所述方法包括:获取目标负荷数据集;针对每个预设采集时刻,从目标负荷数据集中提取各日的该预设采集时刻对应的负荷数据,得到该预设采集时刻对应的负荷数据子集;针对每个负荷数据子集,根据该负荷数据子集中各个负荷数据的密度确定该负荷数据子集对应的异常数据域;根据各个负荷数据子集对应的异常数据域确定目标负荷数据集对应的异常数据域,并基于目标负荷数据集对应的异常数据域,识别目标负荷数据集中异常的负荷数据。本发明能够更准确地识别异常的负荷数据。

Description

异常负荷数据识别方法及电子设备
技术领域
本发明属于电力技术领域,尤其涉及一种异常负荷数据识别方法及电子设备。
背景技术
随着电力网络智能化水平的提高和电力市场改革的深入,电力负荷数据逐渐成为应用最为广泛的数据之一,其在电力***运行、电力消费分析和用电需求管控等方面都起到了不可替代的作用。
电力负荷数据会因为方方面面的原因而偏离其常规数值,所以在应用电力负荷数据之前,对负荷数据中的异常值进行识别和修正显得尤为重要。
然而,在异常负荷数据识别方面,现有技术通常只是根据某一天的负荷数据连续性来分析识别异常值,不能客观反映异常情况,识别准确率低。
发明内容
有鉴于此,本发明实施例提供了一种异常负荷数据识别方法及电子设备,以解决现有技术中的异常负荷数据识别方法识别准确率低的问题。
本发明实施例的第一方面提供了一种异常负荷数据识别方法,包括:
获取目标负荷数据集;其中,目标负荷数据集为多日的负荷数据,每日均包括多个预设采集时刻,每个预设采集时刻对应一个负荷数据;
针对每个预设采集时刻,从目标负荷数据集中提取各日的该预设采集时刻对应的负荷数据,得到该预设采集时刻对应的负荷数据子集;
针对每个负荷数据子集,根据该负荷数据子集中各个负荷数据的密度确定该负荷数据子集对应的异常数据域;
根据各个负荷数据子集对应的异常数据域确定目标负荷数据集对应的异常数据域,并基于目标负荷数据集对应的异常数据域,识别目标负荷数据集中异常的负荷数据。
可选的,根据该负荷数据子集中各个负荷数据的密度确定该负荷数据子集对应的异常数据域,包括:
根据该负荷数据子集中各个负荷数据的密度计算该负荷数据子集对应的中心负荷,并计算该负荷数据子集中的各个负荷数据与中心负荷的偏差值;
根据各个偏差值确定该负荷数据子集对应的偏差标准正态分布;
基于偏差标准正态分布确定该负荷数据子集对应的异常数据域。
可选的,根据该负荷数据子集中各个负荷数据的密度计算该负荷数据子集对应的中心负荷,包括:
根据各个负荷数据的密度计算各个负荷数据的权重值;
根据
Figure BDA0003214276820000021
确定该负荷数据子集对应的中心负荷;
其中,
Figure BDA0003214276820000022
为该负荷数据子集对应的中心负荷,L为该负荷数据子集中的负荷数据的数量,wi为该负荷数据子集中第i个负荷数据的权重值,yi为该负荷数据子集中的第i个负荷数据。
可选的,根据各个负荷数据的密度计算各个负荷数据的权重值的公式为:
Figure BDA0003214276820000023
式中,l为该负荷数据子集对应的中心负荷,li和lj分别为该负荷数据子集中的第i个和第j个负荷数据,Kernh为尺度为h的高斯核函数。
可选的,根据各个偏差值确定该负荷数据子集对应的偏差标准正态分布,包括:
根据各个偏差值计算偏差标准正态分布的方差,并根据偏差标准正态分布的方差确定偏差标准正态分布;
其中,根据各个偏差值计算偏差标准正态分布的方差的公式为:
Figure BDA0003214276820000031
式中,σ2为偏差标准正态分布的方差,L为该负荷数据子集中的负荷数据的数量,
Figure BDA0003214276820000032
为该负荷数据子集对应的中心负荷,yi为该负荷数据子集对中的第i个负荷数据。
可选的,基于偏差标准正态分布确定的该负荷数据子集对应的异常数据域为:
Figure BDA0003214276820000033
式中,
Figure BDA0003214276820000034
为该负荷数据子集对应的异常数据域,α为偏差标准正态分布的预设置信度,
Figure BDA0003214276820000035
为偏差标准正态分布的标准差,y为负荷数据变量,
Figure BDA0003214276820000036
为该负荷数据子集对应的中心负荷,
Figure BDA0003214276820000037
为偏差标准正态分布的100×(1-α/2)分位数。
可选的,根据各个负荷数据子集对应的异常数据域确定目标负荷数据集对应的异常数据域,包括:
计算各个负荷数据子集对应的异常数据域的并集,得到目标负荷数据集对应的异常数据域;
相应的,基于目标负荷数据集对应的异常数据域,识别目标负荷数据集中异常的负荷数据,包括:
若目标负荷数据集中的某个负荷数据位于异常数据域内,则将该负荷数据识别为异常的负荷数据。
可选的,在识别目标负荷数据集中异常的负荷数据之后,还包括对异常的负荷数据进行修正的过程;对异常的负荷数据进行修正,包括:
获取异常的负荷数据所在日的至少一个负荷相似日;
获取异常的负荷数据对应的采集时刻;
从各个负荷相似日的负荷数据中提取该采集时刻的负荷数据,并根据各个负荷相似日的该采集时刻的负荷数据对异常的负荷数据进行修正。
本发明实施例的第二方面提供了一种异常负荷数据识别装置,包括:
获取模块,用于获取目标负荷数据集;其中,目标负荷数据集为多日的负荷数据,每日均包括多个预设采集时刻,每个预设采集时刻对应一个负荷数据;
提取模块,用于针对每个预设采集时刻,从目标负荷数据集中提取各日的该预设采集时刻对应的负荷数据,得到该预设采集时刻对应的负荷数据子集;
确定模块,用于针对每个负荷数据子集,根据该负荷数据子集中各个负荷数据的密度确定该负荷数据子集对应的异常数据域;
识别模块,用于根据各个负荷数据子集对应的异常数据域确定目标负荷数据集对应的异常数据域,并基于目标负荷数据集对应的异常数据域,识别目标负荷数据集中异常的负荷数据。
本发明实施例的第三方面提供了一种电子设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上述异常负荷数据识别的步骤。
本发明实施例的第四方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现如上述异常负荷数据识别方法的步骤。
本发明实施例与现有技术相比存在的有益效果是:
本发明实施例通过对多日的负荷数据进行综合分析,即首先横向分析,根据每天同一时刻的负荷数据的密度确定该时刻对应的异常数据域,然后纵向分析,根据各个时刻对应的异常数据域求出多日负荷数据对应的整体异常数据域来识别异常的负荷数据。本发明实施例综合考虑了负荷数据的横向连续性和纵向连续性,能够更准确地识别异常的负荷数据。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的异常负荷数据识别方法的实现流程示意图;
图2是本发明实施例提供的异常负荷识别修正结果的示意图;
图3是本发明实施例提供的异常负荷识别修正结果的示意图;
图4是本发明实施例提供的异常负荷数据识别装置的结构示意图;
图5是本发明实施例提供的电子设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定***结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的***、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
伴随着中国智能电表普及程度的提高,海量的电力负荷数据被采集并上传至集控中心。面对如此庞大的数据量,通过人工来识别异常值是不现实的想法,必须采用高效且可靠的数据处理方法来自动完成。在智能电网环境下,有研究对电力负荷数据质量问题进行记录,重点针对负荷异常值的形成原因和当前检测方法进行了总结。在负荷异常值识别方面,有研究采用样本聚类深度对畸变负荷形状进行识别,利用传统的t检验法进行异常数据点检验;也有研究改善了神经网络模式漂移不足的问题,提出了异常数据识别与调整模型;有研究把模糊软聚类的思想融入神经网络模型,结合径向基函数(RBF)网络,形成了异常数据识别和清洗模型;还有研究提出一种基于多源信息的动态数据处理技术,利用能量管理***数据来源渠道多的特点,修正负荷异常值。
然而,本申请的发明人发现,到目前为止,在异常负荷数据的识别与修正方面,现有技术大都只根据某一天的负荷数据连续性来分析识别异常值,即在一个维度中进行处理,具有一定的局限性。有鉴于此,本发明提出一种基于改进的密度估计算法的电网负荷大数据异常识别与修正方法,同时考虑了负荷的横向连续性与纵向连续性,把每天96点负荷曲线数据按日期排列成二维数据集,然后使用密度估计方法,从整体上对异常数据进行识别,最后对识别出的异常数据进行修正,仿真结果表明这种方法是有效的。
为了便于理解,首先对本发明中改进的密度估计算法的原理进行整体介绍:
(1)假设有一个数据点总数为M的二维数据集Z;
(2)产生一个称为种子群的数据集S,其所含的种子个数N预先确定,相邻种子之间的距离恒等,且种子群的范围包含数据集Z;
(3)每个数据点zj(j∈{1,2,…,M})均附有一个初值为0的种子吸附计数器ci,用于累计该数据点吸附的种子数目;
(4)对于每个种子si(i∈{1,2,…,N}),分别计算它与数据集Z中的各个数据点之间的欧式距离,假设距离种子si最近的数据点为zk,则将该数据点zk所附带的种子吸附计数器ck加1,如果存在p个数据点与种子si的距离相等且均为最近,则将p个数据点的种子吸附计数器均累加1/p;
(5)如果某个数据点的种子吸附计数器的值大,则表明该数据点吸附的种子多,即该数据点的邻域内与其竞争分享这些种子的数据点不多,该数据点密度低;若某一数据点的邻域内存在许多数据点,那么该数据点与其周围的数据点在吸附种子时就存在较为激烈的竞争,每个数据点所吸附的种子数目就较少。因此,数据点的密度低表示在其邻域内出现数据点的概率较小,这样就可把种子吸附计数器值高于某个设定值的数据点归为异常数据。
基于以上内容,参见图1所示,本发明实施例提供了一种异常负荷数据识别方法,该方法包括以下步骤:
步骤S101,获取目标负荷数据集;其中,目标负荷数据集为多日的负荷数据,每日均包括多个预设采集时刻,每个预设采集时刻对应一个负荷数据。
在本发明实施例中,负荷数据可以从电网的信息采集***中获取,信息采集***可以每15分钟采集一次负荷数据,一天共采集96次,即每日包括96个预设采集时刻,多日的负荷数据形成负荷数据集。
步骤S102,针对每个预设采集时刻,从目标负荷数据集中提取各日的该预设采集时刻对应的负荷数据,得到该预设采集时刻对应的负荷数据子集。
在本发明实施例中,首先将每天同一时刻的负荷数据提取出来,形成负荷数据子集,以对负荷数据的横向连续性进行分析。
步骤S103,针对每个负荷数据子集,根据该负荷数据子集中各个负荷数据的密度确定该负荷数据子集对应的异常数据域。
在本发明实施例中,采用密度估计方法寻找负荷数据子集对应的异常数据域,对于某个负荷数据,其密度越高,异常的概率越低,相反,密度越低,异常的概率越高。通过对负荷数据子集的密度进行分析,能够确定负荷数据子集对应的异常数据域,实现负荷数据的横向连续性分析。
步骤S104,根据各个负荷数据子集对应的异常数据域确定目标负荷数据集对应的异常数据域,并基于目标负荷数据集对应的异常数据域,识别目标负荷数据集中异常的负荷数据。
在本发明实施例中,根据各个负荷数据子集对应的异常数据域确定整体的异常数据域来识别异常的负荷数据,实现负荷数据的纵向连续性分析。
可见,本发明实施例通过对多日的负荷数据进行综合分析,即首先横向分析,根据每天同一时刻的负荷数据的密度确定该时刻对应的异常数据域,然后纵向分析,根据各个时刻对应的异常数据域求出多日负荷数据对应的整体异常数据域来识别异常的负荷数据。本发明实施例综合考虑了负荷数据的横向连续性和纵向连续性,能够更准确地识别异常的负荷数据。
可选的,在一种可能的实现方式中,根据该负荷数据子集中各个负荷数据的密度确定该负荷数据子集对应的异常数据域,可以详述为:
根据该负荷数据子集中各个负荷数据的密度计算该负荷数据子集对应的中心负荷,并计算该负荷数据子集中的各个负荷数据与中心负荷的偏差值;
根据各个偏差值确定该负荷数据子集对应的偏差标准正态分布;
基于偏差标准正态分布确定该负荷数据子集对应的异常数据域。
在本发明实施例中,在对每日同一时刻的负荷数据进行横向连续性分析中,通过负荷数据的密度计算出中心负荷,再计算各个负荷数据域域中心负荷之间的偏差值,根据偏差值的正态分布规律来确定异常数据域。
可选的,在一种可能的实现方式中,根据该负荷数据子集中各个负荷数据的密度计算该负荷数据子集对应的中心负荷,可以详述为:
根据各个负荷数据的密度计算各个负荷数据的权重值;
根据
Figure BDA0003214276820000081
确定该负荷数据子集对应的中心负荷;
其中,
Figure BDA0003214276820000082
为该负荷数据子集对应的中心负荷,L为该负荷数据子集中的负荷数据的数量,wi为该负荷数据子集中第i个负荷数据的权重值,yi为该负荷数据子集中的第i个负荷数据。
在本发明实施例中,具体的,根据各个负荷数据的密度为各个负荷数据分配相应的权重值,即为密度较高的负荷数据分配较高的权重值,为密度较低的负荷数据分配较低的权重值,各个负荷数据乘以各自权重值求和,并计算平均值,得到中心负荷。该方法得到的中心负荷更客观准确。
可选的,在一种可能的实现方式中,根据各个负荷数据的密度计算各个负荷数据的权重值的公式为:
Figure BDA0003214276820000083
式中,l为该负荷数据子集对应的中心负荷,li和lj分别为该负荷数据子集中的第i个和第j个负荷数据,Kernh为尺度为h的高斯核函数。
在本发明实施例中,采用高斯核函数
Figure BDA0003214276820000084
计算负荷数据的概率密度,并确定各个负荷数据对应的权重值。
可选的,在一种可能的实现方式中,根据各个偏差值确定该负荷数据子集对应的偏差标准正态分布,可以详述为:
根据各个偏差值计算偏差标准正态分布的方差,并根据偏差标准正态分布的方差确定偏差标准正态分布;
其中,根据各个偏差值计算偏差标准正态分布的方差的公式为:
Figure BDA0003214276820000091
式中,σ2为偏差标准正态分布的方差,L为该负荷数据子集中的负荷数据的数量,
Figure BDA0003214276820000092
为该负荷数据子集对应的中心负荷,yi为该负荷数据子集对中的第i个负荷数据。
在本发明实施例中,对于同一时刻,各个负荷数据与中心负荷的偏差值应服从均值为0、方差为σ2的标准正态分布。
可选的,在一种可能的实现方式中,基于偏差标准正态分布确定的该负荷数据子集对应的异常数据域为:
Figure BDA0003214276820000093
式中,
Figure BDA0003214276820000094
为该负荷数据子集对应的异常数据域,α为偏差标准正态分布的预设置信度,
Figure BDA0003214276820000095
为偏差标准正态分布的标准差,y为负荷数据变量,
Figure BDA0003214276820000096
为该负荷数据子集对应的中心负荷,
Figure BDA0003214276820000097
为偏差标准正态分布的100×(1-α/2)分位数。
在本发明实施例中,根据偏差标准正态分布定义异常数据域,即将偏差值不服从标准正态分布的负荷数据,定义为异常数据。
可选的,在一种可能的实现方式中,根据各个负荷数据子集对应的异常数据域确定目标负荷数据集对应的异常数据域,可以详述为:
计算各个负荷数据子集对应的异常数据域的并集,得到目标负荷数据集对应的异常数据域;
相应的,基于目标负荷数据集对应的异常数据域,识别目标负荷数据集中异常的负荷数据,包括:
若目标负荷数据集中的某个负荷数据位于异常数据域内,则将该负荷数据识别为异常的负荷数据。
在本发明实施例中,仅对负荷数据进行横向连续分析不能客观准确地反应异常数据,还需要通过计算各个负荷数据子集对应的异常数据域的并集,考虑负荷数据的纵向连续性。即从整体上而言,本发明先对每天同一时刻进行分析,再对连续时刻进行分析,综合识别异常数据,提高了异常数据的识别率。
可选的,在一种可能的实现方式中,在识别目标负荷数据集中异常的负荷数据之后,还包括对异常的负荷数据进行修正的过程;对异常的负荷数据进行修正,可以详述为:
获取异常的负荷数据所在日的至少一个负荷相似日;
获取异常的负荷数据对应的采集时刻;
从各个负荷相似日的负荷数据中提取该采集时刻的负荷数据,并根据各个负荷相似日的该采集时刻的负荷数据对异常的负荷数据进行修正。
在本发明实施例中,在负荷异常值修正方面,可以分情况采用常规加权均值法和基于负荷水平映射的加权均值法。
当待修正日能够找到负荷相似日,采用常规加权均值法,常规加权均值法是选取负荷相似日的负荷数据作为参考。修正公式如下:
Figure BDA0003214276820000101
式中,ma为选取的相似日个数,yd-i,t和λi分别为第d-i天t时刻的负荷观测值和对待修正值的影响权重。
当待修正日未找到负荷相似日,可以采用引入了负荷水平映射关系的加权均值法,公式如下:
Figure BDA0003214276820000102
式中,mb为选取的邻近日个数,f(yd-i,t)和λi分别为第d-i天t时刻的映射负荷值和对待修正值的影响权重。
以下,基于实例,采用传统神经网络算法作为对比,对本发明实施例的异常负荷数据识别方法进行可行性验证:
选取某省2020年全年负荷数据作为样本,人为设置了部分数据错误点,异常数据率为24/1920=1.25%。
图2和图3分别为对1月15日第5、6、7、8点异常负荷的修正值、对3月10日第4、19点异常负荷的修正值。两图中,曲线1均代表实际负荷数据,曲线4为人为修改的异常负荷数据,曲线2与曲线3分别代表基于本方法(方法A)与传统神经网络(方法B)对异常负荷点的修正值。对比上图中曲线可知,利用方法A修正的负荷曲线在数值上更接近于原始正常负荷值。其中,方法A对连续点与单点异常值修正的平均相对误差分别为3.58%、1.36%,而方法B的平均相对误差为5.14%、2.80%。显然,无论是修正连续多点的异常负荷数据,还是修正单个异常点的负荷数据,采用本发明实施例提出的异常负荷数据识别方法能够准确识别异常数据,并且修正精度远高于使用神经网络对异常负荷数据的修正结果。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
参见图4所示,本发明实施例的第二方面提供了一种异常负荷数据识别装置,该装置40包括:
获取模块41,用于获取目标负荷数据集;其中,目标负荷数据集为多日的负荷数据,每日均包括多个预设采集时刻,每个预设采集时刻对应一个负荷数据。
提取模块42,用于针对每个预设采集时刻,从目标负荷数据集中提取各日的该预设采集时刻对应的负荷数据,得到该预设采集时刻对应的负荷数据子集。
确定模块43,用于针对每个负荷数据子集,根据该负荷数据子集中各个负荷数据的密度确定该负荷数据子集对应的异常数据域。
识别模块44,用于根据各个负荷数据子集对应的异常数据域确定目标负荷数据集对应的异常数据域,并基于目标负荷数据集对应的异常数据域,识别目标负荷数据集中异常的负荷数据。
可选的,在一种可能的实现方式中,确定模块43用于:
根据该负荷数据子集中各个负荷数据的密度计算该负荷数据子集对应的中心负荷,并计算该负荷数据子集中的各个负荷数据与中心负荷的偏差值;
根据各个偏差值确定该负荷数据子集对应的偏差标准正态分布;
基于偏差标准正态分布确定该负荷数据子集对应的异常数据域。
可选的,在一种可能的实现方式中,确定模块43用于:
根据各个负荷数据的密度计算各个负荷数据的权重值;
根据
Figure BDA0003214276820000121
确定该负荷数据子集对应的中心负荷;
其中,
Figure BDA0003214276820000122
为该负荷数据子集对应的中心负荷,L为该负荷数据子集中的负荷数据的数量,wi为该负荷数据子集中第i个负荷数据的权重值,yi为该负荷数据子集中的第i个负荷数据。
可选的,在一种可能的实现方式中,确定模块43用于根据以下公式计算各个负荷数据的权重值:
Figure BDA0003214276820000123
式中,l为该负荷数据子集对应的中心负荷,li和lj分别为该负荷数据子集中的第i个和第j个负荷数据,Kernh为尺度为h的高斯核函数。
可选的,在一种可能的实现方式中,确定模块43用于:
根据各个偏差值计算偏差标准正态分布的方差,并根据偏差标准正态分布的方差确定偏差标准正态分布;
其中,根据各个偏差值计算偏差标准正态分布的方差的公式为:
Figure BDA0003214276820000124
式中,σ2为偏差标准正态分布的方差,L为该负荷数据子集中的负荷数据的数量,
Figure BDA0003214276820000131
为该负荷数据子集对应的中心负荷,yi为该负荷数据子集对中的第i个负荷数据。
可选的,在一种可能的实现方式中,确定模块43用于:
Figure BDA0003214276820000132
式中,
Figure BDA0003214276820000133
为该负荷数据子集对应的异常数据域,α为偏差标准正态分布的预设置信度,
Figure BDA0003214276820000134
为偏差标准正态分布的标准差,y为负荷数据变量,
Figure BDA0003214276820000135
为该负荷数据子集对应的中心负荷,
Figure BDA0003214276820000136
为偏差标准正态分布的100×(1-α/2)分位数。
可选的,在一种可能的实现方式中,识别模块44用于:
计算各个负荷数据子集对应的异常数据域的并集,得到目标负荷数据集对应的异常数据域;
相应的,基于目标负荷数据集对应的异常数据域,识别目标负荷数据集中异常的负荷数据,包括:
若目标负荷数据集中的某个负荷数据位于异常数据域内,则将该负荷数据识别为异常的负荷数据。
可选的,在识别目标负荷数据集中异常的负荷数据之后,识别模块44还用于:
获取异常的负荷数据所在日的至少一个负荷相似日;
获取异常的负荷数据对应的采集时刻;
从各个负荷相似日的负荷数据中提取该采集时刻的负荷数据,并根据各个负荷相似日的该采集时刻的负荷数据对异常的负荷数据进行修正。
图5是本发明实施例提供的电子设备50的示意图。如图5所示,该实施例的电子设备50包括:处理器51、存储器52以及存储在存储器52中并可在处理器51上运行的计算机程序53,例如异常负荷数据识别程序。处理器51执行计算机程序53时实现上述各个异常负荷数据识别方法实施例中的步骤,例如图1所示的步骤S101至S104。或者,处理器51执行计算机程序53时实现上述各装置实施例中各模块的功能,例如图4所示模块41至44的功能。
示例性的,计算机程序53可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器52中,并由处理器51执行,以完成本发明。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序53在电子设备50中的执行过程。例如,计算机程序53可以被分割成获取模块41、提取模块42、确定模块43、识别模块44(虚拟装置中的模块),各模块具体功能如下:
获取模块41,用于获取目标负荷数据集;其中,目标负荷数据集为多日的负荷数据,每日均包括多个预设采集时刻,每个预设采集时刻对应一个负荷数据。
提取模块42,用于针对每个预设采集时刻,从目标负荷数据集中提取各日的该预设采集时刻对应的负荷数据,得到该预设采集时刻对应的负荷数据子集。
确定模块43,用于针对每个负荷数据子集,根据该负荷数据子集中各个负荷数据的密度确定该负荷数据子集对应的异常数据域。
识别模块44,用于根据各个负荷数据子集对应的异常数据域确定目标负荷数据集对应的异常数据域,并基于目标负荷数据集对应的异常数据域,识别目标负荷数据集中异常的负荷数据。
电子设备50可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。电子设备50可包括,但不仅限于,处理器51、存储器52。本领域技术人员可以理解,图5仅仅是电子设备50的示例,并不构成对电子设备50的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如电子设备50还可以包括输入输出设备、网络接入设备、总线等。
所称处理器51可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器52可以是电子设备50的内部存储单元,例如电子设备50的硬盘或内存。存储器52也可以是电子设备50的外部存储设备,例如电子设备50上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器52还可以既包括电子设备50的内部存储单元也包括外部存储设备。存储器52用于存储计算机程序以及电子设备50所需的其他程序和数据。存储器52还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述***中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/电子设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/电子设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种异常负荷数据识别方法,其特征在于,包括:
获取目标负荷数据集;其中,所述目标负荷数据集为多日的负荷数据,每日均包括多个预设采集时刻,每个预设采集时刻对应一个负荷数据;
针对每个预设采集时刻,从所述目标负荷数据集中提取各日的该预设采集时刻对应的负荷数据,得到该预设采集时刻对应的负荷数据子集;
针对每个负荷数据子集,根据该负荷数据子集中各个负荷数据的密度确定该负荷数据子集对应的异常数据域;
根据各个负荷数据子集对应的异常数据域确定所述目标负荷数据集对应的异常数据域,并基于所述目标负荷数据集对应的异常数据域,识别所述目标负荷数据集中异常的负荷数据。
2.如权利要求1所述的异常负荷数据识别方法,其特征在于,根据该负荷数据子集中各个负荷数据的密度确定该负荷数据子集对应的异常数据域,包括:
根据该负荷数据子集中各个负荷数据的密度计算该负荷数据子集对应的中心负荷,并计算该负荷数据子集中的各个负荷数据与所述中心负荷的偏差值;
根据各个偏差值确定该负荷数据子集对应的偏差标准正态分布;
基于所述偏差标准正态分布确定该负荷数据子集对应的异常数据域。
3.如权利要求2所述的异常负荷数据识别方法,其特征在于,根据该负荷数据子集中各个负荷数据的密度计算该负荷数据子集对应的中心负荷,包括:
根据各个负荷数据的密度计算各个负荷数据的权重值;
根据
Figure FDA0003214276810000011
确定该负荷数据子集对应的中心负荷;
其中,
Figure FDA0003214276810000012
为该负荷数据子集对应的中心负荷,L为该负荷数据子集中的负荷数据的数量,wi为该负荷数据子集中第i个负荷数据的权重值,yi为该负荷数据子集中的第i个负荷数据。
4.如权利要求3所述的异常负荷数据识别方法,其特征在于,根据各个负荷数据的密度计算各个负荷数据的权重值的公式为:
Figure FDA0003214276810000021
式中,l为该负荷数据子集对应的中心负荷,li和lj分别为该负荷数据子集中的第i个和第j个负荷数据,Kernh为尺度为h的高斯核函数。
5.如权利要求2所述的异常负荷数据识别方法,其特征在于,根据各个偏差值确定该负荷数据子集对应的偏差标准正态分布,包括:
根据各个偏差值计算所述偏差标准正态分布的方差,并根据所述偏差标准正态分布的方差确定所述偏差标准正态分布;
其中,根据各个偏差值计算所述偏差标准正态分布的方差的公式为:
Figure FDA0003214276810000022
式中,σ2为所述偏差标准正态分布的方差,L为该负荷数据子集中的负荷数据的数量,
Figure FDA0003214276810000023
为该负荷数据子集对应的中心负荷,yi为该负荷数据子集对中的第i个负荷数据。
6.如权利要求2所述的异常负荷数据识别方法,其特征在于,基于所述偏差标准正态分布确定的该负荷数据子集对应的异常数据域为:
Figure FDA0003214276810000024
式中,
Figure FDA0003214276810000025
为该负荷数据子集对应的异常数据域,α为所述偏差标准正态分布的预设置信度,
Figure FDA0003214276810000026
为所述偏差标准正态分布的标准差,y为负荷数据变量,
Figure FDA0003214276810000027
为该负荷数据子集对应的中心负荷,
Figure FDA0003214276810000028
为所述偏差标准正态分布的100×(1-α/2)分位数。
7.如权利要求1所述的异常负荷数据识别方法,其特征在于,根据各个负荷数据子集对应的异常数据域确定所述目标负荷数据集对应的异常数据域,包括:
计算各个负荷数据子集对应的异常数据域的并集,得到所述目标负荷数据集对应的异常数据域;
相应的,基于所述目标负荷数据集对应的异常数据域,识别所述目标负荷数据集中异常的负荷数据,包括:
若所述目标负荷数据集中的某个负荷数据位于所述异常数据域内,则将该负荷数据识别为异常的负荷数据。
8.如权利要求1所述的异常负荷数据识别方法,其特征在于,在识别所述目标负荷数据集中异常的负荷数据之后,还包括对异常的负荷数据进行修正的过程;所述对异常的负荷数据进行修正,包括:
获取异常的负荷数据所在日的至少一个负荷相似日;
获取异常的负荷数据对应的采集时刻;
从各个负荷相似日的负荷数据中提取该采集时刻的负荷数据,并根据各个负荷相似日的该采集时刻的负荷数据对异常的负荷数据进行修正。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述方法的步骤。
CN202110939592.3A 2021-08-16 2021-08-16 异常负荷数据识别方法及电子设备 Pending CN113554117A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110939592.3A CN113554117A (zh) 2021-08-16 2021-08-16 异常负荷数据识别方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110939592.3A CN113554117A (zh) 2021-08-16 2021-08-16 异常负荷数据识别方法及电子设备

Publications (1)

Publication Number Publication Date
CN113554117A true CN113554117A (zh) 2021-10-26

Family

ID=78134020

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110939592.3A Pending CN113554117A (zh) 2021-08-16 2021-08-16 异常负荷数据识别方法及电子设备

Country Status (1)

Country Link
CN (1) CN113554117A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709816A (zh) * 2016-11-29 2017-05-24 国网陕西省电力公司电力科学研究院 基于非参数回归分析的电力负荷异常数据识别与修正方法
CN108959424A (zh) * 2018-06-11 2018-12-07 长春电力设计有限公司 一种用于电力***负荷监测的城市用电地图的操作方法
CN110458230A (zh) * 2019-08-12 2019-11-15 江苏方天电力技术有限公司 一种基于多判据融合的配变用采数据异常甄别方法
CN111046913A (zh) * 2019-11-18 2020-04-21 杭州海兴电力科技股份有限公司 一种负荷异常值识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709816A (zh) * 2016-11-29 2017-05-24 国网陕西省电力公司电力科学研究院 基于非参数回归分析的电力负荷异常数据识别与修正方法
CN108959424A (zh) * 2018-06-11 2018-12-07 长春电力设计有限公司 一种用于电力***负荷监测的城市用电地图的操作方法
CN110458230A (zh) * 2019-08-12 2019-11-15 江苏方天电力技术有限公司 一种基于多判据融合的配变用采数据异常甄别方法
CN111046913A (zh) * 2019-11-18 2020-04-21 杭州海兴电力科技股份有限公司 一种负荷异常值识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赵天辉,等: "基于非参数回归分析的工业负荷异常值识别与修正方法", 电力***自动化, vol. 41, no. 18, 31 July 2010 (2010-07-31), pages 53 - 59 *

Similar Documents

Publication Publication Date Title
CN109034244B (zh) 基于电量曲线特征模型的线损异常诊断方法及装置
Flach et al. Multivariate anomaly detection for Earth observations: a comparison of algorithms and feature extraction techniques
Biard et al. Automated detection of weather fronts using a deep learning neural network
CN114912720A (zh) 基于记忆网络电力负荷预测方法、装置、终端及存储介质
CN113516275A (zh) 一种配电网超短期负荷预测方法、装置及终端设备
CN113240153A (zh) 光伏发电数据预测方法、装置、计算设备及存储介质
CN116578945A (zh) 一种基于飞行器多源数据融合方法、电子设备及存储介质
CN116739172A (zh) 一种基于爬坡识别的海上风电功率超短期预测方法及装置
CN111461923A (zh) 一种基于深度卷积神经网络的窃电监测***和方法
CN111383732A (zh) 一种基于互斥识别的药品审核方法、装置、计算机***及可读存储介质
CN113435479A (zh) 基于区域特征表达约束的特征点匹配方法与***
CN111127407B (zh) 一种基于傅里叶变换的风格迁移伪造图像检测装置及方法
CN113554117A (zh) 异常负荷数据识别方法及电子设备
CN116166993A (zh) 电力线路故障类型识别方法及装置、电力***、存储介质
CN115545164A (zh) 光伏发电功率预测方法、***、设备及介质
CN109978675A (zh) 一种税务监控方法和装置
CN111882046A (zh) 多媒体数据的识别方法、装置、设备及计算机存储介质
CN110837459A (zh) 一种基于大数据的运行绩效分析方法及***
CN117093984B (zh) 一种基于深度学习的侧信道攻击方法及***
CN116305588B (zh) 一种风洞试验数据异常检测方法、电子设备及存储介质
CN115514621B (zh) 故障监测方法、电子设备及存储介质
CN113487080B (zh) 一种基于风速分类的风速动态场景生成方法、***及终端
CN113569482A (zh) 隧道服役性能的评估方法、装置、终端及存储介质
CN117493957A (zh) 一种用于农业灌溉的农作物识别方法及***
CN115759446A (zh) 面向新能源高精度预测的机器学习特征选择方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination