CN115858630B - 一种储能电站储能数据的异常检测方法 - Google Patents
一种储能电站储能数据的异常检测方法 Download PDFInfo
- Publication number
- CN115858630B CN115858630B CN202310139290.7A CN202310139290A CN115858630B CN 115858630 B CN115858630 B CN 115858630B CN 202310139290 A CN202310139290 A CN 202310139290A CN 115858630 B CN115858630 B CN 115858630B
- Authority
- CN
- China
- Prior art keywords
- data
- energy storage
- value
- distribution
- abnormal data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Testing Electric Properties And Detecting Electric Faults (AREA)
Abstract
本发明涉及数据处理技术领域,具体涉及一种储能电站储能数据的异常检测方法。该方法通过获得储能参数的时序数据构建关键储能矩阵,通过关键储能矩阵筛选出的疑似异常数据并分析其与非疑似异常数据的分布特征,获得分布偏离指标;根据疑似异常数据局部数据的局部分布特征获得局部数据分布指标;根据疑似异常数据邻域数据的数据值变化差异,获得数据变化指标,根据分布偏离指标、局部数据分布指标和数据变化指标构建异常数据检测模型,获得真实异常数据,根据真实异常数据判断储能电站的异常状况。本发明通过数据处理,全面且精确的检测出异常数据,实现储能电站异常检测。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种储能电站储能数据的异常检测方法。
背景技术
储能电站安装和投运使用过程中,储能电站电池质量好坏以及老化速度都是不易控制的,随着使用时间的不断增加,储能电站的安全性也就会越来越差,发生事故的风险也会逐渐增加。储能电站最主要的部件就是储能电池,存在多种不同的运行参数如电压、电流、电阻等,其变化直接影响到储能电站的综合性能,因此安全性成为储能领域关注的核心问题之一,对于储能电站的安全性检测是极为重要的流程。
当前,不同的储能电站存在不同的储能电池,其因为使用场景和对应时间段的不同,对应储能参数的数据变化也不尽相同,因此采用传统的神经网络训练模型进行异常数据检测,并不能很好的检测出不同情况下储能参数中的异常值,而且根据具体情况进行训练的成本量较大,检测结果也不够准确。而现阶段对于不同储能电站中异常数据的检测较为单调,不能全面且快速精准的检测出一段时间内储能数据中的异常数据,进而使得判断储能电站实时的异常状况不够准确。
发明内容
为了解决现有技术中对于不同储能电站中异常数据的检测较为单调,不能全面且快速精准的检测出一段时间内储能数据中异常数据的技术问题,本发明的目的在于提供一种储能电站储能数据的异常检测方法,所采用的技术方案具体如下:
本发明提供了一种储能电站储能数据的异常检测方法,所述方法包括:
通过传感器获得在预设时间段上至少两类储能参数的时序数据,根据所述时序数据构建关键储能数据矩阵;根据关键储能数据矩阵中每类储能参数中的每个储能数据的数据波动程度筛选出关键储能数据矩阵中的疑似异常数据;
获得疑似异常数据对应的实际分布特征与关键储能数据矩阵中的非疑似异常数据对应的标准分布特征的分布特征差异,根据分布特征差异获得每个疑似异常数据的分布偏离指标;
在关键储能数据矩阵中,根据每个疑似异常数据对应预设局部窗口中不同预设方向上数据值的局部分布特征获得每个疑似异常数据的局部数据分布指标;根据疑似异常数据对应预设邻域范围内储能数据的数据值差异情况,获得数据变化矩阵,根据数据值变化矩阵获得疑似异常数据的数据变化指标;
根据疑似异常数据的分布偏离指标、局部数据分布指标和数据变化指标获得异常数据检测模型;根据异常数据检测模型筛选出疑似异常数据中的真实异常数据,根据真实异常数据的数据值获得异常程度判断指标,通过所述异常程度判断指标检测储能电站的异常状况。
进一步地,所述根据关键储能数据矩阵中每类储能参数中的每个储能数据的数据波动程度筛选出关键储能数据矩阵中的疑似异常数据包括:
将关键储能数据矩阵中每个储能数据与同类储能参数中其他储能数据之间的差值绝对值作为数据差异,将数据差异的均值作为储能数据的数据波动程度指标;
获得所有储能数据的数据波动程度指标;当数据波动程度指标大于预设波动阈值时,将对应的储能数据作为疑似异常数据;当数据波动程度指标小于等于预设波动阈值时,将对应的储能数据作为非疑似异常数据。
进一步地,所述标准分布特征和疑似异常数据的实际分布特征的获取包括:
对关键储能数据中的非疑似异常数据采用高斯模型拟合,获得标准高斯模型,将每个储能数据对应的标准高斯模型值作为储能参数的标准分布特征;
对关键储能数据中的疑似异常数据采用高斯模型拟合,获得异常数据高斯模型,将每个疑似异常数据对应的异常数据高斯模型值作为疑似异常数据的实际分布特征。
进一步地,所述分布偏离指标的获取包括:
将每个疑似异常数据的实际分布特征对应的异常数据高斯模型值与标准分布特征对应的标准高斯模型值的差值绝对值作为分布特征差异;将每个分布特征差异进行归一化处理获得每个疑似异常数据的分布偏离指标。
进一步地,所述局部分布特征的获取包括:
所述局部分布特征包括数据值分布特征值和种类分布特征值;
将每个疑似异常数据对应预设局部窗口中具有相同数据值的储能数据划分为同一数据值种类,获得所有数据值种类;将数据值种类中任意两个数据值种类对应数据值的组合作为种类二元组,获得所有种类二元组;
将每种种类二元组的大小作为滑动窗口的大小,在对应疑似异常数据的预设局部窗口水平方向上遍历,统计与每种种类二元组中数据值相同的频次作为水平频次;同理,获得每种种类二元组在竖直方向上遍历的竖直频次;统计疑似异常数据的预设局部窗口中所有种类二元组的频次作为总频次;
根据每种种类二元组的水平频次在总频次的占比获得水平熵值;根据每种种类二元组的竖直频次在总频次的占比获得竖直熵值;将水平熵值与竖直熵值相加获得种类分布特征值;
将预设局部窗口中所有储能数据的数据值的均值和非疑似异常数据的数据值的均值之间的差值绝对值作为数据值分布特征值。
进一步地,所述局部数据分布指标的获取包括:
将数据值分布特征值与种类分布特征值的乘积作为局部数据分布指标。
进一步地,所述根据数据值变化矩阵获得疑似异常数据的数据变化指标包括:
计算疑似异常数据与对应预设邻域范围内每个预设方向上每个储能数据的差值之和,获得对应预设方向下的整体数据值差异;将所有预设方向下的整体数据值差异排列构建的方阵作为数据值变化矩阵;
获得数据值变化矩阵的特征值,将所有特征值的绝对值相乘,将获得的特征值乘积作为数据变化指标。
进一步地,所述异常数据检测模型的获取包括:
将疑似异常数据的分布偏离指标和局部数据分布指标的乘积与数据变化指标作比,获得第一比值;对第一比值进行归一化处理获得异常数据检测模型。
进一步地,所述异常程度判断指标的获取包括:
获得所有真实异常数据的数据值的累加值,对累加值进行归一化处理获得异常程度判断指标。
进一步地,所述关键储能数据矩阵的获取包括:
根据同类储能参数中的数据值,将每类储能参数中的储能数据均进行归一化,获得归一化后的时序数据;将所有归一化后的时序数据中的时刻信息和储能参数作为矩阵的行和列,获得储能数据矩阵;
对储能数据矩阵采用主成分分析法降维,获得由时刻信息和关键储能参数数据重构的矩阵作为关键储能数据矩阵。
本发明具有如下有益效果:
1.本发明通过矩阵的方式对多类储能参数的时序数据综合分析,可以更好地反映储能电站的异常状况,且可适用于多种场景。通过对关键储能数据矩阵中数据的波动程度进行初步判断,获得疑似异常数据,然后对疑似异常数据的分布偏离特征和局部数据的分布变化特征综合分析,筛选出最精确的真实异常数据,使异常数据的检测更加精准快速,更好的对储能电站的异常状况进行预警。
2.对于疑似异常数据的筛选,考虑到正常储能数据也存在的一定的波动情况,首先通过疑似异常数据的分布偏离情况获得疑似异常数据对于非疑似异常数据的偏离程度,计算反映偏离程度的分布偏离指标,用于后续对真实异常数据的筛选。同时还考虑到在本发明精确获取真实异常数据的过程中,存在噪声数据的影响,通过对疑似异常数据周围的局部数据的分布均匀情况和数据值变化情况获得局部数据分布指标和数据变化指标,可排除疑似异常数据中的噪声数据的影响。综合分布偏离指标、局部数据分布指标和数据变化指标进行筛选获得真实异常数据,使得到的真实异常数据更精确。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的一种储能电站储能数据的异常检测方法流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种储能电站储能数据的异常检测方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种储能电站储能数据的异常检测方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种储能电站储能数据的异常检测方法流程图,该方法包括以下步骤:
S1:通过传感器获得在预设时间段上至少两类储能参数的时序数据,根据时序数据构建关键储能数据矩阵;根据关键储能数据矩阵中每类储能参数中的每个储能数据的数据波动程度筛选出关键储能数据矩阵中的疑似异常数据。
本发明主要针对储能电站中的储能数据进行异常数据的检测,进而及时通过异常数据判断异常状况,以防止风险事故的发生。由于储能电站最主要的部件就是储能电池,储能电池的数据参数变化可以直接影响到整个储能电站中储能***的运行效率和综合性能,因此在对储能电站中储能数据分析时,主要分析的储能数据为储能电池参数中的数据,如储能电池的温度、电流、电压和储能SOC值等。为了能够综合分析储能电站中储能数据的异常情况,先通过传感器获得在预设时间段上至少两类储能参数的时序数据,根据时序数据构建关键储能数据矩阵,具体包括:
在不同的时刻各类储能参数可能因外部影响产生具有差异的数据序列,为了更准确的检测出当前时段的异常数据,在采集数据时需采集具有时刻信息的数据序列。因此,本发明将采用相应的数据采集传感器对储能参数的实时数据进行采集,获得在预设时间段上至少两类储能参数的时序数据。
在本发明实施例中,每隔T时段对储能参数的数据进行一次采集,每次采集设定的时序数据的长度为m,具体设置间隔时间T为0.5s,时序数据的长度m为800,该数据可根据实际情况具体设置,在此不做限定。需要说明的是,对于不同的储能电站可能存在对不同储能参数的获取需求,因此对于数据采集的传感器类型以及型号的选择,实施者可以根据实际情况自行选取,在此对获取的储能参数种类不做限定。
基于采集到的所有时序数据,采用构建矩阵的方式对所有储能参数综合分析,为了避免各类储能参数不同量纲之间的影响,根据同类储能参数中的数据值,将每类储能参数中的储能数据均进行归一化,获得归一化后的时序数据,以便于后续的分析,需要说明的是,归一化方法为本领域技术人员公知的方法,在此不做赘述。根据时序数据构建储能数据矩阵的具体方法包括:
将归一化后的所有时序数据中的时刻信息和储能参数作为矩阵的行和列,获得储能数据矩阵。在本发明实施例中,储能数据矩阵的每一行代表同一时刻,每一列代表同一储能参数,为了后续计算的准确性,储能数据矩阵具体为:
式中,表示为大小为的储能数据矩阵,表示为储能数据对应时刻的总时长,表示为储能数据对应储能参数的总类数,表示为第时刻所采集的第类储能参数进行归一化后的储能数据的数据值。
为了进一步提高异常数据分析的精度,减小数据体量,提高检测速率,通过重构储能数据矩阵实现数据的降维处理,优选地,对储能数据矩阵采用主成分分析法进行降维,主成分分析法可以将多个具有一定相关性的指标重新组合,获得一组相互无关的综合指标来代替原来的指标,在本发明中,当一类储能参数产生异常时可能会使多类储能参数的数据共同发生异常变化,因此可以使用主成分分析法仅保留能够进行储能数据异常分析的关键数据信息。
将时刻信息和关键储能参数数据重构的矩阵作为关键储能数据矩阵,在本发明实施例中,关键储能数据矩阵为,重构矩阵的大小为,其中,表示为储能数据对应时刻的总时长,表示为储能数据对应储能参数的总类数,表示为降维后的关键储能参数的总类数,需要说明的是,主成分分析法是本领域技术人员熟知的技术手段,在此不做赘述。
在完成关键储能数据矩阵的获取后,通过关键储能数据矩阵进行储能电站的异常数据分析。正常情况下,在储能电站对应的关键储能数据矩阵中,储能参数中的对应储能数据具有一致性,即数据值的变化程度较小。而当出现异常情况时,异常数据与其他储能数据相比存在较大的差异,因此在异常数据检测时先初步对每个储能数据的数据波动程度进行分析,根据关键储能数据矩阵中每类储能参数中的每个储能数据的数据波动程度筛选出关键储能数据矩阵中的疑似异常数据,具体包括:
将关键储能数据矩阵中每个储能数据与对应储能参数中其他储能数据之间的差值绝对值作为数据差异,数据差异可以反映在同一储能参数中储能数据与其他储能数据之间数据值的差异程度,当数据差异越大,说明两个储能数据之间存在较大的差异。
将每个储能数据对应所有数据差异的均值作为储能数据的数据波动程度指标,数据波动程度指标可以反映对应储能数据相较于其他储能数据的差异情况,差异越大,该储能数据越可能为异常数据,具体数据波动程度指标的表达式为:
式中,表示为关键储能数据矩阵中储能数据对应的数据波动程度指标;表示为关键储能数据矩阵中第行第列的储能数据;表示为储能数据对应时刻的总时长,即关键储能数据矩阵的总行数。
在本发明实施例中,为了更好的通过数据波动程度指标筛选出疑似异常数据的储能数据,对数据波动程度指标进行归一化处理,后续分析的数据波动程度指标均为归一化后的数据波动程度指标。
获得所有储能数据的数据波动程度指标,当数据波动程度指标大于预设波动阈值时,说明对应的储能数据相比于同储能参数中的其他储能数据的数据值差异较大,将对应的储能数据记为疑似异常数据;当数据波动程度指标小于等于预设波动阈值时,说明对应的储能数据相比于同储能参数中的其他储能数据的数据值差异较小,将对应的储能数据作为非疑似异常数据。在本发明实施例中,预设的波动阈值为0.5。
至此,可获得关键储能数据矩阵中的所有疑似异常数据,并组成疑似异常数据集合,可进一步对疑似异常数据进行分析。
S2:获得疑似异常数据对应的实际分布特征与关键储能数据矩阵中的非疑似异常数据对应的标准分布特征的分布特征差异,根据分布特征差异获得每个疑似异常数据的分布偏离指标。
根据S1可以得到疑似异常数据集合,为了更准确地识别出真实的异常数据,实现储能电站异常状况的检测,进一步对疑似异常数据集合中的储能数据进行分析,筛选出更准确的异常数据。在疑似异常数据的获取过程中,可能存在正常的储能数据,也即非疑似异常数据,其对应的波动程度较大的情况,因此先对疑似异常数据的分布特征进行分析,获得疑似异常数据对应的实际分布特征与关键储能数据矩阵中的非疑似异常数据对应的标准分布特征的分布特征差异,根据分布特征差异获得每个疑似异常数据的分布偏离指标,具体包括:
为了更好的反映每个疑似异常数据的分布状况,考虑到高斯模型可以表征数据的分布状况,优选地,对关键储能数据中的疑似异常数据采用高斯模型拟合,获得异常数据高斯模型,将每个疑似异常数据对应的异常数据高斯模型值作为疑似异常数据的实际分布特征,反映疑似异常数据的实际分布状况。
同时,为了更好的对比疑似异常数据的分布情况,对于关键储能数据矩阵中的其他非疑似异常数据,即正常数据,也需要获得正常的分布状况作为标准进行对比分析,优选地,对关键储能数据中的非疑似异常数据采用高斯模型拟合,获得标准高斯模型,将每个储能数据对应的标准高斯模型值作为储能参数的标准分布特征,反映了在非疑似异常数据中,每个储能数据应该对应的分布状况。需要说明的是,高斯模型拟合是本领域技术人员熟知的技术手段,在此不做赘述。
将每个疑似异常数据的实际分布特征对应的异常数据高斯模型值与标准分布特征对应的标准高斯模型值的差值绝对值作为分布特征差异,分布特征差异反映了每个疑似异常数据的分布偏离程度,当分布特征差异越大,说明该疑似异常数据的数据值分布与相应理想正常储能数据的分布偏离程度是越大的,所以对每个疑似异常数据的分布特征差异进行归一化,获得每个疑似异常数据的分布偏离指标,分布偏离指标的表达式为:
式中,表示为疑似异常数据的分布偏离指标;表示为在关键储能数据矩阵中第行第列的记为疑似异常数据的储能数据;表示为疑似异常数据对应的异常数据高斯模型值,即实际分布特征;表示为疑似异常数据对应的标准高斯模型值,即标准分布特征;表示为自然常数。
表达式中,表示为分布特征差异,当分布特征差异越大时,分布偏离指标就越大,说明对应疑似异常数据的分布偏离程度越高,则该疑似异常数据越可能为真实的异常数据,因此分布特征差异和分布偏离指标呈正相关关系,表示为对分布特征差异进行归一化处理。
获得所有疑似异常数据的分布偏离指标,将每个疑似异常数据的分布偏离指标作为异常数据检测的指标之一。
S3:在关键储能数据矩阵中,根据每个疑似异常数据对应预设局部窗口中不同预设方向上数据值的局部分布特征获得每个疑似异常数据的局部数据分布指标;根据疑似异常数据对应预设邻域范围内储能数据的数据值差异情况,获得数据变化矩阵,根据数据值变化矩阵获得疑似异常数据的数据变化指标。
在疑似异常数据集合中,可能存在一定的噪声数据会被误认为是疑似异常数据,而这些噪声数据会影响异常数据检测的精度,使最终储能电站的异常状况分析存在较大误差,因此为了提高异常数据的检测准确度,需要将这些噪声数据进行筛除。考虑到噪声数据具有孤立性特点,其噪声数据对应周围的数据分布较为均匀,且噪声数据的数据值多为突变的数值,因此对每个疑似异常数据周围的局部储能数据分析,根据局部数据的分布均匀程度和数据值变化程度,获得相应的指标便于后续判断。
S3.1:首先对疑似异常数据的局部数据分布均匀程度进行分析,在关键储能数据矩阵中,根据每个疑似异常数据对应预设局部窗口中不同预设方向上数据值的局部分布特征获得每个疑似异常数据的局部数据分布指标,具体包括:
根据噪声数据的孤立性可知,噪声数据局部范围中的储能数据分布较为规律和均匀,也即储能数据的一致性较高,因此对每个疑似异常数据局部数据的分布情况进行分析,获得局部分布特征反映局部数据的分布均匀程度。本发明实施例,通过数据分布特征值和种类分布特征值两个特征值反映局部分布特征,其中种类分布特征值主要反映疑似异常数据局部数据的数据值分布情况,为了更好的表征局部数据的数据值值的分布规律性,首先***部数据的数据值种类。
具体数据值种类的划分为:获得以每个疑似异常数据为中心的预设局部窗口,将每个疑似异常数据对应预设局部窗口中具有相同数据值的储能数据划分为同一数据值种类,不同的数据值为不同的数据值种类,在本发明实施例中,预设的局部窗口尺寸为7×7,具体局部窗口的尺寸实施者可自行设定。
统计数据值种类的总数量,为了更清晰的反映局部数据的分布规律状况,将数据值种类组成种类二元组,通过种类二元组对局部数据的分布情况进行分析,将数据值种类中任意两个数据值种类对应数据值的组合作为种类二元组,具体例如,当预设局部窗口中存在的数据值有1,2,3,4共四种情况,则对应的数据值种类也为四种,在对任意两个数据种类的数据值进行组合时,每个数据种类可以和其本身组合,即获得的种类二元组为(1,1),(1,2),(1,3),(1,4),(2,1),(2,2)……(4,4),共可获得16种种类二元组。
将每种种类二元组对应的大小范围作为滑动窗口的大小,即滑动窗口的大小为1×2,通过滑动窗口以不同预设方向对预设局部窗口内的数据进行分析,统计每种种类二元组在局部窗口内不同预设方向上的频次,优选地,选择不同预设方向为水平方向及竖直方向,具体为:将每种种类二元组在对应疑似异常数据的预设局部窗口水平方向上遍历,统计与每种种类二元组中数据值相同的频次作为水平频次;同理,获得每种种类二元组在竖直方向上遍历的竖直频次,并统计疑似异常数据的预设局部窗口中所有种类二元组的频次作为总频次。需要说明的是,若疑似异常数据在关键储能数据矩阵中的位置位于矩阵的边缘,则在预设局部窗口大小中仅存在一部分储能数据,在遍历过程中,仅遍历预设局部窗口中存在的储能数据即可。
获得不同预设方向的所有种类二元组的频次,结合熵的运算,可以反映疑似异常数据预设局部窗口中数据值分布的混乱程度,具体为:根据每种种类二元组的水平频次在总频次的占比获得水平熵值;根据每种种类二元组的竖直频次在总频次的占比获得竖直熵值。
通过种类二元组在水平方向和竖直方向上的熵值,可以获得种类分布特征值,种类分布特征值主要表征了疑似异常数据的局部数据分布规律性,具体为:将水平熵值与竖直熵值相加获得种类分布特征值。当种类特征值越大,说明对应疑似异常数据的局部数据分布越不规律,分布状况越混乱,对应的疑似异常数据越可能为真实的异常数据。
在获取了疑似异常数据局部数据的种类分布特征值后,进一步分析局部数据的数据值分布特征,因为种类分布特征仅针对数据值的分布进行分析,并未对具体数据值的大小进行判断,当疑似异常数据预设局部窗口中的数据值均值,对于非疑似异常数据的数据值均值差异较大时,说明对应疑似异常数据的局部数据相较于非疑似异常数据越不均匀,该疑似异常数据越可能为真实的异常数据,因此将预设局部窗口中所有储能数据的数据值的均值和非疑似异常数据的数据值的均值之间的差值绝对值作为数据值分布特征值。当数据值分布特征值越大,说明疑似异常数据的局部数据的数据值与非疑似异常数据的数据值差异越大,则该疑似异常数据越可能为真实的异常数据。
根据局部分布特征的种类分布特征值和数据值分布特征值获得局部数据分布指标,将数据值分布特征值与种类分布特征值的乘积作为局部数据分布指标,通过局部数据分布指标反映疑似异常数据局部数据的分布均匀程度,在本发明实施例中,为了后续计算的准确性,具体局部数据分布指标的表达式为:
式中,表示为疑似异常数据的局部数据分布指标,表示为在关键储能数据矩阵中第行第列的记为疑似异常数据的储能数据,表示为疑似异常数据预设局部窗口内的数据值的均值,表示为关键储能数据矩阵中非疑似异常数据的数据值的均值,表示为第种种类二元组在预设局部窗口内水平方向上的频次,表示为第种种类二元组在预设局部窗口内竖直方向上的频次,表示为预设局部窗口中所有种类二元组的总频次,表示为疑似异常数据在预设局部窗口中种类二元组的总类数,表示为以自然常数为底的对数函数。
采用乘法的方式结合数据值分布特征值和种类分布特征值,式中表示为疑似异常数据的数据值分布特征值,当数据值分布特征值越大,说明对应疑似异常数据局部数据的数据值与非疑似异常数据的数据值差异越大,对应疑似异常数据局部数据的数据值越不均匀,则局部数据分布指标越大。
式中,表示为疑似异常数据预设局部窗口中根据每种种类二元组的水平频次在总频次的占比获得的水平熵值,示为疑似异常数据预设局部窗口中根据每种种类二元组的竖直频次在总频次的占比获得的竖直熵值,表示为疑似异常数据的种类分布特征值,当熵值越大,则种类分布特征值越大,说明疑似异常数据局部数据中的数据值种类分布情况越混乱,局部数据分布越不规律,则局部数据分布指标越大,疑似异常数据越可能为真实的异常数据。需要说明的是,熵值公式的运用为本领域技术人员熟知的技术手段,因此具体公式的意义不再赘述。
至此完成对疑似异常数据的局部数据分布均匀程度的分析。
S3.2:进一步地,对疑似异常数据的局部数据的数据值变化程度进行分析,根据疑似异常数据对应预设邻域范围内储能数据的数据值差异情况,获得数据变化矩阵,根据数据值变化矩阵获得疑似异常数据的数据变化指标,具体包括:
对于储能电站的异常状况而言,产生异常数据时,异常数据邻近的储能数据也存在一定程度的变化,而噪点数据的孤立性也体现在数据值的变化为突变的形式,因此对每个疑似异常数据局部数据的数据值变化进行分析,获得疑似异常数据相较于局部数据的数据值变化程度。本发明通过矩阵的形式表征疑似异常数据局部数据的数据值变化特征,首先对疑似异常数据建立数据值变化矩阵。
获得疑似异常数据与局部数据的数据变化值,优选地,计算疑似异常数据与对应预设邻域范围内每个预设方向上每个储能数据的差值之和,获得对应预设方向下的整体数据值差异,每个整体数据值差异反映了疑似异常数据在对应预设方向上的数据值的梯度变化情况,将所有预设方向下的整体数据值差异排列构建的方阵作为数据值变化矩阵。
在本发明实施例中,预设邻域范围为疑似异常数据邻近的八邻域范围,预设方向为水平方向、竖直方向、45度直线方向和135度直线方向。故以疑似异常数据为例,在水平方向下的整体数据值差异为,在竖直方向下的整体数据值差异为,在45度直线方向下的整体数据值差异为,在135度直线方向下的整体数据值差异为。将获得的四个预设方向下的整体数据值差异进行排列,得到的疑似异常数据对应的数值变化矩阵为:
式中,表示为疑似异常数据的数据值变化矩阵,表示为疑似异常数据在水平方向下的整体数据值差异,表示为疑似异常数据在竖直方向下的整体数据值差异,表示为疑似异常数据在45度直线方向下的整体数据值差异,表示为疑似异常数据在135度直线方向下的整体数据值差异。
进一步地,计算数据值变化矩阵的特征值,特征值的大小用于表征在特征值对应特征向量方向上的数据值变化程度,当特征值的绝对值越大,则认为疑似异常数据在对应特征向量的方向上数据值变化程度越大,因此获得数据值变化矩阵的所有特征值,将所有特征值的绝对值相乘,获得疑似异常数据的数据变化指标,在本发明实施例中,因为数据值变化矩阵为2×2大小的方形矩阵,因此可以得到两个特征值,即疑似异常数据对应的数据变化指标表达式为:
式中,表示为疑似异常数据的数据变化指标,表示为疑似异常数据对应数据值变化矩阵的一个特征值,表示为疑似异常数据对应数据值变化矩阵的另一个特征值。
采用乘积的形式对数据值变化程度进行分析,当所有特征值的绝对值越大,说明疑似异常数据在各个方向上的数据值变化程度均越大,则该疑似异常数据更有可能为噪声数据,对应的数据变化指标也是越大的,特征值绝对值与数据变化指标呈正相关关系。
至此,完成了对每个疑似异常数据局部数据的数据分布均匀程度和数据值变化程度的综合分析,得到每个疑似异常数据的局部数据分布指标和数据变化指标,可以极大的减少噪声数据对异常数据检测的影响,使对异常数据的检测更精确。
S4:根据疑似异常数据的分布偏离指标、局部数据分布指标和数据变化指标获得异常数据检测模型;根据异常数据检测模型筛选出疑似异常数据中的真实异常数据,根据真实异常数据的数据值获得异常程度判断指标,通过异常程度判断指标检测储能电站的异常状况。
根据S2和S3,可以得到每个疑似异常数据的分布偏离指标、局部数据分析指标和数据变化指标,根据三个指标构建异常数据检测模型,实现对储能电站中储能数据异常状况的综合分析。通过异常数据检测模型,对储能数据中的异常数据进行识别,筛选出真实异常数据,通过真实异常数据对储能电站的异常状态进行判定。
异常数据检测模型的构建具体为:将疑似异常数据的分布偏离指标和局部数据分布指标的乘积与数据变化指标作比获得第一比值,对第一比值进行归一化处理获得异常数据检测模型。在本发明实施例中,为了后续分析的准确性,以疑似异常数据为例构建异常数据检测模型具体方式为:
式中,表示为疑似异常数据的第一比值,表示为疑似异常数据的分布偏离指标,表示为疑似异常数据的局部数据分布指标,表示为疑似异常数据的数据变化指标,表示为常数系数,表示为归一化函数。本公式中常数系数的目的是避免因分母为零而使公式无意义的情况,在本发明实施例中,常数系数设置为0.01,需要说明的是,归一化函数可以选择线性归一化或零均值归一化等多种归一化方法,在此不做限定。
采用乘积和比值的形式对疑似异常数据的所有指标综合分析,当疑似异常数据的分布偏离指标越大,说明该疑似异常数据的数据值分布对于非疑似异常数据的分布差异越大,该疑似异常数据越可能为真实异常数据;当疑似异常数据的局部数据分布指标越大,说明该疑似异常数据局部数据的分布越混乱,该疑似异常数据越可能为真实异常数据;所以分布偏离指标与局部数据分布指标越大,第一比值越大,说明该疑似异常数据越可能为真实异常数据,分布偏离指标和局部数据分布指标均与第一比值呈正相关关系。而疑似异常数据的数据变化指标越大,说明该疑似异常数据在各个方向上的数据值变化程度越大,说明该疑似异常数据越可能为噪声数据,因此数据变化指标越小,第一比值越大,对应疑似异常数据越可能为真实异常数据,数据变化指标与第一比值呈负相关关系。
对获得的第一比值进行归一化处理,完成异常数据检测模型的构建,此时可根据异常数据检测模型获得每个疑似异常数据的异常检测指标,在本发明实施例中,设置异常阈值为0.5,当异常检测指标大于异常阈值时,则认为对应的疑似异常数据为真实异常数据,将所有的真实异常数据筛选出来。
通过异常数据检测模型,完成对真实异常数据的提取,获得真实异常数据集合,进一步可根据真实异常数据判断储能电站的异常状况,根据真实异常数据的数据值获得异常程度判断指标,通过异常程度判断指标检测储能电站的异常状况,具体包括:
获得所有真实异常数据的数据值的累加值,累加值可以反映出储能数据的异常程度,当累加值越大,说明该段时间储能数据的异常程度大,异常情况更严重,为了更好的判定储能电站的异常情况,对累加值进行归一化处理获得异常程度判断指标,进一步根据异常程度判断指标进行分析。
在本发明实施例中,预设预警阈值为0.4,当异常程度判断指标小于等于预警阈值时,说明该段时间储能电站中的储能数据异常程度较低,暂不进行预警提示;当异常程度判断指标大于预警阈值时,说明该段时间储能电站中的储能数据异常程度较高,此时需要进行预警提示,提示相关管理人员尽快对相关问题进行检查维修,避免严重事故的发生。
综上所述,本发明通过传感器获得预设时间段上的储能参数的时序数据,根据时序数据构建关键储能数据矩阵,通过关键储能数据矩阵中每类储能参数中每个储能数据的波动程度获得疑似异常数据,根据疑似异常数据的分布偏离程度获得分布偏离指标,根据疑似异常数据周围的局部数据分布均匀情况获得局部数据分布指标,根据疑似异常数据局部数据的数据值变化情况获得数据变化指标,根据分布偏离指标、局部数据分布指标和数据变化指标筛选出真实异常数据,根据真实异常数据的数据值获得异常检测指标,通过异常检测指标判断储能电站异常状况,该发明通过数据处理,更全面且快速精确的检测出一段时间内储能数据中的异常数据,进而更准确的判断储能电站实时的异常情况。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
Claims (7)
1.一种储能电站储能数据的异常检测方法,其特征在于,所述方法包括:
通过传感器获得在预设时间段上至少两类储能参数的时序数据,根据所述时序数据构建关键储能数据矩阵;根据关键储能数据矩阵中每类储能参数中的每个储能数据的数据波动程度筛选出关键储能数据矩阵中的疑似异常数据;
获得疑似异常数据对应的实际分布特征与关键储能数据矩阵中的非疑似异常数据对应的标准分布特征的分布特征差异,根据分布特征差异获得每个疑似异常数据的分布偏离指标;
在关键储能数据矩阵中,根据每个疑似异常数据对应预设局部窗口中不同预设方向上数据值的局部分布特征获得每个疑似异常数据的局部数据分布指标;根据疑似异常数据对应预设邻域范围内储能数据的数据值差异情况,获得数据变化矩阵,根据数据值变化矩阵获得疑似异常数据的数据变化指标;
根据疑似异常数据的分布偏离指标、局部数据分布指标和数据变化指标获得异常数据检测模型;根据异常数据检测模型筛选出疑似异常数据中的真实异常数据,根据真实异常数据的数据值获得异常程度判断指标,通过所述异常程度判断指标检测储能电站的异常状况;
所述局部分布特征的获取包括:
所述局部分布特征包括数据值分布特征值和种类分布特征值;
将每个疑似异常数据对应预设局部窗口中具有相同数据值的储能数据划分为同一数据值种类,获得所有数据值种类;将数据值种类中任意两个数据值种类对应数据值的组合作为种类二元组,获得所有种类二元组;
将每种种类二元组的大小作为滑动窗口的大小,在对应疑似异常数据的预设局部窗口水平方向上遍历,统计与每种种类二元组中数据值相同的频次作为水平频次;同理,获得每种种类二元组在竖直方向上遍历的竖直频次;统计疑似异常数据的预设局部窗口中所有种类二元组的频次作为总频次;
根据每种种类二元组的水平频次在总频次的占比获得水平熵值;根据每种种类二元组的竖直频次在总频次的占比获得竖直熵值;将水平熵值与竖直熵值相加获得种类分布特征值;
将预设局部窗口中所有储能数据的数据值的均值和非疑似异常数据的数据值的均值之间的差值绝对值作为数据值分布特征值;
所述局部数据分布指标的获取包括:
将数据值分布特征值与种类分布特征值的乘积作为局部数据分布指标;
所述异常数据检测模型的获取包括:
将疑似异常数据的分布偏离指标和局部数据分布指标的乘积与数据变化指标作比,获得第一比值;对第一比值进行归一化处理获得异常数据检测模型。
2.根据权利要求1所述的一种储能电站储能数据的异常检测方法,其特征在于,所述根据关键储能数据矩阵中每类储能参数中的每个储能数据的数据波动程度筛选出关键储能数据矩阵中的疑似异常数据包括:
将关键储能数据矩阵中每个储能数据与同类储能参数中其他储能数据之间的差值绝对值作为数据差异,将数据差异的均值作为储能数据的数据波动程度指标;
获得所有储能数据的数据波动程度指标;当数据波动程度指标大于预设波动阈值时,将对应的储能数据作为疑似异常数据;当数据波动程度指标小于等于预设波动阈值时,将对应的储能数据作为非疑似异常数据。
3.根据权利要求1所述的一种储能电站储能数据的异常检测方法,其特征在于,所述标准分布特征和疑似异常数据的实际分布特征的获取包括:
对关键储能数据中的非疑似异常数据采用高斯模型拟合,获得标准高斯模型,将每个储能数据对应的标准高斯模型值作为储能参数的标准分布特征;
对关键储能数据中的疑似异常数据采用高斯模型拟合,获得异常数据高斯模型,将每个疑似异常数据对应的异常数据高斯模型值作为疑似异常数据的实际分布特征。
4.根据权利要求3所述的一种储能电站储能数据的异常检测方法,其特征在于,所述分布偏离指标的获取包括:
将每个疑似异常数据的实际分布特征对应的异常数据高斯模型值与标准分布特征对应的标准高斯模型值的差值绝对值作为分布特征差异;将每个分布特征差异进行归一化处理获得每个疑似异常数据的分布偏离指标。
5.根据权利要求1所述的一种储能电站储能数据的异常检测方法,其特征在于,所述根据数据值变化矩阵获得疑似异常数据的数据变化指标包括:
计算疑似异常数据与对应预设邻域范围内每个预设方向上每个储能数据的差值之和,获得对应预设方向下的整体数据值差异;将所有预设方向下的整体数据值差异排列构建的方阵作为数据值变化矩阵;
获得数据值变化矩阵的特征值,将所有特征值的绝对值相乘,将获得的特征值乘积作为数据变化指标。
6.根据权利要求1所述的一种储能电站储能数据的异常检测方法,其特征在于,所述异常程度判断指标的获取包括:
获得所有真实异常数据的数据值的累加值,对累加值进行归一化处理获得异常程度判断指标。
7.根据权利要求1所述的一种储能电站储能数据的异常检测方法,其特征在于,所述关键储能数据矩阵的获取包括:
根据同类储能参数中的数据值,将每类储能参数中的储能数据均进行归一化,获得归一化后的时序数据;将所有归一化后的时序数据中的时刻信息和储能参数作为矩阵的行和列,获得储能数据矩阵;
对储能数据矩阵采用主成分分析法降维,获得由时刻信息和关键储能参数数据重构的矩阵作为关键储能数据矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310139290.7A CN115858630B (zh) | 2023-02-21 | 2023-02-21 | 一种储能电站储能数据的异常检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310139290.7A CN115858630B (zh) | 2023-02-21 | 2023-02-21 | 一种储能电站储能数据的异常检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115858630A CN115858630A (zh) | 2023-03-28 |
CN115858630B true CN115858630B (zh) | 2023-05-09 |
Family
ID=85658500
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310139290.7A Active CN115858630B (zh) | 2023-02-21 | 2023-02-21 | 一种储能电站储能数据的异常检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115858630B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115600119B (zh) * | 2022-12-13 | 2023-06-16 | 青岛左岸数据科技有限公司 | 适用于风力发电的数据处理方法及*** |
CN116087759B (zh) * | 2023-04-12 | 2023-05-30 | 广东翰唐智控有限公司 | 一种电路板导电路径的检验方法及电路*** |
CN116230193B (zh) * | 2023-05-11 | 2023-07-21 | 聊城市第二人民医院 | 一种智能化医院用档案管理方法及*** |
CN116340795B (zh) * | 2023-05-29 | 2023-07-28 | 山东一然环保科技有限公司 | 一种用于纯氧燃烧加热炉运行数据处理方法 |
CN116610682B (zh) * | 2023-07-21 | 2023-09-29 | 山东盈动智能科技有限公司 | 基于数据存储的温度测试仪数据分类方法 |
CN116930595B (zh) * | 2023-09-18 | 2023-11-24 | 法拉迪电气有限公司 | 一种用于新能源并网调压的精准数据计量方法 |
CN116992391B (zh) * | 2023-09-27 | 2023-12-15 | 青岛冠宝林活性炭有限公司 | 一种硬碳工艺环保监测数据采集处理方法 |
CN117113107B (zh) * | 2023-10-24 | 2023-12-29 | 广东顺德爱顺机电科技有限公司 | 一种转子压铸异常误差数据处理方法 |
CN117195008B (zh) * | 2023-11-08 | 2024-03-12 | 山东神光航天科技有限公司 | 一种用于空气质量监测的异常数据处理方法 |
CN117421689B (zh) * | 2023-12-18 | 2024-03-12 | 杭州湘亭科技有限公司 | 一种基于管道机器人的铀放射性污染测量传输*** |
CN117874445B (zh) * | 2024-03-11 | 2024-06-14 | 北京盛拓达生物技术有限公司 | 一种实时在线监测数据分析的酶制剂生产监测方法 |
CN117907845B (zh) * | 2024-03-20 | 2024-05-17 | 山东泰开电力电子有限公司 | 基于电参数分析的电化学储能***绝缘检测方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115082744A (zh) * | 2022-08-22 | 2022-09-20 | 启东市罗源光伏设备有限公司 | 一种基于人工智能的太阳能集热效率分析方法及*** |
CN115600837A (zh) * | 2022-11-02 | 2023-01-13 | 国网山东省电力公司营销服务中心(计量中心)(Cn) | 一种用于电器负荷异常的节能诊断方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10896574B2 (en) * | 2018-12-31 | 2021-01-19 | Playtika Ltd | System and method for outlier detection in gaming |
US20220058174A1 (en) * | 2020-08-24 | 2022-02-24 | Microsoft Technology Licensing, Llc | System and method for removing exception periods from time series data |
CN115392408B (zh) * | 2022-10-31 | 2023-04-07 | 山东鲁抗医药集团赛特有限责任公司 | 一种电子数粒机运行异常检测方法及*** |
-
2023
- 2023-02-21 CN CN202310139290.7A patent/CN115858630B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115082744A (zh) * | 2022-08-22 | 2022-09-20 | 启东市罗源光伏设备有限公司 | 一种基于人工智能的太阳能集热效率分析方法及*** |
CN115600837A (zh) * | 2022-11-02 | 2023-01-13 | 国网山东省电力公司营销服务中心(计量中心)(Cn) | 一种用于电器负荷异常的节能诊断方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115858630A (zh) | 2023-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115858630B (zh) | 一种储能电站储能数据的异常检测方法 | |
CN107742127B (zh) | 一种改进的防窃电智能预警***及方法 | |
CN103077402B (zh) | 基于奇异值分解算法的变压器局部放电模式识别方法 | |
CN109389145B (zh) | 基于计量大数据聚类模型的电能表生产厂商评价方法 | |
CN106373025A (zh) | 基于离群点检测的用电信息采集***实时防窃电监测方法 | |
CN113533995B (zh) | 一种动力电池一致性检测方法 | |
CN112485747A (zh) | 一种电容式电压互感器误差状态评估方法 | |
CN109947815B (zh) | 一种基于离群点算法的窃电辨识方法 | |
CN105373894A (zh) | 基于稽查数据的电力营销业务诊断模型的建立方法及*** | |
CN106548021A (zh) | 一种基于高维随机矩阵的电子式互感器误差状态评估方法 | |
CN116520068B (zh) | 一种电力数据的诊断方法、装置、设备及存储介质 | |
CN114169424A (zh) | 基于k近邻回归算法和用电数据的排污量预测方法 | |
CN117274827B (zh) | 一种智慧环境环保远程实时监测预警方法及*** | |
CN104499001B (zh) | 基于特征子空间优化相对矩阵的铝电解槽况诊断方法 | |
CN116910677A (zh) | 一种工业仪表故障诊断方法及*** | |
CN117102082A (zh) | 一种液态金属电池的分选方法及*** | |
CN113204894B (zh) | 一种电能计量异常诊断模型的构建方法及应用 | |
Gu et al. | Mechanical fault diagnosis of transformer on-load tap-changer based on improved variational mode decomposition and support vector machine | |
CN111062538A (zh) | 空间负荷预测中确定元胞负荷合理最大值的ceemd方法 | |
CN118151034B (zh) | 一种高精度的电池内阻检测方法及*** | |
CN114239759B (zh) | 电动汽车的故障诊断方法、装置、电子设备及存储介质 | |
CN111780936B (zh) | 一种桥梁多参数融合可视化监测方法 | |
CN116500456B (zh) | 一种基于机器学习的三元锂电池容量检测方法 | |
CN118091283A (zh) | 一种基于电能质量分析的智能电表故障检测方法 | |
CN117031387A (zh) | 一种风电机组电能表状态检测方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |