CN113344134B - 一种低压配电监控终端数据采集异常检测方法及*** - Google Patents

一种低压配电监控终端数据采集异常检测方法及*** Download PDF

Info

Publication number
CN113344134B
CN113344134B CN202110744907.9A CN202110744907A CN113344134B CN 113344134 B CN113344134 B CN 113344134B CN 202110744907 A CN202110744907 A CN 202110744907A CN 113344134 B CN113344134 B CN 113344134B
Authority
CN
China
Prior art keywords
data
sample
abnormal
low
power distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110744907.9A
Other languages
English (en)
Other versions
CN113344134A (zh
Inventor
黄国政
李波
关华深
易晋
丁勇
吴昌盛
黄孟哲
冯志华
蔡子恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Power Grid Co Ltd
Jiangmen Power Supply Bureau of Guangdong Power Grid Co Ltd
Original Assignee
Guangdong Power Grid Co Ltd
Jiangmen Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Power Grid Co Ltd, Jiangmen Power Supply Bureau of Guangdong Power Grid Co Ltd filed Critical Guangdong Power Grid Co Ltd
Priority to CN202110744907.9A priority Critical patent/CN113344134B/zh
Publication of CN113344134A publication Critical patent/CN113344134A/zh
Application granted granted Critical
Publication of CN113344134B publication Critical patent/CN113344134B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Quality & Reliability (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Remote Monitoring And Control Of Power-Distribution Networks (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种低压配电监控终端数据采集异常检测方法及***,通过基于密度的聚类算法对预先处理好的低压配电终端的数据样本进行聚类分析,从而可以得到异常数据样本,进而通过异常数据样本的个数判断低压配电终端是否为数据采集异常。其实现了对低压配电终端的数据采集进行异常检测,同时,基于对低压配电终端的数据样本的标准化处理和数据清洗,提高了异常检测的准确性。

Description

一种低压配电监控终端数据采集异常检测方法及***
技术领域
本申请涉及配电物联网技术领域,尤其涉及一种低压配电监控终端数据采集异常检测方法及***。
背景技术
低压配电网位于配电***的最末端环节,是直接面向终端用户的,因此,低压配电网的可靠运行是整个电网运行可靠性链条中的重要组成部分。
目前,我国低压配电网有着地域分布广,网络架构复杂等特点,且大部分处于未监测状态。为解决以往低压配网盲管的问题,大量的低压配电终端(low-voltage terminalunit,LTU)被安装于低压配网中对线路运行数据进行实时采集,并与低压配变终端(Transformer terminal unit,TTU)进行实时信息交互,以实现低压故障在线研判、三相不平衡治理、分布式电源管理等功能,进一步提高用户供电可靠性和供电质量。
由于低压配网中LTU数量多、总体数据量大,往往容易出现因工作状态异常而产生的异常数据难以及时检测出来,进而影响故障检测和处理,降低低压配网供电的可靠性,且此类异常排查较为耗时,额外增加了运维人员的工作量;而对于含分布式电源的低压配电网来说,分布式电源通过LTU将采集的信息上送至微电网控制中心进行监视控制,异常数据的送入会导致错误决策。在实际的低压配网运行过程中,LTU采集的数据中电流、电压采样值错误数据较多,但由于低压配网中LTU安装规模日益庞大,对低压配网数据中潜在的LTU异常采样数据已无法采取人工方式实现校核与辨识。
因此,目前亟需一种针对低压配网数据中LTU工作状态异常导致的异常采样数据进行检测的技术。
发明内容
本申请提供了一种低压配电监控终端数据采集异常检测方法及***,用于解决现有技术很难对低压配电终端的数据采集进行异常检测的技术问题。
有鉴于此,本申请第一方面提供了一种低压配电监控终端数据采集异常检测方法,包括以下步骤:
S1、获取同一低压台区内的所有低压配电终端的数据样本,构建数据集;
S2、基于Z-score标准化方法对所述数据集进行标准化处理,得到标准化数据集;
S3、对所述标准化数据集进行数据清洗,得到清洗数据集;
S4、基于预先训练好的DBSCAN聚类模型对所述清洗数据集进行聚类分析,从而划分出异常数据样本和正常数据样本;
S5、判断所述异常数据样本的个数是否大于预设的异常数据样本个数阈值,若上述判断为是,则将所述低压配电终端判定为数据采集异常。
优选地,步骤S3中的数据清洗的方式包括线性差值。
优选地,在步骤S4之前包括:
S401、获取低压配电终端的历史正常数据,对所述历史正常数据进行标准化处理,将经标准化处理的历史正常数据构建为正常样本数据集;
S402、基于所述正常样本数据集在同一时刻获取两个等长单变量时间序列的第一数据样本点集和第二数据样本点集,所述第一数据样本点集和所述第二数据样本点集中的样本点数相等;
S403、基于时间序列相似性测度公式计算所述第一数据样本点集和所述第二数据样本点集之间的各个样本点的距离,对所述距离进行升序排列,以构建距离矩阵;
S404、根据所述第一数据样本点集和所述第二数据样本点集之间的各个样本点的距离构建距离曲线图,所述距离曲线图的横坐标为样本点序号,其纵坐标为距离,每条距离曲线表示为所述第一数据样本点集的当前样本点与所述第二数据样本点集中各个样本点的距离;
S405、基于所述距离曲线图,将样本点中位数处所对应的距离曲线按照距离值由大到小的次序进行排序,得到距离曲线序列,在所述距离曲线序列中以均等间隔确定四条距离曲线作为拟合曲线;
S406、对步骤S405确定的四条拟合曲线分别进行四次多项式曲线拟合,其四次多项式曲线拟合的拟合方程为,
disti(x)=pix4+qix3+rix2+six+ti
上式中,t为变量,表示拟合曲线的位置点,pi、qi、ri、si和ti均为通过相应的拟合曲线数据得到的拟合系数;
S407、根据四次多项式曲线拟合的拟合结果确定每个拟合曲线的拐点位置的值,再根据每个拟合曲线的拐点位置的值再次进行四次多项式曲线拟合,得到每个拟合曲线的拟合结果,根据四个拟合曲线的拟合结果的均值确定邻域范围的半径;
S408、将所述邻域范围的半径进行四次多项式曲线拟合,得到四个变量值,根据四个变量值的平均值确定密度阈值;
S409、基于DBSCAN聚类算法对所述正常样本数据集进行训练,并在训练前,将所述正常样本数据集中的所有样本数据标记为未读;
S410、任选一个未读的样本数据为起始数据,以所述起始数据为圆点,并根据所述邻域范围的半径进行画圆,以圆作为所述起始数据的邻域范围,对所述起始数据的邻域范围内的样本数据的个数进行计数,判断所述样本数据的个数是否大于所述密度阈值,若判断为是,则将所述样本数据判定为核心点,并将所述核心点标记为已读;
S411、根据所述邻域范围的半径确定所述核心点所有密度可达的样本数据,并将所述核心点和所述核心点密度可达的样本数据归类为一簇;
S412、重复步骤S410~S411直至所有未读的样本数据被标记为已读,从而确定出所有簇;若已读的样本数据未被归类到簇中,则将相应的样本数据归类为噪声点,并将所述噪声点剔除,从而构建DBSCAN聚类模型。
优选地,所述时间序列相似性测度公式为,
式中,表示第一数据样本点集,/>表示第二数据样本点集,/>表示/>概率分布的JS散度;DE i,j为/>与/>对应的各个样本点之间的欧氏距离,DM i,j表示错误模式距离,即代表/>与/>是否同时具有或不具有数据流中出现缺失值和有小于0的样本点两种错误。
优选地,步骤S4具体包括:
S401、将所有的所述核心点构建为核心点集;
S402、向所述预先训练好的DBSCAN聚类模型中输入所述清洗数据集,将所述清洗数据集中的各个数据样本和所述核心点集中的各个核心点进行线性遍历比较,根据所述邻域范围的半径判断所述清洗数据集中的数据样本是否在所述核心点的邻域范围内,若上述判断为是,则将相应的数据样本标记为异常数据样本,若上述判断为否,则将相应的数据样本标记为正常数据样本。
优选地,步骤S5之后包括:
S6、基于预设的异常节点区分准则判断所述低压配电终端导致数据采集异常的异常节点类型,所述异常节点类型包括事件节点和故障节点,所述事件节点为所述低压配电终端的外部线路故障导致,所述故障节点为所述低压配电终端的内部故障导致。
优选地,步骤S6具体包括:
S601、在低压配电物联网中选取与所述异常数据样本相关联的LTU节点χi,通过所述LTU节点χi进行拓扑连接分析,以确定与所述LTU节点χi的电气距离最近的节点χi+1
S602、在所述LTU节点χi和所述节点χi+1中获取对应的时间序列Tχi,t和时间序列Tχi+1,t
S603、基于滑动时间窗口的方法计算所述时间序列Tχi,t和所述时间序列Tχi+1,t的互相关系数,并根据互相关系数绘制空间互相关系数曲线图,所述空间互相关系数曲线图的横坐标为时间窗口时延,其纵坐标为互相关系数;
S604、基于所述空间互相关系数曲线图确定最大互相关系数的点V1、以及与其左右两端距离最近的谷点V2和谷点V3,基于所述最大互相关系数的点V1、谷点V2和谷点V3进行连线构成几何三角形,基于所述几何三角形获取当前子时间序列内的几何特征向量和前N个子时间序列的几何特征向量的均值;
S605、基于当前子时间序列内的几何特征向量和前N个子时间序列的几何特征向量的均值计算当前子时间序列内的几何特征向量的突变量;
S606、将当前子时间序列内的几何特征向量和当前子时间序列内的几何特征向量的突变量作为输入量输入到模糊逻辑***中,基于空间相关模糊规则对当前子时间序列内的几何特征向量和当前子时间序列内的几何特征向量的突变量进行分别数据处理,从而得到相应的第一输出特征和第二输出特征;
S607、在所述模糊逻辑***中,基于时间相关模糊规则对所述第一输出特征和所述第二输出特征进行合并数据处理,得到空间相关度指标;
S608、判断所述空间相关度指标是否大于预设指标阈值,若上述判断为是,则将所述异常节点类型判定为事件节点,若上述判断为否,则将所述异常节点类型判定为故障节点。
优选地,步骤S607之后,步骤S608之前包括:
S617、重新选取不同的时间窗口,重新执行步骤S603~S607从而得到相应的新的空间相关度指标;
则相应的,步骤S608具体包括:
判断所述空间相关度指标及所述新的空间相关度指标是否均大于预设指标阈值,若上述判断为是,则将所述异常节点类型判定为事件节点,若上述判断为否,则将所述异常节点类型判定为故障节点。
优选地,步骤S5之后还包括:当所述低压配电终端判定为数据采集异常时,则生成数据采集异常信号,并将所述数据采集异常信号发送至配电运维中心,以进行异常提醒。
第二方面,本发明还提供了一种低压配电监控终端数据采集异常检测***,以执行上述的低压配电监控终端数据采集异常检测方法,包括数据获取模块、标准化模块、数据清洗模块、聚类模块和异常判定模块;
所述数据获取模块,用于获取同一低压台区内的所有低压配电终端的数据样本,构建数据集;
所述标准化模块,用于基于Z-score标准化方法对所述数据集进行标准化处理,得到标准化数据集;
所述数据清洗模块,用于对所述标准化数据集进行数据清洗,得到清洗数据集;
所述聚类模块,用于基于预先训练好的DBSCAN聚类模型对所述清洗数据集进行聚类分析,从而划分出异常数据样本和正常数据样本;
所述异常判定模块,用于判断所述异常数据样本的个数是否大于预设的异常数据样本个数阈值,还用于当判断所述异常数据样本大于预设的异常数据样本阈值时,则将所述低压配电终端判定为数据采集异常。
从以上技术方案可以看出,本发明具有以下优点:
本发明通过基于密度的聚类算法对预先处理好的低压配电终端的数据样本进行聚类分析,从而可以得到异常数据样本,进而通过异常数据样本的个数判断低压配电终端是否为数据采集异常。其实现了对低压配电终端的数据采集进行异常检测,同时,基于对低压配电终端的数据样本的标准化处理和数据清洗,提高了异常检测的准确性。
附图说明
图1为本申请实施例提供的一种低压配电监控终端数据采集异常检测方法的流程图;
图2为本申请实施例提供的距离曲线图;
图3为本申请实施例提供的空间互相关系数曲线图;
图4为本申请实施例提供的模糊逻辑模糊集合划分示意图;
图5为本申请实施例提供的一种低压配电监控终端数据采集异常检测***的结构示意图;
图6为本申请算例提供的低压配电网拓扑结构图;
图7为本申请算例提供的训练阶段聚类结果示意图;
图8为本申请算例提供的异常样本点检测结果图;
图9为本申请算例提供的节点在某时间窗口上的空间互相关系数曲线图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
由于低压配网中LTU数量多、总体数据量大,往往容易出现因工作状态异常而产生的异常数据难以及时检测出来,进而影响故障检测和处理,降低低压配网供电的可靠性,且此类异常排查较为耗时,额外增加了运维人员的工作量;而对于含分布式电源的低压配电网来说,分布式电源通过LTU将采集的信息上送至微电网控制中心进行监视控制,异常数据的送入会导致错误决策。在实际的低压配网运行过程中,LTU采集的数据中电流、电压采样值错误数据较多,但由于低压配网中LTU安装规模日益庞大,对低压配网数据中潜在的LTU异常采样数据已无法采取人工方式实现校核与辨识。
为此,本发明提供了一种低压配电监控终端数据采集异常检测方法以解决上述很难对低压配电终端的数据采集进行异常检测的技术问题,从而提高低压配网数据质量与自动检测水平。
为了便于理解,请参阅图1,本发明提供的一种低压配电监控终端数据采集异常检测方法,包括以下步骤:
S1、获取同一低压台区内的所有低压配电终端的数据样本,构建数据集;
S2、基于Z-score标准化方法对数据集进行标准化处理,得到标准化数据集;
需要说明的是,基于Z-score标准化方法为现有技术,在此不再赘述。
S3、对标准化数据集进行数据清洗,得到清洗数据集;
S4、基于预先训练好的DBSCAN聚类模型对清洗数据集进行聚类分析,从而划分出异常数据样本和正常数据样本;
需要说明的是,DBSCAN(density-Based spatial clustering ofapplicationswith noise),即基于密度的聚类算法。
S5、判断异常数据样本的个数是否大于预设的异常数据样本个数阈值,若上述判断为是,则将低压配电终端判定为数据采集异常。
本发明通过基于密度的聚类算法对预先处理好的低压配电终端的数据样本进行聚类分析,从而可以得到异常数据样本,进而通过异常数据样本的个数判断低压配电终端是否为数据采集异常。其实现了对低压配电终端的数据采集进行异常检测,同时,基于对低压配电终端的数据样本的标准化处理和数据清洗,提高了异常检测的准确性。
以上为本发明提供的一种低压配电监控终端数据采集异常检测方法的实施例的详细描述,以下为本发明提供的一种低压配电监控终端数据采集异常检测方法的另一实施例的详细描述。
本实施例提供的一种低压配电监控终端数据采集异常检测方法,包括以下步骤:
S100、获取同一低压台区内的所有低压配电终端的数据样本,构建数据集;
S200、基于Z-score标准化方法对数据集进行标准化处理,得到标准化数据集;
需要说明的是,由于同一台区下不同低压配电终端(low-voltage terminalunit,LTU)的安装位置、设备运行状况、周围环境条件均不同,低压配变终端(Transformerterminal unit,TTU)进行数据处理、分析时难以拿到所有LTU在同一时间断面的数据值,因此,要对数据进行标准化处理,本实施例是通过使用Z-score标准化方法将不同量级的数据转化为同一个量级。
S300、对标准化数据集进行数据清洗,得到清洗数据集;
需要说明的是,由于LTU采集的样本数据较难同步,而对于同一时间断面数据不全的问题采用线性插值的方法进行解决。
S400、基于预先训练好的DBSCAN聚类模型对清洗数据集进行聚类分析,从而划分出异常数据样本和正常数据样本;
具体地,在步骤S400之前还包括对DBSCAN聚类模型进行训练的过程,则在在步骤S400之前具体包括:
S401、获取低压配电终端的历史正常数据,对历史正常数据进行标准化处理,将经标准化处理的历史正常数据构建为正常样本数据集;
S402、基于正常样本数据集在同一时刻获取两个等长单变量时间序列的第一数据样本点集和第二数据样本点集,第一数据样本点集和第二数据样本点集中的样本点数相等;
在本实施例中,基于配电网的两个终端设备传感器Mi和Mj在某时刻T的两个等长的单变量时间序列分别为,
公式1中,表示第一数据样本点集,Pi,t,t=1,2,...,t表示第一数据样本点集中的数据样本点,/>表示第一数据样本点集,Pj,t,t=1,2,...,t表示第二数据样本点集中的数据样本点。
S403、基于时间序列相似性测度公式计算第一数据样本点集和第二数据样本点集之间的各个样本点的距离,对距离进行升序排列,以构建距离矩阵;
需要说明的是,时间序列相似性测度公式为,
式中,表示第一数据样本点集,/>表示第二数据样本点集,/>表示/>概率分布的JS散度;DE i,j为/>与/>对应的各个样本点之间的欧氏距离,DM i,j表示错误模式距离,即代表/>与/>是否同时具有或不具有数据流中出现缺失值和有小于0的样本点两种错误。
其中,JS散度的计算公式为,
式中,Dk i,j(R||M)表示KL散度;
欧氏距离DE i,j的计算公式为,
错误模式距离DM i,j的计算公式为,
公式5中,为判定结果值,NaN表示数据缺失;
S404、根据第一数据样本点集和第二数据样本点集之间的各个样本点的距离构建距离曲线图,距离曲线图的横坐标为样本点序号,其纵坐标为距离,每条距离曲线表示为第一数据样本点集的当前样本点与第二数据样本点集中各个样本点的距离;
需要说明的是,在本实施例中,LTU采集的第一数据样本点集和第二数据样本点集均为15min一个数据点,一天均为96个数据点,其构建的距离曲线图如图2所示,其共有96条距离曲线。
S405、基于距离曲线图,将样本点中位数处所对应的距离曲线按照距离值由大到小的次序进行排序,得到距离曲线序列,在距离曲线序列中以均等间隔确定四条距离曲线作为拟合曲线;
在本实施例中,在96条距离曲线中,取样本点中位数为50的位置所对应的距离曲线按照距离值由大到小的次序进行排序,从而得到具有48条距离曲线,在48条距离曲线中,可以由大到小以均等间隔选取四条距离曲线作为拟合曲线,其间隔可以为一条。
S406、对步骤S405确定的四条拟合曲线分别进行四次多项式曲线拟合,其四次多项式曲线拟合的拟合方程为,
disti(x)=pix4+qix3+rix2+six+ti 公式7
公式7中,t为变量,表示拟合曲线的位置点,pi、qi、ri、si和ti均为通过相应的拟合曲线数据得到的拟合系数;
S407、根据四次多项式曲线拟合的拟合结果确定每个拟合曲线的拐点位置的值,再根据每个拟合曲线的拐点位置的值再次进行四次多项式曲线拟合,得到每个拟合曲线的拟合结果,根据四个拟合曲线的拟合结果的均值确定邻域范围的半径;
具体地,在步骤S407中,对四次多项式曲线拟合进行拟合后,对disti(x)求二阶导数,得到二阶导数方程为,
disti”(x)=12pix2+6qix+2ri 公式8
令disti”(x)=0代入公式8中,得到二阶导数方程的两个根x1、x2,选取两个根中最大值作为相应的拟合曲线的拐点位置的值,即xi=max(x1,x2),从而得到四个拟合曲线的拐点位置的值;
令disti(x)=disti(xi),xi表示每个拟合曲线的拐点位置的值,将disti(xi)代入到公式7中,从而得到每个拟合曲线的disti(xi)的值,取四个拟合曲线的disti(xi)的值的均值作为邻域范围的半径,即表示为,
公式9中,Eps表示为邻域范围的半径。
S408、将邻域范围的半径进行四次多项式曲线拟合,得到四个变量值,根据四个变量值的平均值确定密度阈值;
具体地,将disti(xi')=Eps代入公式7中,从而可以得到四次多项式曲线拟合的拟合方程的四个变量值,将四个变量值的平均值作为密度阈值,也即
公式10中,MinPts表示密度阈值。
需要说明的是,传统的DBSCAN聚类算法中Eps与MinPts的大小通常以人工取经验值的方式设置,其精度低且适用性差。而本实施例是在欧氏距离的基础上,应用JSD(Jensen-Shannon Divergence)JS散度距离和自定义的错误模式距离,得到自适应的Eps与MinPts,提高了精度和适用性。
S409、基于DBSCAN聚类算法对正常样本数据集进行训练,并在训练前,将正常样本数据集中的所有样本数据标记为未读;
S410、任选一个未读的样本数据为起始数据,以起始数据为圆点,并根据邻域范围的半径进行画圆,以圆作为起始数据的邻域范围,对起始数据的邻域范围内的样本数据的个数进行计数,判断样本数据的个数是否大于密度阈值,若判断为是,则将样本数据判定为核心点,并将核心点标记为已读;
需要说明的是,在本实施例中,将正常样本数据集定义为P,在正常样本数据集P中任意一个样本数据q作为起始数据,以该样本数据q为圆点,并根据邻域范围的半径进行画圆,以圆内的范围作为起始数据的邻域范围,若起始数据的邻域范围的样本数据的个数大于密度阈值(即最小的数据个数),则将样本数据q判定为核心点,并将样本数据q标记为已读,可以将样本数据q邻域范围内的样本数据定义为聚类数据集Pi
S411、根据邻域范围的半径确定核心点所有密度可达的样本数据,并将核心点和核心点密度可达的样本数据归类为一簇;
在本实施例中,即将样本数据q和聚类数据集Pi归类为一簇,从而生成聚类簇。
S412、重复步骤S410~S411直至所有未读的样本数据被标记为已读,从而确定出所有簇;若已读的样本数据未被归类到簇中,则将相应的样本数据归类为噪声点,并将噪声点剔除,从而构建DBSCAN聚类模型。
在本实施例中,在满足的条件下,重复步骤S410~S411将所有未读的样本数据都进行遍历,判断是否为核心点或为其密度可达的样本数据,若某个样本数据既不属于核心点,也不是核心点密度可达的样本数据,则将该样本数据定义为噪声点,并将噪声点剔除,从而构建DBSCAN聚类模型,可以对正常样本数据进行分类,并识别出异常样本数据。
在另一实施例中,还获取低压配电终端的历史异常数据作为测试集,对DBSCAN聚类模型进行测试,以对DBSCAN聚类模型进行优化。
具体地,步骤S400具体包括:
S401、将所有的核心点构建为核心点集;
S402、向预先训练好的DBSCAN聚类模型中输入清洗数据集,将清洗数据集中的各个数据样本和核心点集中的各个核心点进行线性遍历比较,根据邻域范围的半径判断清洗数据集中的数据样本是否在核心点的邻域范围内,若上述判断为是,则将相应的数据样本标记为异常数据样本,若上述判断为否,则将相应的数据样本标记为正常数据样本。
需要说明的是,经过训练得到的DBSCAN聚类模型中,由于核心点代表一簇,则可以将所有核心点构成核心点集,通过将实时获取的数据样本与核心点集中的各个核心点进行比较,判断实时获取的数据样本是否在核心点的邻域范围内,如果为正常数据样本则在核心点的邻域范围内,反之则立,从而可以区分出异常数据样本和正常数据样本。
S500、判断异常数据样本的个数是否大于预设的异常数据样本个数阈值,若上述判断为是,则将低压配电终端判定为数据采集异常。
在本实施例中,预设的异常数据样本个数阈值为1。
S600、基于预设的异常节点区分准则判断低压配电终端导致数据采集异常的异常节点类型,异常节点类型包括事件节点和故障节点,事件节点为低压配电终端的外部线路故障导致,故障节点为低压配电终端的内部故障导致。
需要说明的是,本实施例区分异常节点类型是事件节点或故障节点,是通过同一台区下不同LTU间的空间相关性区分发生异常的LTU节点是事件节点还是故障节点。
具体地,步骤S600具体包括:
S601、在低压配电物联网中选取与异常数据样本相关联的LTU节点χi,通过LTU节点χi进行拓扑连接分析,以确定与LTU节点χi的电气距离最近的节点χi+1
S602、在LTU节点χi和节点χi+1中获取对应的时间序列和时间序列/>
S603、基于滑动时间窗口的方法计算时间序列和时间序列/>的互相关系数,并根据互相关系数绘制空间互相关系数曲线图,空间互相关系数曲线图的横坐标为时间窗口时延,其纵坐标为互相关系数;
需要说明的是,假设将Ff(a)(τ)定义为在第f个子时间序列上的LTU节点χi的时间窗口Ys与节点χi+1的时间窗口Ys-τ的互相关系数,则互相关系数的计算公式为,
公式11中,表示时间序列/>以窗口起始时刻a且以滑动时间窗口Wa为起点进行连续滑动值,/>表示时间序列/>以窗口起始时刻a-τ且以滑动时间窗口Wa-τ为起点进行连续滑动值;
将公式11中的符号进行展开得到,
公式12,A表示B表示/>A={a1,a2,...,ai},B={b1,b2,...,bi},
而根据互相关系数绘制空间互相关系数曲线图如图3所示,空间互相关系数曲线的横坐标为时间窗口时延τ0~τn,其纵坐标为互相关系数。
S604、基于空间互相关系数曲线图确定最大互相关系数的点V1、以及与其左右两端距离最近的谷点V2和谷点V3,基于最大互相关系数的点V1、谷点V2和谷点V3进行连线构成几何三角形,基于几何三角形获取当前子时间序列内的几何特征向量和前N个子时间序列的几何特征向量的均值;
具体地,如图3所示,确定时间窗口内的最大互相关系数的点,定义为V1,以最大互相关系数的点V1为中心点分别向空间互相关系数曲线的左边和右边确定距离与最大互相关系数V1最近的谷点(最低极点)V2、V3,连接最大互相关系数的点V1、谷点V2和谷点V3形成几何三角形V1V2V3,在几何三角形中提取几何特征,提取方法为,
基于最大互相关系数的点确定空间互相关系数曲线的最大曲线幅值,定义为
基于几何三角形V1V2V3的边V1V2(点V1与谷点V2构成的连线)和边V1V3(点V1与谷点V3构成的连线),边V1V2和边V1V3两边的余弦值,定义为
基于几何三角形V1V2V3计算几何三角形V1V2V3的面积,定义为
基于上述几何特征计算,前N个子时间序列的几何特征向量的均值,具体为,
公式13中,表示前N个子时间序列的空间互相关系数曲线的最大曲线幅值的均值,/>表示前N个子时间序列中几何三角形V1V2V3的边V1V2和边V1V3两边的余弦值的均值,/>表示前N个子时间序列中几何三角形V1V2V3的面积的均值,/>表示前N个子时间序列的空间互相关系数曲线的最大曲线幅值的总和,/>表示前N个子时间序列的几何三角形V1V2V3的边V1V2和边V1V3两边的余弦值的总和,/>表示前N个子时间序列的几何三角形V1V2V3的面积的总和。
S605、基于当前子时间序列内的几何特征向量和前N个子时间序列的几何特征向量的均值计算当前子时间序列内的几何特征向量的突变量;
在本实施例中,计算当前子时间序列内的几何特征向量的突变量的计算公式为,
公式14中,ΔC表示当前子时间序列内的空间互相关系数曲线的最大曲线幅值的突变量,表示当前子时间序列内的空间互相关系数曲线的最大曲线幅值,Δcos(θ)表示当前子时间序列内的几何三角形V1V2V3的边V1V2和边V1V3两边的余弦值的突变量,/>表示当前子时间序列内的几何三角形V1V2V3的边V1V2和边V1V3两边的余弦值,ΔS表示当前子时间序列内的几何三角形V1V2V3的面积的突变量,/>表示当前子时间序列内的几何三角形V1V2V3的面积。
S606、将当前子时间序列内的几何特征向量和当前子时间序列内的几何特征向量的突变量作为输入量输入到模糊逻辑***中,基于空间相关模糊规则对当前子时间序列内的几何特征向量和当前子时间序列内的几何特征向量的突变量进行分别数据处理,从而得到相应的第一输出特征和第二输出特征;
在本实施例中,模糊隶属度函数对模糊逻辑***定义了三个模糊集合,分别为{“L(强)”}、{“M(中)”}、{“S(弱)”},并用高斯隶属度函数及三角形隶属度函数共同构造了一种混合模糊隶属度函数,该模糊函数的稳定性及灵敏性较好,模糊集合的划分如图4所示。
为一组输入量和ΔC、Δcos(θ)、ΔS为一组输入量分别输入到模糊逻辑***中,基于空间相关模糊规则对当前子时间序列内的几何特征向量和当前子时间序列内的几何特征向量的突变量进行分别数据处理,其空间相关模糊规则如表1所示。
表1空间相关模糊规则表
序号 输入1 输入2 输入3 输出
1 L L L L
2 L M S L
3 L S L L
4 L S M L
5 L S S S
6 M S S S
7 M L L L
8 M M M M
9 S L L L
10 S S S S
其中,在对为一组输入量进行空间相关模糊规则处理所输出的第一输出特征为两个输出子特征Rf、/>其中,第一个输出子特征Rf为经过空间相关模糊规则直接处理输出的,第二个输出子特征是经过空间相关模糊规则后得到第一个输出子特征Rf,第一个输出子特征Rf再通过下式进行计算得到输出的,
公式15中,f表示函数;
S607、在模糊逻辑***中,基于时间相关模糊规则对第一输出特征和第二输出特征进行合并数据处理,得到空间相关度指标;
在本实施例中,时间相关模糊规则如表2所示。
表2时间相关模糊规则表
序号 输入1 输入2 输入3 输出
1 L L L S
2 L L M M
3 L M L M
4 L S L M
5 L M M L
6 L S M L
7 L L S M
8 L M S L
9 L S S L
10 M M L S
11 M L L S
12 M S L M
13 M M M M
14 M S M M
15 M L S S
16 M M S M
17 M S S M
18 M L M S
19 S L S S
20 S M S S
21 S S S S
S608、判断空间相关度指标是否大于预设指标阈值,若上述判断为是,则将异常节点类型判定为事件节点,若上述判断为否,则将异常节点类型判定为故障节点。
在本实施例中,预设指标阈值为根据用户自定义设置的。
另外,在另一实施示例中,步骤S607之后,步骤S608之前包括:
S617、重新选取不同的时间窗口,重新执行步骤S603~S607从而得到相应的新的空间相关度指标;
则相应的,步骤S608具体包括:
判断空间相关度指标及新的空间相关度指标是否均大于预设指标阈值,若上述判断为是,则将异常节点类型判定为事件节点,若上述判断为否,则将异常节点类型判定为故障节点。
需要说明的是,在选择时间窗口时,可能会产生一定的误差,因此,通过选取2个时间窗口进行确定相应的空间相关度指标,可以降低判定异常节点类型的误差。
进一步地,步骤S5之后还包括:当低压配电终端判定为数据采集异常时,则生成数据采集异常信号,并将数据采集异常信号发送至配电运维中心,以进行异常提醒。
需要说明的是,在获取异常节点类型后,数据采集异常信号还可以携带异常节点类型同时上传至配电运维中心,以便对运维人员进行及时提醒,并告知故障类型以提高维修效率。
本实施例通过基于密度的聚类算法对预先处理好的低压配电终端的数据样本进行聚类分析,从而可以得到异常数据样本,进而通过异常数据样本的个数判断低压配电终端是否为数据采集异常。其实现了对低压配电终端的数据采集进行异常检测,同时,基于对低压配电终端的数据样本的标准化处理和数据清洗,提高了异常检测的准确性,根据低压配网中LTU安装位置的空间相关性实现异常来源分析,以提高后续运维的效率。
请参阅图5,本发明还提供了一种低压配电监控终端数据采集异常检测***,以执行上述实施例的低压配电监控终端数据采集异常检测方法,包括数据获取模块100、标准化模块200、数据清洗模块300、聚类模块400和异常判定模块500;
数据获取模块100,用于获取同一低压台区内的所有低压配电终端的数据样本,构建数据集;
标准化模块200,用于基于Z-score标准化方法对数据集进行标准化处理,得到标准化数据集;
数据清洗模块300,用于对标准化数据集进行数据清洗,得到清洗数据集;
聚类模块400,用于基于预先训练好的DBSCAN聚类模型对清洗数据集进行聚类分析,从而划分出异常数据样本和正常数据样本;
异常判定模块500,用于判断异常数据样本的个数是否大于预设的异常数据样本个数阈值,还用于当判断异常数据样本大于预设的异常数据样本阈值时,则将低压配电终端判定为数据采集异常。
为了验证上述的低压配电监控终端数据采集异常检测方法能够实现对低压配电终端的数据采集进行异常检测,以下为结合低压配电监控终端数据采集异常检测方法的一个具体算例。
如图6所示,低压配电物联网主要以辐射型网络为主。在改造或者新建的台区中,分别在台区变压器、电缆分支箱处分别安装TTU与LTU,各处的LTU能够实时的监测电流、电压、功率、环境状态等数据,经低压***通信信道传输到TTU,TTU对数据进行数据处理后通过光纤将信息送至云端进行进一步的数据挖掘。
Step1、数据筛选
由本发明的低压配电监控终端数据采集异常检测方法要对合理的数据特征进行聚类,因此,根据LTU数据的时间相关性,可人为筛选出部分数据间方差非常大的的端设备数据作为异常数据,其余数据间方差较小的作为合理的观测数据P1。由预处理后的数据集P1中抽取训练集P2,在余下的节点数据中随机注入异常从而生成故障节点和事件节点,得到标记出异常节点的检测集P3,以训练集P2的训练结果对P3中的异常节点进行检测,将检测得出的异常节点数据集P4结合数据集P1作为输入以验证方法识别故障节点和时间节点的能力。
Step2、算法训练
选取训练集P1中单个端设备每天观测的时间片段作为样本点用改进的DBSCAN算法对训练集P2中Ntrain=30个样本点进行聚类,聚类得到的每个核心点将代表低压配网上该LTU处工作日内电压的每种环境特征。算法自适应生成的全局密度参数:Eps为1.35,MinPts为18,将聚类结果经主成分分析法PCA(Principal ComponentAnalysis)映射到二维空间,如图7所示。
Step3、检测阶段
通过训练阶段获得了低压配电网中单台LTU量测区域内的核心点集,在通过训练阶段获得了单个端设备正常运行状态下的核心点集后,将实时运行数据依序加入数据集中,形成检测数据集P3输入到DBSCAN算法中,通过与核心点集进行线性遍历比较,根据低压配电监控终端数据采集异常检测方法对检测数据集P3进行异常样本点检测,LTU数据检测结果如图8所示。
异常样本点检测出后,进行计数统计,连续出现计数超过设定阈值γ=1,则判断LTU数据采集异常。
此时检测出的异常状态的LTU节点中包含事件节点与故障节点,故障节点的输出失信与误报会导致保护剩余电流保护闭锁与电弧保护的误动,需及时告警而事件节点则反映出线路中可能发生短路等严重故障,应及时预警并采取措施解决,因此要对LTU节点异常状态的异常来源进行区分。
Step4、异常节点类型识别
对于一个异常的LTU节点,计算与其物理距离最近节点的的空间互相关系数选取的滑动窗口的长度T为2小时(8个数据点),子时间序列长度为12小时(48个数据点)。图9为该LTU节点在某半天中以起始时刻为中午12时的时间窗口上的空间互相关系数曲线图。
提取节点在每个时间窗口上空间互相关系数的几何特征,得到节点在半天的子时间序列中的空间相关特征向量,类似地,得到节点过去各个半天的空间相关特征向量并计算均值作为节点在历史时间上的空间相关特征向量,将上述作为模糊逻辑***的输入,设置实验模糊隶属度函数u=1,自定义预设指标阈值thre为0.5,当空间相关度指标R连续低于阈值的时间长度超过2个时间窗口长度时,判定为事件节点,反之则为故障节点。
由本算例可以得出的是,本发明提供的低压配电监控终端数据采集异常检测方法能够实现对低压配电终端的数据采集进行异常检测,同时,能够对数据的分布进行更深度的挖掘,从而计算出最佳的密度阈值和领域范围的半径值;且通过时划分时间长度降低了数据集的维度,避免了维度灾难对聚类结果的影响,可以有效提升计算效率及计算精度;同时,该方法动态性强,能够很好的满足在实际配电网运行中端设备的在线检测的实时性。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (9)

1.一种低压配电监控终端数据采集异常检测方法,其特征在于,包括以下步骤:
S1、获取同一低压台区内的所有低压配电终端的数据样本,构建数据集;
S2、基于Z-score标准化方法对所述数据集进行标准化处理,得到标准化数据集;
S3、对所述标准化数据集进行数据清洗,得到清洗数据集;
S4、基于预先训练好的DBSCAN聚类模型对所述清洗数据集进行聚类分析,从而划分出异常数据样本和正常数据样本;
S5、判断所述异常数据样本的个数是否大于预设的异常数据样本个数阈值,若上述判断为是,则将所述低压配电终端判定为数据采集异常;
在步骤S4之前包括:
S401、获取低压配电终端的历史正常数据,对所述历史正常数据进行标准化处理,将经标准化处理的历史正常数据构建为正常样本数据集;
S402、基于所述正常样本数据集在同一时刻获取两个等长单变量时间序列的第一数据样本点集和第二数据样本点集,所述第一数据样本点集和所述第二数据样本点集中的样本点数相等;
S403、基于时间序列相似性测度公式计算所述第一数据样本点集和所述第二数据样本点集之间的各个样本点的距离,对所述距离进行升序排列,以构建距离矩阵;
S404、根据所述第一数据样本点集和所述第二数据样本点集之间的各个样本点的距离构建距离曲线图,所述距离曲线图的横坐标为样本点序号,其纵坐标为距离,每条距离曲线表示为所述第一数据样本点集的当前样本点与所述第二数据样本点集中各个样本点的距离;
S405、基于所述距离曲线图,将样本点中位数处所对应的距离曲线按照距离值由大到小的次序进行排序,得到距离曲线序列,在所述距离曲线序列中以均等间隔确定四条距离曲线作为拟合曲线;
S406、对步骤S405确定的四条拟合曲线分别进行四次多项式曲线拟合,其四次多项式曲线拟合的拟合方程为,
disti(x)=pix4+qix3+rix2+six+ti
上式中,t为变量,表示拟合曲线的位置点,pi、qi、ri、si和ti均为通过相应的拟合曲线数据得到的拟合系数;
S407、根据四次多项式曲线拟合的拟合结果确定每个拟合曲线的拐点位置的值,再根据每个拟合曲线的拐点位置的值再次进行四次多项式曲线拟合,得到每个拟合曲线的拟合结果,根据四个拟合曲线的拟合结果的均值确定邻域范围的半径;
S408、将所述邻域范围的半径进行四次多项式曲线拟合,得到四个变量值,根据四个变量值的平均值确定密度阈值;
S409、基于DBSCAN聚类算法对所述正常样本数据集进行训练,并在训练前,将所述正常样本数据集中的所有样本数据标记为未读;
S410、任选一个未读的样本数据为起始数据,以所述起始数据为圆点,并根据所述邻域范围的半径进行画圆,以圆作为所述起始数据的邻域范围,对所述起始数据的邻域范围内的样本数据的个数进行计数,判断所述样本数据的个数是否大于所述密度阈值,若判断为是,则将所述样本数据判定为核心点,并将所述核心点标记为已读;
S411、根据所述邻域范围的半径确定所述核心点所有密度可达的样本数据,并将所述核心点和所述核心点密度可达的样本数据归类为一簇;
S412、重复步骤S410~S411直至所有未读的样本数据被标记为已读,从而确定出所有簇;若已读的样本数据未被归类到簇中,则将相应的样本数据归类为噪声点,并将所述噪声点剔除,从而构建DBSCAN聚类模型。
2.根据权利要求1所述的低压配电监控终端数据采集异常检测方法,其特征在于,步骤S3中的数据清洗的方式包括线性差值。
3.根据权利要求1所述的低压配电监控终端数据采集异常检测方法,其特征在于,所述时间序列相似性测度公式为,
式中,表示第一数据样本点集,/>表示第二数据样本点集,/>表示/>与/>概率分布的JS散度;DE i,j为/>与/>对应的各个样本点之间的欧氏距离,DM i,j表示错误模式距离,即代表/>与/>是否同时具有或不具有数据流中出现缺失值和有小于0的样本点两种错误。
4.根据权利要求1所述的低压配电监控终端数据采集异常检测方法,其特征在于,步骤S4具体包括:
S401、将所有的所述核心点构建为核心点集;
S402、向所述预先训练好的DBSCAN聚类模型中输入所述清洗数据集,将所述清洗数据集中的各个数据样本和所述核心点集中的各个核心点进行线性遍历比较,根据所述邻域范围的半径判断所述清洗数据集中的数据样本是否在所述核心点的邻域范围内,若上述判断为是,则将相应的数据样本标记为异常数据样本,若上述判断为否,则将相应的数据样本标记为正常数据样本。
5.根据权利要求1所述的低压配电监控终端数据采集异常检测方法,其特征在于,步骤S5之后包括:
S6、基于预设的异常节点区分准则判断所述低压配电终端导致数据采集异常的异常节点类型,所述异常节点类型包括事件节点和故障节点,所述事件节点为所述低压配电终端的外部线路故障导致,所述故障节点为所述低压配电终端的内部故障导致。
6.根据权利要求5所述的低压配电监控终端数据采集异常检测方法,其特征在于,步骤S6具体包括:
S601、在低压配电物联网中选取与所述异常数据样本相关联的LTU节点χi,通过所述LTU节点χi进行拓扑连接分析,以确定与所述LTU节点χi的电气距离最近的节点χi+1
S602、在所述LTU节点χi和所述节点χi+1中获取对应的时间序列和时间序列/>
S603、基于滑动时间窗口的方法计算所述时间序列和所述时间序列/>的互相关系数,并根据互相关系数绘制空间互相关系数曲线图,所述空间互相关系数曲线图的横坐标为时间窗口时延,其纵坐标为互相关系数;
S604、基于所述空间互相关系数曲线图确定最大互相关系数的点V1、以及与其左右两端距离最近的谷点V2和谷点V3,基于所述最大互相关系数的点V1、谷点V2和谷点V3进行连线构成几何三角形,基于所述几何三角形获取当前子时间序列内的几何特征向量和前N个子时间序列的几何特征向量的均值;
S605、基于当前子时间序列内的几何特征向量和前N个子时间序列的几何特征向量的均值计算当前子时间序列内的几何特征向量的突变量;
S606、将当前子时间序列内的几何特征向量和当前子时间序列内的几何特征向量的突变量作为输入量输入到模糊逻辑***中,基于空间相关模糊规则对当前子时间序列内的几何特征向量和当前子时间序列内的几何特征向量的突变量进行分别数据处理,从而得到相应的第一输出特征和第二输出特征;
S607、在所述模糊逻辑***中,基于时间相关模糊规则对所述第一输出特征和所述第二输出特征进行合并数据处理,得到空间相关度指标;
S608、判断所述空间相关度指标是否大于预设指标阈值,若上述判断为是,则将所述异常节点类型判定为事件节点,若上述判断为否,则将所述异常节点类型判定为故障节点。
7.根据权利要求5所述的低压配电监控终端数据采集异常检测方法,其特征在于,步骤S607之后,步骤S608之前包括:
S617、重新选取不同的时间窗口,重新执行步骤S603~S607从而得到相应的新的空间相关度指标;
则相应的,步骤S608具体包括:
判断所述空间相关度指标及所述新的空间相关度指标是否均大于预设指标阈值,若上述判断为是,则将所述异常节点类型判定为事件节点,若上述判断为否,则将所述异常节点类型判定为故障节点。
8.根据权利要求1所述的低压配电监控终端数据采集异常检测方法,其特征在于,步骤S5之后还包括:当所述低压配电终端判定为数据采集异常时,则生成数据采集异常信号,并将所述数据采集异常信号发送至配电运维中心,以进行异常提醒。
9.一种低压配电监控终端数据采集异常检测***,以执行权利要求1所述的低压配电监控终端数据采集异常检测方法,其特征在于,包括数据获取模块、标准化模块、数据清洗模块、聚类模块和异常判定模块;
所述数据获取模块,用于获取同一低压台区内的所有低压配电终端的数据样本,构建数据集;
所述标准化模块,用于基于Z-score标准化方法对所述数据集进行标准化处理,得到标准化数据集;
所述数据清洗模块,用于对所述标准化数据集进行数据清洗,得到清洗数据集;
所述聚类模块,用于基于预先训练好的DBSCAN聚类模型对所述清洗数据集进行聚类分析,从而划分出异常数据样本和正常数据样本;
所述异常判定模块,用于判断所述异常数据样本的个数是否大于预设的异常数据样本个数阈值,还用于当判断所述异常数据样本大于预设的异常数据样本阈值时,则将所述低压配电终端判定为数据采集异常。
CN202110744907.9A 2021-06-30 2021-06-30 一种低压配电监控终端数据采集异常检测方法及*** Active CN113344134B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110744907.9A CN113344134B (zh) 2021-06-30 2021-06-30 一种低压配电监控终端数据采集异常检测方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110744907.9A CN113344134B (zh) 2021-06-30 2021-06-30 一种低压配电监控终端数据采集异常检测方法及***

Publications (2)

Publication Number Publication Date
CN113344134A CN113344134A (zh) 2021-09-03
CN113344134B true CN113344134B (zh) 2024-04-19

Family

ID=77482073

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110744907.9A Active CN113344134B (zh) 2021-06-30 2021-06-30 一种低压配电监控终端数据采集异常检测方法及***

Country Status (1)

Country Link
CN (1) CN113344134B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113807431A (zh) * 2021-09-15 2021-12-17 西安理工大学 一种基于多源信息融合的智能主轴状态评估方法和***
CN114124460B (zh) * 2021-10-09 2023-07-18 广东技术师范大学 工控***入侵检测方法、装置、计算机设备及存储介质
CN114492517B (zh) * 2022-01-10 2022-11-25 南方科技大学 电梯检测方法、电梯检测装置、电子设备及存储介质
CN115409132A (zh) * 2022-10-31 2022-11-29 广东电网有限责任公司佛山供电局 一种配电网数据的处理方法及***
CN115936428B (zh) * 2022-11-17 2023-06-30 江苏东港能源投资有限公司 增量配电网防外破定值优化***
CN115982602B (zh) * 2023-03-20 2023-06-30 济宁众达利电气设备有限公司 一种光伏变压器电故障检测方法
CN116774109B (zh) * 2023-06-26 2024-01-30 国网黑龙江省电力有限公司佳木斯供电公司 基于声纹检测信息的变压器故障识别***
CN117454299B (zh) * 2023-12-21 2024-03-26 深圳市研盛芯控电子技术有限公司 异常节点的监测方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512474A (zh) * 2015-12-02 2016-04-20 国网山东省电力公司电力科学研究院 一种变压器状态监测数据的异常检测方法
WO2016101690A1 (zh) * 2014-12-22 2016-06-30 国家电网公司 基于时间序列分析的输变电设备的状态监测数据清洗方法
CN106909664A (zh) * 2017-02-28 2017-06-30 国网福建省电力有限公司 一种电力设备数据流故障识别方法
CN111695639A (zh) * 2020-06-17 2020-09-22 浙江经贸职业技术学院 一种基于机器学习的电力用户用电异常检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016101690A1 (zh) * 2014-12-22 2016-06-30 国家电网公司 基于时间序列分析的输变电设备的状态监测数据清洗方法
CN105512474A (zh) * 2015-12-02 2016-04-20 国网山东省电力公司电力科学研究院 一种变压器状态监测数据的异常检测方法
CN106909664A (zh) * 2017-02-28 2017-06-30 国网福建省电力有限公司 一种电力设备数据流故障识别方法
CN111695639A (zh) * 2020-06-17 2020-09-22 浙江经贸职业技术学院 一种基于机器学习的电力用户用电异常检测方法

Also Published As

Publication number Publication date
CN113344134A (zh) 2021-09-03

Similar Documents

Publication Publication Date Title
CN113344134B (zh) 一种低压配电监控终端数据采集异常检测方法及***
CN109816031B (zh) 一种基于数据不均衡度量的变压器状态评估聚类分析方法
CN115187527B (zh) 一种多源混合型特高频局部放电图谱的分离识别方法
CN108199891B (zh) 一种基于人工神经网络多角度综合决策的cps网络攻击辨识方法
CN112416643A (zh) 无监督异常检测方法与装置
CN107679734A (zh) 一种用于无标签数据分类预测的方法和***
CN114004137A (zh) 一种多源气象数据融合与预处理方法
Jiang et al. A multisensor cycle-supervised convolutional neural network for anomaly detection on magnetic flux leakage signals
CN109063885A (zh) 一种变电站异常量测数据预测方法
CN112949714A (zh) 一种基于随机森林的故障可能性预估方法
CN110348683A (zh) 电能质量扰动事件主成因分析方法、装置设备及存储介质
CN113987908A (zh) 基于机器学习方法的天然气管网泄漏预警方法
CN115130578A (zh) 一种基于增量式粗糙聚类的配电设备状态在线评估方法
CN116467950A (zh) 一种基于不确定表征的无人机飞行数据异常检测方法
CN114244594A (zh) 网络流量异常检测方法及检测***
CN112215307B (zh) 一种应用机器学习自动检测地震仪器信号异常的方法
CN113657747A (zh) 一种企业安全生产标准化级别智能评定***
CN117251814A (zh) 一种高速公路充电桩电量损耗异常的分析方法
CN112345972A (zh) 基于停电事件的配电网线变关系异常诊断方法、装置及***
CN115469585B (zh) 一种基于大数据的水电机组状态监测方法及***
CN116317103A (zh) 一种配电网电压数据处理方法
CN112732773B (zh) 一种继电保护缺陷数据的唯一性校核方法及***
CN114597886A (zh) 基于区间二型模糊聚类分析的配电网运行状态评估方法
CN112287302A (zh) 用于检测油液酸碱度的方法、计算设备和计算机存储介质
CN118051863B (zh) 一种基于数字计量技术的健康数据采集***及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant