CN112668612A - 一种基于网格的局部放电信号聚类分析方法 - Google Patents

一种基于网格的局部放电信号聚类分析方法 Download PDF

Info

Publication number
CN112668612A
CN112668612A CN202011430387.6A CN202011430387A CN112668612A CN 112668612 A CN112668612 A CN 112668612A CN 202011430387 A CN202011430387 A CN 202011430387A CN 112668612 A CN112668612 A CN 112668612A
Authority
CN
China
Prior art keywords
grid
clustering
partial discharge
data
analysis method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011430387.6A
Other languages
English (en)
Inventor
代少升
刘小兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202011430387.6A priority Critical patent/CN112668612A/zh
Publication of CN112668612A publication Critical patent/CN112668612A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Testing Relating To Insulation (AREA)

Abstract

本发明属于电力电气设备局部放电信号监测的领域,申请保护一种基于网格的局部放电信号聚类分析方法。涉及数据挖掘技术与数字信号处理技术。该方法首先通过采集***采集原始局部放电信号,获取有效的信号特征量;经过预处理对原始有效特征量进行归一化处理;利用数据集本身属性划分网格单元;将数据通过一定的索引关系映射到网格中去;利用高斯核函数的优势对网格局部密度进行估计;利用相对距离的思想,通过决策图的形式自决策聚类数目与聚类中心点;根据聚类中心点分配非聚类中心数据;最后,根据相对距离标记噪声点和离群点。本发明提出的基于网格的局部放电信号聚类分析方法具有思想易实现、易集成、开发周期短、实时性高、聚类结果人为干预少等一系列优点。

Description

一种基于网格的局部放电信号聚类分析方法
技术领域
本发明涉及电力电气设备局部放电信号状态的检测分析方法,涉及数据挖掘技术、数字信号处理技术等领域。
背景技术
局部放电作为绝缘体缺陷的一种表征,通过检测其存在及其含量之后,有利于对高压电气设备进行恰当的检修与更换。然而不同的放电类型,其产生原因、放电强度以及放电持续时间等不尽相同。在复杂的环境中,往往存在多种局部放电源信号和噪声,给辨别局部放电类型增加了难度,有时甚至依靠主观经验来判断放电类型。这在复杂的情形下是很难做到正确判断的,甚至可能误判成其他放电类型,从而不能及时有效地完成检修工作。因此,有效地将不同放电类型根据其特征量区分开,然后将满足同一条件的信号聚集在一起并辨识,如此才能及时检测设备运行状况,避免突发事故。
为了检测局部放电并及时维护电力设备,在长期发展的过程中,电力电气设备的故障检测一般采用定期检测,但是随着工业的突飞猛进,电网变得越来越复杂,定期检测也开始呈现出越来越多的不足之处,在进行电气设备故障检测时,为了保障检修时的设备及人员安全,必须停电检修,这将给人们的生产生活带来极大的不便;由于定期检查,工作量大,所以其检修周期时间长,可能半年或者一年检修一次。这样就很难发现一个周期内发生的电气设备故障问题,潜在危害极大;由于检修时试验设备的限制以及试验过程中产生的各种噪声干扰,不能正确的反映实际情况,测试到的数据往往不能反映真实的绝缘体状态,从而无法发现绝缘体缺陷的存在。
针对这些问题,行业内制造了能实时反映绝缘体状态的在线监测***。这不仅缩短了检测时的时间和周期,同时保障能及时发现潜在的绝缘体缺陷。然而由于采集设备的限制,采集局部放电信号时,往往会参杂大量与局放信号相似度极高的干扰信号,甚至可能是其他局部放电信号。这些干扰信号可能传播途径不同,信号强度和频率不同,有些干扰信号甚至会将局放信号淹没,这直接影响到局放信号的检测。另外,由于局部放电有多种放电类型,当用设备采集局放信号用作分析时,必将把多种局放信号混合在一起,导致无法准确判定为何种类型的局放信号,这给高压电气设备的检修带来极大的困难。
近年来,随着大数据时代的到来,数据挖掘技术被应用于多个场景,将现有聚类方法应用于局部放电信号的分析中,主要需要考虑的是算法的实时性、算法最优参数的选取问题。而常规的聚类方法均无法满足局部放电检测的自动化和智能化需求。
发明内容
针对存在的技术问题,本发明提出了一种针对局部放电信号的聚类分析方法,采用网格划分技术来提高算法收敛速度,利用筛选差分抖升法自动决策聚类数目和聚类中心。
为了解决局部放电信号特征量的聚类分析问题,本发明采用了如下技术方案:一种基于网格的局部放电信号聚类分析方法,该方法主要由以下步骤组成:
第1步:获取原始数据的波形特征数据并用于聚类分析的输入数据集。
第2步:对数据集进行预处理,采用归一化处理数据集。
第3步:利用网格聚类方法的思想,将归一化后的数据集进行网格划分,划分的网格等长且互不相交,网格划分的长度依赖于数据集的规模。
第4步:将归一化后的数据集映射到网格空间中,生成对应的映射值。
第5步:利用高斯核函数,估计每个网格的密度,并记录每个网格的密度值。
第6步:根据密度峰值聚类的相对距离思想,利用网格密度来计算相对网格距离值。
第7步:根据网格密度和相对网格距离组成二维决策图,并通过均值筛选序列对,之后利用差分抖升法确定聚类中心和聚类数量。
第8步:将非聚类中心分配到最近的簇内,并对边界点和离群点进行处理,输出聚类结果。
该方法的聚类指标主要包括准确度ACC和调整兰德指数ARI,其中准确度 ACC主要用于判断聚类划分的准确性;调整兰德指数ARI主要用于判断类内的纯度。上述指标的公式如下:
Figure BDA0002826463170000021
Figure BDA0002826463170000022
其中Nright、N分别为正确聚类的点数和总的数据集点数,RI可表示如下:
Figure BDA0002826463170000023
a表示实际与实验结果在同一个簇的数据样本对个数,而b为实际与实验都不在一个簇的数据样本对个数,ndou表示数据集中可以组成样本对的个数。
对于聚类结果而言,当ACC值和ARI值均最大时,聚类效果最好。而本文的数据样本,来自于采集电路获取的局部放电信号的特征量,这些特征量具有一定的分辨性,可以用作区分不同的局部放电信号。该采集电路主要包括特高频传感器(UHF),利用局部放电信号产生时附带的磁场效应,通过传感器耦合成电信号之后,信号进入前置包络电路,通过包络电路保留信号重要信息的同时还能对特高频信号起到降频的作用,经过ADC采集模块对该包络信号进行采集,并通过通路选择芯片选择多路信号采集多相位信号,然后在现场可编程门阵列(FPGA) 上对波形数据逐个提取基本特征量,最后将基本特征量传入DSP计算最终使用的特征量。
本发明提出的基于网格的局部放电信号聚类分析方法与传统方法相比,能够运用于局部放电检测的硬件***上,适用于含噪的场景,能够发现噪声信号以及离群点,在实际应用中能够自动确定聚类数目和聚类中心点,顺应自动化和智能化的现实需求。
附图说明
图1是本发明数据集来源的结构图。
图2是本发明基于网格的局部放电聚类分析方法的流程图。
图3是本发明的聚类过程中的效果图。
其中图3(a)为归一化后的原始数据集分布图;图3(b)筛选后的决策图;图3(c) 为自动确定的聚类中心示意图;图3(d)为聚类结果图。
具体实施方式
下面结合附图和具体实例对本发明的聚类分析方法进行详细的描述:
图2中描述了基于网格的局部放电聚类分析方法的分析流程图,图中聚类分析从数据集输入开始,经过了一系列处理,最后输出聚类结果。其算法的实现原理如下:
数据集输入。通过提取局部放电信号波形特征量,作为聚类分析的输入。通过如图1所示的硬件***,从传感器接收耦合磁场信息开始,经包络电路降频提取有用信息,采取250M采样率的ADC采样,并运用可编程门阵列提取各种波形特征量,如:幅值、相位、偏斜度和峰度等特征量。将其组合成所需要的二维或者三维数据集,用作聚类分析的输入数据。如图2所示,对局部放电信号特征量的聚类分析分多阶段来实现。首先,由于不同特征量数据的数值范围和量纲不同,使得特征数据相互之间没有可比性,会增加误差,因此不能直接用作聚类分析,为了避免不同量纲带来的数量级差别,增加不同特征量之间的可比性,首先要做的是对原始特征量数据进行预处理,常见的消除量纲的方法有归一化和标准化,而归一化能将各特征量压缩到0到1之间,故本发明采用归一化来完成数据的预处理工作。给定数据总数为n的数据集Xd={xid},其中i=1,2,…,n,d表示数据的维度,数据集构成nxd的数据矩阵:
Figure BDA0002826463170000041
则数据集第i维数据的归一化值
Figure BDA0002826463170000042
可表示为式(3.2):
Figure BDA0002826463170000043
式中,
Figure BDA0002826463170000044
分别表示第i维数据样本的最大值和最小值。归一化后的数据集样本分布如图3(a)所示,
经过预处理之后,为了减少算法的执行时间,利用网格划分技术对归一化后的数据集进行处理,给定数据集Xd={xid},且每一维的数据存在上下界。该数据集的每一维数据分成本维度等间距且不想交的区间,然后联合多维度划分信息构成了网格单元,网格单元多为正方形区域。为了保证网格数量的合理性且保证其网格大小受制于数据集本身的属性,如数量和数据集的上下限。同时为了避免偏差太大的离群点对网格数目的影响,将第i维数据的网格边长定义为:
Figure BDA0002826463170000045
其中,Ui和Li分别表示数据集合中第i维数据的上界和下界,n表示数据样本的个数。对应第i维数据的网格数量为:
Figure BDA0002826463170000046
确定好网格空间后,需要将归一化后数据集的每个维度的数据映射到对应的网格区间里去。该过程不能打乱原有数据的分布,每个数据样本有且仅能分配到一个网格单元中去。则第i维数据的归一化值
Figure BDA0002826463170000047
映射到网格后,按原行标顺序形成的索引值为:
Figure BDA0002826463170000048
其中,[x]表示对数据值向下取整。
在计算局部密度时,一般通过计算邻居点的个数和其他参数来估计其局部密度,而常用的局部密度估计方法有截断函数法和高斯核函数法。因为前者为离散估计法,相当于寻找规定邻域内邻居点的个数,以此来表示某点处的局部密度,容易出现局部密度相同的数据样本,因为它没有考虑自身的影响。方法(2)为连续递减函数法,他将自身考虑进去,降低了出现相同密度点的概率。故本发明使用高斯核函数估计局部密度。则网格划分后每个网格的局部密度为:
Figure BDA0002826463170000051
其中d(x-cj)为对应网格中数据到网格中心的欧拉距离。lj为第j网格的边长。
获取对应网格的局部密度之后,将每个网格的密度进行降序排序:
Den_sort=sort(Den(i)) (9)
去掉密度值为0的网格密度,得到有效网格密度排序矩阵:
Den_validid(i)=Den_sort(i)≠0 (10)
在上述排序和筛选过程中,记录对应网格密度的原索引值,并通过相关公式将索引值转换为下标值。
根据密度峰值聚类算法的思想,确定相对距离作为判断聚类中心的因素之一,相对距离γi定义为:
Figure BDA0002826463170000052
相对距离的含义为:点i的相对密度为局部密度比其大的点j的距离,其中点j 还必需满足距离dij最小;如果对于点i,找不到比它局部密度更大的点,就将点 i到其他所有点的最大距离值作为相对距离。将排序后的有效网格密度与相对距离一一对应,组成排序后的ρii决策图,
筛选决策图上的点,方便后续判断,取局部密度ρi与相对距离γi的均值分别为:
Figure BDA0002826463170000053
当局部密度值和相对距离值分别大于式(12)的均值时,则保留其值,组成新的序列对,筛选出有效ρ’i和有效γ’i,定义有效决策值αi=ρ’i*γ’i。根据式(12)的方法对 有效决策值进一步筛选,便得到图3(b)的最终决策图。
利用差分法,求图3(b)中各个决策值的差分值:
si=αii+1 (13)
通过寻找si的抖升值,便可以找到图3(b)中左上角的三个离群决策值作为聚类个数,通过下标映射关系可确定出代表聚类中心的网格编号。如图3(c)所示为自动决策后确定的网格聚类中心。
确定完代表聚类中心的网格编号后,对映射后到网格后的非聚类中心数据进行分配,将局部密度比自己的且满足距离最小的那个聚类中心点,作为非聚类中心点的聚类中心。结果如图3(d)所示。
在此基础上,对部分噪声点和离群点进行处理,将到各个聚类中心相距同等远的离群点作为噪声点处理。通过对模拟多种局部放电缺陷的情况进行验证。常见的放电缺陷包括尖端放电、表面放电和空穴放电。其中三种放电的PRPD图谱呈现出不同的形式。
通过比较表明,采用基于网格的局部放电信号聚类分析方法可以加快算法的执行时间,聚类过程几乎不需要人为干预,通过与传统DBSCAN聚类方法进行比较。在相同设备和相同实验环境下,该方法能提高1倍的运算速度,且不需要像DBSCAN聚类方法一样设置两个关键参数。能够较好的满足实际应用的需求。

Claims (4)

1.一种基于网格的局部放电信号聚类分析方法,其特征在于:该聚类方法包括以下步骤:第1步:获取原始包络波形的特征量;第2步:对原始包络波形的特征量进行预处理;第3步:利用网格划分技术,根据归一化数据的属性划分合适的网格空间,并关联数据集和网格空间,为每个数据样本分配合适的标号;第4步:利用高斯核函数估计每个网格的局部密度;第5步:利用相对网格距离和网格局部密度的对应关系,通过自决策方法确定聚类中心和聚类数目;第6步:根据第5步结果分配非聚类中心点的所属类别,并利用相对距离发现噪声点和离群点,最后输出聚类结果,并在显示器上显示最终的聚类图谱。
2.根据权利要求1所述的一种基于网格的局部放电信号聚类分析方法,其特征在于,所属聚类方法的评价指标包括准确度ACC和调整兰德指数ARI,其中准确度ACC主要用于判断聚类划分的准确性;调整兰德指数ARI主要用于判断类内的纯度。上述指标的公式如下:
Figure FDA0002826463160000011
Figure FDA0002826463160000012
其中Nright、N分别为正确聚类的点数和总的数据集点数,RI可表示如下:
Figure FDA0002826463160000013
a表示实际与实验结果在同一个簇的数据样本对个数,而b为实际与实验都不在一个簇的数据样本对个数,ndou表示数据集中可以组成样本对的个数。
3.如权利要求1所述的一种基于网格的局部放电信号聚类分析方法,其特征在于:该方法所述的聚类方法的指标为准确度ACC和调整兰德指数ARI均接近1。
4.如权利要求1所述的一种基于网格的局部放电信号聚类分析方法,其特征在于:所用的聚类数据通过采集***采集,该采集***包括传感器耦合磁场信号;前置包络模块提取信号包络波形;ADC采集包络信号;经过现场可编程门阵列提取包络波形的特征量,之后将特征量送往DSP用于聚类分析,从而实现局部放电信号的分离。
CN202011430387.6A 2020-12-09 2020-12-09 一种基于网格的局部放电信号聚类分析方法 Pending CN112668612A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011430387.6A CN112668612A (zh) 2020-12-09 2020-12-09 一种基于网格的局部放电信号聚类分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011430387.6A CN112668612A (zh) 2020-12-09 2020-12-09 一种基于网格的局部放电信号聚类分析方法

Publications (1)

Publication Number Publication Date
CN112668612A true CN112668612A (zh) 2021-04-16

Family

ID=75401681

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011430387.6A Pending CN112668612A (zh) 2020-12-09 2020-12-09 一种基于网格的局部放电信号聚类分析方法

Country Status (1)

Country Link
CN (1) CN112668612A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113092972A (zh) * 2021-06-07 2021-07-09 杭州兆华电子有限公司 基于非接触式超声波传感器的局放类型识别方法和装置
CN113361411A (zh) * 2021-06-07 2021-09-07 国网新疆电力有限公司哈密供电公司 基于网格和密度聚类算法的随机脉冲干扰信号排除方法
CN113791318A (zh) * 2021-09-01 2021-12-14 上海交通大学 基于多光谱检测阵列的局部放电故障识别方法及***
CN117036790A (zh) * 2023-07-25 2023-11-10 中国科学院空天信息创新研究院 一种小样本条件下的实例分割多分类方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102221651A (zh) * 2011-03-11 2011-10-19 太原理工大学 一种矿用隔爆型干式变压器故障在线诊断及预警方法
CN107491779A (zh) * 2017-06-27 2017-12-19 重庆邮电大学 一种基于密度峰值的网格聚类算法
CN109063780A (zh) * 2018-08-10 2018-12-21 国网上海市电力公司 基于粒子群优化核近邻传播算法的变压器局部放电识别方法
CN109061426A (zh) * 2018-11-02 2018-12-21 国网河北省电力有限公司电力科学研究院 变压器局部放电故障诊断方法及在线监测装置
CN109685122A (zh) * 2018-12-12 2019-04-26 浙江工业大学 一种基于密度峰和引力影响的半监督游客画像数据聚类方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102221651A (zh) * 2011-03-11 2011-10-19 太原理工大学 一种矿用隔爆型干式变压器故障在线诊断及预警方法
CN107491779A (zh) * 2017-06-27 2017-12-19 重庆邮电大学 一种基于密度峰值的网格聚类算法
CN109063780A (zh) * 2018-08-10 2018-12-21 国网上海市电力公司 基于粒子群优化核近邻传播算法的变压器局部放电识别方法
CN109061426A (zh) * 2018-11-02 2018-12-21 国网河北省电力有限公司电力科学研究院 变压器局部放电故障诊断方法及在线监测装置
CN109685122A (zh) * 2018-12-12 2019-04-26 浙江工业大学 一种基于密度峰和引力影响的半监督游客画像数据聚类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘小兵: "《多源局部放电信号聚类方法研究》", 《中国优秀硕士学位论文全文数据库 (工程科技Ⅱ辑)》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113092972A (zh) * 2021-06-07 2021-07-09 杭州兆华电子有限公司 基于非接触式超声波传感器的局放类型识别方法和装置
CN113092972B (zh) * 2021-06-07 2021-09-03 杭州兆华电子有限公司 基于非接触式超声波传感器的局放类型识别方法和装置
CN113361411A (zh) * 2021-06-07 2021-09-07 国网新疆电力有限公司哈密供电公司 基于网格和密度聚类算法的随机脉冲干扰信号排除方法
CN113791318A (zh) * 2021-09-01 2021-12-14 上海交通大学 基于多光谱检测阵列的局部放电故障识别方法及***
CN117036790A (zh) * 2023-07-25 2023-11-10 中国科学院空天信息创新研究院 一种小样本条件下的实例分割多分类方法
CN117036790B (zh) * 2023-07-25 2024-03-22 中国科学院空天信息创新研究院 一种小样本条件下的实例分割多分类方法

Similar Documents

Publication Publication Date Title
CN112668612A (zh) 一种基于网格的局部放电信号聚类分析方法
CN111651545A (zh) 一种基于多源数据融合的城市边缘区提取方法
CN116186634A (zh) 一种建筑工程施工数据智能管理***
CN108020752B (zh) 一种基于多源贯通相关性的配线线损诊断方法及***
CN109492683A (zh) 一种针对广域量测电力大数据数据质量的快速在线评估方法
CN113344134B (zh) 一种低压配电监控终端数据采集异常检测方法及***
CN115187527B (zh) 一种多源混合型特高频局部放电图谱的分离识别方法
CN115982602B (zh) 一种光伏变压器电故障检测方法
CN108802535B (zh) 筛选方法、主干扰源识别方法及装置、服务器及存储介质
CN109239553B (zh) 一种基于局部放电脉冲局部密度的聚类方法
CN108333468B (zh) 一种有源配电网下不良数据的识别方法及装置
CN103197218A (zh) 一种高压电缆绝缘缺陷局放带电检测诊断方法
CN110596506A (zh) 基于时间卷积网络的变换器故障诊断方法
CN110348683A (zh) 电能质量扰动事件主成因分析方法、装置设备及存储介质
CN111368919A (zh) 特征数据构建方法、数据集构建方法、数据分类方法、emc故障的诊断方法和***
CN102867421A (zh) 一种识别有效停车泊位占有率中离群数据的方法
CN113810792B (zh) 一种基于云计算的边缘数据采集分析***
CN114676749A (zh) 一种基于数据挖掘的配电网运行数据异常判定方法
CN112415304B (zh) 基于低压台区电压数据曲线分群的线路识别方法
CN103902798A (zh) 数据预处理方法
CN109388512A (zh) 针对大规模计算机集群异常程度的评估与分析***
CN116466408B (zh) 一种基于航磁数据的人工神经网络超基性岩识别方法
CN109765878A (zh) 新能源汽车can总线网络故障的辅助分析方法
CN112069633B (zh) 一种采用大数据聚类的基于粒子群原理的配电网数据预处理方法
CN114358550A (zh) 基于大数据的电网分析***及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210416

WD01 Invention patent application deemed withdrawn after publication