CN116776209A - 一种关口计量装置运行状态辨识方法、***、设备及介质 - Google Patents
一种关口计量装置运行状态辨识方法、***、设备及介质 Download PDFInfo
- Publication number
- CN116776209A CN116776209A CN202311089567.6A CN202311089567A CN116776209A CN 116776209 A CN116776209 A CN 116776209A CN 202311089567 A CN202311089567 A CN 202311089567A CN 116776209 A CN116776209 A CN 116776209A
- Authority
- CN
- China
- Prior art keywords
- samples
- electricity utilization
- sample
- class
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 87
- 230000005611 electricity Effects 0.000 claims abstract description 159
- 238000012549 training Methods 0.000 claims abstract description 50
- 238000013528 artificial neural network Methods 0.000 claims abstract description 46
- 238000012216 screening Methods 0.000 claims abstract description 34
- 238000003745 diagnosis Methods 0.000 claims abstract description 18
- 230000035755 proliferation Effects 0.000 claims abstract description 17
- 239000011159 matrix material Substances 0.000 claims description 45
- 239000006185 dispersion Substances 0.000 claims description 43
- 238000004364 calculation method Methods 0.000 claims description 41
- 230000006870 function Effects 0.000 claims description 39
- 238000013507 mapping Methods 0.000 claims description 19
- 238000011176 pooling Methods 0.000 claims description 17
- 238000013527 convolutional neural network Methods 0.000 claims description 16
- 239000013598 vector Substances 0.000 claims description 14
- 238000010606 normalization Methods 0.000 claims description 13
- 101100134058 Caenorhabditis elegans nth-1 gene Proteins 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 238000010586 diagram Methods 0.000 claims description 8
- 230000008602 contraction Effects 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims description 7
- 241000820057 Ithone Species 0.000 claims description 6
- 230000009471 action Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 description 9
- 230000002159 abnormal effect Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种关口计量装置运行状态辨识方法、***、设备及介质,其中方法包括以下步骤:采集目标关口计量装置的历史用电数据,获取用电特征指标并对其添加故障类型标签,形成真实样本;基于真实样本的故障类型分布进行样本增殖,形成训练样本集;对训练样本集中的样本进行特征筛选;构建第一神经网络,将训练样本集中的样本重新添加第二标签指示是否发生故障,以用电特征指标作为输入,第二标签作为输出进行训练,得到故障诊断模型;构建第二神经网络,以用电特征指标作为输入,故障类型标签作为输出进行训练,得到故障类型辨识模型;获取当前用电数据,并通过故障诊断模型中判断是否发生故障,通过故障类型辨识模型辨识发生的故障类型。
Description
技术领域
本发明涉及一种关口计量装置运行状态辨识方法、***、设备及介质,属于电力设备状态监测技术领域。
背景技术
关口计量装置是购售电双方进行贸易结算的重要设备,由于关口计量装置监测指标多且上传的数据量巨大,因此其上传数据的可靠性与准确性会直接影响到交易的公平性。目前国内对关口计量装置失准的研究大多集中在运行状态辨识上。对关口失准产生机理进行分析,将关口计量装置故障原因分成以下四大类:第一类是计量装置本身故障,包括电能表死机(停止计量,不循显)、电量异常、电能表自动核抄异常等。第二类是二次回路故障,包括电流二次回路失流、电压回路电缆连接松动等。第三类是计量装置通讯模块损坏,导致后台无法读取电能表电量数据。第四类是人为差错,包括接线错误与设备安装错误等。除了常见的几类故障,在对关口计量装置上传的数据进行日常监测的过程中,常有异常数据的出现,异常点的出现并不代表计量装置一定处于故障状态,也可能是由用户的异常用电行为所引起的。通过上述分析可以看出,关口计量装置故障种类繁多,并且带有一定的隐蔽性,常规的检测手段往往消耗大量的人力物力资源,并且无法做到及时性的告警,这期间伴随着电网资产的大量流失。目前,关口计量装置运行状态辨识方法主要包括:
(1)选择与关口计量装置运行状态相关的指标并对其进行赋权,利用赋权后的结果对计量装置进行状态辨识。此类方法过于依赖所选状态指标,指标权重受人工干预大,可靠性难以得到有效验证。
(2)用电信息采集***传回的监测数据中含有大量与计量装置运行状态相关的信息,从这些信息中挖掘反映计量装置相应运行状态的特征指标,并通过构建好的机器学***衡的情况下辨识准确率难以得到保证。
现有的关口计量装置运行状态辨识方法虽然能够判断部分关口计量装置运行状态,但在实际工程应用中仍存在一定局限性,例如:
(1)信息***上传的丰富用电数据能够确定关口计量装置的运行状态,但并非所有数据都能用于计量装置运行状态的辨识,冗余的信息只会增大数据挖掘的计算量,加大模型训练难度。
(2)变压器损耗与母线损耗是评判关口计量装置状态的一个重要特征量。在负荷较小的情况下,受计量装置精度影响,变压器损耗与母线损耗的波动十分剧烈,这会使得模型对计量装置的状态产生误判,降低状态辨识准确率。
(3)对于常见的机器学***的提升以及保护措施的完善,关口计量点发生故障的频率并不频繁,能够获取的关口计量点故障样本远小于正常状态运行样本,即会出现不同类别之间数据样本不平衡的问题,从而导致训练模型过拟合,辨识准确率降低。
(4)自然界中存在大量干扰源,这些干扰源产生的信号通过电磁耦合或是通过电力接线等路径进入到各种电气设备当中,形成各种形式的噪声。传统方法无法忽略噪声对数据采集产生的影响,最终势必会降低计量装置运行状态辨识精度。
发明内容
为了解决上述现有技术中存在的问题,本发明提出了一种关口计量装置运行状态辨识方法、***、设备及介质。
本发明的技术方案如下:
一方面,本发明提供一种关口计量装置运行状态辨识方法,包括以下步骤:
采集目标关口计量装置的历史用电数据,基于历史用电数据获取若干历史时段的若干用电特征指标进行预处理,并对每一历史时段的用电特征指标添加故障类型标签,形成真实样本;
基于真实样本的故障类型分布,对数量少的真实样本进行样本增殖,形成训练样本集;
对训练样本集中的样本进行特征筛选,筛选出高相关的用电特征指标,将其余用电特征指标从样本中剔除;
构建第一神经网络,将训练样本集中的样本按照故障类型标签重新添加第二标签,第二标签用于指示样本是否发生故障,以样本中的用电特征指标作为输入,第二标签作为输出对第一神经网络进行训练,得到训练好的故障诊断模型;
构建第二神经网络,以样本中的用电特征指标作为输入,故障类型标签作为输出对第二神经网络进行训练,得到训练好的故障类型辨识模型;
获取目标关口计量装置的当前用电数据,并获取相应的用电特征指标输入至故障诊断模型中判断是否发生故障,当发生故障后将用电特征指标输入至故障类型辨识模型辨识发生的故障类型。
作为优选实施方式,所述对数量少的真实样本进行样本增殖的方法具体为:
采用变分自编码器进行样本生成;
将真实样本输入至变分自编码器的编码器网络中,压缩为低维向量;
再将低维向量输入至变分自编码器的解码器网络进行样本重构,得到生成样本。
作为优选实施方式,所述对训练样本集中的样本进行特征筛选,筛选出高相关的用电特征指标的方法具体为:
对于任意两类故障类型的样本,记第一类样本的特征集为,第二类样本的特征集为/>;
其中,表示第一类样本中的第i个用电特征指标的特征集,/>表示第二类样本中的第i个用电特征指标的特征集,/>表示第一类样本中的第N1个样本的第i个用电特征指标,/>为第二类样本中的第N2个样本的第i个用电特征指标,第一类样本的样本数为N1,第二类样本的样本数为N2;
采用高斯核函数对上述样本进行非线性变换,映射到高维空间,映射方程具体为:
;
其中,为/>和/>的欧式距离,其中/>表示核函数的中心点,/>为空间中任意一点;/>为带宽,用于控制高斯核函数的作用范围;
得到映射到高维空间的两类样本的特征集和/>,具体如下:
;
;
其中,表示第一类样本映射到高维空间后的第j个用电特征指标的特征集,/>表示第二类样本中的第j个用电特征指标的特征集;/>表示第一类样本中的第N1个样本的第i个映射到高维空间的用电特征指标,/>表示第二类样本中的第N2个样本的第i个映射到高维空间的用电特征指标;
再使用Fisher线性判别法得到每类样本特征集的类内离散度矩阵为:
;
;
其中:
;
;
获取样本的总类内离散度矩阵和总类间离散度矩阵:
;
;
根据样本的总类内离散度矩阵和总类间离散度矩阵构造特征计分公式:
;
为第i个用电特征指标的特征计分,特征计分的值越大,表示不同类样本的类间离散度越大,即特征区分度越大;
采用最大信息系数法来计算用电特征指标之间的冗余度,具体为:
给定i、j,对任意两个变量U、V构成的散点图进行i列j行网格化,并求出最大的互信息值;然后对最大的互信息值进行归一化;最后选择不同尺度下互信息的最大值作为MIC值,其计算公式如下:
;
其中,U、V为任意两个变量,B为预设的参考因子;为U、V的互信息值,其计算公式为:
;
基于特征计分和MIC值计算最终计分:
;
其中,为第i个用电特征指标的最终计分,N为特征数,/>为第i个用电特征指标,基于计算出的最终计分,选取出能够表现出关口计量装置运行状态的最优特征组。
作为优选实施方式,所述第一神经网络采用多尺度卷积神经网络,并在多尺度卷积神经网络的池化层之后加入了批标准化和Dropout算法进行优化;
所述第二神经网络采用深度残差收缩网络。
另一方面,本发明还提供一种关口计量装置运行状态辨识***,包括:
数据采集模块,用于采集目标关口计量装置的历史用电数据,基于历史用电数据获取若干历史时段的若干用电特征指标进行预处理,并对每一历史时段的用电特征指标添加故障类型标签,形成真实样本;
样本平衡模块,基于真实样本的故障类型分布,对数量少的真实样本进行样本增殖,形成训练样本集;
特征筛选模块,用于对训练样本集中的样本进行特征筛选,筛选出高相关的用电特征指标,将其余用电特征指标从样本中剔除;
第一网络训练模块,用于构建第一神经网络,将训练样本集中的样本按照故障类型标签重新添加第二标签,第二标签用于指示样本是否发生故障,以样本中的用电特征指标作为输入,第二标签作为输出对第一神经网络进行训练,得到训练好的故障诊断模型;
第二网络训练模块,用于构建第二神经网络,以样本中的用电特征指标作为输入,故障类型标签作为输出对第二神经网络进行训练,得到训练好的故障类型辨识模型;
辨识模块,用于获取目标关口计量装置的当前用电数据,并获取相应的用电特征指标输入至故障诊断模型中判断是否发生故障,当发生故障后将用电特征指标输入至故障类型辨识模型辨识发生的故障类型。
作为优选实施方式,所述样本平衡模块对数量少的真实样本进行样本增殖的方法具体为:
采用变分自编码器进行样本生成;
将真实样本输入至变分自编码器的编码器网络中,压缩为低维向量;
再将低维向量输入至变分自编码器的解码器网络进行样本重构,得到生成样本。
作为优选实施方式,所述特征筛选模块对训练样本集中的样本进行特征筛选,筛选出高相关的用电特征指标的方法具体为:
对于任意两类故障类型的样本,记第一类样本的特征集为,第二类样本的特征集为/>;
其中,表示第一类样本中的第i个用电特征指标的特征集,/>表示第二类样本中的第i个用电特征指标的特征集,/>表示第一类样本中的第N1个样本的第i个用电特征指标,/>为第二类样本中的第N2个样本的第i个用电特征指标,第一类样本的样本数为N1,第二类样本的样本数为N2;
采用高斯核函数对上述样本进行非线性变换,映射到高维空间,映射方程具体为:
;
其中,为/>和/>的欧式距离,其中/>表示核函数的中心点,/>为空间中任意一点;/>为带宽,用于控制高斯核函数的作用范围;
得到映射到高维空间的两类样本的特征集和/>,具体如下:
;
;
其中,表示第一类样本映射到高维空间后的第j个用电特征指标的特征集,/>表示第二类样本中的第j个用电特征指标的特征集;/>表示第一类样本中的第N1个样本的第i个映射到高维空间的用电特征指标,/>表示第二类样本中的第N2个样本的第i个映射到高维空间的用电特征指标;
再使用Fisher线性判别法得到每类样本特征集的类内离散度矩阵为:
;
;
其中:
;
;
获取样本的总类内离散度矩阵和总类间离散度矩阵:
;
;
根据样本的总类内离散度矩阵和总类间离散度矩阵构造特征计分公式:
;
为第i个用电特征指标的特征计分,特征计分的值越大,表示不同类样本的类间离散度越大,即特征区分度越大;
采用最大信息系数法来计算用电特征指标之间的冗余度,具体为:
给定i、j,对任意两个变量U、V构成的散点图进行i列j行网格化,并求出最大的互信息值;然后对最大的互信息值进行归一化;最后选择不同尺度下互信息的最大值作为MIC值,其计算公式如下:
;
其中,U、V为任意两个变量,B为预设的参考因子;为U、V的互信息值,其计算公式为:
;
基于特征计分和MIC值计算最终计分:
;
其中,为第i个用电特征指标的最终计分,N为特征数,/>为第i个用电特征指标,基于计算出的最终计分,选取出能够表现出关口计量装置运行状态的最优特征组。
作为优选实施方式,所述第一神经网络采用多尺度卷积神经网络,并在多尺度卷积神经网络的池化层之后加入了批标准化和Dropout算法进行优化;
所述第二神经网络采用深度残差收缩网络。
再一方面,本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明任一实施例所述的关口计量装置运行状态辨识方法。
再一方面,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如本发明任一实施例所述的关口计量装置运行状态辨识方法。
本发明具有如下有益效果:
1、本发明一种关口计量装置运行状态辨识方法,通过样本增殖、特征集自主筛选并结合神经网络实现关口计量装置的运行状态辨识。该方法能够有效解决样本不平衡问题,在降低数据冗余及噪声干扰的前提下快速实现关口计量装置运行状态分类。
2、本发明一种关口计量装置运行状态辨识方法,通过变分自编码器对关口计量装置故障样本进行增殖,有效解决故障样本不均衡以及样本量较小导致的训练模型过拟合,整体辨识准确率降低的问题,保证训练模型的稳定性和整体辨识准确率。
3、本发明一种关口计量装置运行状态辨识方法,利用高斯核Fisher判别分析法以及最大信息系数法对关口计量装置运行状态特征进行自主筛选,从中挑选出最能表达出样本特点的最优特征组,提高模型训练的效率。
4、本发明一种关口计量装置运行状态辨识方法,通过两个神经网络模型实现多层级的关口计量装置运行状态辨识,先判断计量装置是否发生故障,再判断具体故障类型,有效提高运行状态辨识的准确率。
附图说明
图1为本发明实施例一的方法流程示意图;
图2为本发明实施例中采用的多尺度卷积神经网络模型结构示例图;
图3为本发明实施例中采用的深度残差收缩网络模型结构示例图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,文中所使用的步骤编号仅是为了方便描述,不对作为对步骤执行先后顺序的限定。
应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
实施例一:
参见图1,本实施例提供一种关口计量装置运行状态辨识方法,通过样本增殖、特征集自主筛选并结合神经网络实现关口计量装置的运行状态辨识。该方法能够有效解决样本不平衡问题,在降低数据冗余及噪声干扰的前提下快速实现关口计量装置运行状态分类。该方法具体包括以下步骤:
S100、基于现有电力行业用电信息采集***、在线监测装置、电能量计量***等平台,对关口计量装置的用电数据进行远程采集,采集目标关口计量装置的历史用电数据,采集的时间间隔为一天一次。再根据关口计量装置基础数据、厂站建模信息、计量装置检修计划等情况进行充分考虑,并基于历史用电数据获取若干历史时段的若干用电特征指标进行预处理,建立用于关口计量装置运行状态辨识的输入矩阵,并对每一历史时段的用电特征指标(也就是输入矩阵)添加故障类型标签,形成真实样本。
在本实施例中,真实样本由输入矩阵和故障类型标签组成,输入矩阵Xnm是一个包含所有用电特征指标的一维矩阵,其中n表示第n个数据指标,共15个指标。
指标X1表示日正向有功电量与每日峰平谷各个费率时段的总电量的差值,该指标表征电能表示值不平状态,其计算公式为:
;
其中,P1代表日正向有功总电量,A1、A2、A3和A4代表每日尖峰、高峰、平和谷不同费率时段的电量。
指标X2表示日正向有功电量与参考值的比值,该指标表征电能表飞走状态,其计算公式为:
;
其中,P1ref代表日正向有功电量的参考值。
指标X3表示连续两日反向有功电量差值和连续两日线损率差值的逻辑与运算,该指标表征电能表停走状态,其计算公式为:
;
其中,P2和P2q表示当天与上一天的日反向有功电量,和/>表示当天与上一天的线损率,&为“与”运算符,其运算规则为:若等式右边的两项计算式的计算结果均大于零,则等式左边的指标置为1,反之则置为0。以上式为例,若计算式P2-P2q,/>-/>的计算结果都大于0,则指标X3等于1,若有两计算式中任一项计算结果小于零,则指标X3等于0。
指标X4表示连续两日正向有功电量差值,该指标表征电能表倒走状态,其计算公式为:
;
其中,P1q表示上一天的日正向有功电量。
指标X5表征电压失压状态,其计算公式为:
;
其中,表示任意一相电压值,/>表示正常运行状态下额定电压,/>表示任意一相电流,/>表示电能表启动电流,&为“与”运算符,其运算规则为:若等式右边的两项计算式的计算结果均大于零,则等式左边的指标置为1,反之则置为0。
指标X6表征电压断相状态,其计算公式为:
;
其中,表示正常运行状态下电压的下限阈值,&为“与”运算符,其运算规则为:若等式右边的两项计算式的计算结果均大于零,则等式左边的指标置为1,反之则置为0。
指标X7表征电压越限状态,其计算公式为:
;
其中,表示正常运行状态下电压的上限阈值。
指标X8表征电压不平衡状态,其计算公式为:
;
其中,表示三相电压的最大值,/>表示三相电压的最小值。
指标X9表征电流失流状态,其计算公式为:
;
指标X10表征电流不平衡状态,其计算公式为:
;
其中,表示三相电流的最大值,/>表示三相电流的最小值。
指标X11表征计量回路错接线状态,采用日反向有功电量和连续两日线损率差值的逻辑与运算表示,其计算公式为:
;
&为“与”运算符,其运算规则为:若等式右边的两项计算式的计算结果均大于零,则等式左边的指标置为1,反之则置为0。
指标X12表征潮流反向状态,采用三相电流表示,其计算公式为:
;
指标X13与X14分别代表主变损耗率与母线损耗率。由于主变或母线空载损耗固定,在负载较小的情况下,输入电量较小,主或母线的损耗率会偏高。考虑到负载较小的情况一般发生于检修之后,如果延长损耗率的计算时限,可以使得损耗率趋于正常。因此在负荷较小的情况下,需要综合研判计量装置是否处在故障状态。当主变或母线每日的输入电量在10kWh以下时,主变与母线损耗率取近七天的数据计算;当输入电量在10-100kWh时,主变与母线损耗率取近五天的数据计算;当输入电量在100-300kWh时,主变与母线损耗率取近三天的数据计算;当输入电量在300kWh以上时,主变与母线损耗率取当天的数据计算。
为了增加对关口异常状态辨识准确率,将前一天是否处于停电检修状态也作为数据指标之一,若前一天有停电检修则记为1,否则记为0,记为指标X15。在模型对样本的辨识过程中,所有指标如果仅有损耗指标异常,将这种情况记为异常用电行为,其他情况归为具体故障类型或是正常运行状态。
由于模型各个维度的输入数据分布范围差异较大,为了避免模型被某个维度的数据主导,需要先通过归一化处理将输入数据统一映射到[0,1]区间上,便于不同单位或量级的指标能够进行比较和加权。归一化公式如下:
;
其中,为归一化后的输入数据,/>为原始输入数据,/>、/>分别为原始输入数据中的最大值与最小值。
S200、基于真实样本的故障类型分布,对数量少的真实样本进行样本增殖,例如故障类型包括五种,数量分别为5000、4500、4600、3800和600,则对数量为600的故障类型的样本进行样本增殖,使其与其他几类故障类型样本的数量保持一定的平衡,形成样本平衡的训练样本集。样本增殖的方法可以采用过采样方法以及生成模型,例如SMOTE算法。
S300、对训练样本集中的样本进行特征筛选,筛选出高相关的用电特征指标,将其余用电特征指标从样本中剔除,每个样本包含了15个用电特征指标,但并非这15个用电特征指标都对最后的分类有帮助。本实施例从15个用电特征指标中筛选出几个用电特征指标,这几个用电特征指标使得我们这几类样本能够被更好的区分。例如筛选了4个用电特征指标能够使得每个类别的样本之间区分度更大,那最后这4个用电特征指标就会更好地帮助模型进行分类,则本实施例就会选用这4个用电特征指标。
S400、构建第一神经网络,将训练样本集中的样本按照故障类型标签重新添加第二标签,第二标签用于指示样本是否发生故障,以样本中的用电特征指标(筛选后的用电特征指标)作为输入,第二标签作为输出对第一神经网络进行训练,得到训练好的故障诊断模型。
S500、构建第二神经网络,以样本中的用电特征指标(筛选后的用电特征指标)作为输入,故障类型标签作为输出对第二神经网络进行训练,得到训练好的故障类型辨识模型。
S600、获取目标关口计量装置的当前用电数据,并获取相应的用电特征指标输入至故障诊断模型中判断是否发生故障,当发生故障后将用电特征指标输入至故障类型辨识模型辨识发生的故障类型。
作为本实施例的优选实施方式,在步骤S200中,所述对数量少的真实样本进行样本增殖的方法具体为:
采用变分自编码器进行样本生成;变分自编码器(Variational Auto-Encoders,VAE)是一种常见的生成模型,它能够学习一个模型,使得输出数据的分布尽可能地逼近原始数据分布。其基本思路是把一堆真实样本通过编码器网络变换成一个理想的数据分布,然后这个数据分布再传递给一个解码器网络,得到一堆生成样本。生成样本与真实样本足够接近的话,就训练出了一个VAE模型。
将真实样本输入至变分自编码器的编码器网络中,压缩为低维向量;
再将低维向量输入至变分自编码器的解码器网络进行样本重构,得到生成样本。
VAE主要分为编码器(Encoder)和解码器(Decoder)两部分,Encoder过程是将原先的数据压缩为低维向量,Decoder则是把低维向量还原为原来数据。首先,将真实样本X输入Encoder来确定其后验分布:
;
然而该后验概率的计算极为复杂,是一个混合分布,这个积分计算起来非常困难,且计算复杂性随X的增加而指数上升,所以使用了变分推断,借助/>来近似,一般假定/>服从于高斯分布,即/>,然后,通过生成辅助变量/>来引入隐变量Z:
;
再用隐变量Z来表示,也即Decoder过程:
;
而对任何输入数据,应该尽量保证最后由隐变量而转换回输出数据与输入数据尽可能相等,由此引入最大似然估计:
;
对进行转换:
;
其中:
;
;
最后,通过神经网络进行调参,使得尽可能小,/>尽可能大,从而达到生成样本与真实样本尽可能相似的效果。通过VAE模型可以大量生成关口计量装置故障样本,从而达到样本平衡。
作为本实施例的优选实施方式,在步骤S300中,所述对训练样本集中的样本进行特征筛选,筛选出高相关的用电特征指标的方法具体为:
对于任意两类故障类型的样本,记第一类样本的特征集为,第二类样本的特征集为/>;
其中,表示第一类样本中的第i个用电特征指标的特征集,/>表示第二类样本中的第i个用电特征指标的特征集,/>表示第一类样本中的第N1个样本的第i个用电特征指标,/>为第二类样本中的第N2个样本的第i个用电特征指标,第一类样本的样本数为N1,第二类样本的样本数为N2;
由于输入的用电特征指标之间差异性很大,为了降低信息的维度,使用高斯核Fisher判别分析法(Gaussian Kernel Fisher Discriminant Analysis,GKFDA)遴选出高表达度的特征。高斯核Fisher判别分析法需要通过高斯核函数对原始数据样本进行非线性变换,映射到高维空间,采用高斯核函数对上述样本进行非线性变换,映射到高维空间,映射方程具体为:
;
其中,为/>和/>的欧式距离,其中/>表示核函数的中心点,/>为空间中任意一点;/>为带宽,用于控制高斯核函数的作用范围;
采用如上高斯核映射方程,得到映射到高维空间的两类样本的特征集和/>,具体如下:
;
;
其中,表示第一类样本映射到高维空间后的第j个用电特征指标的特征集,/>表示第二类样本中的第j个用电特征指标的特征集;/>表示第一类样本中的第N1个样本的第i个映射到高维空间的用电特征指标,/>表示第二类样本中的第N2个样本的第i个映射到高维空间的用电特征指标;
再使用Fisher线性判别法得到每类样本特征集的类内离散度矩阵为:
;
;
其中:
;/>
;
获取样本的总类内离散度矩阵和总类间离散度矩阵:
;
;
根据样本的总类内离散度矩阵和总类间离散度矩阵构造特征计分公式:
;
为第i个用电特征指标的特征计分,特征计分的值越大,表示不同类样本的类间离散度越大,即特征区分度越大;
在评判特征区分度后,采用最大信息系数法(Maximal InformationCoefficient,MIC)来计算用电特征指标之间的冗余度,具体为:
给定i、j,对任意两个变量U、V构成的散点图进行i列j行网格化,并求出最大的互信息值;然后对最大的互信息值进行归一化;最后选择不同尺度下互信息的最大值作为MIC值,其计算公式如下:
;
其中,U、V为任意两个变量,B为预设的参考因子;为U、V的互信息值,其计算公式为:
;
基于特征计分和MIC值计算最终计分:
;
其中,为第i个用电特征指标的最终计分,N为特征数,/>为第i个用电特征指标,基于计算出的最终计分,选取出能够表现出关口计量装置运行状态的最优特征组,本实施例中,选取最优特征组的方法为通过对最终计分对所选用电特征指标进行排序,然后从中选择几个最终计分最高的用电特征指标组成最优特征组。
作为本实施例的优选实施方式,所述第一神经网络采用多尺度卷积神经网络,并在多尺度卷积神经网络的池化层之后加入了批标准化和Dropout算法进行优化;
所述第二神经网络采用深度残差收缩网络。
本实施例所构建的多尺度卷积神经网络模型结构如图2所示。其中,F代表卷积核个数,K代表卷积核尺度,P代表池化层尺度,S代表池化步长。批标准化(batchnormalization,BN)和Dropout算法被用于防止网络产生过拟合现象。
假设S 0为输入的序列矩阵,S i为第i个输出的序列矩阵。
卷积层的作用是对输入的序列数据实现局部特征提取。在CNN中,卷积层和池化层通常是交替出现的,假设S i(i为奇数)为卷积层的输出矩阵,其可以被描述为:
;
其中,是第i层的权重,/>是第i层的偏差,/>是激活函数。
池化层的作用是将卷积层提取的特征压缩,实现信息降维。本研究中使用最大池化函数(c×1),保留池化核中的最大值为输出特征。池化层的输出矩阵(m为从2开始的偶数)可以表示为:
;
其中,指的是最大池化函数,/>的大小是j/c×k,j和k分别是/>层特征的尺度,c是当前池化层的尺度。
输出层本质上是一层全连接层,它的作用是分类,选择softmax作为它的激活函数。在这一层,模型计算当前每个样本对应每一种类型的概率,然后得到一个新的表达式():
;
f代表的是softmax激活函数,代表输入样本属于第i个类型的概率,/>代表权重,b代表偏置。
深度残差收缩网络(Deep Residual Shrinkage Network,DRSN)是基于深度残差网络的一种改进网络,结合了深度残差网络、注意力机制和软阈值函数。
本实施例所构建的深度残差收缩网络模型结构如图3所示。深度残差收缩网络堆叠了一定数量的自适应阈值残差收缩单元(RSBU-CW),卷积层(Conv),批标准化(BN),激活函数(ReLU),全局平均池化(GAP),全连接层(FC)等,网络自适应学习样本特征,通过软阈值化减小噪声对当前任务的影响。
网络残差收缩网络由4个残差收缩单元组成,每个残差收缩单元的下采样步长设置为2,输出特征图通道数设置为4。输出层的正则化方案选择L2正则化,正则化系数设置为0.0015。网络配置的损失函数选用交叉熵损失函数,Adam的初始学习率设置为1e-4。
在实际应用中,不论是环境的影响还是电磁辐射的干扰都会导致采集到的数据包含有一定的噪声,没有采取任何优化手段的网络在训练实际样本的时候很容易发生过拟合和数据分散化的现象,从而导致模型的辨识精度明显降低。为了解决这一问题,提高模型的泛化能力和抗干扰能力,本实施例采用了几种方法对上述神经网络进行优化。
1. 批标准化
批标准化(BN)指的是将数据分成一批批进行随机梯度下降,并且数据在继续向前传递的时候都会先经过标准化的处理。批标准化的计算公式如式所示:
;
其中,和/>都代表该算法的两个可学习变量,/>是为了防止除数为0而添加的一个微小正数,/>代表每一批包含的输入数据个数。
2. 正则化系数、损失函数与优化器选择
在输出层选用L2 正则化来加快网络的收敛速度,防止网络过拟合。选用分类交叉熵作为模型的损失函数,交叉熵的值越小,表示实际输出与期望输出越接近。损失函数的计算方法可由下式表示:
;
其中,为一个取值是0或1的变量,如果第i个样本的类别与第j个类别相同,取值为1,否则取值为0;/>为第i个样本对应于第j个类别的概率;n是样本的数量;c代表输出类别的个数;/>为L2正则化因子。
同时采用Adam optimizer作为模型的优化器。它能够根据神经网络每一次的训练结果迭代更新神经网络的权重,确保模型的损失函数能够达到最小化。
本实施例中神经网络的训练过程做如下的概括:首先,将输入的用电特征指标进行标准化处理。紧接着,对模型的各个参数进行设置,设置的参数包括卷积核个数、卷积核尺寸、卷积核步长、池化窗口大小、池化步长、全连接层神经元个数、批量样本个数、网络学习率和训练次数等。然后,样本被随机划分为训练集、验证集和测试集。再然后,对网络中的权重矩阵和偏置变量进行初始化处理。网络的训练方式可以被看作是前向传播和反向传播两个过程,首先网络通过前向传播的方式对输入数据进行计算,获得模型输出之后计算实际输出与理想输出之间的差值,再通过反向传播算法从最后一层开始逐层计算梯度,由Adam优化器根据梯度对网络的权重和偏置进行调整,当网络的误差满足故障诊断需求或者网络训练次数达到预设次数的时候结束训练。
在上述神经网络训练完成后,进行步骤S600。在需要对关口计量装置进行运行状态辨识时,首先获取当前用电数据,其次对当前用电数据进行预处理并进行特征集自主筛选之后获取当前的用电特征指标,将其送入至以多尺度卷积神经网络为基础的故障诊断模型,故障诊断模型判断关口计量装置的运行状态为故障或正常用电状态,若状态为正常用电状态则结束整个辨识流程。若故障诊断模型判断关口计量装置的运行状态为故障状态,则将预处理后的用电特征指标送入以深度残差收缩网络模型为基础的故障类型辨识模型进行具体的故障类型辨识,获取当前关口计量装置发生的故障类型。
实施例二:
本实施例提供一种关口计量装置运行状态辨识***,包括:
数据采集模块,用于采集目标关口计量装置的历史用电数据,基于历史用电数据获取若干历史时段的若干用电特征指标进行预处理,并对每一历史时段的用电特征指标添加故障类型标签,形成真实样本;该模块用于实现实施例一中步骤S100的功能,在此不再赘述;
样本平衡模块,基于真实样本的故障类型分布,对数量少的真实样本进行样本增殖,形成训练样本集;该模块用于实现实施例一中步骤S200的功能,在此不再赘述;
特征筛选模块,用于对训练样本集中的样本进行特征筛选,筛选出高相关的用电特征指标,将其余用电特征指标从样本中剔除;该模块用于实现实施例一中步骤S300的功能,在此不再赘述;
第一网络训练模块,用于构建第一神经网络,将训练样本集中的样本按照故障类型标签重新添加第二标签,第二标签用于指示样本是否发生故障,以样本中的用电特征指标作为输入,第二标签作为输出对第一神经网络进行训练,得到训练好的故障诊断模型;该模块用于实现实施例一中步骤S400的功能,在此不再赘述;
第二网络训练模块,用于构建第二神经网络,以样本中的用电特征指标作为输入,故障类型标签作为输出对第二神经网络进行训练,得到训练好的故障类型辨识模型;该模块用于实现实施例一中步骤S500的功能,在此不再赘述;
辨识模块,用于获取目标关口计量装置的当前用电数据,并获取相应的用电特征指标输入至故障诊断模型中判断是否发生故障,当发生故障后将用电特征指标输入至故障类型辨识模型辨识发生的故障类型;该模块用于实现实施例一中步骤S600的功能,在此不再赘述。
作为本实施例的优选实施方式,所述样本平衡模块对数量少的真实样本进行样本增殖的方法具体为:
采用变分自编码器进行样本生成;
将真实样本输入至变分自编码器的编码器网络中,压缩为低维向量;
再将低维向量输入至变分自编码器的解码器网络进行样本重构,得到生成样本。
作为本实施例的优选实施方式,所述特征筛选模块对训练样本集中的样本进行特征筛选,筛选出高相关的用电特征指标的方法具体为:
对于任意两类故障类型的样本,记第一类样本的特征集为,第二类样本的特征集为/>;
其中,表示第一类样本中的第i个用电特征指标的特征集,/>表示第二类样本中的第i个用电特征指标的特征集,/>表示第一类样本中的第N1个样本的第i个用电特征指标,/>为第二类样本中的第N2个样本的第i个用电特征指标,第一类样本的样本数为N1,第二类样本的样本数为N2;
采用高斯核函数对上述样本进行非线性变换,映射到高维空间,映射方程具体为:
;/>
其中,为/>和/>的欧式距离,其中/>表示核函数的中心点,/>为空间中任意一点;/>为带宽,用于控制高斯核函数的作用范围;
得到映射到高维空间的两类样本的特征集和/>,具体如下:
;
;
其中,表示第一类样本映射到高维空间后的第j个用电特征指标的特征集,/>表示第二类样本中的第j个用电特征指标的特征集;/>表示第一类样本中的第N1个样本的第i个映射到高维空间的用电特征指标,/>表示第二类样本中的第N2个样本的第i个映射到高维空间的用电特征指标;
再使用Fisher线性判别法得到每类样本特征集的类内离散度矩阵为:
;
;
其中:
;
;
获取样本的总类内离散度矩阵和总类间离散度矩阵:
;
;
根据样本的总类内离散度矩阵和总类间离散度矩阵构造特征计分公式:
;
为第i个用电特征指标的特征计分,特征计分的值越大,表示不同类样本的类间离散度越大,即特征区分度越大;
采用最大信息系数法来计算用电特征指标之间的冗余度,具体为:
给定i、j,对任意两个变量U、V构成的散点图进行i列j行网格化,并求出最大的互信息值;然后对最大的互信息值进行归一化;最后选择不同尺度下互信息的最大值作为MIC值,其计算公式如下:
;
其中,U、V为任意两个变量,B为预设的参考因子;为U、V的互信息值,其计算公式为:
;
基于特征计分和MIC值计算最终计分:
;
其中,为第i个用电特征指标的最终计分,N为特征数,/>为第i个用电特征指标,基于计算出的最终计分,选取出能够表现出关口计量装置运行状态的最优特征组。
作为本实施例的优选实施方式,所述第一神经网络采用多尺度卷积神经网络,并在多尺度卷积神经网络的池化层之后加入了批标准化和Dropout算法进行优化;
所述第二神经网络采用深度残差收缩网络。
实施例三:
本实施例提出一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明任一实施例所述的关口计量装置运行状态辨识方法。
实施例四:
本实施例提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任一实施例所述的关口计量装置运行状态辨识方法。
本申请实施例中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示单独存在A、同时存在A和B、单独存在B的情况。其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项”及其类似表达,是指的这些项中的任意组合,包括单项或复数项的任意组合。例如,a,b和c中的至少一项可以表示:a,b,c,a和b,a和c,b和c或a和b和c,其中a,b,c可以是单个,也可以是多个。
本领域普通技术人员可以意识到,本文中公开的实施例中描述的各单元及算法步骤,能够以电子硬件、计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,任一功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory;以下简称:ROM)、随机存取存储器(Random Access Memory;以下简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (8)
1.一种关口计量装置运行状态辨识方法,其特征在于,包括以下步骤:
采集目标关口计量装置的历史用电数据,基于历史用电数据获取若干历史时段的若干用电特征指标进行预处理,并对每一历史时段的用电特征指标添加故障类型标签,形成真实样本;
基于真实样本的故障类型分布,对数量少的真实样本进行样本增殖,形成训练样本集;
对训练样本集中的样本进行特征筛选,筛选出高相关的用电特征指标,将其余用电特征指标从样本中剔除;
构建第一神经网络,将训练样本集中的样本按照故障类型标签重新添加第二标签,第二标签用于指示样本是否发生故障,以样本中的用电特征指标作为输入,第二标签作为输出对第一神经网络进行训练,得到训练好的故障诊断模型;
构建第二神经网络,以样本中的用电特征指标作为输入,故障类型标签作为输出对第二神经网络进行训练,得到训练好的故障类型辨识模型;
获取目标关口计量装置的当前用电数据,并获取相应的用电特征指标输入至故障诊断模型中判断是否发生故障,当发生故障后将用电特征指标输入至故障类型辨识模型辨识发生的故障类型;
其中,所述对训练样本集中的样本进行特征筛选,筛选出高相关的用电特征指标的方法具体为:
对于任意两类故障类型的样本,记第一类样本的特征集为,第二类样本的特征集为/>;
其中,表示第一类样本中的第i个用电特征指标的特征集,/>表示第二类样本中的第i个用电特征指标的特征集,/>表示第一类样本中的第N1个样本的第i个用电特征指标,/>为第二类样本中的第N2个样本的第i个用电特征指标,第一类样本的样本数为N1,第二类样本的样本数为N2;
采用高斯核函数对上述样本进行非线性变换,映射到高维空间,映射方程具体为:
;
其中,为/>和/>的欧式距离,其中/>表示核函数的中心点,/>为空间中任意一点;/>为带宽,用于控制高斯核函数的作用范围;
得到映射到高维空间的两类样本的特征集和/>,具体如下:
;
;
其中,表示第一类样本映射到高维空间后的第j个用电特征指标的特征集,/>表示第二类样本中的第j个用电特征指标的特征集;/>表示第一类样本中的第N1个样本的第i个映射到高维空间的用电特征指标,/>表示第二类样本中的第N2个样本的第i个映射到高维空间的用电特征指标;
再使用Fisher线性判别法得到每类样本特征集的类内离散度矩阵为:
;
;
其中:
;
;
获取样本的总类内离散度矩阵和总类间离散度矩阵:
;
;
根据样本的总类内离散度矩阵和总类间离散度矩阵构造特征计分公式:
;
为第i个用电特征指标的特征计分,特征计分的值越大,表示不同类样本的类间离散度越大,即特征区分度越大;
采用最大信息系数法来计算用电特征指标之间的冗余度,具体为:
给定i、j,对任意两个变量U、V构成的散点图进行i列j行网格化,并求出最大的互信息值;然后对最大的互信息值进行归一化;最后选择不同尺度下互信息的最大值作为MIC值,其计算公式如下:
;
其中,U、V为任意两个变量,B为预设的参考因子;为U、V的互信息值,其计算公式为:
;
基于特征计分和MIC值计算最终计分:
;
其中,为第i个用电特征指标的最终计分,N为特征数,/>为第i个用电特征指标,基于计算出的最终计分,选取出能够表现出关口计量装置运行状态的最优特征组。
2.根据权利要求1所述的一种关口计量装置运行状态辨识方法,其特征在于,所述对数量少的真实样本进行样本增殖的方法具体为:
采用变分自编码器进行样本生成;
将真实样本输入至变分自编码器的编码器网络中,压缩为低维向量;
再将低维向量输入至变分自编码器的解码器网络进行样本重构,得到生成样本。
3.根据权利要求1所述的一种关口计量装置运行状态辨识方法,其特征在于:
所述第一神经网络采用多尺度卷积神经网络,并在多尺度卷积神经网络的池化层之后加入了批标准化和Dropout算法进行优化;
所述第二神经网络采用深度残差收缩网络。
4.一种关口计量装置运行状态辨识***,其特征在于,包括:
数据采集模块,用于采集目标关口计量装置的历史用电数据,基于历史用电数据获取若干历史时段的若干用电特征指标进行预处理,并对每一历史时段的用电特征指标添加故障类型标签,形成真实样本;
样本平衡模块,基于真实样本的故障类型分布,对数量少的真实样本进行样本增殖,形成训练样本集;
特征筛选模块,用于对训练样本集中的样本进行特征筛选,筛选出高相关的用电特征指标,将其余用电特征指标从样本中剔除;
第一网络训练模块,用于构建第一神经网络,将训练样本集中的样本按照故障类型标签重新添加第二标签,第二标签用于指示样本是否发生故障,以样本中的用电特征指标作为输入,第二标签作为输出对第一神经网络进行训练,得到训练好的故障诊断模型;
第二网络训练模块,用于构建第二神经网络,以样本中的用电特征指标作为输入,故障类型标签作为输出对第二神经网络进行训练,得到训练好的故障类型辨识模型;
辨识模块,用于获取目标关口计量装置的当前用电数据,并获取相应的用电特征指标输入至故障诊断模型中判断是否发生故障,当发生故障后将用电特征指标输入至故障类型辨识模型辨识发生的故障类型;
所述特征筛选模块对训练样本集中的样本进行特征筛选,筛选出高相关的用电特征指标的方法具体为:
对于任意两类故障类型的样本,记第一类样本的特征集为,第二类样本的特征集为/>;
其中,表示第一类样本中的第i个用电特征指标的特征集,/>表示第二类样本中的第i个用电特征指标的特征集,/>表示第一类样本中的第N1个样本的第i个用电特征指标,/>为第二类样本中的第N2个样本的第i个用电特征指标,第一类样本的样本数为N1,第二类样本的样本数为N2;
采用高斯核函数对上述样本进行非线性变换,映射到高维空间,映射方程具体为:
;
其中,为/>和/>的欧式距离,其中/>表示核函数的中心点,/>为空间中任意一点;/>为带宽,用于控制高斯核函数的作用范围;
得到映射到高维空间的两类样本的特征集和/>,具体如下:
;
;
其中,表示第一类样本映射到高维空间后的第j个用电特征指标的特征集,/>表示第二类样本中的第j个用电特征指标的特征集;/>表示第一类样本中的第N1个样本的第i个映射到高维空间的用电特征指标,/>表示第二类样本中的第N2个样本的第i个映射到高维空间的用电特征指标;
再使用Fisher线性判别法得到每类样本特征集的类内离散度矩阵为:
;
;
其中:
;
;
获取样本的总类内离散度矩阵和总类间离散度矩阵:
;
;
根据样本的总类内离散度矩阵和总类间离散度矩阵构造特征计分公式:
;
为第i个用电特征指标的特征计分,特征计分的值越大,表示不同类样本的类间离散度越大,即特征区分度越大;
采用最大信息系数法来计算用电特征指标之间的冗余度,具体为:
给定i、j,对任意两个变量U、V构成的散点图进行i列j行网格化,并求出最大的互信息值;然后对最大的互信息值进行归一化;最后选择不同尺度下互信息的最大值作为MIC值,其计算公式如下:
;
其中,U、V为任意两个变量,B为预设的参考因子;为U、V的互信息值,其计算公式为:
;
基于特征计分和MIC值计算最终计分:
;
其中,为第i个用电特征指标的最终计分,N为特征数,/>为第i个用电特征指标,基于计算出的最终计分,选取出能够表现出关口计量装置运行状态的最优特征组。
5.根据权利要求4所述的一种关口计量装置运行状态辨识***,其特征在于,所述样本平衡模块对数量少的真实样本进行样本增殖的方法具体为:
采用变分自编码器进行样本生成;
将真实样本输入至变分自编码器的编码器网络中,压缩为低维向量;
再将低维向量输入至变分自编码器的解码器网络进行样本重构,得到生成样本。
6.根据权利要求4所述的一种关口计量装置运行状态辨识***,其特征在于:
所述第一神经网络采用多尺度卷积神经网络,并在多尺度卷积神经网络的池化层之后加入了批标准化和Dropout算法进行优化;
所述第二神经网络采用深度残差收缩网络。
7.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至3任一项所述的关口计量装置运行状态辨识方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至3任一项所述的关口计量装置运行状态辨识方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311089567.6A CN116776209A (zh) | 2023-08-28 | 2023-08-28 | 一种关口计量装置运行状态辨识方法、***、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311089567.6A CN116776209A (zh) | 2023-08-28 | 2023-08-28 | 一种关口计量装置运行状态辨识方法、***、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116776209A true CN116776209A (zh) | 2023-09-19 |
Family
ID=87991696
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311089567.6A Pending CN116776209A (zh) | 2023-08-28 | 2023-08-28 | 一种关口计量装置运行状态辨识方法、***、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116776209A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117176550A (zh) * | 2023-09-25 | 2023-12-05 | 云念软件(广东)有限公司 | 基于故障辨识的集成运行维护方法及*** |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103824093A (zh) * | 2014-03-19 | 2014-05-28 | 北京航空航天大学 | 一种基于kfda及svm的sar图像目标特征提取与识别方法 |
CN105162413A (zh) * | 2015-09-08 | 2015-12-16 | 河海大学常州校区 | 一种基于工况辨识的光伏***性能实时评估方法 |
CN113657556A (zh) * | 2021-09-23 | 2021-11-16 | 华北电力大学 | 基于多元统计分析的燃气轮机进口导叶***故障诊断方法 |
CN114064900A (zh) * | 2021-11-24 | 2022-02-18 | 广东电网有限责任公司 | 一种配电自动化终端故障诊断方法、装置、设备及存储介质 |
-
2023
- 2023-08-28 CN CN202311089567.6A patent/CN116776209A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103824093A (zh) * | 2014-03-19 | 2014-05-28 | 北京航空航天大学 | 一种基于kfda及svm的sar图像目标特征提取与识别方法 |
CN105162413A (zh) * | 2015-09-08 | 2015-12-16 | 河海大学常州校区 | 一种基于工况辨识的光伏***性能实时评估方法 |
CN113657556A (zh) * | 2021-09-23 | 2021-11-16 | 华北电力大学 | 基于多元统计分析的燃气轮机进口导叶***故障诊断方法 |
CN114064900A (zh) * | 2021-11-24 | 2022-02-18 | 广东电网有限责任公司 | 一种配电自动化终端故障诊断方法、装置、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
高伟等: ""不均衡小样本下多特征优化选择的生命体触电故障识别方法"", 《电工技术学报》, pages 1 - 13 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117176550A (zh) * | 2023-09-25 | 2023-12-05 | 云念软件(广东)有限公司 | 基于故障辨识的集成运行维护方法及*** |
CN117176550B (zh) * | 2023-09-25 | 2024-03-19 | 云念软件(广东)有限公司 | 基于故障辨识的集成运行维护方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2023123941A1 (zh) | 一种数据异常检测方法及装置 | |
CN108053148B (zh) | 一种电力信息***故障高效诊断方法 | |
CN116150897A (zh) | 一种基于数字孪生的机床主轴性能测评方法及*** | |
CN111695731A (zh) | 基于多源数据和混合神经网络的负荷预测方法、***及设备 | |
CN116776209A (zh) | 一种关口计量装置运行状态辨识方法、***、设备及介质 | |
CN115841278B (zh) | 电能计量装置运行误差状态评价方法、***、设备及介质 | |
CN117473048B (zh) | 基于数据挖掘的财务异常数据监测分析***及方法 | |
CN115587543A (zh) | 基于联邦学习和lstm的刀具剩余寿命预测方法及*** | |
CN113409166A (zh) | 基于XGBoost模型的用户异常用电行为检测方法及装置 | |
Dong | Combining unsupervised and supervised learning for asset class failure prediction in power systems | |
CN111460001A (zh) | 一种配电网理论线损率评估方法及*** | |
CN114266289A (zh) | 一种复杂装备健康状态评估方法 | |
CN115640969A (zh) | 一种基于设备状态与运行年限的电网运维成本分配方法 | |
Zhang et al. | Load Prediction Based on Hybrid Model of VMD‐mRMR‐BPNN‐LSSVM | |
CN113935413A (zh) | 一种基于卷积神经网的配网录波文件波形识别方法 | |
CN117131022B (zh) | 一种电力信息***的异构数据迁移方法 | |
CN114021758A (zh) | 一种基于梯度提升决策树与逻辑回归融合的运维人员智能推荐方法和装置 | |
CN117674119A (zh) | 电网运行风险评估方法、装置、计算机设备和存储介质 | |
CN113033898A (zh) | 基于k均值聚类与bi-lstm神经网络的电负荷预测方法及*** | |
CN112232570A (zh) | 一种正向有功总电量预测方法、装置及可读存储介质 | |
CN111738483A (zh) | 基于聚类和深层信念网络的电网降损优化方法及*** | |
CN112348220A (zh) | 一种基于企业行为模式的信用风险评估预测方法及*** | |
Pisica et al. | Feature selection filter for classification of power system operating states | |
CN115864644A (zh) | 一种继电保护装置状态评价方法、***、设备及介质 | |
CN115759343A (zh) | 一种基于e-lstm的用户电量预测方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20230919 |