CN116776209A

CN116776209A - 一种关口计量装置运行状态辨识方法、***、设备及介质

Info

Publication number: CN116776209A
Application number: CN202311089567.6A
Authority: CN
Inventors: 赖国书; 黄春竹; 黄天富; 吴志武; 涂彦昭; 张颖; 王春光; 姚文翰; 林彤尧; 黄汉斌; 张增荣; 伍翔; 童承鑫; 林雨欣
Original assignee: State Grid Fujian Electric Power Co Ltd; Marketing Service Center of State Grid Fujian Electric Power Co Ltd
Current assignee: State Grid Fujian Electric Power Co Ltd; Marketing Service Center of State Grid Fujian Electric Power Co Ltd
Priority date: 2023-08-28
Filing date: 2023-08-28
Publication date: 2023-09-19

Abstract

本发明涉及一种关口计量装置运行状态辨识方法、***、设备及介质，其中方法包括以下步骤：采集目标关口计量装置的历史用电数据，获取用电特征指标并对其添加故障类型标签，形成真实样本；基于真实样本的故障类型分布进行样本增殖，形成训练样本集；对训练样本集中的样本进行特征筛选；构建第一神经网络，将训练样本集中的样本重新添加第二标签指示是否发生故障，以用电特征指标作为输入，第二标签作为输出进行训练，得到故障诊断模型；构建第二神经网络，以用电特征指标作为输入，故障类型标签作为输出进行训练，得到故障类型辨识模型；获取当前用电数据，并通过故障诊断模型中判断是否发生故障，通过故障类型辨识模型辨识发生的故障类型。

Description

一种关口计量装置运行状态辨识方法、***、设备及介质

技术领域

本发明涉及一种关口计量装置运行状态辨识方法、***、设备及介质，属于电力设备状态监测技术领域。

背景技术

关口计量装置是购售电双方进行贸易结算的重要设备，由于关口计量装置监测指标多且上传的数据量巨大，因此其上传数据的可靠性与准确性会直接影响到交易的公平性。目前国内对关口计量装置失准的研究大多集中在运行状态辨识上。对关口失准产生机理进行分析，将关口计量装置故障原因分成以下四大类：第一类是计量装置本身故障，包括电能表死机（停止计量，不循显）、电量异常、电能表自动核抄异常等。第二类是二次回路故障，包括电流二次回路失流、电压回路电缆连接松动等。第三类是计量装置通讯模块损坏，导致后台无法读取电能表电量数据。第四类是人为差错，包括接线错误与设备安装错误等。除了常见的几类故障，在对关口计量装置上传的数据进行日常监测的过程中，常有异常数据的出现，异常点的出现并不代表计量装置一定处于故障状态，也可能是由用户的异常用电行为所引起的。通过上述分析可以看出，关口计量装置故障种类繁多，并且带有一定的隐蔽性，常规的检测手段往往消耗大量的人力物力资源，并且无法做到及时性的告警，这期间伴随着电网资产的大量流失。目前，关口计量装置运行状态辨识方法主要包括：

（1）选择与关口计量装置运行状态相关的指标并对其进行赋权，利用赋权后的结果对计量装置进行状态辨识。此类方法过于依赖所选状态指标，指标权重受人工干预大，可靠性难以得到有效验证。

（2）用电信息采集***传回的监测数据中含有大量与计量装置运行状态相关的信息，从这些信息中挖掘反映计量装置相应运行状态的特征指标，并通过构建好的机器学***衡的情况下辨识准确率难以得到保证。

现有的关口计量装置运行状态辨识方法虽然能够判断部分关口计量装置运行状态，但在实际工程应用中仍存在一定局限性，例如：

（1）信息***上传的丰富用电数据能够确定关口计量装置的运行状态，但并非所有数据都能用于计量装置运行状态的辨识，冗余的信息只会增大数据挖掘的计算量，加大模型训练难度。

（2）变压器损耗与母线损耗是评判关口计量装置状态的一个重要特征量。在负荷较小的情况下，受计量装置精度影响，变压器损耗与母线损耗的波动十分剧烈，这会使得模型对计量装置的状态产生误判，降低状态辨识准确率。

（3）对于常见的机器学***的提升以及保护措施的完善，关口计量点发生故障的频率并不频繁，能够获取的关口计量点故障样本远小于正常状态运行样本，即会出现不同类别之间数据样本不平衡的问题，从而导致训练模型过拟合，辨识准确率降低。

（4）自然界中存在大量干扰源，这些干扰源产生的信号通过电磁耦合或是通过电力接线等路径进入到各种电气设备当中，形成各种形式的噪声。传统方法无法忽略噪声对数据采集产生的影响，最终势必会降低计量装置运行状态辨识精度。

发明内容

为了解决上述现有技术中存在的问题，本发明提出了一种关口计量装置运行状态辨识方法、***、设备及介质。

本发明的技术方案如下：

一方面，本发明提供一种关口计量装置运行状态辨识方法，包括以下步骤：

采集目标关口计量装置的历史用电数据，基于历史用电数据获取若干历史时段的若干用电特征指标进行预处理，并对每一历史时段的用电特征指标添加故障类型标签，形成真实样本；

基于真实样本的故障类型分布，对数量少的真实样本进行样本增殖，形成训练样本集；

对训练样本集中的样本进行特征筛选，筛选出高相关的用电特征指标，将其余用电特征指标从样本中剔除；

构建第一神经网络，将训练样本集中的样本按照故障类型标签重新添加第二标签，第二标签用于指示样本是否发生故障，以样本中的用电特征指标作为输入，第二标签作为输出对第一神经网络进行训练，得到训练好的故障诊断模型；

构建第二神经网络，以样本中的用电特征指标作为输入，故障类型标签作为输出对第二神经网络进行训练，得到训练好的故障类型辨识模型；

获取目标关口计量装置的当前用电数据，并获取相应的用电特征指标输入至故障诊断模型中判断是否发生故障，当发生故障后将用电特征指标输入至故障类型辨识模型辨识发生的故障类型。

作为优选实施方式，所述对数量少的真实样本进行样本增殖的方法具体为：

采用变分自编码器进行样本生成；

将真实样本输入至变分自编码器的编码器网络中，压缩为低维向量；

再将低维向量输入至变分自编码器的解码器网络进行样本重构，得到生成样本。

作为优选实施方式，所述对训练样本集中的样本进行特征筛选，筛选出高相关的用电特征指标的方法具体为：

对于任意两类故障类型的样本，记第一类样本的特征集为，第二类样本的特征集为/>；

其中，表示第一类样本中的第i个用电特征指标的特征集，/>表示第二类样本中的第i个用电特征指标的特征集，/>表示第一类样本中的第N1个样本的第i个用电特征指标，/>为第二类样本中的第N2个样本的第i个用电特征指标，第一类样本的样本数为N1，第二类样本的样本数为N2；

采用高斯核函数对上述样本进行非线性变换，映射到高维空间，映射方程具体为：

；

其中，为/>和/>的欧式距离，其中/>表示核函数的中心点，/>为空间中任意一点；/>为带宽，用于控制高斯核函数的作用范围；

得到映射到高维空间的两类样本的特征集和/>，具体如下：

；

其中，表示第一类样本映射到高维空间后的第j个用电特征指标的特征集，/>表示第二类样本中的第j个用电特征指标的特征集；/>表示第一类样本中的第N1个样本的第i个映射到高维空间的用电特征指标，/>表示第二类样本中的第N2个样本的第i个映射到高维空间的用电特征指标；

再使用Fisher线性判别法得到每类样本特征集的类内离散度矩阵为：

；

其中：

；

获取样本的总类内离散度矩阵和总类间离散度矩阵：

；

根据样本的总类内离散度矩阵和总类间离散度矩阵构造特征计分公式：

；

为第i个用电特征指标的特征计分，特征计分的值越大，表示不同类样本的类间离散度越大，即特征区分度越大；

采用最大信息系数法来计算用电特征指标之间的冗余度，具体为：

给定i、j，对任意两个变量U、V构成的散点图进行i列j行网格化，并求出最大的互信息值；然后对最大的互信息值进行归一化；最后选择不同尺度下互信息的最大值作为MIC值，其计算公式如下：

；

其中，U、V为任意两个变量，B为预设的参考因子；为U、V的互信息值，其计算公式为：

；

基于特征计分和MIC值计算最终计分：

；

其中，为第i个用电特征指标的最终计分，N为特征数，/>为第i个用电特征指标，基于计算出的最终计分，选取出能够表现出关口计量装置运行状态的最优特征组。

作为优选实施方式，所述第一神经网络采用多尺度卷积神经网络，并在多尺度卷积神经网络的池化层之后加入了批标准化和Dropout算法进行优化；

所述第二神经网络采用深度残差收缩网络。

另一方面，本发明还提供一种关口计量装置运行状态辨识***，包括：

数据采集模块，用于采集目标关口计量装置的历史用电数据，基于历史用电数据获取若干历史时段的若干用电特征指标进行预处理，并对每一历史时段的用电特征指标添加故障类型标签，形成真实样本；

样本平衡模块，基于真实样本的故障类型分布，对数量少的真实样本进行样本增殖，形成训练样本集；

特征筛选模块，用于对训练样本集中的样本进行特征筛选，筛选出高相关的用电特征指标，将其余用电特征指标从样本中剔除；

第一网络训练模块，用于构建第一神经网络，将训练样本集中的样本按照故障类型标签重新添加第二标签，第二标签用于指示样本是否发生故障，以样本中的用电特征指标作为输入，第二标签作为输出对第一神经网络进行训练，得到训练好的故障诊断模型；

第二网络训练模块，用于构建第二神经网络，以样本中的用电特征指标作为输入，故障类型标签作为输出对第二神经网络进行训练，得到训练好的故障类型辨识模型；

辨识模块，用于获取目标关口计量装置的当前用电数据，并获取相应的用电特征指标输入至故障诊断模型中判断是否发生故障，当发生故障后将用电特征指标输入至故障类型辨识模型辨识发生的故障类型。

作为优选实施方式，所述样本平衡模块对数量少的真实样本进行样本增殖的方法具体为：

采用变分自编码器进行样本生成；

作为优选实施方式，所述特征筛选模块对训练样本集中的样本进行特征筛选，筛选出高相关的用电特征指标的方法具体为：

；

得到映射到高维空间的两类样本的特征集和/>，具体如下：

；

其中：

；

获取样本的总类内离散度矩阵和总类间离散度矩阵：

；

基于特征计分和MIC值计算最终计分：

；

所述第二神经网络采用深度残差收缩网络。

再一方面，本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如本发明任一实施例所述的关口计量装置运行状态辨识方法。

再一方面，本发明还提供一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如本发明任一实施例所述的关口计量装置运行状态辨识方法。

本发明具有如下有益效果：

1、本发明一种关口计量装置运行状态辨识方法，通过样本增殖、特征集自主筛选并结合神经网络实现关口计量装置的运行状态辨识。该方法能够有效解决样本不平衡问题，在降低数据冗余及噪声干扰的前提下快速实现关口计量装置运行状态分类。

2、本发明一种关口计量装置运行状态辨识方法，通过变分自编码器对关口计量装置故障样本进行增殖，有效解决故障样本不均衡以及样本量较小导致的训练模型过拟合，整体辨识准确率降低的问题，保证训练模型的稳定性和整体辨识准确率。

3、本发明一种关口计量装置运行状态辨识方法，利用高斯核Fisher判别分析法以及最大信息系数法对关口计量装置运行状态特征进行自主筛选，从中挑选出最能表达出样本特点的最优特征组，提高模型训练的效率。

4、本发明一种关口计量装置运行状态辨识方法，通过两个神经网络模型实现多层级的关口计量装置运行状态辨识，先判断计量装置是否发生故障，再判断具体故障类型，有效提高运行状态辨识的准确率。

附图说明

图1为本发明实施例一的方法流程示意图；

图2为本发明实施例中采用的多尺度卷积神经网络模型结构示例图；

图3为本发明实施例中采用的深度残差收缩网络模型结构示例图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，文中所使用的步骤编号仅是为了方便描述，不对作为对步骤执行先后顺序的限定。

应当理解，在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

实施例一：

参见图1，本实施例提供一种关口计量装置运行状态辨识方法，通过样本增殖、特征集自主筛选并结合神经网络实现关口计量装置的运行状态辨识。该方法能够有效解决样本不平衡问题，在降低数据冗余及噪声干扰的前提下快速实现关口计量装置运行状态分类。该方法具体包括以下步骤：

S100、基于现有电力行业用电信息采集***、在线监测装置、电能量计量***等平台，对关口计量装置的用电数据进行远程采集，采集目标关口计量装置的历史用电数据，采集的时间间隔为一天一次。再根据关口计量装置基础数据、厂站建模信息、计量装置检修计划等情况进行充分考虑，并基于历史用电数据获取若干历史时段的若干用电特征指标进行预处理，建立用于关口计量装置运行状态辨识的输入矩阵，并对每一历史时段的用电特征指标（也就是输入矩阵）添加故障类型标签，形成真实样本。

在本实施例中，真实样本由输入矩阵和故障类型标签组成，输入矩阵X_nm是一个包含所有用电特征指标的一维矩阵，其中n表示第n个数据指标，共15个指标。

指标X₁表示日正向有功电量与每日峰平谷各个费率时段的总电量的差值，该指标表征电能表示值不平状态，其计算公式为：

；

其中，P₁代表日正向有功总电量，A₁、A₂、A₃和A₄代表每日尖峰、高峰、平和谷不同费率时段的电量。

指标X₂表示日正向有功电量与参考值的比值，该指标表征电能表飞走状态，其计算公式为：

；

其中，P_1ref代表日正向有功电量的参考值。

指标X₃表示连续两日反向有功电量差值和连续两日线损率差值的逻辑与运算，该指标表征电能表停走状态，其计算公式为：

；

其中，P₂和P_2q表示当天与上一天的日反向有功电量，和/>表示当天与上一天的线损率，&为“与”运算符，其运算规则为：若等式右边的两项计算式的计算结果均大于零，则等式左边的指标置为1，反之则置为0。以上式为例，若计算式P₂-P_2q，/>-/>的计算结果都大于0，则指标X₃等于1，若有两计算式中任一项计算结果小于零，则指标X₃等于0。

指标X₄表示连续两日正向有功电量差值，该指标表征电能表倒走状态，其计算公式为：

；

其中，P_1q表示上一天的日正向有功电量。

指标X₅表征电压失压状态，其计算公式为：

；

其中，表示任意一相电压值，/>表示正常运行状态下额定电压，/>表示任意一相电流，/>表示电能表启动电流，&为“与”运算符，其运算规则为：若等式右边的两项计算式的计算结果均大于零，则等式左边的指标置为1，反之则置为0。

指标X₆表征电压断相状态，其计算公式为：

；

其中，表示正常运行状态下电压的下限阈值，&为“与”运算符，其运算规则为：若等式右边的两项计算式的计算结果均大于零，则等式左边的指标置为1，反之则置为0。

指标X₇表征电压越限状态，其计算公式为：

；

其中，表示正常运行状态下电压的上限阈值。

指标X₈表征电压不平衡状态，其计算公式为：

；

其中，表示三相电压的最大值，/>表示三相电压的最小值。

指标X₉表征电流失流状态，其计算公式为：

；

指标X₁₀表征电流不平衡状态，其计算公式为：

；

其中，表示三相电流的最大值，/>表示三相电流的最小值。

指标X₁₁表征计量回路错接线状态，采用日反向有功电量和连续两日线损率差值的逻辑与运算表示，其计算公式为：

；

&为“与”运算符，其运算规则为：若等式右边的两项计算式的计算结果均大于零，则等式左边的指标置为1，反之则置为0。

指标X₁₂表征潮流反向状态，采用三相电流表示，其计算公式为：

；

指标X₁₃与X₁₄分别代表主变损耗率与母线损耗率。由于主变或母线空载损耗固定，在负载较小的情况下，输入电量较小，主或母线的损耗率会偏高。考虑到负载较小的情况一般发生于检修之后，如果延长损耗率的计算时限，可以使得损耗率趋于正常。因此在负荷较小的情况下，需要综合研判计量装置是否处在故障状态。当主变或母线每日的输入电量在10kWh以下时，主变与母线损耗率取近七天的数据计算；当输入电量在10-100kWh时，主变与母线损耗率取近五天的数据计算；当输入电量在100-300kWh时，主变与母线损耗率取近三天的数据计算；当输入电量在300kWh以上时，主变与母线损耗率取当天的数据计算。

为了增加对关口异常状态辨识准确率，将前一天是否处于停电检修状态也作为数据指标之一，若前一天有停电检修则记为1，否则记为0，记为指标X₁₅。在模型对样本的辨识过程中，所有指标如果仅有损耗指标异常，将这种情况记为异常用电行为，其他情况归为具体故障类型或是正常运行状态。

由于模型各个维度的输入数据分布范围差异较大，为了避免模型被某个维度的数据主导，需要先通过归一化处理将输入数据统一映射到[0,1]区间上，便于不同单位或量级的指标能够进行比较和加权。归一化公式如下：

；

其中，为归一化后的输入数据，/>为原始输入数据，/>、/>分别为原始输入数据中的最大值与最小值。

S200、基于真实样本的故障类型分布，对数量少的真实样本进行样本增殖，例如故障类型包括五种，数量分别为5000、4500、4600、3800和600，则对数量为600的故障类型的样本进行样本增殖，使其与其他几类故障类型样本的数量保持一定的平衡，形成样本平衡的训练样本集。样本增殖的方法可以采用过采样方法以及生成模型，例如SMOTE算法。

S300、对训练样本集中的样本进行特征筛选，筛选出高相关的用电特征指标，将其余用电特征指标从样本中剔除，每个样本包含了15个用电特征指标，但并非这15个用电特征指标都对最后的分类有帮助。本实施例从15个用电特征指标中筛选出几个用电特征指标，这几个用电特征指标使得我们这几类样本能够被更好的区分。例如筛选了4个用电特征指标能够使得每个类别的样本之间区分度更大，那最后这4个用电特征指标就会更好地帮助模型进行分类，则本实施例就会选用这4个用电特征指标。

S400、构建第一神经网络，将训练样本集中的样本按照故障类型标签重新添加第二标签，第二标签用于指示样本是否发生故障，以样本中的用电特征指标（筛选后的用电特征指标）作为输入，第二标签作为输出对第一神经网络进行训练，得到训练好的故障诊断模型。

S500、构建第二神经网络，以样本中的用电特征指标（筛选后的用电特征指标）作为输入，故障类型标签作为输出对第二神经网络进行训练，得到训练好的故障类型辨识模型。

S600、获取目标关口计量装置的当前用电数据，并获取相应的用电特征指标输入至故障诊断模型中判断是否发生故障，当发生故障后将用电特征指标输入至故障类型辨识模型辨识发生的故障类型。

作为本实施例的优选实施方式，在步骤S200中，所述对数量少的真实样本进行样本增殖的方法具体为：

采用变分自编码器进行样本生成；变分自编码器（Variational Auto-Encoders，VAE）是一种常见的生成模型，它能够学习一个模型，使得输出数据的分布尽可能地逼近原始数据分布。其基本思路是把一堆真实样本通过编码器网络变换成一个理想的数据分布，然后这个数据分布再传递给一个解码器网络，得到一堆生成样本。生成样本与真实样本足够接近的话，就训练出了一个VAE模型。

VAE主要分为编码器(Encoder)和解码器(Decoder)两部分，Encoder过程是将原先的数据压缩为低维向量，Decoder则是把低维向量还原为原来数据。首先，将真实样本X输入Encoder来确定其后验分布：

；

然而该后验概率的计算极为复杂，是一个混合分布，这个积分计算起来非常困难，且计算复杂性随X的增加而指数上升，所以使用了变分推断，借助/>来近似，一般假定/>服从于高斯分布，即/>，然后，通过生成辅助变量/>来引入隐变量Z：

；

再用隐变量Z来表示，也即Decoder过程：

；

而对任何输入数据，应该尽量保证最后由隐变量而转换回输出数据与输入数据尽可能相等，由此引入最大似然估计：

；

对进行转换：

；

其中：

；

最后，通过神经网络进行调参，使得尽可能小，/>尽可能大，从而达到生成样本与真实样本尽可能相似的效果。通过VAE模型可以大量生成关口计量装置故障样本，从而达到样本平衡。

作为本实施例的优选实施方式，在步骤S300中，所述对训练样本集中的样本进行特征筛选，筛选出高相关的用电特征指标的方法具体为：

由于输入的用电特征指标之间差异性很大，为了降低信息的维度，使用高斯核Fisher判别分析法（Gaussian Kernel Fisher Discriminant Analysis，GKFDA）遴选出高表达度的特征。高斯核Fisher判别分析法需要通过高斯核函数对原始数据样本进行非线性变换，映射到高维空间，采用高斯核函数对上述样本进行非线性变换，映射到高维空间，映射方程具体为：

；

采用如上高斯核映射方程，得到映射到高维空间的两类样本的特征集和/>，具体如下：

；

其中：

；/>

；

获取样本的总类内离散度矩阵和总类间离散度矩阵：

；

在评判特征区分度后，采用最大信息系数法（Maximal InformationCoefficient，MIC）来计算用电特征指标之间的冗余度，具体为：

；

基于特征计分和MIC值计算最终计分：

；

其中，为第i个用电特征指标的最终计分，N为特征数，/>为第i个用电特征指标，基于计算出的最终计分，选取出能够表现出关口计量装置运行状态的最优特征组，本实施例中，选取最优特征组的方法为通过对最终计分对所选用电特征指标进行排序，然后从中选择几个最终计分最高的用电特征指标组成最优特征组。

作为本实施例的优选实施方式，所述第一神经网络采用多尺度卷积神经网络，并在多尺度卷积神经网络的池化层之后加入了批标准化和Dropout算法进行优化；

所述第二神经网络采用深度残差收缩网络。

本实施例所构建的多尺度卷积神经网络模型结构如图2所示。其中，F代表卷积核个数，K代表卷积核尺度，P代表池化层尺度，S代表池化步长。批标准化（batchnormalization，BN）和Dropout算法被用于防止网络产生过拟合现象。

假设S ₀为输入的序列矩阵，S _i为第i个输出的序列矩阵。

卷积层的作用是对输入的序列数据实现局部特征提取。在CNN中，卷积层和池化层通常是交替出现的，假设S _i(i为奇数)为卷积层的输出矩阵，其可以被描述为：

；

其中，是第i层的权重，/>是第i层的偏差，/>是激活函数。

池化层的作用是将卷积层提取的特征压缩，实现信息降维。本研究中使用最大池化函数（c×1），保留池化核中的最大值为输出特征。池化层的输出矩阵(m为从2开始的偶数)可以表示为：

；

其中，指的是最大池化函数，/>的大小是j/c×k,j和k分别是/>层特征的尺度，c是当前池化层的尺度。

输出层本质上是一层全连接层，它的作用是分类，选择softmax作为它的激活函数。在这一层，模型计算当前每个样本对应每一种类型的概率，然后得到一个新的表达式（）：

；

f代表的是softmax激活函数，代表输入样本属于第i个类型的概率，/>代表权重，b代表偏置。

深度残差收缩网络（Deep Residual Shrinkage Network，DRSN）是基于深度残差网络的一种改进网络，结合了深度残差网络、注意力机制和软阈值函数。

本实施例所构建的深度残差收缩网络模型结构如图3所示。深度残差收缩网络堆叠了一定数量的自适应阈值残差收缩单元（RSBU-CW），卷积层（Conv），批标准化（BN），激活函数（ReLU），全局平均池化(GAP)，全连接层(FC)等，网络自适应学习样本特征，通过软阈值化减小噪声对当前任务的影响。

网络残差收缩网络由4个残差收缩单元组成，每个残差收缩单元的下采样步长设置为2，输出特征图通道数设置为4。输出层的正则化方案选择L2正则化，正则化系数设置为0.0015。网络配置的损失函数选用交叉熵损失函数，Adam的初始学习率设置为1e-4。

在实际应用中，不论是环境的影响还是电磁辐射的干扰都会导致采集到的数据包含有一定的噪声，没有采取任何优化手段的网络在训练实际样本的时候很容易发生过拟合和数据分散化的现象，从而导致模型的辨识精度明显降低。为了解决这一问题，提高模型的泛化能力和抗干扰能力，本实施例采用了几种方法对上述神经网络进行优化。

1. 批标准化

批标准化（BN）指的是将数据分成一批批进行随机梯度下降，并且数据在继续向前传递的时候都会先经过标准化的处理。批标准化的计算公式如式所示：

；

其中，和/>都代表该算法的两个可学习变量，/>是为了防止除数为0而添加的一个微小正数，/>代表每一批包含的输入数据个数。

2. 正则化系数、损失函数与优化器选择

在输出层选用L2 正则化来加快网络的收敛速度，防止网络过拟合。选用分类交叉熵作为模型的损失函数，交叉熵的值越小，表示实际输出与期望输出越接近。损失函数的计算方法可由下式表示：

；

其中，为一个取值是0或1的变量，如果第i个样本的类别与第j个类别相同，取值为1，否则取值为0；/>为第i个样本对应于第j个类别的概率；n是样本的数量；c代表输出类别的个数；/>为L2正则化因子。

同时采用Adam optimizer作为模型的优化器。它能够根据神经网络每一次的训练结果迭代更新神经网络的权重，确保模型的损失函数能够达到最小化。

本实施例中神经网络的训练过程做如下的概括：首先，将输入的用电特征指标进行标准化处理。紧接着，对模型的各个参数进行设置，设置的参数包括卷积核个数、卷积核尺寸、卷积核步长、池化窗口大小、池化步长、全连接层神经元个数、批量样本个数、网络学习率和训练次数等。然后，样本被随机划分为训练集、验证集和测试集。再然后，对网络中的权重矩阵和偏置变量进行初始化处理。网络的训练方式可以被看作是前向传播和反向传播两个过程，首先网络通过前向传播的方式对输入数据进行计算，获得模型输出之后计算实际输出与理想输出之间的差值，再通过反向传播算法从最后一层开始逐层计算梯度，由Adam优化器根据梯度对网络的权重和偏置进行调整，当网络的误差满足故障诊断需求或者网络训练次数达到预设次数的时候结束训练。

在上述神经网络训练完成后，进行步骤S600。在需要对关口计量装置进行运行状态辨识时，首先获取当前用电数据，其次对当前用电数据进行预处理并进行特征集自主筛选之后获取当前的用电特征指标，将其送入至以多尺度卷积神经网络为基础的故障诊断模型，故障诊断模型判断关口计量装置的运行状态为故障或正常用电状态，若状态为正常用电状态则结束整个辨识流程。若故障诊断模型判断关口计量装置的运行状态为故障状态，则将预处理后的用电特征指标送入以深度残差收缩网络模型为基础的故障类型辨识模型进行具体的故障类型辨识，获取当前关口计量装置发生的故障类型。

实施例二：

本实施例提供一种关口计量装置运行状态辨识***，包括：

数据采集模块，用于采集目标关口计量装置的历史用电数据，基于历史用电数据获取若干历史时段的若干用电特征指标进行预处理，并对每一历史时段的用电特征指标添加故障类型标签，形成真实样本；该模块用于实现实施例一中步骤S100的功能，在此不再赘述；

样本平衡模块，基于真实样本的故障类型分布，对数量少的真实样本进行样本增殖，形成训练样本集；该模块用于实现实施例一中步骤S200的功能，在此不再赘述；

特征筛选模块，用于对训练样本集中的样本进行特征筛选，筛选出高相关的用电特征指标，将其余用电特征指标从样本中剔除；该模块用于实现实施例一中步骤S300的功能，在此不再赘述；

第一网络训练模块，用于构建第一神经网络，将训练样本集中的样本按照故障类型标签重新添加第二标签，第二标签用于指示样本是否发生故障，以样本中的用电特征指标作为输入，第二标签作为输出对第一神经网络进行训练，得到训练好的故障诊断模型；该模块用于实现实施例一中步骤S400的功能，在此不再赘述；

第二网络训练模块，用于构建第二神经网络，以样本中的用电特征指标作为输入，故障类型标签作为输出对第二神经网络进行训练，得到训练好的故障类型辨识模型；该模块用于实现实施例一中步骤S500的功能，在此不再赘述；

辨识模块，用于获取目标关口计量装置的当前用电数据，并获取相应的用电特征指标输入至故障诊断模型中判断是否发生故障，当发生故障后将用电特征指标输入至故障类型辨识模型辨识发生的故障类型；该模块用于实现实施例一中步骤S600的功能，在此不再赘述。

作为本实施例的优选实施方式，所述样本平衡模块对数量少的真实样本进行样本增殖的方法具体为：

采用变分自编码器进行样本生成；

作为本实施例的优选实施方式，所述特征筛选模块对训练样本集中的样本进行特征筛选，筛选出高相关的用电特征指标的方法具体为：

；/>

得到映射到高维空间的两类样本的特征集和/>，具体如下：

；

其中：

；

获取样本的总类内离散度矩阵和总类间离散度矩阵：

；

基于特征计分和MIC值计算最终计分：

；

所述第二神经网络采用深度残差收缩网络。

实施例三：

本实施例提出一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如本发明任一实施例所述的关口计量装置运行状态辨识方法。

实施例四：

本实施例提出一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明任一实施例所述的关口计量装置运行状态辨识方法。

本申请实施例中，“至少一个”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示单独存在A、同时存在A和B、单独存在B的情况。其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项”及其类似表达，是指的这些项中的任意组合，包括单项或复数项的任意组合。例如，a，b和c中的至少一项可以表示：a，b，c，a和b，a和c，b和c或a和b和c，其中a，b，c可以是单个，也可以是多个。

本领域普通技术人员可以意识到，本文中公开的实施例中描述的各单元及算法步骤，能够以电子硬件、计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的***、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，任一功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory；以下简称：ROM)、随机存取存储器(Random Access Memory；以下简称：RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本发明的实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种关口计量装置运行状态辨识方法，其特征在于，包括以下步骤：

获取目标关口计量装置的当前用电数据，并获取相应的用电特征指标输入至故障诊断模型中判断是否发生故障，当发生故障后将用电特征指标输入至故障类型辨识模型辨识发生的故障类型；

其中，所述对训练样本集中的样本进行特征筛选，筛选出高相关的用电特征指标的方法具体为：

；

得到映射到高维空间的两类样本的特征集和/>，具体如下：

；

其中：

；

获取样本的总类内离散度矩阵和总类间离散度矩阵：

；

基于特征计分和MIC值计算最终计分：

；

2.根据权利要求1所述的一种关口计量装置运行状态辨识方法，其特征在于，所述对数量少的真实样本进行样本增殖的方法具体为：

采用变分自编码器进行样本生成；

3.根据权利要求1所述的一种关口计量装置运行状态辨识方法，其特征在于：

所述第一神经网络采用多尺度卷积神经网络，并在多尺度卷积神经网络的池化层之后加入了批标准化和Dropout算法进行优化；

所述第二神经网络采用深度残差收缩网络。

4.一种关口计量装置运行状态辨识***，其特征在于，包括：

辨识模块，用于获取目标关口计量装置的当前用电数据，并获取相应的用电特征指标输入至故障诊断模型中判断是否发生故障，当发生故障后将用电特征指标输入至故障类型辨识模型辨识发生的故障类型；

所述特征筛选模块对训练样本集中的样本进行特征筛选，筛选出高相关的用电特征指标的方法具体为：

；

得到映射到高维空间的两类样本的特征集和/>，具体如下：

；

其中：

；

获取样本的总类内离散度矩阵和总类间离散度矩阵：

；

基于特征计分和MIC值计算最终计分：

；

5.根据权利要求4所述的一种关口计量装置运行状态辨识***，其特征在于，所述样本平衡模块对数量少的真实样本进行样本增殖的方法具体为：

采用变分自编码器进行样本生成；

6.根据权利要求4所述的一种关口计量装置运行状态辨识***，其特征在于：

所述第二神经网络采用深度残差收缩网络。

7.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至3任一项所述的关口计量装置运行状态辨识方法。

8.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1至3任一项所述的关口计量装置运行状态辨识方法。