CN113988215B - 一种配电网计量柜状态检测方法及*** - Google Patents
一种配电网计量柜状态检测方法及*** Download PDFInfo
- Publication number
- CN113988215B CN113988215B CN202111350022.7A CN202111350022A CN113988215B CN 113988215 B CN113988215 B CN 113988215B CN 202111350022 A CN202111350022 A CN 202111350022A CN 113988215 B CN113988215 B CN 113988215B
- Authority
- CN
- China
- Prior art keywords
- training
- mcgal
- state
- model
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 59
- 238000009826 distribution Methods 0.000 title claims abstract description 23
- 238000012549 training Methods 0.000 claims abstract description 121
- 238000000034 method Methods 0.000 claims abstract description 54
- 238000012544 monitoring process Methods 0.000 claims abstract description 41
- 230000006870 function Effects 0.000 claims description 64
- 239000013598 vector Substances 0.000 claims description 56
- 230000008569 process Effects 0.000 claims description 36
- 238000005457 optimization Methods 0.000 claims description 18
- 230000002159 abnormal effect Effects 0.000 claims description 14
- 238000005070 sampling Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 239000000284 extract Substances 0.000 claims description 10
- 230000008014 freezing Effects 0.000 claims description 9
- 238000007710 freezing Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 8
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 6
- 238000005259 measurement Methods 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 abstract description 13
- 238000013135 deep learning Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 230000005012 migration Effects 0.000 description 3
- 238000013508 migration Methods 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 230000002411 adverse Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000008485 antagonism Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012847 principal component analysis method Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开了一种配电网计量柜状态检测方法及***,根据历史监测数据的运行状态分别构造源域的标签样本和目标域的无标签样本;得到不同运行状态下的训练数据集;构造MCGAL模型,利用不同运行状态下的训练数据集分别训练MCGAL模型,不断更新MCGAL模型的训练参数;判断训练次数和训练参数是否均满足各自的设置阈值,若不满足,则继续训练MCGAL模型并不断更新其训练参数,若满足,则保存训练好的MCGAL模型;获取计量柜实时运行监测数据,并输入到训练好的MCGAL模型中,输出状态检测结果,基于多注意力机制卷积生成对抗学习对计量柜的状态进行检测,以提高在少样本下深度学习计量柜故障检测的精度和效率。
Description
技术领域
本发明涉及配电技术领域,具体涉及一种配电网计量柜状态检测方法及***。
背景技术
计量柜是配电***的主要设备之一,主要起控制和保护其他电力设备的作用。在配电实际运用中,计量柜是配电网故障率最高的设备,对计量柜的状态检测是保证配电***稳定运行的主要环节。目前,对于计量柜的状态进行检测的方法主要有综合评价方法和智能算法,综合评价方法主要包括模糊综合评价、灰色***综合评价、主成分分析法、数据包络分析法等。智能算法主要包括神经网络、模糊控制、支持向量机、Adaboost分类算法等。对于综合评价主要存在的问题是:计算复杂;对于某些指标的权重量分配不合理;模糊隶属度分配精度不够等。智能算法存在的问题是:需要大量数据训练,可能导致数据冗余;算法中存在对特征量的提取不敏感;容易陷入局部最优解等。
发明内容
本发明所要解决的技术问题是,在少样本情况下,如何提高计量柜状态检测的方法没有实现高精确度的检测,减少误判现象,目的在于提出一种配电网计量柜状态检测方法,基于多注意力机制卷积生成对抗学习对计量柜的状态进行检测,以提高在少样本下深度学习计量柜故障检测的精度和效率。
本发明通过下述技术方案实现:
一种配电网计量柜状态检测方法,包括以下步骤:
采集计量柜历史运行监测数据;根据历史监测数据的运行状态分别构造源域的标签样本和目标域的无标签样本;得到不同运行状态下的训练数据集;
构造MCGAL模型,利用不同运行状态下的训练数据集分别训练MCGAL模型,并不断更新MCGAL模型的训练参数,得到训练好的MCGAL模型;
其中,对于每种训练数据集,判断训练次数和训练参数是否均满足各自的设置阈值,若不满足,则继续训练MCGAL模型并不断更新其训练参数,若满足,则保存该次训练好的MCGAL模型;
获取计量柜实时运行监测数据,并输入到训练好的MCGAL模型中,最终输出状态检测结果。
进一步地,所述MCGAL模型包括共享特征生成器和状态识别模块,MCGAL模型的训练过程为:
预训练过程:
对于每种训练数据集,将对应运行状态下的标签样本和无标签样本输入到共享特征生成器中,提取出计量柜高维状态特征;
将计量柜高维状态特征输入状态识别模块,输出类别概率向量;
对抗训练过程:
根据类别概率向量,计算标签样本在状态识别模块的交叉熵损失;
采用差异项作为源域的决策边界的优化函数,检测源域决策边界外的无标签样本;
基于决策边界自适应竞争的学习策略,根据优化函数和交叉熵损失,计算MCGAL模型的训练全局损失并不断更新MCGAL模型的参数;
迭代更新:
判断训练全局损失和训练次数是否满足训练全局损失大于损失阈值且训练次数小于迭代阈值,若满足,则重复执行所述预训练和对抗训练的过程,若不满足,则保存训练好的MCGAL 模型。
本发明为了提高计量柜状态检测识别的精度,构建了MCGAL模型,MCGAL模型包括具有多注意力机制的共享特征生成器和状态识别模块,由于多注意力机制的本质在于不同特征的建构和不同层次信息的综合利用,多注意力机制具有显著提高特征丰富度的优异性能,可以在共享特征生成器中通过收集对应于不同尺度的子空间从而获得一个综合特征空间,可以有效避免更深层次的网络带来的不良影响,提升了模型的动态调整性能、自适应能力,进而提高了基于MCGAL的计量柜状态检测技术在各种不同工作环境的检测精度和检测效率。在上述多注意力机制的卷积运算中,为了保证输出特征的格式,均采用了零填充策略,所有的卷积步长都设置为1。另外,针对域对抗网络只区分域而忽略决策边界的不足,在状态识别模块引入基于决策边界自适应竞争的学习策略对MCGAL模型进行对抗训练并进行参数更新,目标在于尽可能区分样本是来自源域还是目标域,以辅助训练和促进域不变特征子空间的构建,通过考虑域间的决策边界以降低处理边界域样本的分类损失,提高了域间迁移能力,进而提高了在少样本情况下的检测精度,有效缓解了标记样本收集的困境。
进一步地,在预训练过程中提取计量柜高维状态特征的过程包括:
使共享特征生成器的每个分支分别从标签样本和无标签样本中提取初步特征;
对于每个分支输出的初步特征,基于以1×3为核的卷积运算和最大池化运算依次从初步特征中抽取维数为[C×M]的中间特征;C和M分别表示分支的通道数和维数;
将所述中间特征展开成特征向量,对特征向量进行特征提取得到多尺度特征,并利用具有[C×M,30,1]结构的三层神经网络对多尺度特征进行非线性变换,得到每个分支的权重;
将每个分支的权重叠加在每个分支的初步特征上,输出计量柜高维状态特征。
进一步地,输出计量柜数据样本的状态类别标签的过程为:
对于状态识别模块中的每个判别器,在卷积层对计量柜高维状态特征进行卷积运算,并添加辅助卷积层调整通道的数量;
对于状态识别模块中的每个判别器,在卷积层对计量柜高维状态特征进行卷积运算,并添加辅助卷积层调整通道的数量;
在全局平均池层对每个判别器的每个通道进行整体采样,输出四维采样特征向量;
利用全连接层的softmax函数处理四维采样特征向量,输出每个判别器的类别概率向量。
进一步地,状态识别模块包括两个初始化不同的判别器,计算标签样本在状态识别模块的交叉熵损失的具体过程为:
计算每个判别器的交叉熵损失
其中,τs表示源域,nsource表示来自源域的标签样本的批量,和/>表示第i个标签样本分别输入两个判别器后,输出的类别概率向量中第j个类别概率对应的计量柜运行状态,/>表示第i个标签样本对应的运行状态。
进一步地,采用差异项作为决策边界,计算差异交叉熵损失,差异交叉熵损失表示为:
其中,τt表示目标域,p1,p2分别为两个判别器的类别概率向量,dis(·)表示差异函数,表示目标域的第i个无标签样本,y表示两个判别器的类别概率向量中最大的类别概率对应的计量柜运行状态;
差异函数采用L1范数计算,表示如下:
其中k表示计量柜所有运行状态类型的数量,p1m和p2m分别表示两个判别器输出的第m 个运行状态的类别概率。
进一步地,计算MCGAL模型的训练全局损失并不断更新MCGAL模型的参数的过程为:
基于源域标签样本最小化分类误差,以下列优化函数为目标进行求解,所述优化函数为:
其中,G表示共享特征生成器、D1和D2分别表示两个初始化不同的判别器;
冻结判别器D1和D2的参数,通过反向传播算法,对得到所述优化函数时对应的交叉熵损失求解,更新共享特征生成器G的参数θG:
其中,η表示学习率;
训练两个判别器使得差异函数的差异项最大化,以下列目标函数为目标进行求解,所述目标函数为:
其中,ladv表示差异交叉熵损失;
冻结共享特征生成器G的参数,通过反向传播算法,对得到所述目标函数时对应的交叉熵损失和差异交叉熵损失求解,更新判别器D1和D2的参数
单独训练共享特征生成器G,使得差异函数的差异项最小化,以下列目标损失函数为目标进行求解,所述目标损失函数为:
接着冻结判别器D1和D2的参数,对得到所述损失函数时对应的差异交叉熵求解,更新共享生成器G的参数θG:
进一步地,对于计量柜实时运行监测数据,输出状态检测结果的过程为:
将历史监测数据的运行状态分为四类分别与类别概率向量的四个维度对应,分别为:正常、需要注意、异常、故障;
将计量柜实时运行监测数据输入到训练好的MCGAL模型中,对于每个判别器输出的类别概率向量,将其中相同维度的概率相加,得到每个维度的输出概率,比较四个维度的输出概率,得到最终输出状态检测结果:
当输出概率为正常概率最大时,所述输出状态检测结果为正常;
当输出概率为需要注意概率最大时,所述输出状态检测结果为注意;
当输出概率为异常概率最大时,所述输出状态检测结果为异常;
当输出概率为故障概率最大时,所述输出状态检测结果为故障。
另外,本发明提供一种配电网计量柜状态检测***,包括:
数据标签构造模块,用于采集计量柜历史运行监测数据;根据历史监测数据的运行状态分别构造源域的标签样本和目标域的无标签样本;得到不同运行状态下的训练数据集;
模型训练模块,用于构造MCGAL模型,利用不同运行状态下的训练数据集分别训练MCGAL模型,并不断更新MCGAL模型的训练参数,得到训练好的MCGAL模型;
模型生成模块,用于判断训练次数和训练参数是否均满足各自的设置阈值,若不满足,则继续训练MCGAL模型并不断更新其训练参数,若满足,则保存训练好的MCGAL模型;
数据分类模块,用于获取计量柜实时运行监测数据,并输入到训练好的MCGAL模型中,最终输出状态检测结果。
进一步地,所述MCGAL模型包括共享特征生成器和状态识别模块,
所述共享特征生成器包括动态注意力模块、第一注意力模块和第二注意力模块,且动态注意力模块包括多个分支;
所述动态注意力模块的每个分支分别从标签样本和无标签样本中提取初步特征,将每个分支的初步特征分别作为第一注意力模块的输入;
所述第一注意力模块从初步特征中抽取维数为[C×M]的中间特征;C和M分别表示动态注意力模块各分支的通道数和维数;
所述第二注意力模块将所述中间特征展开成特征向量,对特征向量进行特征提取得到多尺度特征,并利用具有[C×M,30,1]结构的三层神经网络对多尺度特征进行非线性变换,得到每个分支的权重;并将每个分支的权重叠加在每个分支的初步特征上,输出计量柜高维状态特征。
本发明与现有技术相比,具有如下的优点和有益效果:
1、本发明基于多注意力机制卷积生成对抗学习的计量柜状态检测方法,多注意力机制卷积生成对抗学习(Multiattentional Convolution Generative AdversarialLearning,MCGAL)模型主要由两部分组成:具有多尺度注意机制的注意力模块构成的共享特征生成器和两个判别器组成的状态识别模块。共享特征生成器不仅可以通过不同的内部感知尺度获取丰富特征,提取差异特征并自适应计算不同尺度对应的贡献度。还通过注意机制决定了不同尺度的权重。共享特征生成器在强调关键尺度的同时,采用注意机制弱化冗余尺度。提升了模型的动态调整性能、自适应能力,进而提高了基于MCGAL的计量柜状态检测技术在各种不同工作环境的检测精度和检测效率。
2、本发明采用两个判别器分别在源域上随机初始化和预训练来实现状态识别和判定边界差异测量。而且MCGAL引入对抗性学习策略,结合两个判别器决策边界的差异进行自竞争学习以消除域分布差异,找到合适的子空间,提取类可分和域不变的特征,通过考虑域间的决策边界以降低处理边界域样本的分类损失,提高了域间迁移能力,进而提高了基于MCGAL 的计量柜状态检测技术的在少样本情况下的检测精度,有效缓解了标记样本收集的困境,提高了计量柜状态检测的精度。
附图说明
为了更清楚地说明本发明示例性实施方式的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。在附图中:
图1为本发明的方法整体流程图;
图2为本发明一种实施方式中的共享特征生成器结构示意图;
图3为本发明一种实施方式中的状态识别模块的结构示意图;
图4为本发明构造的MCGAL模型示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例1
如图1所示,本实施1一种配电网计量柜状态检测方法,包括以下步骤:
S1、采集计量柜历史运行监测数据;根据历史监测数据的运行状态分别构造源域的标签样本和目标域的无标签样本;得到不同运行状态下的训练数据集;
采集计量柜历史运行监测数据,包括原始的运行电流、电压和功率等数据;通过人工标记的方式将计量柜在各种状态下的一部分历史电流、电压和功率等样本进行分类打标签,分为四类,分别为正常、需要注意、异常、故障,并将这些标签样本作为源域的标签样本,将其他未标记的监测电流、电压和功率等数据作为目标域的无标签样本。
S2、构造MCGAL模型,利用不同运行状态下的训练数据集分别训练MCGAL模型,并不断更新MCGAL模型的训练参数,得到训练好的MCGAL模型;其中,对于每种训练数据集,直至训练MCGAL模型输出为该训练数据集对应的计量柜运行状态;
判断训练次数和训练参数是否均满足各自的设置阈值,若不满足,则继续训练MCGAL 模型并不断更新其训练参数,若满足,则保存该次训练好的MCGAL模型;
具体地,如图4所示,所述MCGAL模型包括共享特征生成器和状态识别模块,MCGAL模型的训练过程为:
S21、预训练过程:
对于每种训练数据集,将对应运行状态下的标签样本和无标签样本输入到共享特征生成器中,提取出计量柜高维状态特征;
将计量柜高维状态特征输入状态识别模块,输出类别概率向量;
具体地,构造的共享特征生成器具有多注意力机制,包括动态注意力模块、两个阶段的多尺度注意力模块,且动态注意力模块包括多个分支,动态注意力模块包括如图2所示的三个平行分支,分别标记为MS1、MS2和MS3,在每个分支中,特定的子空间是基于特定的内核尺度提取的,例如扩张速率(Dilation Rate,DR),DR值为2意味着任何两个权重之间都有一个零值和在卷积核中,并行连接模型允许所提出的模块在不同层次上对同一输入特征执行特征提取,并且通过收集对应于不同尺度的子空间可以获得一个综合特征空间。由于多注意力机制的本质在于不同特征的建构和不同层次信息的综合利用,多注意力机制具有显著提高特征丰富度的优异性能。基于以上优势,可以有效避免更深层次的网络带来的不良影响,提升了模型的动态调整性能、自适应能力,进而提高了基于MCGAL的计量柜状态检测技术在各种不同工作环境的检测精度和检测效率。在卷积运算中,为了保证输出特征的格式,本实施例采用了零填充策略,所有的卷积步长都设置为1,然后,将每个分支提取的特征作为第一阶段多尺度注意力模块的输入,得到不同尺度的权重,确定每个分支的重要性,随后,根据通道的维度连接每个分支的加权特征,第二阶段多尺度注意力模块根据每个分支的重要性对每个分支的输出进行加权。
则上述的提取计量柜高维状态特征的过程为:
A1、动态注意力模块的每个分支分别从标签样本和无标签样本中提取初步特征;
提取的初步特征z表示为:
z=[z1,z2,...,zN] (1)
其中,N表示分支的数量;
A2、对于每个分支输出的初步特征,第一阶段的多尺度注意力模块基于以1×3为核的卷积运算和最大池化运算依次从初步特征中抽取维数为[C×M]的中间特征U;C和M分别表示分支的通道数和维数;
中间特征U记为:
其中,表示第一阶段的多尺度注意力模块的特征提取过程函数;
A3、第二阶段的多尺度注意力模块将所述中间特征展开成特征向量,对特征向量进行特征提取得到多尺度特征,并进一步利用具有[C×M,30,1]结构的三层神经网络对多尺度特征进行非线性变换,得到每个分支的权重;
每个分支的权重αi可以通过Softmax函数计算,如下所示:
其中,s表示第二阶段提取对特征向量进行特征提取得到的多尺度特征,第二阶段多尺度注意力模块的特征提取过程函数,fflat(·)表示展开操作,e表示自然指数。
A4、将每个分支的权重叠加在每个分支的初步特征上,输出计量柜高维状态特征,具体地,基于生成的权重αi,则第二阶段的多尺度注意力模块最终输出的计量柜高维状态特征O为:
O=[α1·z1,α2·z2,...,αN·zN] (5)
接着,针对域对抗网络只区分域而忽略决策边界的不足,本实施例中状态识别模块包括两种不同初始化的判别器D1和D2,判别器的结构如图3所示,判别器的目标就是尽可能区分样本是来自源域还是目标域,以辅助训练和促进域不变特征子空间的构建。同时,共享特征生成器试图欺骗鉴别器用于保持模型的整体分类性能。在状态识别模块中,对于每个判别器,先采用卷积池化层进一步变换计量柜高维状态特征。此外,为了满足检测任务的标签空间,添加了辅助卷积层来调整通道的数量,全局平均池(GAP)层用于对每个通道进行整体采样,在全局平均池层对每个判别器的每个通道进行整体采样,输出四维采样特征向量,该过程可表示如下:
其中,D1(·)和D2(·)分别表示判别器D1和D2的运算过程,即对计量柜高维状态特征的各个特征的权重求和,F1、F2表示判别器D1和D2输出的四维采样特征向量;
另外,D1和D2基于源域进行不同初始化的预训练,共同承担分类检测任务,因此采用 Softmax函数处理四维采样特征向量,输出每个判别器的类别概率向量:
其中p1、p2分别表示两个判别器输出的四维的类别概率向量,p1={p1,1,p1,2,p1,3,p1,4}, p2={p2,1,p2,2,p2,3,p2,4},设定p1,1和p2,1表示正常状态的概率,p1,2和p2,2表示需要注意状态的概率,p1,3和p2,3表示异常状态概率,p1,4和p2,4表示故障状态概率;通过源域的标签样本,在模型训练过程中,训练判别器输出正确的概率,训练至状态识别模块输出的类别概率为该训练数据集对应的运行状态所属类别概率最大时,例如对于正常状态的标签样本,训练两个判别器输出类别概率向量p1、p2中的p1,1和p2,1最大;
最后训练完成后,在训练好的MCGAL模型中,将两个概率向量相加,得到最终计量柜状态类别状态:
y=MAX(p1+p2) (8)
其中,MAX(·)表示输出最大类别概率对应的状态,具体地,
当两个概率向量相加为正常概率最大时,所述计量柜状态类别状态y为正常;
当两个概率向量相加为需要注意概率最大时,所述计量柜状态类别状态y为注意;
当两个概率向量相加为异常概率最大时,所述计量柜状态类别状态y为异常;
当两个概率向量相加为故障概率最大时,所述计量柜状态类别状态y为故障。
S22、对抗训练过程:为了使得上述的两个判别器能输出正确的对应于训练数据集的运行状态概率,进行以下训练过程:
S221、根据类别概率向量,计算标签样本在状态识别模块的交叉熵损失;
具体地,由于MCGAL模型在上述预训练过程中是基于源域进行的,以确保其优异的分类检测性能,则两个判别器D1和D2的交叉熵损失表示如下:
其中,τs表示源域,nsource表示来自源域的标签样本的批量,和/>表示第i个标签样本分别输入两个判别器后,输出的类别概率向量中第j个类别概率对应的计量柜运行状态,/>表示第i个标签样本对应的运行状态;
S222、采用差异项作为源域的决策边界的优化函数,检测源域决策边界外的无标签样本;为了检测源域的决策边界之外的目标样本,本实施例采用差异项作为决策边界优化函数的参数,计算差异交叉熵损失,差异交叉熵损失表示为:
其中,τt表示目标域,p1,p2分别为两个判别器的类别概率向量,dis(·)表示差异函数,表示目标域的第i个无标签样本;y表示两个判别器的类别概率向量中最大的类别概率对应的计量柜运行状态;
差异函数采用L1范数计算,表示如下:
其中k表示计量柜所有运行状态类型的数量,p1m和p2m分别表示两个判别器输出的第m个运行状态的类别概率。
S223、基于决策边界自适应竞争的学习策略,根据优化函数和交叉熵损失,计算MCGAL 模型的训练全局损失并不断更新MCGAL模型的参数;
根据优化函数的优化函数,在MCGAL的对抗训练过程中,本实施例采用三个损失函数来实现MCGAL的对抗训练:
第一步的目标是:基于源域样本最小化分类误差,以便共享生成器可以捕获深度可分离的特征,以下列优化函数为目标进行求解,所述优化函数为:
其中,G表示共享特征生成器、D1和D2分别表示两个初始化不同的判别器;
接着更新共享特征生成器G的参数θG,冻结判别器D1和D2的参数,通过反向传播算法,对得到所述优化函数时对应的交叉熵损失求解,更新共享特征生成器G的参数θG:
其中,η表示学习率;
第二步的目标是:训练两个判别器使得差异函数的差异项最大化,以促进特征生成器能够提取域不变特征,同时确保分类性能,则以下列目标函数为目标进行求解,所述目标函数为:
其中,ladv表示差异交叉熵损失;
接着更新判别器D1和D2的参数:冻结共享特征生成器G的参数,通过反向传播算法,对达到所述目标函数的目标时对应的交叉熵损失和差异交叉熵损失求解,更新判别器D1和D2的参数
第三步的目标是:单独训练共享特征生成器G,使得差异函数的差异项最小化,以下列目标损失函数为目标进行求解,所述目标损失函数为:
接着更新共享生成器G的参数:冻结判别器D1和D2的参数,对达到所述损失函数的目标时得到的对应的差异交叉熵求解,更新共享生成器G的参数θG:
S23、迭代更新:
判断训练全局损失和训练次数是否满足训练全局损失大于损失阈值且训练次数小于迭代阈值,若满足,则重复执行步骤S21-S22的预训练和对抗训练的过程,若不满足,则保存训练好的MCGAL模型。
上述的训练全局损失等于步骤S22中三个损失函数之和,即优化函数、目标函数,目标损失函数之和,这样不仅能有效缓解域偏移现象带来的特征分布差异的限制,还能保证判别器的识别性能。通过执行上述训练过程,共享特征生成器可以逐渐感知域不变和类可分离的特征。同时,判别器具有更强的识别样本所属域的能力。通过考虑域间的决策边界以降低处理边界域样本的分类损失,提高了域间迁移能力,进而提高了基于MCGAL的计量柜状态检测技术的在上样本情况下的检测精度,有效缓解了标记样本收集的困境,使该方法更适合实际诊断需求。
S3、获取计量柜实时运行监测数据,并输入到训练好的MCGAL模型中,最终输出状态检测结果。
当模型训练好后,将实时运行监测数据输入MCGAL模型中,检测过程为:先通过两阶段多注意力机制提取计量柜的高维状态特征,再将高维状态特征分别输入判别器D1和D2中输出计量柜的四维采样特征向量,通过softmax函数输出计量柜的状态类别概率,最后将两个概率向量相加得到最终计量柜状态类别标签,实现对计量柜状态的检测,则对于计量柜实时运行监测数据,输出状态检测结果的过程为:
将历史监测数据的运行状态分为四类分别与类别概率向量的四个维度对应,分别为:正常、需要注意、异常、故障;
将计量柜实时运行监测数据输入到训练好的MCGAL模型中,对于每个判别器输出的类别概率向量,按公式(8)的方法,将其中相同维度的类别概率相加,得到每个维度的输出概率,比较四个维度的输出概率,得到最终输出状态检测结果:
当输出概率为正常概率最大时,所述输出状态检测结果为正常;
当输出概率为需要注意概率最大时,所述输出状态检测结果为注意;
当输出概率为异常概率最大时,所述输出状态检测结果为异常;
当输出概率为故障概率最大时,所述输出状态检测结果为故障。
实施例2
另外,本实施例2提供一种配电网计量柜状态检测***,包括:
数据标签构造模块,用于采集计量柜历史运行监测数据;根据历史监测数据的运行状态分别构造源域的标签样本和目标域的无标签样本;得到不同运行状态下的训练数据集;
采集计量柜历史运行监测数据,包括原始的运行电流、电压和功率等数据;通过人工标记的方式将计量柜在各种状态下的一部分历史电流、电压和功率等样本进行分类打标签,分为四类,分别为正常、需要注意、异常、故障,并将这些标签样本作为源域的标签样本,将其他未标记的监测电流、电压和功率等数据作为目标域的无标签样本。
模型训练模块,用于构造MCGAL模型,利用不同运行状态下的训练数据集分别训练MCGAL模型,并不断更新MCGAL模型的训练参数,得到训练好的MCGAL模型;
具体地,所述MCGAL模型包括共享特征生成器和状态识别模块,
所述共享特征生成器包括动态注意力模块、第一注意力模块和第二注意力模块,且动态注意力模块包括多个分支;
所述动态注意力模块的每个分支分别从标签样本和无标签样本中提取初步特征,将每个分支的初步特征分别作为第一注意力模块的输入;
所述第一注意力模块从初步特征中抽取维数为[C×M]的中间特征;C和M分别表示动态注意力模块各分支的通道数和维数;
所述第二注意力模块将所述中间特征展开成特征向量,对特征向量进行特征提取得到多尺度特征,并利用具有[C×M,30,1]结构的三层神经网络对多尺度特征进行非线性变换,得到每个分支的权重;并将每个分支的权重叠加在每个分支的初步特征上,输出计量柜高维状态特征。具体地,可以通过实施例1中的公式(1)-(5)计算共享特征生成器的输出以提取两个计量柜的高维状态特征。
状态识别模块中包括两个不同初始化的判别器,在每个判别器的卷积层对计量柜高维状态特征进行卷积运算,并添加辅助卷积层调整通道的数量,在每个判别器的全局平均池层对每个通道进行整体采样,并经过softmax函数处理,输出每个通道的类别概率。具体可通过实施例1中的公式(6-8)预测两个判别器输出的类别概率向量;
模型生成模块,用于判断训练次数和训练参数是否均满足各自的设置阈值,若不满足,则继续训练MCGAL模型并不断更新其训练参数,若满足,则保存训练好的MCGAL模型;
此时的训练参数包括训练全局损失,则可通过实施例1中的公式(9)-(17)计算MCGAL 模型的训练全局损失,并计算MCGAL中的网络权重和偏置关于全局算式的梯度,并更新 MCGAL模型中的网络权重和偏置。
数据分类模块,用于获取计量柜实时运行监测数据,并输入到训练好的MCGAL模型中,输出状态检测结果。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/ 或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/ 或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本领域普通技术人员可以理解实现上述事实和方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,涉及的程序或者所述的程序可以存储于一计算机所可读取存储介质中,该程序在执行时,包括如下步骤:此时引出相应的方法步骤,所述的存储介质可以是 ROM/RAM、磁碟、光盘等等。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种配电网计量柜状态检测方法,其特征在于,包括以下步骤:
采集计量柜历史运行监测数据;根据历史监测数据的运行状态分别构造源域的标签样本和目标域的无标签样本;得到不同运行状态下的训练数据集;
构造MCGAL模型,利用不同运行状态下的训练数据集分别训练MCGAL模型,并不断更新MCGAL模型的训练参数,得到训练好的MCGAL模型;
其中,对于每种训练数据集,判断训练次数和训练参数是否均满足各自的设置阈值,若不满足,则继续训练MCGAL模型并不断更新其训练参数,若满足,则保存该次训练好的MCGAL模型;
获取计量柜实时运行监测数据,并输入到训练好的MCGAL模型中,最终输出状态检测结果;
其中,所述MCGAL模型包括共享特征生成器和状态识别模块,MCGAL模型的训练过程分为:
预训练过程:
对于每种训练数据集,将对应运行状态下的标签样本和无标签样本输入到共享特征生成器中,提取出计量柜高维状态特征;将
计量柜高维状态特征输入状态识别模块,输出类别概率向量;对抗训练过程:根据类别概率向量,计算标签样本在状态识别模块的交叉熵损失;
采用差异项作为源域的决策边界的优化函数,检测源域决策边界外的无标签样本;
基于决策边界自适应竞争的学习策略,根据优化函数和交叉熵损失,计算MCGAL模型的训练全局损失并不断更新MCGAL模型的参数;
迭代更新:
判断训练全局损失和训练次数是否满足训练全局损失大于损失阈值且训练次数小于迭代阈值,若满足,则重复执行所述预训练和对抗训练的过程,若不满足,则保存训练好的MCGAL模型;
在预训练过程中提取计量柜高维状态特征的过程包括:
使共享特征生成器的每个分支分别从标签样本和无标签样本中提取初步特征;
对于每个分支输出的初步特征,从初步特征中抽取维数为[C×M]的中间特征;C和M分别表示分支的通道数和维数;
将所述中间特征展开成特征向量,对特征向量进行特征提取得到多尺度特征,并利用具有[C×M,30,1]结构的三层神经网络对多尺度特征进行非线性变换,得到每个分支的权重;
将每个分支的权重叠加在每个分支的初步特征上,输出计量柜高维状态特征;
输出类别概率向量的过程为:
对于状态识别模块中的每个判别器,在卷积层对计量柜高维状态特征进行卷积运算,并添加辅助卷积层调整通道的数量;
在全局平均池层对每个判别器的每个通道进行整体采样,输出四维采样特征向量;
利用全连接层的softmax函数处理四维采样特征向量,输出每个判别器的类别概率向量。
2.根据权利要求1所述的一种配电网计量柜状态检测方法,其特征在于,状态识别模块包括两个初始化不同的判别器,计算标签样本在状态识别模块的交叉熵损失的具体过程为:
计算每个判别器的交叉熵损失、/>,
其中,表示源域,/>表示来自源域的标签样本的批量,/>和/>表示第i个标签样本分别输入两个判别器后,输出的类别概率向量中第j个类别概率对应的计量柜运行状态,/>表示第i个标签样本对应的运行状态。
3.根据权利要求1所述的一种配电网计量柜状态检测方法,其特征在于,采用差异项作为决策边界,计算差异交叉熵损失,差异交叉熵损失表示为:
其中,表示目标域,p1,p2分别为两个判别器的类别概率向量,dis(·)表示差异函数,表示目标域的第i个无标签样本;y表示两个判别器的类别概率向量中最大的类别概率对应的计量柜运行状态;
差异函数采用L1范数计算,表示如下:
其中k表示计量柜所有运行状态类型的数量,p1m和p2m分别表示两个判别器输出的类别概率向量中,第m个运行状态的类别概率。
4.根据权利要求3所述的一种配电网计量柜状态检测方法,其特征在于,计算MCGAL模型的训练全局损失并不断更新MCGAL模型的参数的过程为:
基于源域标签样本最小化分类误差,以下列优化函数为目标进行求解,所述优化函数为:
其中,G表示共享特征生成器、D1和D2分别表示两个初始化不同的判别器;冻结判别器D1和D2的参数,通过反向传播算法,对得到所述优化函数时对应的交叉熵损失求解,更新共享特征生成器G的参数θG:
其中,η表示学习率;训练两个判别器使得差异函数的差异项最大化,以下列目标函数为目标进行求解,所述目标函数为:
其中,ladv表示差异交叉熵损失;
冻结共享特征生成器G的参数,通过反向传播算法,对得到所述目标函数时对应的交叉熵损失和差异交叉熵损失求解,更新判别器D1和D2的参数;
单独训练共享特征生成器G,使得差异函数的差异项最小化,以下列目标损失函数为目标进行求解,所述目标损失函数为:
接着冻结判别器D1和D2的参数,对得到所述损失函数时对应的差异交叉熵求解,更新共享生成器G的参数θG:
。
5.根据权利要求1所述的一种配电网计量柜状态检测方法,其特征在于,对于计量柜实时运行监测数据,输出状态检测结果的过程为:
将历史监测数据的运行状态分为四类分别与类别概率向量的四个维度对应,分别为:正常、需要注意、异常、故障;
将计量柜实时运行监测数据输入到训练好的MCGAL模型中,对于每个判别器输出的类别概率向量,将其中相同维度的概率相加,得到每个维度的输出概率,比较四个维度的输出概率,得到最终输出状态检测结果:
当输出概率为正常概率最大时,所述输出状态检测结果为正常;
当输出概率为需要注意概率最大时,所述输出状态检测结果为注意;
当输出概率为异常概率最大时,所述输出状态检测结果为异常;
当输出概率为故障概率最大时,所述输出状态检测结果为故障。
6.一种配电网计量柜状态检测***,其特征在于,包括:
数据标签构造模块,用于采集计量柜历史运行监测数据;根据历史监测数据的运行状态分别构造源域的标签样本和目标域的无标签样本;得到不同运行状态下的训练数据集;
模型训练模块,用于构造MCGAL模型,利用不同运行状态下的训练数据集分别训练MCGAL模型,并不断更新MCGAL模型的训练参数,得到训练好的MCGAL模型;
模型生成模块,用于判断训练次数和训练参数是否均满足各自的设置阈值,若不满足,则继续训练MCGAL模型并不断更新其训练参数,若满足,则保存训练好的MCGAL模型;
数据分类模块,用于获取计量柜实时运行监测数据,并输入到训练好的MCGAL模型中,最终输出状态检测结果;
所述MCGAL模型包括共享特征生成器和状态识别模块,
所述共享特征生成器包括动态注意力模块、第一注意力模块和第二注意力模块,且动态注意力模块包括多个分支;
所述动态注意力模块的每个分支分别从标签样本和无标签样本中提取初步特征,将每个分支的初步特征分别作为第一注意力模块的输入;
所述第一注意力模块从初步特征中抽取维数为[CXM]的中间特征;C和M分别表示动态注意力模块各分支的通道数和维数;
所述第二注意力模块将所述中间特征展开成特征向量,对特征向量进行特征提取得到多尺度特征,并利用具有[CXM,30,1]结构的三层神经网络对多尺度特征进行非线性变换,得到每个分支的权重;并将每个分支的权重叠加在每个分支的初步特征上,输出计量柜高维状态特征;
状态识别模块中包括两个不同初始化的判别器,在每个判别器的卷积层对计量柜高维状态特征进行卷积运算,并添加辅助卷积层调整通道的数量,在每个判别器的全局平均池层对每个通道进行整体采样,并经过softmax函数处理,输出每个通道的类别概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111350022.7A CN113988215B (zh) | 2021-11-15 | 2021-11-15 | 一种配电网计量柜状态检测方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111350022.7A CN113988215B (zh) | 2021-11-15 | 2021-11-15 | 一种配电网计量柜状态检测方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113988215A CN113988215A (zh) | 2022-01-28 |
CN113988215B true CN113988215B (zh) | 2024-06-07 |
Family
ID=79748605
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111350022.7A Active CN113988215B (zh) | 2021-11-15 | 2021-11-15 | 一种配电网计量柜状态检测方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113988215B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116846082B (zh) * | 2023-08-31 | 2023-11-03 | 北京拓普尔通信技术有限公司 | 用于配电柜的远程调控*** |
CN117347803A (zh) * | 2023-10-25 | 2024-01-05 | 爱科特科技(海南)有限公司 | 一种局部放电检测方法、***、设备及介质 |
CN117951585A (zh) * | 2024-03-27 | 2024-04-30 | 国网山东省电力公司曲阜市供电公司 | 一种电力设备运行状态实时检测方法及*** |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1593977A2 (de) * | 2004-05-08 | 2005-11-09 | ABB PATENT GmbH | Zählerschrank |
CN106771717A (zh) * | 2016-11-28 | 2017-05-31 | 国网山东省电力公司济宁供电公司 | 一种计量柜柜门监测装置及计量柜 |
CN112989573A (zh) * | 2021-02-08 | 2021-06-18 | 国网四川省电力公司营销服务中心 | 一种计量柜状态检测方法、装置、设备及介质 |
-
2021
- 2021-11-15 CN CN202111350022.7A patent/CN113988215B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1593977A2 (de) * | 2004-05-08 | 2005-11-09 | ABB PATENT GmbH | Zählerschrank |
CN106771717A (zh) * | 2016-11-28 | 2017-05-31 | 国网山东省电力公司济宁供电公司 | 一种计量柜柜门监测装置及计量柜 |
CN112989573A (zh) * | 2021-02-08 | 2021-06-18 | 国网四川省电力公司营销服务中心 | 一种计量柜状态检测方法、装置、设备及介质 |
Non-Patent Citations (1)
Title |
---|
基于NWPSO-BP神经网络的异常用电行为检测算法;李晋国;丁朋鹏;王亮亮;周绍景;吕欢欢;;上海电力大学学报;20200815(第04期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113988215A (zh) | 2022-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113988215B (zh) | 一种配电网计量柜状态检测方法及*** | |
CN105447473B (zh) | 一种基于PCANet-CNN的任意姿态人脸表情识别方法 | |
CN113256066A (zh) | 基于PCA-XGBoost-IRF的作业车间实时调度方法 | |
CN110766137A (zh) | 基于天牛须优化深度置信网络算法的电力电子电路故障诊断方法 | |
CN112528676A (zh) | 文档级别的事件论元抽取方法 | |
CN111768000A (zh) | 在线自适应微调深度学习的工业过程数据建模方法 | |
CN114004252A (zh) | 一种轴承故障诊断的方法、装置以及设备 | |
Zhou et al. | Convolutional neural networks based pornographic image classification | |
Dai et al. | Hybrid deep model for human behavior understanding on industrial internet of video things | |
Li et al. | Adaptive assessment of power system transient stability based on active transfer learning with deep belief network | |
CN114818963B (zh) | 一种基于跨图像特征融合的小样本检测方法 | |
CN110705694A (zh) | 基于特征提取的面向边缘数据中心的窃电监测方法 | |
Mengcan et al. | Constrained voting extreme learning machine and its application | |
CN111695611A (zh) | 一种蜂群优化核极限学习和稀疏表示机械故障识别方法 | |
CN114973226A (zh) | 自监督对比学习自然场景中文本识别***训练方法 | |
Behera et al. | A multi-model data-fusion based deep transfer learning for improved remaining useful life estimation for IIOT based systems | |
Cheng et al. | MMFSL: A Novel Multimodal Few-Shot Learning Framework for Fault Diagnosis of Industrial Bearings | |
Rethik et al. | Attention Based Mapping for Plants Leaf to Classify Diseases using Vision Transformer | |
CN117154256A (zh) | 锂电池的电化学修复方法 | |
CN108898157B (zh) | 基于卷积神经网络的数值型数据的雷达图表示的分类方法 | |
CN115481788B (zh) | 相变储能***负荷预测方法及*** | |
CN115293249A (zh) | 一种基于动态时序预测的电力***典型场景概率预测方法 | |
He et al. | Study of application model on BP neural network optimized by fuzzy clustering | |
Ge et al. | Remaining useful life prediction using deep multi-scale convolution neural networks | |
CN107092927A (zh) | 一种基于边界消解伪逆算法的不平衡数据分类*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |