CN116186630A

CN116186630A - 一种异常漏电电流数据识别方法及相关装置

Info

Publication number: CN116186630A
Application number: CN202211151491.0A
Authority: CN
Inventors: 宋如楠; 杨艺宁; 张蓬鹤; 薛阳; 陈昊; 郑安刚; 吴忠强; 秦译为
Original assignee: State Grid Corp of China SGCC; China Electric Power Research Institute Co Ltd CEPRI; Marketing Service Center of State Grid Hebei Electric Power Co Ltd
Current assignee: State Grid Corp of China SGCC; China Electric Power Research Institute Co Ltd CEPRI; Marketing Service Center of State Grid Hebei Electric Power Co Ltd
Priority date: 2022-09-21
Filing date: 2022-09-21
Publication date: 2023-05-30

Abstract

本发明公开了一种异常漏电电流数据识别方法及相关装置。其中，方法包括：获取用户采样点当前时刻的前预定数量时刻的时序计量数据；利用预先训练的聚类分析模型对时序计量数据进行计算，确定异常值时序计量数据；利用预先训练的神经网络模型对异常值时序计量数据进行预测，确定当前时刻的预测计量数据；将预测计量数据与当前时刻的真实计量数据进行比对，确定比对误差，并根据比对误差判定当前时刻的真实计量数据是否为漏电电流数据。

Description

一种异常漏电电流数据识别方法及相关装置

技术领域

本发明涉及计量数据识别技术领域，并且更具体地，涉及一种异常漏电电流数据识别方法及相关装置。

背景技术

电网及设备数字化更迭使得客户侧线路正常和故障漏电呈现出复杂的非线性特征，传统的工频剩余电流检测方法不再适用，给低压配电***剩余电流监测带来很大困难。另一方面，工作于高频开关状态的电力电子设备比传统工频用电设备更易产生对地泄漏电流，从而使客户电气设备和供电线路等不同区域的漏电信息更加复杂多变，故障隐患更加隐蔽，剩余电流保护误动作或拒动作问题可能加剧。面对巨大的数据体量，单纯依靠人工或统计方法对逐条数据进行判断识别，不仅准确率无法保证，判断效率也十分低下。为了提高剩余电流监测的快速性和准确性，亟需一种科学高效的数据分析方法对电表计量数据中是否存在异常数据进行判别。

发明内容

针对现有技术的不足，本发明提供一种异常漏电电流数据识别方法及相关装置。

根据本发明的一个方面，提供了一种异常漏电电流数据识别方法，包括：

获取用户采样点当前时刻的前预定数量时刻的时序计量数据；

利用预先训练的聚类分析模型对时序计量数据进行计算，确定异常值时序计量数据；

利用预先训练的神经网络模型对异常值时序计量数据进行预测，确定当前时刻的预测计量数据；

将预测计量数据与当前时刻的真实计量数据进行比对，确定比对误差，并根据比对误差判定当前时刻的真实计量数据是否为漏电电流数据。

可选地，时序计量数据包括零线电流时序数据以及火线电流时序数据，并且获取用户采样点当前时刻的前预定数量时刻的时序计量数据的操作，包括：

采集用户采样点的当前时刻的前预定数量时刻的零线电流时序数据以及火线电流时序数据。

可选地，利用预先训练的聚类分析模型对时序计量数据进行计算，确定异常值时序计量数据的操作，包括：

对零线电流时序数据以及火线电流时序数据进行清洗，剔除无效电流数据；

根据零线电流时序数据以及火线电流时序数据，确定剩余电流值；

对剩余电流值进行归一化处理，确定归一化结果；

利用欧式距离公式对归一化结果与聚类分析模型中的聚类中心进行计算，确定异常值时序计量数据。

可选地，根据比对误差判定当前时刻的真实计量数据是否为漏电电流数据的操作，包括：

当误差值超过预先设置的误差阈值的情况下，确定当前时刻的真实计量数据为漏电电流数据。

可选地，还包括：通过如下方法训练聚类分析模型：

利用Canopy算法将获取的历史时序样本计量数据进行聚类分析，确定聚类数目以及每个类别的初始聚类中心；

利用K-means对每个类别的初始聚类中心进行迭代计算，确定每个类别的最终聚类中心；

根据聚类数目以及每个类别的最终聚类中心，确定聚类分析模型。

可选地，还包括：通过如下方法确定神经网络模型：

根据历史时序样本计量数据的采样点个数，确定神经网络模型的神经元个数；

将神经网络模型的激活函数设置为sigmoid函数；

将神经网络模型的输出激活函数设置为tanh函数。

根据本发明的另一个方面，提供了一种异常漏电电流数据识别装置，包括：

获取模块，用于获取用户采样点当前时刻的前预定数量时刻的时序计量数据；

第一确定模块，用于利用预先训练的聚类分析模型对时序计量数据进行计算，确定异常值时序计量数据；

第二确定模块，用于利用预先训练的神经网络模型对异常值时序计量数据进行预测，确定当前时刻的预测计量数据；

判定模块，用于将预测计量数据与当前时刻的真实计量数据进行比对，确定比对误差，并根据比对误差判定当前时刻的真实计量数据是否为漏电电流数据。

根据本发明的又一个方面，提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序用于执行本发明上述任一方面所述的方法。

根据本发明的又一个方面，提供了一种电子设备，所述电子设备包括：处理器；用于存储所述处理器可执行指令的存储器；所述处理器，用于从所述存储器中读取所述可执行指令，并执行所述指令以实现本发明上述任一方面所述的方法。

从而，本申请方案基于Canopy+K-means聚类算法解决了传统K-means算法中初始K值大小和聚类中心难以确定的问题，其中Canopy能够快速地寻找出大量样本数据的初始聚类中心，K-means聚类可以初步筛选出含有异常数据的数据序列，且计算方法简便，聚类精度较高。将长短期记忆神经网络对长序列的处理能力，应用到异常数据识别中，通过设置比对误差阈值进行预测值与计量数据误差判断，有效识别出与预测值相差较大的计量数据，即为该时序序列的异常数据。从而本发明提出的方法可以有效降低因漏电数据异常引起的配电线路漏电保护装置误动、拒动的风险，对维护低压配电线路的正常运行具有一定的意义。

附图说明

通过参考下面的附图，可以更为完整地理解本发明的示例性实施方式：

图1是本发明一示例性实施例提供的异常漏电电流数据识别方法的流程示意图；

图2是本发明一示例性实施例提供的基于Canopy+K-means的聚类算法流程图；

图3是本发明一示例性实施例提供的LSTM内部神经元结构图；

图4是本发明一示例性实施例提供的基于聚类算法和LSTM神经网络的异常漏电识别流程图；

图5是本发明一示例性实施例提供的异常漏电电流数据识别方法的具体实施流程示意图；

图6是本发明一示例性实施例提供的异常漏电电流数据识别装置的结构示意图；

图7是本发明一示例性实施例提供的电子设备的结构。

具体实施方式

下面，将参考附图详细地描述根据本发明的示例实施例。显然，所描述的实施例仅仅是本发明的一部分实施例，而不是本发明的全部实施例，应理解，本发明不受这里描述的示例实施例的限制。

应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

本领域技术人员可以理解，本发明实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等，既不代表任何特定技术含义，也不表示它们之间的必然逻辑顺序。

还应理解，在本发明实施例中，“多个”可以指两个或两个以上，“至少一个”可以指一个、两个或两个以上。

还应理解，对于本发明实施例中提及的任一部件、数据或结构，在没有明确限定或者在前后文给出相反启示的情况下，一般可以理解为一个或多个。

另外，本发明中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本发明中字符“/”，一般表示前后关联对象是一种“或”的关系。

还应理解，本发明对各个实施例的描述着重强调各个实施例之间的不同之处，其相同或相似之处可以相互参考，为了简洁，不再一一赘述。

同时，应当明白，为了便于描述，附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本发明及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，技术、方法和设备应当被视为说明书的一部分。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

本发明实施例可以应用于终端设备、计算机***、服务器等电子设备，其可与众多其它通用或专用计算***环境或配置一起操作。适于与终端设备、计算机***、服务器等电子设备一起使用的众所周知的终端设备、计算***、环境和/或配置的例子包括但不限于：个人计算机***、服务器计算机***、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的***、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机***﹑大型计算机***和包括上述任何***的分布式云计算技术环境，等等。

终端设备、计算机***、服务器等电子设备可以在由计算机***执行的计算机***可执行指令(诸如程序模块)的一般语境下描述。通常，程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等，它们执行特定的任务或者实现特定的抽象数据类型。计算机***/服务器可以在分布式云计算环境中实施，分布式云计算环境中，任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中，程序模块可以位于包括存储设备的本地或远程计算***存储介质上。

示例性方法

图1是本发明一示例性实施例提供的异常漏电电流数据识别方法的流程示意图。本实施例可应用在电子设备上，如图1所示，异常漏电电流数据识别方法100包括以下步骤：

步骤101，获取用户采样点当前时刻的前预定数量时刻的时序计量数据；

其中，例如每个采集24个数据，即每小时采集一次数据，那么当前时刻如果为9时，前预定数量时刻可以为6、7、8时，也可以时其他数量此处不做限定。

步骤102，利用预先训练的聚类分析模型对时序计量数据进行计算，确定异常值时序计量数据；

其中聚类分析模型可以是Canopy+K-means聚类算法。

步骤103，利用预先训练的神经网络模型对异常值时序计量数据进行预测，确定当前时刻的预测计量数据；

其中，例如可以用6、7、8时的数据预测9时的数据，得到9时的预测数据，再根据采集的9时的真实数据进行比对。神经网络模型可以是长短期记忆神经网络。

步骤104，将预测计量数据与当前时刻的真实计量数据进行比对，确定比对误差，并根据比对误差判定当前时刻的真实计量数据是否为漏电电流数据。

从而，基于Canopy+K-means聚类算法解决了传统K-means算法中初始K值大小和聚类中心难以确定的问题，其中Canopy能够快速地寻找出大量样本数据的初始聚类中心，K-means聚类可以初步筛选出含有异常数据的数据序列，且计算方法简便，聚类精度较高。将长短期记忆神经网络对长序列的处理能力，应用到异常数据识别中，通过设置比对误差阈值进行预测值与计量数据误差判断，有效识别出与预测值相差较大的计量数据，即为该时序序列的异常数据。从而本发明提出的方法可以有效降低因漏电数据异常引起的配电线路漏电保护装置误动、拒动的风险，对维护低压配电线路的正常运行具有一定的意义。

对剩余电流值进行归一化处理，确定归一化结果；

具体地，电流数据进行清洗，剔除零线电流、火线电流为零或者某采集点时刻电表未计入数据等情况，根据单相用户电表火线、零线电流计量数据进行低压配电线路正常漏电电流特征分析。根据剩余电流定义，可以利用相线(L)电流和中性线(N)电流的差值间接表示线路中剩余电流的值，即

I_Δ＝|I_L-I_N|

为了加快Canopy+K-means聚类算法的收敛速度，在进行聚类操作前需要对样本数据进行归一化处理，此处采用最大最小归一化的方法，其公式如下式所示。

式中，y_min和y_max分别为归一化后的最小值和最大值，分别取0和1，x为待归一化变量，x_min和x_max分别为待归一化变量的最小值和最大值，y为归一化结果。

可选地，还包括：通过如下方法训练聚类分析模型：

具体地，本发明提供一种异常数据漏电识别方法，其核心主要包括三个部分:漏电数据聚类分析、LSTM神经网络预测、异常数据识别。

漏电数据聚类分析主要由采集电能计量数据、漏电数据预处理、Canopy+K-means聚类分析组成。低压配电线路中采集到的电能计量数据做初步分析可知，漏电电流由采集到的相线和中性线电流计算所得，不同用户的用电习惯对漏电电流的大小存在很大的影响。利用聚类分析将相同变化规律的漏电数据进行聚类操作，实现异常漏电的初步识别。利用Canopy聚类算法可以解决传统K-means算法K值和初始K个聚类中心难以确定的问题。相较于其他聚类算法，Canopy算法在聚类精度上仍有不足，但其在速度上具有很大的优势，因此可以作为K-means算法的初步处理步骤。为K-means算法提供初始聚类中心并确定K值，从而进行更精细聚类操作，其算法流程如下，原理图如图2所示。

(1)将漏电电流样本数据集排序并用list(列表)存储在计算机中，计算每个漏电电流之间的距离，并求出平均距离，将距离平均距离最近的数据设为第一个Canopy，选择两个距离阈值：T₁和T₂，其中T₁>T₂；

(2)从漏电数据集中选取一个对象P，计算它与所有已经产生的Canopy的距离，如果P到所有Canopy中心的距离都大于T₁，则P可以作为一个新的Canopy，同时将该漏电数据从数据集中删除。如果到某个Canopy的距离大于T₂而小于T₁，则将P加入到该Canopy中，不将此漏电数据从数据集中删除，也就是该数据对象仍然参与下一轮的聚类；如果P到某个Canopy中心的距离都小于T₂，则把它添加到该Canopy中，同时将它从数据集中删除，不再作为其他Canopy中心。

(3)重复上述过程，直到集合为空，算法结束，即选取出K个样本作为初始聚类中心C＝{c₁,c₂,…c_k}。分别计算其他数据与已经确定的聚类中心之间的最短距离dist(x_i,C_j),i∈[1,n],j∈[1,k]，本发明采用的计算距离的方法为欧式距离计算方法，可以简化计算量，计算公式如下式所示：

式中，i和p均表示样本的行数，D为数据样本的维度；

(4)针对每一个类别c_k，利用计算所有对象均值的方法，选出新的聚类中心，其个数仍为K，计算公式如下式所示。当每个聚类的中心，不再改变时或达到指定迭代次数时，就可以停止K-means算法。

式中，c_k表示第k类，|c_k|表示第k类中数据对象的个数。

(5)在Canopy+K-means聚类算法操作求出的各类别漏电电流数据的聚类中心，这些聚类中心分别可以作为各聚类的特征数据，利用式(1)依次各类别聚类中心与其他漏电电流数据的欧式距离F，分别将计算得到的各类别欧式距离按照从小到大进行排列，当某一类别数据中存在异常漏电数据时，其变化规律跟该类别的数据相似性存在较大差异，因此计算出的欧式距离值也较大。故可以设定判断阈值F_k，当距离值大于F_k时便可初步判断该类别中存在异常漏电数据。

可选地，还包括：通过如下方法确定神经网络模型：

将神经网络模型的激活函数设置为sigmoid函数；

将神经网络模型的输出激活函数设置为tanh函数。

具体地，LSTM神经网络预测主要利用其特有的记忆单元，结合网络结构中的遗忘门、输入门和输出门，从而有选择性地保留或删除原始数据中的信息，能够较好地学习长期依赖关系，其内部神经元结构如图3所示。基于Canopy+K-means聚类算法对计量数据进行分类并对含有异常的数据进行了初步筛选，将含有异常数据的时序序列样本作为LSTM神经网络的输入，划分样本数据的训练集和测试集，利用神经网络的正向计算和反向传播过程进行训练。

异常数据识别主要是通过LSTM神经网络进行预测识别，利用时序序列数据中的前n个数据预测下一个数据，将预测值作为数据的准确值，再将真实计量数据与预测值大小进行判断。设置一定的误差阈值范围，如果误差大小在阈值范围内，则判断当前漏电电流为正常值，当误差超过阈值时，则判断出现异常数据。将该异常数据从样本中剔除并替换为预测值，持续网络模型预测，直到时序数据全部运行结束。其具体流程如图4所示。

此外，参考图5所示，本发明方法可以用于识别普通居民用户的电表计量数据中是否存在异常数据，实现对用电信息的在线监测。数据预处理：选取210户用户数据共1250组，其中零线电流、火线电流数据各625组。每组数据共有24个采集点电流值，即电表每天每隔一小时进行电流数据采集一次。

对210户用户的电流数据进行清洗，剔除零线电流、火线电流为零或者某采集点时刻电表未计入数据等情况，根据单相用户电表火线、零线电流计量数据进行低压配电线路正常漏电电流特征分析。根据剩余电流定义，可以利用相线(L)电流和中性线(N)电流的差值间接表示线路中剩余电流的值，即

I_Δ＝|I_L-I_N|

数据识别：基于聚类算法的LSTM神经网络异常数据识别主要包括：Canopy+K-means聚类分析、LSTM神经网络预测、异常数据识别三个部分。其具体流程如下：

(1)将计算所得的剩余电流作为原始数据输入到Canopy+K-means聚类算法中。首先利用Canopy算法得到聚类数目和初始聚类中心，再利用K-means求取均值的方法得到下一次的聚类中心，重复上述操作直到聚类中心不再改变，即聚类算法完成。

(2)在日常生活中部分居民用电习惯和规律相同，有些存在很大差异。在异常数据识别和提取过程中将相同变化规律的用户分为一类，可实现对剩余电流数据的精细化划分。将聚类分析算法提取的各类别数据的聚类中心作为该类用户最具有代表性的数据。利用欧式距离公式依次计算其他数据与各类别聚类中心的距离，当超过阈值F_k时，则可以初步推断该时序数据(24个采集点)中存在异常数据。

(3)将聚类分析筛选出的含有异常值的时序序列数据作为LSTM神经网络的输入数据，由于时序序列的数据采样点个数m为24，因此可以设置的LSTM输入神经元的个数n(n<m)为3，设置输出神经元的个数为1，即利用前3个时刻的数据预测下一个时刻的数据。LSTM神经网络的激活函数设置为sigmoid函数，输出的激活函数为tanh函数。在LSTM神经网络的前向传播计算过程中，主要是使用不同的激活函数完成对遗忘门、输入门、状态单元、输出门的不断更新。在反向传播过程中，主要思想是通过梯度下降迭代更新所有的参数，关键点在于计算所有参数基于损失函数的偏导数。反向传播的实现过程可以借助算法库实现，其相关数学推导过程繁琐，本发明不再进行详细阐述。

(4)在LSTM神经网络对漏电电流时序序列的预测过程中，将每一次预测出的漏电电流与计量数据进行误差判断，设置误差合理阈值，从而实现对真实漏电数据的保留，以及异常漏电数据的识别与替换，直至时序序列预测结束，最终识别结果即为与LSTM神经网络预测值相差较大的漏电电流数据。

从而，基于Canopy+K-means聚类算法解决了传统K-means算法中初始K值大小和聚类中心难以确定的问题，其中Canopy能够快速地寻找出大量样本数据的初始聚类中心，K-means聚类可以初步筛选出含有异常数据的数据序列，且计算方法简便，聚类精度较高。将长短期记忆神经网络对长序列的处理能力，应用到异常数据识别中，通过设置阈值进行预测值与计量数据误差判断，有效识别出与预测值相差较大的计量数据，即为该时序序列的异常数据。本发明提出的方法可以有效降低因漏电数据异常引起的配电线路漏电保护装置误动、拒动的风险，对维护低压配电线路的正常运行具有一定的意义。

示例性装置

图6是本发明一示例性实施例提供的异常漏电电流数据识别装置的结构示意图。如图6所示，装置600包括：

获取模块610，用于获取用户采样点当前时刻的前预定数量时刻的时序计量数据；

第一确定模块620，用于利用预先训练的聚类分析模型对时序计量数据进行计算，确定异常值时序计量数据；

第二确定模块630，用于利用预先训练的神经网络模型对异常值时序计量数据进行预测，确定当前时刻的预测计量数据；

判定模块640，用于将预测计量数据与当前时刻的真实计量数据进行比对，确定比对误差，并根据比对误差判定当前时刻的真实计量数据是否为漏电电流数据。

可选地，时序计量数据包括零线电流时序数据以及火线电流时序数据，并且获取模块610，包括：

采集子模块，用于采集用户采样点的当前时刻的前预定数量时刻的零线电流时序数据以及火线电流时序数据。

可选地，第一确定模块620，包括：

剔除子模块，用于对零线电流时序数据以及火线电流时序数据进行清洗，剔除无效电流数据；

第一确定子模块，用于根据零线电流时序数据以及火线电流时序数据，确定剩余电流值；

第二确定子模块，用于对剩余电流值进行归一化处理，确定归一化结果；

第三确定子模块，用于利用欧式距离公式对归一化结果与聚类分析模型中的聚类中心进行计算，确定异常值时序计量数据。

可选地，判定模块640，包括：

第四确定子模块，用于当误差值超过预先设置的误差阈值的情况下，确定当前时刻的真实计量数据为漏电电流数据。

可选地，装置600还包括：第一训练模块，用于通过如下方法训练聚类分析模型：

第五确定子模块，用于利用Canopy算法将获取的历史时序样本计量数据进行聚类分析，确定聚类数目以及每个类别的初始聚类中心；

第六确定子模块，用于利用K-means对每个类别的初始聚类中心进行迭代计算，确定每个类别的最终聚类中心；

第七确定子模块，用于根据聚类数目以及每个类别的最终聚类中心，确定聚类分析模型。

可选地，装置600还包括：第二训练模块，用于通过如下方法确定神经网络模型：

第八确定子模块，用于根据历史时序样本计量数据的采样点个数，确定神经网络模型的神经元个数；

第一设置模块，用于将神经网络模型的激活函数设置为sigmoid函数；

第二设置模块，用于将神经网络模型的输出激活函数设置为tanh函数。

示例性电子设备

图7是本发明一示例性实施例提供的电子设备的结构。如图7所示，电子设备70包括一个或多个处理器71和存储器72。

处理器71可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元，并且可以控制电子设备中的其他组件以执行期望的功能。

存储器72可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器71可以运行所述程序指令，以实现上文所述的本发明的各个实施例的软件程序的方法以及/或者其他期望的功能。在一个示例中，电子设备还可以包括：输入装置73和输出装置74，这些组件通过总线***和/或其他形式的连接机构(未示出)互连。

此外，该输入装置73还可以包括例如键盘、鼠标等等。

该输出装置74可以向外部输出各种信息。该输出装置74可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然，为了简化，图7中仅示出了该电子设备中与本发明有关的组件中的一些，省略了诸如总线、输入/输出接口等等的组件。除此之外，根据具体应用情况，电子设备还可以包括任何其他适当的组件。

示例性计算机程序产品和计算机可读存储介质

除了上述方法和设备以外，本发明的实施例还可以是计算机程序产品，其包括计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本发明各种实施例的方法中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本发明实施例操作的程序代码，所述程序设计语言包括面向对象的程序设计语言，诸如Java、C++等，还包括常规的过程式程序设计语言，诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外，本发明的实施例还可以是计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本发明各种实施例的对历史变更记录进行信息挖掘的方法中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的***、***或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本发明的基本原理，但是，需要指出的是，在本发明中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本发明的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本发明为必须采用上述具体的细节来实现。

本说明书中各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似的部分相互参见即可。对于***实施例而言，由于其与方法实施例基本对应，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本发明中涉及的器件、***、设备、***的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、***、设备、***。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。

可能以许多方式来实现本发明的方法和***。例如，可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法和***。用于所述方法的步骤的上述顺序仅是为了进行说明，本发明的方法的步骤不限于以上具体描述的顺序，除非以其它方式特别说明。此外，在一些实施例中，还可将本发明实施为记录在记录介质中的程序，这些程序包括用于实现根据本发明的方法的机器可读指令。因而，本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。

还需要指出的是，在本发明的***、设备和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本发明。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义的一般原理可以应用于其他方面而不脱离本发明的范围。因此，本发明不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本发明的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims

1.一种异常漏电电流数据识别方法，其特征在于，包括：

利用预先训练的聚类分析模型对所述时序计量数据进行计算，确定异常值时序计量数据；

利用预先训练的神经网络模型对所述异常值时序计量数据进行预测，确定所述当前时刻的预测计量数据；

将所述预测计量数据与所述当前时刻的真实计量数据进行比对，确定所述比对误差，并根据所述比对误差判定所述当前时刻的真实计量数据是否为漏电电流数据。

2.根据权利要求1所述的方法，其特征在于，所述时序计量数据包括零线电流时序数据以及火线电流时序数据，并且获取用户采样点当前时刻的前预定数量时刻的时序计量数据的操作，包括：

采集所述用户采样点的所述当前时刻的前预定数量时刻的零线电流时序数据以及火线电流时序数据。

3.根据权利要求2所述的方法，其特征在于，利用预先训练的聚类分析模型对所述时序计量数据进行计算，确定异常值时序计量数据的操作，包括：

对所述零线电流时序数据以及所述火线电流时序数据进行清洗，剔除无效电流数据；

根据所述零线电流时序数据以及所述火线电流时序数据，确定剩余电流值；

对所述剩余电流值进行归一化处理，确定所述归一化结果；

利用欧式距离公式对所述归一化结果与所述聚类分析模型中的聚类中心进行计算，确定异常值时序计量数据。

4.根据权利要求1所述的方法，其特征在于，根据所述比对误差判定所述当前时刻的真实计量数据是否为漏电电流数据的操作，包括：

当误差值超过预先设置的误差阈值的情况下，确定所述当前时刻的所述真实计量数据为漏电电流数据。

5.根据权利要求1所述的方法，其特征在于，还包括：通过如下方法训练所述聚类分析模型：

利用K-means对每个类别的所述初始聚类中心进行迭代计算，确定每个类别的最终聚类中心；

根据所述聚类数目以及每个类别的所述最终聚类中心，确定所述聚类分析模型。

6.根据权利要求5所述的方法，其特征在于，还包括：通过如下方法确定所述神经网络模型：

根据所述历史时序样本计量数据的采样点个数，确定所述神经网络模型的神经元个数；

将所述神经网络模型的激活函数设置为sigmoid函数；

将所述神经网络模型的输出激活函数设置为tanh函数。

7.一种异常漏电电流数据识别装置，其特征在于，包括：

第一确定模块，用于利用预先训练的聚类分析模型对所述时序计量数据进行计算，确定异常值时序计量数据；

第二确定模块，用于利用预先训练的神经网络模型对所述异常值时序计量数据进行预测，确定所述当前时刻的预测计量数据；

判定模块，用于将所述预测计量数据与所述当前时刻的真实计量数据进行比对，确定所述比对误差，并根据所述比对误差判定所述当前时刻的真实计量数据是否为漏电电流数据。

8.根据权利要求7所述的装置，其特征在于，所述时序计量数据包括零线电流时序数据以及火线电流时序数据，并且获取模块，包括：

采集子模块，用于采集所述用户采样点的所述当前时刻的前预定数量时刻的零线电流时序数据以及火线电流时序数据。

9.根据权利要求8所述的装置，其特征在于，第一确定模块，包括：

剔除子模块，用于对所述零线电流时序数据以及所述火线电流时序数据进行清洗，剔除无效电流数据；

第一确定子模块，用于根据所述零线电流时序数据以及所述火线电流时序数据，确定剩余电流值；

第二确定子模块，用于对所述剩余电流值进行归一化处理，确定所述归一化结果；

第三确定子模块，用于利用欧式距离公式对所述归一化结果与所述聚类分析模型中的聚类中心进行计算，确定异常值时序计量数据。

10.根据权利要求7所述的装置，其特征在于，判定模块，包括：

第四确定子模块，用于当误差值超过预先设置的误差阈值的情况下，确定所述当前时刻的所述真实计量数据为漏电电流数据。

11.一种计算机可读存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序用于执行上述权利要求1-6任一所述的方法。

12.一种电子设备，其特征在于，所述电子设备包括：

处理器；

用于存储所述处理器可执行指令的存储器；

所述处理器，用于从所述存储器中读取所述可执行指令，并执行所述指令以实现上述权利要求1-6任一所述的方法。